এডিটর রেটিং: ব্যবহারকারী রেটিং: [মোট: 0 গড়: 0].ilfs_responsive_below_title_1 { প্রস্থ: 300px; } @media(মিনিমাম-প্রস্থ: 500px) {.ilfs_responsive_below_title_1 { প্রস্থ: 300px; } } @media(মিনিমাম-প্রস্থ: 800px) {.ilfs_responsive_below_title_1 { প্রস্থ: 336px; } }
আইটি পরিভাষায়, একটি পার্সার হল একটি কম্পাইলার প্রোগ্রাম যা নির্দিষ্ট নির্বাচিত ডেটার সিনট্যাক্স বিশ্লেষণ করে এবং তারপরে এটিকে ভেঙে দেয় ছোট বিযুক্ত উপাদানে নিচে যাতে এটি সহজেই অন্য ভাষায় অনুবাদ করা যায়। উদাহরণস্বরূপ, একজন এইচটিএমএল পার্সার এইচটিএমএল কোড নেবে এবং এটি থেকে গুরুত্বপূর্ণ তথ্য যেমন পৃষ্ঠার শিরোনাম, পৃষ্ঠার অনুচ্ছেদ (বডি), শিরোনাম, লিঙ্ক এবং আরও অনেক কিছু বের করবে।
এই নিবন্ধে আমরা করব কন্টেন্ট পার্সার সম্পর্কে আলোচনা করা হচ্ছে, এটি একটি বিনামূল্যের অনলাইন টুল যা যেকেউ ব্যবহার করে প্লেইন টেক্সট, মার্কডাউন ল্যাঙ্গুয়েজ বা এইচটিএমএল এক্সট্র্যাক্ট করতে (পার্স) করতে পারে যেগুলোতে মূলত ভারী কন্টেন্ট রয়েছে। এই অ্যাপ্লিকেশানের লিঙ্কটি এই নিবন্ধের শেষে উপলব্ধ৷
আপনাকে যা করতে হবে তা হল ওয়েবপৃষ্ঠাটির URL টাইপ বা পেস্ট করুন যেখান থেকে আপনি ডেটা (তথ্য) পার্স করতে চান এবং বেছে নিন নিষ্কাশনের ধরন যেমন মার্কডাউন, এইচটিএমএল বা প্লেইন টেক্সট। Extract এ ক্লিক করুন এবং পার্স করা বিষয়বস্তু খুব কমই কয়েক সেকেন্ডের মধ্যে প্রদর্শিত হবে৷
নিচে প্রথম স্ক্রিন শটটি দেখুন যা জনপ্রিয় GitHub ওয়েবসাইট থেকে একটি সংগ্রহস্থলের পৃষ্ঠাকে চিত্রিত করে৷ তারপর দেখুন কিভাবে পৃষ্ঠার বিষয়বস্তু তিনটি ফরম্যাটে পার্স করা হয়েছে (এক্সট্রাক্ট করা হয়েছে)।
বন্ধ করা মন্তব্য:
কিছুক্ষণ পরীক্ষা করার পরে, আমি অনুভব করেছি যে এটি একটি ভাল অনলাইন টুল যেকোন ওয়েবসাইটের বিষয়বস্তুকে একাধিক ফরম্যাটে যেমন HTML, Markdown এবং আরও অনেক কিছুতে পার্স করার জন্য। এটি আপনার জন্য ভাষাগত, ফর্ম্যাটিং কারণ এবং আরও অনেক কিছুর জন্য ওয়েবসাইটের অনুবাদ করা সহজ করে তোলে।