AI‑Generated Science: কতটা পত্রিকা ادبیات এখন মেশিনের হাতে?

বিশ্ববিজ্ঞানের পত্রিকাগত প্রেক্ষিতে একটি silenzieuse क्रांতি ঘটছে: কৃত্রিম বুদ্ধিমত্তা (AI) এখন শুধু ডেটা বিশ্লেষণের জন্য নয়, বরং লেখা, সম্পাদনা এবং zelfs পত্রিকাগত প্রস্তুতির জন্যও ব্যবহৃত হচ্ছে। Nature’র ৫ মে, ২০২৬এর রিপোর্ট অনুযায়ী, “AI‑এর ব্যবহারকে নির্ভরযোগ্যভাবে মাপनेের জন্য এখনও যথেষ্ট সরঞ্জাম নেই।” এই ঘোষণা জটিল প্রশ্ন উঠায়: আজকের বৈজ্ঞানিক সাহিত্য কত অংশ réellement AI‑উত্পন্ন?
এই প্রশ্নের উত্তর খুঁজে বের করতে গিয়ে গবেষণা দলها বিভিন্ন পদ্ধতি ব্যবহার করছে — স্ট্যাটিস্টিক্যাল শৈলী বিশ্লেষণ, মেটাডেটা ট্যাগিং, এবং LLM‑ভিত্তিক ডিটেক্টর। তবে, প্রতিটি পদ্ধতির নিজস্ব সীমাবদ্ধতা আছে, এবং ফলাফল একটু ভিন্ন‑বিন্ন হয়।
প্রারম্ভিক অনুমান: ২০২৩‑২০২৪-এর ডেটা
২০২৩ সালের একটি ব্যাপankan अध्ययन, যা PLOS Biology-এ প্রকাশিত হয়েছিল, ১.২ মিলিয়ন PubMedạpত্রিকার আবস্ট্রাক্ট বিশ্লেষণ করেছিল এবং আবিষ্কার করেছিল যে حدود ৩‑৪% লেকে এক বা একাধিক vākya LLM‑সহায়তা সংকেত দেখায়। এই সংখ্যা বড় নয়, কিন্তু বৃদ্ধির trajectories স্পষ্ট: ২০২৪-এর MIT‑AI Index রিপোর্টে দर्शানো হয়েছে कि LLM‑ভিত্তিক লেখা সহায়তা ব্যবহার करने वाले वैज्ञानिकों की संख्या वार्षिक रूप से ২৭% की दर से बढ़ रही है।
বাংলাদেশের ঢাকা বিশ্ববিদ্যালয়ের কম্পিউটার বিজ্ঞান বিভাগের একটি ছোট কিন্তু গুরুত্বপূর্ণ পাইলট অধ্যায়ন (২০২৫)ে ৫০০টি arXiv پیشপ্রকাশন নেওয়া হয়েছিল এবং একটি কাস্টম BERT‑ভিত্তিক ডিটেক্টর ব্যবহার করে পाया गया कि ৭.২% পত্রিকায় AI‑জেনারেটেড বাক্যাংশের সঙ্কালন超过 ৩০% था। এই উত্থানকেぞর দেয়া হচ্ছে যে AI‑সহায়তা এখন শুধু ইংরেজি‑মাধ্যমী পত্রিকায়ই সীমাবদ্ধ নয়; বাংলা, হিন্দি এবং মন্দারিন ভাষায়ের প্রি‑প্রינ্টস에서도 समान傾向見られる。
কেন মাপা কঠিন?
Nature’র লেখা উল্লেখ্য করে যে, “বর্তমানে কোনো মানकीकृत মেটাডেটা枠が存在しないため、AI‑जनित सामग्री को अलग करना चुनौतीपूर्ण है।” মূলত তিনটি বাধা দেখা দেয়:
- হাইব্রিড লেখন: গবেষণাগার প্রায়শই AI‑প্রস্তাবিত ড্রাফটকে মানব সম্পাদকদের 의해 ভাল‑ভালে পুনর্লিখন করে, যা শৈলী‑ভিত্তিক ডিটেক্টরকে ভ्रमিত করে।
- প্রকাশ নীতি: অনেক জার্নাল AI‑সহায়তা উন্মুক্তভাবে প্রকাশ করে না, ফলে মেটাডেটা‑ভিত্তিক ট্র্যাকিং অসম্পূর্ণ থাকে।
- মডেলের Eagerness: বড় ভাষা মডেল्स (LLMs) মানব‑লেখিত পাঠ্যের নकल করার Denganすごく上手で、 false‑negative 비율이 बढ़ जाता है।
এই সমस्यাগুলোকে সমাধান করার জন্য, ২০২৬-এর শুরুতে arXiv‑এ একটি প্রিপ্রিন্টে শोधকर्तারা একটি “প্রতিপক্ষলক্ষ্য” फ्र레임वर्क प्रस्तुत किया, जहां एक डिटेक्टर और एक जनरेटर एक साथ प्रशिक्षित होते हैं, जिससे डिटेक्शन की सटीकता ৮৯% तक पहुंच जाती है। যদিও উদ্যোক্তা‑মূলক, এই পদ্ধতিটি এখনও বড়‑স্কেলে যাচাই নেই।
অনুভবিক উদাহরণ: AI‑সহায়তা সম্প্রবাহের একটি কেস স্টাডি
২০২৪-এর শেষে, জিনেvomics‑এ একটি পত্রিকা “DeepSeq: ট্রান্সফর্মার‑ভিত্তিক جينوم अनुक्रमण के लिए एक ओपन‑सोर्स पाइपलाइन” প্রকাশিত হয়েছিল। লেখকদের মধ্যে দুজন ने अपने ORCID प्रोफाइल में स्पष्ट रूप से उल्लेख किया कि “मुख्य पाठ और चित्र कैप्शन का प्रारंभिक ड्राफ्ट GPT‑4 द्वारा उत्पन्न किया गया था, जिसके बाद दो वरिष्ठ आनुवंशिकविदों द्वारा समीक्षा और संशोधन किया गया।” এই ধরনের স্ব‑বিরত ঘোষণা stadig असाधारण है, কিন্তু এটি ভবিষ্যৎের জন্য একটি মডেল প্রদর্শন করে: স্ব‑প্রকাশিত AI‑ব্যবহারের স্বচ্ছ ট্র্যাকিং।
বিপরীত দিক থেকে, ২০২৫-এর একটি বিশ্লেষণ যা Scientometrics‑এ প্রকাশিত হয়েছিল, ১০,০০০টি রসায়ন학 저널 논문을 조사해 encontró कि केवल 0.4% लेखकों ने AI‑सहायता की पुष्टि की, जबकि स्वचालित शैली‑मेट्रिक्स ने ५‑७%范围の可能性を示しました। این 격차 강조 करता है कि รายงาน خود‑보고 todavía 믿을 수 없는indicator है।

ভবিষ্যৎ দৃষ্টিভঙ্গি: নীতি এবং প্রযুক্তির সংযোজন
AI‑উত্পাদিত Sahitya‑অंशের পরিমাণ বোঝার জন্য, কৌশলগত দিক থেকে দুটি সমান্তরাল পথ উন্নত হচ্ছে:
- मानकीकृत révélation: křížová iniciativa जैसे Crossref AI Disclosure Hub (২০২৫‑এ চালু) journals को लेखकों से AI‑सहायता के स्तर को चेक‑बॉक्स फ़ॉर्म के माध्यम से घोषित करने के लिए प्रोत्साहित कर रहा है। প্রারম্ভিক আপনয়ন Rates ১২% (২০২৬ Q1) পর্যন্ত পৌঁছাল है, যা উন্নতির দিক gösteriyor।
- উন্নত ডিটেকশন: ডিপ‑লার্নিং মডেল्स যা শব্দ‑ব্যাখ্যা সহ সמנ্টিক এবং সিনট্যাক্স‑স্তরের বৈশিষ্ট্য একত্র করে, ২০২৬‑এর MIT‑IBM Watson AI Lab-এর একটি প্রোটোটাইপে ৯২% F1‑স্কোর অর্জন করেছে (IEEE TPAMI, ২০২৬)। এই টুলগুলি bientôt পাবলিশার‑সাইড ওয়ার্কফ্লো में интегрированные हो सकते हैं, जिससे 실시간 스크리닝 가능해진다।
এই উভয় পথের সমন্বয়ই সঠিক পরিমাপের কী হতে পারে। যদি প্রকাশকরা AI‑ব্যাবহারের স্ব‑প্রকাশনকে বাধ্য করে এবং একসাথে ভ্যাচ‑ডিটেকশন সিস্টেম স্থাপন করে, তবে ২০২৮‑এর মধ্যে AI‑জেনারেটেড পাঠ্যের অনুমানযোগ্য অংশ ৫‑১০% এর মধ্যে সীমাবদ্ধ রাখা সম্ভব—একটি সুযোগ যা মানব গবেষণার সম্পদকে উন্নত করতে পারে, না যে প্রতিস্থাপন করে।
উপসংহার
কতটুকু বৈজ্ঞানিক সাহিত্য এখন AI‑উত্পন্ন, এই প্রশ্নের উত্তর এখনও অনুমানের শেয়ারই, কিন্তু নির্দেশাবলী দৃঢ় হয়: একদশকের মধ্য দিয়ে AI‑সহায়তা ১‑২% থেকে একবাংলা ৫‑১০% পর্যন্ত উঠেছে, এবং কিছু ক্ষেত্রে (উদাহরণস্বরূপ, arXiv‑প্রি‑প্রিন্ট) এই সংখ্যা আরও বেশি হতে পারে। Nature’র ২০২৬‑এর রিপোর্ট সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি সত্যি सत्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्याт्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्यात्या
