প্রাচীন লেখা ও আধুনিক pattern recognition-এর মিলন
হিট্টাইট গবেষণায় একটি reported machine learning breakthrough মানবিক শাস্ত্রে এআই-এর ব্যবহারে একটি বৃহত্তর পরিবর্তনের ইঙ্গিত দেয়। Interesting Engineering থেকে দেওয়া candidate metadata এবং excerpt অনুযায়ী, কম্পিউটেশনাল ভাষাবিদ ও প্রত্নতত্ত্ববিদদের একটি দল ৩,৫০০ বছরের পুরোনো হিট্টাইট লিপি ৯০% নির্ভুলতায় decipher করতে সক্ষম একটি digital system তৈরি করেছে।
সীমিত source detail সত্ত্বেও, মূল দাবি গুরুত্বপূর্ণ। হিট্টাইট পাঠ্য প্রাচীন Near East-এর foundational archive-গুলোর মধ্যে পড়ে, কিন্তু ক্ষতিগ্রস্ত বা কঠিন inscription পড়া, শ্রেণিবদ্ধ করা, এবং পুনর্গঠন করা এখনও শ্রমসাধ্য কাজ। উচ্চ নির্ভুলতায় সহায়তা করতে পারে এমন একটি system বিশেষজ্ঞ ব্যাখ্যাকে প্রতিস্থাপন করবে না, তবে ইতিহাস বিশ্লেষণের সবচেয়ে সময়সাপেক্ষ অংশগুলোকে উল্লেখযোগ্যভাবে দ্রুত করতে পারে।
৯০% সংখ্যাটি কেন গুরুত্বপূর্ণ
প্রতিবেদিত নির্ভুলতার মাত্রা প্রত্নতত্ত্ব এবং এআই গবেষণা উভয় ক্ষেত্রেই দৃষ্টি আকর্ষণ করার জন্য যথেষ্ট উচ্চ। বাস্তবে, এই ধরনের tools গুরুত্বপূর্ণ কারণ তারা পুরো ক্ষেত্রের সমস্যা সমাধান করে বলে নয়, বরং বিশেষজ্ঞদের ওপর থাকা ম্যানুয়াল বোঝা কমাতে পারে বলে। একটি model যদি শক্তিশালী candidate readings দিতে পারে, বারবার দেখা patterns শনাক্ত করতে পারে, বা transcription workflow standardize করতে সাহায্য করে, তাহলে গবেষকেরা সেই কঠিন interpretive কাজের জন্য সময় পান যা machines এখনও ভালোভাবে পারে না।
এটি scale-ও বদলে দেয়। প্রাচীন ভাষা-সংক্রান্ত scholarship প্রায়ই expert time, fragment condition, এবং বারবার review-এর প্রয়োজনের কারণে সীমাবদ্ধ থাকে। একটি digital system সম্ভাব্যভাবে মানুষের একটি দলের তুলনায় অনেক বেশি উপাদান process করতে পারে, বিশেষত যখন inscription সংখ্যা বেশি, আংশিকভাবে সংরক্ষিত, বা বিভিন্ন collection-এ ছড়িয়ে থাকে।
শাস্ত্রে এআই কী বোঝাচ্ছে
রিপোর্ট করা হিট্টাইট ফলাফল একটি বৃহত্তর trend-এর সঙ্গে মেলে: এআই consumer-facing novelty থেকে domain-specific research infrastructure-এ যাচ্ছে। science ও engineering-এ, এর মানে সাধারণত modeling, simulation, বা automation tools। humanities-এ, এর মানে increasingly transcription, restoration assistance, corpus analysis, এবং বৃহৎ text ও image body-জুড়ে pattern discovery।
গুরুত্বপূর্ণ পার্থক্য হলো, ঐতিহাসিক গবেষণাকে raw prediction-এ নামিয়ে আনা যায় না। একটি model সম্ভাব্য reading দিতে পারে, কিন্তু context, grammar, chronology, এবং material evidence এখনও গুরুত্বপূর্ণ। তাই human oversight কেন্দ্রে থাকে। প্রকৃত প্রতিশ্রুতি হলো বিশেষজ্ঞ ও সফটওয়্যারের সহযোগিতায়, একটিকে অন্যটি দিয়ে প্রতিস্থাপনে নয়।
বোঝা থেকে প্রবেশগম্যতা
এ ধরনের system যদি আরও উন্নত হতে থাকে, তাহলে এর সবচেয়ে বড় দীর্ঘমেয়াদি প্রভাব হতে পারে access। আরও পাঠ্য digitize করা যেতে পারে, আরও inscription searchable হতে পারে, এবং যেসব ancient corpus আগে খুব কঠিন বা খুব ধীর ছিল, সেগুলোর সঙ্গে আরও research group কাজ করতে পারে। ছাত্র ও গবেষক উভয়ের জন্যই এটি অত্যন্ত বিশেষায়িত ক্ষেত্রে প্রবেশের বাধা কমাতে পারে।
এটি preservation workflow-ও উন্নত করতে পারে। digital-assisted reading tool প্রতিষ্ঠানগুলোকে artifact আরও ধারাবাহিকভাবে document করতে এবং ভবিষ্যৎ গবেষণার জন্য আরও ব্যবহারযোগ্য archive তৈরি করতে সাহায্য করতে পারে। যেখানে material damage এবং data scarcity নিয়মিত উদ্বেগ, সেখানে better digital handling নিজেই একটি অর্থবহ অগ্রগতি।
নিশ্চিতভাবে যা বলা যায়
- দেওয়া metadata-তে কম্পিউটেশনাল ভাষাবিদ ও প্রত্নতত্ত্ববিদদের তৈরি একটি machine learning system বর্ণনা করা হয়েছে।
- সিস্টেমটি ৩,৫০০ বছরের পুরোনো হিট্টাইট লিপিকে লক্ষ্য করে বলা হয়েছে।
- প্রতিবেদিত performance level হলো ৯০% নির্ভুলতা।
এই বিবরণগুলোই কাহিনীটিকে এআই-সহায় scholarship কোন দিকে যাচ্ছে তার একটি গুরুত্বপূর্ণ সংকেত হিসেবে তুলে ধরতে যথেষ্ট। যদি রিপোর্ট করা performance পূর্ণ publication বা technical disclosure-এ সত্য প্রমাণিত হয়, তবে তা digital archaeology এবং computational linguistics উভয়ের জন্যই উল্লেখযোগ্য অগ্রগতি হবে।
এই নিবন্ধটি Interesting Engineering-এর প্রতিবেদনভিত্তিক। মূল নিবন্ধটি পড়ুন.
Originally published on interestingengineering.com

