AI ডেটা সংগ্রহ যখন প্রারম্ভিক শৈশব শিক্ষার সঙ্গে মিলিত হয়

ওয়াশিংটন বিশ্ববিদ্যালয়ের একটি প্রস্তাবিত গবেষণা উদ্যোগ একটি কঠিন প্রশ্নকে জনসমক্ষে এনেছে: যখন সেই ডেটা প্রিস্কুল শ্রেণিকক্ষ থেকে আসবে, তখন কৃত্রিম বুদ্ধিমত্তা ব্যবস্থার জন্য বাস্তবজগতের ডেটা সংগ্রহ করতে গবেষকদের কতদূর যাওয়া উচিত?

404 Media-এর মতে, গবেষকরা পরিকল্পনা করেছিলেন যে প্রিস্কুল শিক্ষকদের ছোট ক্যামেরা পরতে বলা হবে, যা স্বাভাবিক শ্রেণিকক্ষ কার্যকলাপের সময় শিক্ষকের আনুমানিক প্রথম-ব্যক্তি দৃষ্টিভঙ্গি ধারণ করবে। এই ফুটেজে যেসব শিশুদের পড়ানো হচ্ছে তারাও থাকবে, এবং পরে তা AI মডেল তৈরিতে ব্যবহার করা হবে। প্রকল্প নথিতেও বলা হয়েছিল যে গবেষণার অংশ হিসেবে শ্রেণিকক্ষে একটি স্থির ভিডিও ক্যামেরা বসানো হতে পারে।

AI কাজের প্রযুক্তিগত বিবরণ আলোচনার কেন্দ্র হওয়ার আগেই, এই প্রস্তাবটি সমৃদ্ধ প্রশিক্ষণ ডেটার চাহিদা এবং এমন ডেটা কোথা থেকে আসা উচিত সেই সামাজিক সীমারেখার মধ্যে বাড়তে থাকা টানাপোড়েনকে প্রকাশ করে।

অভিভাবকদের কী বলা হয়েছিল

অভিভাবকদের সঙ্গে ভাগ করা এবং পরে 404 Media-এর হাতে আসা একটি নথিতে বলা হয়েছিল, অনুমতি থাকলে, একটি শিশুর প্রধান শিক্ষক শিক্ষক-পরিধেয় ক্যামেরা পরে শিক্ষকের আনুমানিক প্রথম-ব্যক্তি দৃষ্টিভঙ্গি ধারণ করতে পারেন, এবং গবেষকরাও শ্রেণিকক্ষে একটি স্থির ক্যামেরা বসাতে পারেন। রেকর্ডিংগুলোকে নিয়মিত শ্রেণিকক্ষ কার্যকলাপের সময় শিক্ষক ও শিশুর মধ্যে স্বাভাবিক মিথস্ক্রিয়া ধারণকারী হিসেবে বর্ণনা করা হয়েছিল। প্রস্তাবিত সময়সূচি ছিল সকালের প্রোগ্রাম চলাকালীন সর্বোচ্চ 150 মিনিট, এক মাসে সর্বোচ্চ চারটি ভিজিট পর্যন্ত।

নথিতে জোর দিয়ে বলা হয়েছিল যে শিশুদের নতুন বা ভিন্ন কিছু করতে বলা হবে না এবং তাদের দৈনন্দিন রুটিন একই থাকবে। এক দিক থেকে, সেই আশ্বাস বোধগম্য: গবেষকরা প্রায়ই পরীক্ষামূলক হস্তক্ষেপে বদলে যাওয়া আচরণের বদলে প্রাকৃতিক, বাস্তবধর্মী ডেটা চান। অন্য দিক থেকে, এটি অস্বস্তিকে আরও তীব্র করে। ডেটা সংগ্রহ যত সাধারণ জীবনের কাছাকাছি যায়, পর্যবেক্ষণ ও নজরদারির মধ্যে পার্থক্য করা তত কঠিন হয়ে ওঠে।

সম্মতির সমস্যা

404 Media-র সঙ্গে কথা বলা এক অভিভাবক এই কর্মসূচিকে opt-in নয়, opt-out হিসেবে বুঝেছিলেন। বিশ্ববিদ্যালয় সেই ব্যাখ্যা অস্বীকার করে জানায়, শ্রেণিকক্ষ অংশগ্রহণ সব সংশ্লিষ্ট শিশুর জন্য অভিভাবকের অনুমতি পাওয়ার ওপর নির্ভরশীল ছিল। এই মতবিরোধ ছোটখাটো প্রশাসনিক বিষয় নয়। এটি পুরো গবেষণা নকশার বৈধতাকেই স্পর্শ করে।

অত্যন্ত ছোট শিশুদের পরিবেশে, সম্মতির প্রক্রিয়াগত দিকটি ফর্মে সম্মতির অস্তিত্বের মতোই গুরুত্বপূর্ণ। কী রেকর্ড করা হচ্ছে, কতদিন তা সংরক্ষিত থাকবে, কারা তা দেখতে পাবে, এবং কোন ধরনের AI সিস্টেমকে সহায়তা করতে এই ফুটেজ ব্যবহৃত হবে তা অভিভাবকদের জানা দরকার। এই শৃঙ্খলের কোনো অংশ অস্পষ্ট হলে জনবিশ্বাস দ্রুত ভেঙে পড়তে পারে।

প্রতিবেদনটি পূর্ণ প্রযুক্তিগত প্রোটোকল দেয় না, কিন্তু উপলব্ধ বিবরণই যথেষ্ট দেখাতে যে কেন সম্মতি মডেলের ব্যাখ্যা প্রায় সঙ্গে সঙ্গেই কেন্দ্রীয় হয়ে উঠেছিল। একটি opt-in কাঠামো অত্যন্ত সংবেদনশীল পরিবেশে স্পষ্ট, তথ্যসমৃদ্ধ সম্মতিকে বোঝায়। opt-out ধারণা আরও দুর্বল মানদণ্ড নির্দেশ করে, যদিও সেটি বিশ্ববিদ্যালয়ের উদ্দেশ্য না-ও হতে পারে।

শ্রেণিকক্ষের ফুটেজ কেন এত মূল্যবান

মেশিন লার্নিংয়ের দৃষ্টিকোণ থেকে, শ্রেণিকক্ষ পরিবেশ তথ্যসমৃদ্ধ। এতে থাকে ধারাবাহিক মিথস্ক্রিয়া, ভাষার ব্যবহার, অঙ্গভঙ্গি, মনোযোগের স্থানান্তর, বস্তু পরিচালনা, এবং সামাজিক সমন্বয়। শিক্ষকের প্রথম-ব্যক্তি ভিডিও এগুলোর অনেকটাই এমন একটি দৃষ্টিভঙ্গি থেকে ধারণ করতে পারে, যা অনুকরণ করা কঠিন। দেহনির্ভর সিস্টেম, নির্দেশনামূলক মডেলিং, বা দৃশ্য বোঝাপড়ায় আগ্রহী AI ডেভেলপারদের জন্য, এই ধরনের ডেটা বিশেষভাবে আকর্ষণীয় হতে পারে।

কিন্তু যে বৈশিষ্ট্যগুলো ফুটেজকে কার্যকর করে, সেগুলোই এটিকে সংবেদনশীলও করে তোলে। প্রিস্কুল শ্রেণিকক্ষে এমন শিশু থাকে যারা অর্থবহভাবে সম্মতি দিতে পারে না, শিক্ষক থাকেন যারা শৃঙ্খলা ও যত্ন সামলানোর সময় রেকর্ড হতে পারেন, এবং প্রতিষ্ঠানগুলোকে একটি সুরক্ষিত পরিবেশ প্রদান করতে প্রত্যাশা করা হয়। সেখানে সংগৃহীত ডেটা রাস্তার ফুটেজ, পাবলিক ওয়েব টেক্সট, বা সাধারণ কর্মক্ষেত্রের ভিডিওর সঙ্গে বিনিময়যোগ্য নয়।

বিস্তৃত শাসন-ঘাটতি

এই ঘটনা AI উন্নয়নের একটি বিস্তৃত ধারা প্রতিফলিত করে: উচ্চমানের, আরও বাস্তবসম্মত প্রশিক্ষণ ডেটার অনুসন্ধান ক্রমশ শক্তিশালী নৈতিক সীমাবদ্ধতাযুক্ত প্রেক্ষাপটে ঢুকে পড়ছে। স্বাস্থ্যসেবা, শিক্ষা, কর্মসংস্থান, এবং গৃহজীবন সবখানেই এমন সূক্ষ্ম আচরণগত ডেটা রয়েছে যা উন্নত মডেল উপকৃত হতে পারে। এগুলোই আবার এমন ক্ষেত্র যেখানে অপব্যবহার, ভুল বোঝাবুঝি, বা দুর্বল শাসন বিশাল পরিণতি ডেকে আনতে পারে।

এর মানে এই নয় যে এমন গবেষণা কখনোই হওয়া উচিত নয়। এর মানে হলো, সাধারণ সফটওয়্যার পরীক্ষার তুলনায় স্বচ্ছতার মানদণ্ড অনেক উঁচু হওয়া দরকার। প্রতিষ্ঠানগুলোর কেবল এই প্রশ্নই নয় যে একটি গবেষণা ন্যূনতম প্রক্রিয়াগত শর্ত পূরণ করছে কি না, বরং মানুষ যখন বুঝবে সিস্টেমটি কীসের জন্য, তখনও তথ্য সংগ্রহের পদ্ধতি কি ন্যায্যভাবে সমর্থনযোগ্য থাকবে কি না, সেটিও ভেবে দেখা উচিত।

AI-র পরবর্তী ডেটা সীমান্ত সম্পর্কে এটি কী প্রকাশ করে

AI নিয়ে জনআলোচনায় প্রায়শই মডেল প্রকাশের পরের দিকেই বেশি নজর থাকে: তারা কী করতে পারে, কীভাবে ব্যর্থ হয়, তারা পক্ষপাতদুষ্ট কি না, এবং কীভাবে নিয়ন্ত্রিত হওয়া উচিত। প্রশিক্ষণ ডেটা কোথা থেকে আসে, যখন সহজ ইন্টারনেট-স্কেল উৎস আর যথেষ্ট নয়, সেই upstream প্রশ্নে অনেক কম মনোযোগ দেওয়া হয়।

প্রিস্কুল-ক্যামেরা প্রস্তাব একটি স্পষ্ট উত্তর দেয়। ল্যাব এবং বিশ্ববিদ্যালয়গুলো যখন আরও সমৃদ্ধ সংকেত খুঁজবে, তখন তারা ক্রমশ এমন সংগঠিত বাস্তবজগতের পরিবেশ লক্ষ্য করতে পারে, যেখানে পারস্পরিক মিথস্ক্রিয়া এবং প্রসঙ্গভিত্তিক তথ্য রয়েছে। সেই পরিবর্তন আরও ভালো সিস্টেম দিতে পারে। তবে যদি ডেটা সংগ্রহ প্রতিষ্ঠানগুলোর ব্যাখ্যা ও ন্যায্যতা দেওয়ার সক্ষমতার চেয়ে দ্রুত প্রসারিত হয়, তবে তা প্রতিক্রিয়ার এক চক্রও তৈরি করতে পারে।

মানদণ্ড স্থির হওয়ার আগেই একটি সতর্কবার্তা

এই মামলাটি গুরুত্বপূর্ণ শুধু এই কারণে নয় যে নির্দিষ্ট গবেষণাটি এগোয় কি না। এটি একটি প্রাথমিক সতর্কবার্তা দেয় যে শিক্ষামূলক স্থানগুলো কীভাবে AI পাইপলাইনে টেনে আনা হতে পারে। একবার গবেষণা দলগুলো প্রমাণ করে যে অত্যন্ত সংবেদনশীল পরিবেশও মডেল উন্নয়নের জন্য ন্যায্য খেলা, তখন একই ধরনের প্রচেষ্টাকে অন্যত্র স্বাভাবিক করার চাপ বাড়বে।

অভিভাবকদের কাছে বর্ণিত নথিগুলো রেকর্ডিং সেশনগুলোকে সাধারণ এবং ন্যূনতম বিঘ্নকারী হিসেবে উপস্থাপন করেছিল। এক অর্থে, দায়িত্বশীল পর্যবেক্ষণমূলক গবেষণার লক্ষ্যও সেটিই। আরেক অর্থে, কেন আরও কঠোর নজরদারি দরকার, সেটাই সম্ভবত এর মাধ্যমে সবচেয়ে ভালো বোঝা যায়। দৈনন্দিন জীবনে AI ডেটা সংগ্রহ যত বেশি অদৃশ্য হবে, স্বয়ংক্রিয়ভাবে বিস্তৃত হওয়ার আগেই সেই কাজের সীমা কোথায় হওয়া উচিত তা নির্ধারণ করা ততই জরুরি হয়ে উঠবে।

প্রিস্কুল শ্রেণিকক্ষ সেই সীমা সতর্কভাবে নির্ধারণ করার সবচেয়ে স্পষ্ট স্থানগুলোর একটি। এই প্রস্তাব দেখায় যে বিতর্ক ইতিমধ্যেই শুরু হয়ে গেছে।

এই নিবন্ধটি 404 Media-র প্রতিবেদনের ভিত্তিতে লেখা। মূল নিবন্ধটি পড়ুন.

Originally published on 404media.co