উন্নত AI-এর পরীক্ষাক্ষেত্র হয়ে উঠছে গণিত
ওপেনএআই গবেষক Sebastian Bubeck এবং Ernest Ryu স্পষ্টভাবে দেখাচ্ছেন কেন কৃত্রিম সাধারণ বুদ্ধিমত্তা নিয়ে আলোচনার কেন্দ্রে এখন গণিত। The Decoder-এ রিপোর্ট করা সাম্প্রতিক একটি OpenAI Podcast আলোচনায় দুজন গবেষকই গণিতকে শুধু ভাষা মডেলের জন্য একটি কঠিন ক্ষেত্র হিসেবে দেখেননি। তারা এটিকে এমন একটি সংক্ষিপ্ত stress test হিসেবে উপস্থাপন করেছেন, যা সাধারণভাবে বুদ্ধিমান একটি সিস্টেমের জন্য প্রয়োজনীয় বিস্তৃত সক্ষমতাগুলো যাচাই করে।
এই যুক্তি গণিতের কাজের প্রকৃতি থেকেই আসে। প্রমাণের জন্য দীর্ঘ, অভ্যন্তরীণভাবে সুসঙ্গত যুক্তি দরকার, যা অনেক সময় দীর্ঘ সময় ধরে বজায় রাখতে হয়। একটি ভুল পুরো চিন্তার ধারাকে অকার্যকর করে দিতে পারে। সেই অর্থে, গণিত শুধু আরেকটি benchmark নয়। এটি এমন একটি ক্ষেত্র, যেখানে সাফল্য fluency নয়, বরং নির্ভরযোগ্যতা, আত্ম-সংশোধন এবং অধ্যবসায়ের ওপর নির্ভর করে।
মডেলের ক্ষমতায় দ্রুত পরিবর্তন
Bubeck বলেছেন, পরিবর্তনের গতি ছিল বিস্ময়কর। তিনি স্মরণ করেছেন যে মাত্র চার বছর আগে Google-এর Minerva model দিয়ে coordinate system-এ points-এর ওপর দিয়ে একটি রেখা টানতে দেখেই তিনি মুগ্ধ হয়েছিলেন। দুই বছর আগে, reasoning-focused মডেলগুলো আজকের মতো ক্ষেত্রকে এগিয়ে নিয়ে যাওয়ার অবস্থায় ছিল না। আজ, তিনি বলেন, এই সিস্টেমগুলো Fields Medal বিজয়ীদের মতো শীর্ষ গণিতবিদদের দৈনন্দিন কাজে সহায়তা করছে।
এই অগ্রগতি গুরুত্বপূর্ণ, কারণ গণিতকে দীর্ঘদিন ধরে AI-এর জন্য সবচেয়ে কঠিন ক্ষেত্রগুলোর একটি হিসেবে দেখা হয়েছে। Bubeck-এর মতে, 18 মাস আগে একটি সম্মেলনে বেশিরভাগ গণিতবিদই মনে করতেন যে বড় আকারে scaled-up large language models ওপেন গবেষণার সমস্যায় সাহায্য করতে পারবে না। তাই সন্দেহ থেকে ব্যবহারিক প্রয়োগে যাওয়ার পথটি খুবই সংকুচিত সময়ের মধ্যে অতিক্রান্ত হয়েছে।
সহায়ক থেকে গবেষণা অংশীদার
Ryu এই পরিবর্তনের একটি বাস্তব উদাহরণ দেন। UCLA-র সাবেক গণিত অধ্যাপক হিসেবে তিনি বলেন, optimization theory-তে Nesterov’s method নিয়ে 42 বছরের পুরোনো একটি ওপেন সমস্যার সমাধান তিনি ChatGPT-এর সাহায্যে টানা তিন সন্ধ্যায়, মোট প্রায় 12 ঘণ্টায়, করতে পেরেছিলেন। মডেল ব্যবহার করার আগে তিনি ইতিমধ্যে 40 ঘণ্টার বেশি সময় ব্যয় করেছিলেন, কিন্তু সমাধান পাননি।
তার বর্ণনাটি কাজের ভাগাভাগি সম্পর্কে যা বলে, তা উল্লেখযোগ্য। Ryu মডেলকে কোনো ত্রুটিহীন oracle হিসেবে বর্ণনা করেননি। তিনি একজন verifier-এর ভূমিকা নিয়েছিলেন, ভুল ধরছিলেন এবং কথোপকথনকে আরও সম্ভাবনাময় দিকে নিয়ে যাচ্ছিলেন। এই framing গুরুত্বপূর্ণ। এই বর্ণনায় সিস্টেমের মূল্য হলো অনুসন্ধানকে দ্রুত করা এবং কার্যকর পথ প্রস্তাব করা, আর যাচাইয়ের দায়িত্ব মানবের ওপর থাকে।
AGI বিতর্কে গণিত কেন মানানসই
Bubeck-এর বিস্তৃত দাবি হলো, গণিত AGI benchmark হিসেবে কাজ করে কারণ এটি অন্য কঠিন বৈজ্ঞানিক ও প্রযুক্তিগত ক্ষেত্রগুলোর জন্য প্রয়োজনীয় একই উপাদানগুলো দাবি করে। দীর্ঘ প্রমাণ ধরে রাখতে সক্ষম একটি সিস্টেমকে মনোযোগ ধরে রাখতে, অভ্যন্তরীণ সামঞ্জস্য বজায় রাখতে, ভুল শনাক্ত করতে এবং নিজের যুক্তি সংশোধন করতে পারতে হবে। এগুলো গণিত-নির্দিষ্ট কৌশল নয়; এগুলো স্থানান্তরযোগ্য সক্ষমতা।
তিনি গণিত শেখাকে মানুষের শিক্ষার সঙ্গেও তুলনা করেছেন। ছাত্রদের গণিত শেখানো হয় শুধু এই কারণে নয় যে সবাই professional mathematician হবে, বরং শৃঙ্খলাবদ্ধ চিন্তার একটি ধরন গড়ে তোলার জন্য। একইভাবে, মডেলকে গণিতে প্রশিক্ষণ দিলে এমন reasoning habits তৈরি হতে পারে, যা biology এবং materials science-এর মতো ক্ষেত্রেও কাজে লাগবে।
গণিতের আরেকটি সুবিধা হলো: মূল্যায়ন খুব স্পষ্ট। সমস্যাগুলো সাধারণত সুস্পষ্টভাবে নির্ধারিত, এবং উত্তর যাচাই করা যায়। অস্পষ্ট benchmark আর বিতর্কিত দাবিতে ভরা এক ক্ষেত্রে, এটি অগ্রগতি মাপার জন্য তুলনামূলকভাবে পরিষ্কার পরিবেশ দেয়।
“AGI time” ধারণা
Bubeck যে আকর্ষণীয় ধারণাগুলোর একটি তুলে ধরেছেন, তা হলো “AGI time”. কোনো মডেল কতক্ষণ পর্যন্ত একটানা যুক্তির সমতুল্য ধারাকে কার্যকরভাবে ধরে রাখতে পারে, তা বোঝাতে তিনি এই শব্দটি ব্যবহার করেন। দুই বছর আগে, তিনি বলেন, সিস্টেমগুলো এই ধরনের চিন্তা minutes ধরে simulate করতে পারত। এখন তারা তা days বা এমনকি এক সপ্তাহ পর্যন্ত করতে পারে। পরবর্তী লক্ষ্য হলো সেই সীমাকে weeks এবং months পর্যন্ত বাড়ানো।
এটি একটি কার্যকর framing, কারণ এটি আলোচনাকে একবারের benchmark score থেকে endurance-এর দিকে সরিয়ে নেয়। ভবিষ্যতের সিস্টেম যদি automated researcher হিসেবে কাজ করে, তাহলে তাদের শুধু একক কাজ সমাধান করলেই হবে না, দীর্ঘ সময় ধরে উৎপাদনশীল থাকতে হবে। তাই “AGI time” বাড়ানো নিছক slogan নয়। এটি একটি নির্দিষ্ট উন্নয়ন লক্ষ্য নির্দেশ করে।
স্বয়ংক্রিয় গবেষকের লক্ষ্য
গবেষকরা বলেছেন, OpenAI একটি “automated researcher” নির্মাণ করছে, যা দীর্ঘ সময় ধরে কিছুটা স্বাধীনতার সঙ্গে সমস্যার ওপর কাজ করতে পারবে। তারা আরও বলেছেন, এর ভিত্তিগত training methods গণিতের জন্য বিশেষ নয়, বরং সাধারণ। যদি তা সত্য হয়, তাহলে গণিতে প্রথমে দেখা অগ্রগতি পরে অন্যান্য বৈজ্ঞানিক ক্ষেত্রে ছড়িয়ে পড়তে পারে।
এর মানে এই নয় যে পথটি সম্পূর্ণ নির্ধারিত। গণিতগত অগ্রগতি আসলে কী প্রমাণ করে, বিশেষ করে বিখ্যাত ওপেন সমস্যাগুলো এবং বর্তমান সিস্টেমের মানব scaffolding-এর প্রয়োজন কতটা, তা নিয়ে বিতর্ক চলবে। কিন্তু আলোচনা এখন স্পষ্টভাবেই শুধু arithmetic বা contest-style novelty-র বাইরে গেছে। মূল প্রশ্ন হলো, AI কি সেই দীর্ঘ reasoning work-এ নির্ভরযোগ্য হতে পারে, যা গুরুতর গবেষণার জন্য প্রয়োজন?
যদি গণিত সেই রূপান্তরের পরীক্ষাক্ষেত্র হয়, তাহলে Bubeck এবং Ryu-র যুক্তি সরল: বৃহত্তর machine intelligence-এর পথ মানবেরা যে সবচেয়ে কঠিন disciplined thinking তৈরি করেছে, তার মধ্য দিয়েই যেতে পারে।
এই নিবন্ধটি The Decoder-এর প্রতিবেদনের ভিত্তিতে। মূল নিবন্ধটি পড়ুন.
Originally published on the-decoder.com


