একটি উপাদানের সঙ্গে কী ভালো যায়, তা জিজ্ঞেস করার দুইটি উপায়
যখন কেউ জিজ্ঞেস করে চিকেনের সঙ্গে কী ভালো যায়, তখন অন্তত দুইটি সঠিক উত্তর থাকে। একটি রন্ধনভিত্তিক: বাস্তব রেসিপিতে কোন উপাদানগুলো চিকেনের সঙ্গে সাধারণত থাকে। অন্যটি রাসায়নিক: কোন উপাদানগুলো আণবিক স্তরে একই ধরনের স্বাদের প্রোফাইল ভাগ করে। Kaikaku.AI-কে ঘিরে নতুন গবেষণা বলছে, অনেক AI সিস্টেম এই দুই উত্তরকে গুলিয়ে ফেলে, আর তাতে একটি গুরুত্বপূর্ণ পার্থক্য ঢাকা পড়ে যায়।
কোম্পানির নতুন কাজ Epicure নামে তিনটি ঘনিষ্ঠ মডেল উপস্থাপন করে। একটি মডেল, Cooc, কেবল recipe co-occurrence-এ প্রশিক্ষিত। আরেকটি, Chem, কেবল FlavorDB chemistry database ব্যবহার করে shared flavor molecules-এ প্রশিক্ষিত। তৃতীয়টি, Core, এই দুই পদ্ধতিকে একত্র করে।
এই পার্থক্য কেন গুরুত্বপূর্ণ
সাধারণ প্রম্প্টেই পার্থক্যটা স্পষ্ট হয়ে ওঠে। উৎস পাঠ্য অনুযায়ী, Cooc “chicken” এর উত্তর হিসেবে garlic, onion এবং black pepper-এর মতো উপাদান দেয়, যা দেখায় রান্নায় কী সাধারণত একসঙ্গে ব্যবহার হয়। অন্যদিকে Chem beef বা pork-এর মতো উপাদান ফেরত দেয়, যেগুলো অবশ্যই সবচেয়ে সাধারণ রেসিপি সঙ্গী নয়, কিন্তু আণবিক স্বাদপ্রোফাইলে আরও কাছাকাছি।
একই ধারা herbs-এর ক্ষেত্রেও দেখা যায়। “basil” এর জন্য Cooc parsley, olive oil এবং parmesan-এর মতো পরিচিত ব্যবহার-পরিস্থিতির সঙ্গে যুক্ত উপাদান দেখায়। Chem basil-কে oregano, tarragon এবং rosemary-এর মতো flavor relatives-এর সঙ্গে গোষ্ঠীবদ্ধ করে। অন্যভাবে বললে, একটি মডেল cookbook-এর মতো, অন্যটি chemistry map-এর মতো আচরণ করে।
ডেটার আকার এবং বহুভাষিক পরিসর
Epicure-কে সাতটি ভাষায়, যার মধ্যে Chinese, Russian, Vietnamese, Turkish, Indonesian এবং German আছে, 11টি উৎস থেকে 4.14 মিলিয়ন রেসিপির ওপর প্রশিক্ষণ দেওয়া হয়েছে। এই বহুভাষিক ব্যাপ্তি প্রকল্পটির প্রাসঙ্গিকতার দাবির একটি বড় অংশ। অনেক খাদ্য ডেটাসেট ইংরেজিভাষী উৎসের দিকে বেশি ঝুঁকে থাকে, ফলে আঞ্চলিক রান্না ম্লান হয়ে যেতে পারে এবং পশ্চিমা রান্নার ধারা অতিরিক্তভাবে প্রতিনিধিত্ব পেতে পারে।
উৎস পাঠ্য বলছে, pipeline Claude এবং Gemini embeddings ব্যবহার করে প্রায় 2,00,000 raw ingredient terms-কে 1,790টি পরিষ্কার করা ingredient labels-এ রূপান্তর ও মানকীকরণে সাহায্য করেছে। এমন data preparation model design-এর মতো আকর্ষণীয় না হলেও, বাস্তব কাঠামো ধরতে পারা আর নয়েজ বাড়ানোর মধ্যে পার্থক্যটা প্রায়ই এখানেই তৈরি হয়।
কেমিস্ট্রি-প্রথম শেখার অপ্রত্যাশিত পারফরম্যান্স
গবেষণার সবচেয়ে আকর্ষণীয় দাবিগুলোর একটি হলো, chemistry-driven model এমন বৈশিষ্ট্যেও ভালো কাজ করে যা প্রশিক্ষণ ডেটায় সরাসরি দেওয়া হয়নি। উৎস পাঠ্য অনুযায়ী, Chem sweet, sour, bitter-এর মতো বৈশিষ্ট্যে এবং protein ও fat-এর মতো nutritional axes-এও স্পষ্টভাবে শ্রেণিবিন্যাস করতে পারে।
এই ফল স্থায়ী হলে, তা ইঙ্গিত করে যে molecular relationships বিস্তৃত culinary knowledge-এর জন্য একটি সংক্ষিপ্ত উপস্থাপন হতে পারে। শুধু chemistry দিয়ে তৈরি একটি মডেলও মানুষেরা উপাদানকে কীভাবে অনুভব করে, স্বাদকে কীভাবে সাজায়, এবং পাশের বৈশিষ্ট্যগুলো কীভাবে অনুমান করে, তা অর্থপূর্ণভাবে শিখতে পারে।
এতে কী বদলাতে পারে
Food AI এখন পর্যন্ত recommendation, substitution এবং content generation-এর দিকে ঝুঁকেছে। কিন্তু এসব system প্রায়ই খুব আলাদা প্রশ্নকে এক ধরনের generic similarity-তে মিশিয়ে ফেলে। Epicure-এর framing দেখায়, ভবিষ্যতের tools-কে স্পষ্ট বলতে হবে তারা কী ধরনের similarity optimize করছে।
Product design-এ এই পার্থক্য গুরুত্বপূর্ণ হতে পারে। একটি recipe assistant-কে co-occurrence এবং cuisine context-কে অগ্রাধিকার দেওয়া উচিত। একটি formulation বা R&D tool molecular similarity-তে বেশি মনোযোগ দিতে পারে। নতুন পদ তৈরি করা creative system-এর জন্য দুটির মধ্যে টিউনযোগ্য ভারসাম্য দরকার হতে পারে।
আরও গুরুত্বপূর্ণ, এই কাজ দেখায় যে ছোট মনে হওয়া domain-ও model design-এর বড় প্রশ্ন তুলে ধরতে পারে। Training data শুধু facts পূরণ করে না। এটি ঠিক করে দেয় system পৃথিবীতে কোন ধরনের সম্পর্ক বিশ্বাস করে।
আরও সুনির্দিষ্ট food intelligence stack
প্রকল্পটির বৃহত্তর মূল্য হলো ধারণাগত স্বচ্ছতা। “এর সঙ্গে কী যায়?” একটিমাত্র সমস্যা নয়। এটি একাধিক সমস্যা। recipe behavior-কে flavor chemistry থেকে আলাদা করে Kaikaku.AI বলছে ingredient intelligence-কে একত্রে গড়িয়ে না দিয়ে ভেঙে দেখা উচিত।
এটি niche শোনালেও AI গবেষণার একটি বড় ধারা তুলে ধরে। যখন একটি dataset-এর ভিন্ন গঠনগুলো models আলাদা করে চিনতে পারে, তখন তারা আরও কাজে লাগে, একক score-এ সব গুলিয়ে ফেললে নয়। এই ক্ষেত্রে, ফলাফলটি culinary knowledge-কে আরও পরিষ্কারভাবে বোঝার উপায় দেয়: অভ্যাস, অণু, এবং যেখানে তারা মিলিত হয়।
এই নিবন্ধটি The Decoder-এর রিপোর্টিংয়ের ভিত্তিতে লেখা। মূল নিবন্ধ পড়ুন.
Originally published on the-decoder.com




