एखाद्या घटकाशी काय जुळते हे विचारण्याचे दोन मार्ग
चिकनसोबत काय जुळते असे विचारले तर किमान दोन बरोबर उत्तरे असू शकतात. एक पाककलेशी संबंधित: प्रत्यक्ष रेसिपींमध्ये कोणते घटक चिकनसोबत येतात. दुसरे रासायनिक: कोणते घटक अणुगत पातळीवर समान चवीचे प्रोफाइल शेअर करतात. Kaikaku.AI ने अधोरेखित केलेले नवे संशोधन म्हणते की अनेक AI प्रणाली ही दोन उत्तरे एकत्र मिसळतात, आणि त्यामुळे एक महत्त्वाचा फरक लपतो.
कंपनीच्या नव्या कामात Epicure या नावाने तीन जवळचे मॉडेल्स सादर केले आहेत. Cooc हे मॉडेल फक्त recipe co-occurrence वर प्रशिक्षित आहे. Chem हे मॉडेल फक्त FlavorDB chemistry database वापरून shared flavor molecules वर प्रशिक्षित आहे. Core हे तिसरे मॉडेल दोन्ही पद्धती एकत्र करते.
हा फरक का महत्त्वाचा आहे
सोप्या प्रश्नांमध्ये फरक लगेच दिसून येतो. स्रोत मजकुरानुसार, Cooc “chicken” साठी garlic, onion आणि black pepper सारखे घटक दाखवते, म्हणजे स्वयंपाकात काय नेहमी एकत्र वापरले जाते ते. त्याच्या उलट Chem beef किंवा pork सारखे घटक परत देते, जे कदाचित सर्वात सामान्य रेसिपी सोबती नसतील, पण अणुगत चव-प्रोफाइलमध्ये जवळचे आहेत.
हर्ब्समध्येही तोच पॅटर्न दिसतो. “basil” साठी Cooc parsley, olive oil आणि parmesan सारखे परिचित वापर-परिस्थितींशी संबंधित घटक सुचवते. Chem basil ला oregano, tarragon आणि rosemary सारख्या flavor relatives बरोबर गटबद्ध करते. दुसऱ्या शब्दांत, एक मॉडेल cookbook सारखे वागते, तर दुसरे chemistry map सारखे.
डेटाचा आकार आणि बहुभाषिक व्याप्ती
Epicure ला सात भाषांमध्ये, Chinese, Russian, Vietnamese, Turkish, Indonesian आणि German यांसह, 11 स्रोतांमधील 4.14 दशलक्ष रेसिपींवर प्रशिक्षित केले गेले. ही बहुभाषिक व्याप्ती प्रकल्पाच्या उपयुक्ततेच्या दाव्यातील महत्त्वाचा भाग आहे. अनेक food datasets इंग्रजी-भाषी स्रोतांकडे झुकतात, त्यामुळे प्रादेशिक पाककृती सपाट होऊ शकतात आणि पाश्चिमात्य स्वयंपाक पद्धतींचे प्रमाण जास्त दिसू शकते.
स्रोत मजकुरात म्हटले आहे की pipeline ने Claude आणि Gemini embeddings वापरून सुमारे 2,00,000 raw ingredient terms चे 1,790 clean ingredient labels मध्ये रूपांतर आणि मानकीकरण करण्यात मदत केली. असा data preparation भाग model design इतका आकर्षक नसतो, पण वास्तविक रचना पकडणे आणि noise वाढवणे यामधला फरक बहुतेक वेळा इथेच ठरतो.
रसायन-प्रथम शिकण्याची अनपेक्षित कामगिरी
संशोधनातील सर्वात रंजक दाव्यांपैकी एक म्हणजे chemistry-driven model प्रशिक्षण डेटामध्ये थेट न दिलेल्या गुणांवरही चांगले काम करते. स्रोत मजकुरानुसार, Chem sweet, sour, bitter अशा वैशिष्ट्यांवर, तसेच protein आणि fat सारख्या nutritional axes वरही अधिक स्पष्टपणे वर्गीकरण करते.
हा निकाल टिकून राहिला, तर molecular relationships व्यापक culinary knowledge साठी संक्षिप्त प्रतिनिधित्व म्हणून काम करू शकतात, असे सूचित होते. केवळ chemistry वर आधारलेले मॉडेलही माणसे घटक कसे ओळखतात, चवीचे आयोजन कसे करतात, आणि शेजारील गुण कसे अंदाज करतात, हे अर्थपूर्ण रीतीने शिकू शकते.
यामुळे काय बदलू शकते
Food AI आतापर्यंत recommendation, substitution आणि content generation यांवर केंद्रित राहिले आहे. पण ही system खूप वेगवेगळे प्रश्न एकाच generic similarity मध्ये मिसळतात. Epicure चे framing सांगते की भविष्यातील tools ना ते कोणत्या प्रकारची similarity optimize करत आहेत हे स्पष्ट करावे लागेल.
Product design मध्ये हा फरक महत्त्वाचा ठरू शकतो. recipe assistant ने co-occurrence आणि cuisine context यांना प्राधान्य द्यायला हवे. formulation किंवा R&D tool ला molecular similarity अधिक महत्त्वाची वाटू शकते. नवीन पदार्थ तयार करणाऱ्या creative system ला दोन्हींत समतोल हवा असेल.
आणखी महत्त्वाचे म्हणजे, हे काम दाखवते की संकुचित वाटणारे domain देखील model design मधील मोठे प्रश्न उघड करू शकतात. Training data फक्त facts भरत नाही. system जगात कोणत्या प्रकारचे संबंध आहेत असे मानतो, हेही ती ठरवते.
अधिक अचूक food intelligence stack
या प्रकल्पाचे व्यापक मूल्य म्हणजे संकल्पनात्मक स्पष्टता. “याच्यासोबत काय जुळते?” हा एकच प्रश्न नाही. ते अनेक प्रश्न आहेत. recipe behavior ला flavor chemistry पासून वेगळे करून Kaikaku.AI सांगत आहे की ingredient intelligence ला एकत्र सरासरीत न मिसळता विभागून पाहिले पाहिजे.
हे niche वाटू शकते, पण AI संशोधनातील मोठ्या पॅटर्नशी ते जुळते. एकाच dataset मधील वेगवेगळ्या संरचना मॉडेल्सनी वेगळ्या ओळखल्या तर ते अधिक उपयुक्त होतात, एकाच score मध्ये त्यांना कोंबले तर नाही. या प्रकरणात, परिणाम culinary knowledge ला स्वच्छ रीतीने समजून घेण्याचा मार्ग देतो: सवयी, अणू, आणि जिथे ते एकत्र येतात ते स्थान.
हा लेख The Decoder च्या वार्तांकनावर आधारित आहे. मूळ लेख वाचा.
Originally published on the-decoder.com




