ஒரு பொருளுடன் என்ன பொருந்தும் என்று கேட்க இரண்டு வழிகள்

சிக்கனுடன் என்ன பொருந்தும் என்று ஒருவர் கேட்டால், குறைந்தது இரண்டு சரியான பதில்கள் உள்ளன. ஒன்று சமையலியல்: உண்மையான ரெசிபிகளில் சிக்கனுடன் சேர்ந்து வரும் பொருட்கள் எவை. மற்றொன்று இரசாயன ரீதியானது: மூலக்கூறு மட்டத்தில் ஒத்த சுவை சுயவிவரம் பகிரும் பொருட்கள் எவை. Kaikaku.AI முன்னிறுத்தும் புதிய ஆய்வு, பல AI அமைப்புகள் இந்த இரண்டு பதில்களையும் ஒன்றாகக் கலக்கிவிடுகின்றன; அதனால் ஒரு முக்கிய வேறுபாடு மறைக்கப்படுகிறது என்று வாதிடுகிறது.

அந்நிறுவனத்தின் புதிய பணியில் Epicure என்ற பெயரில் மூன்று நெருங்கிய தொடர்புடைய மாதிரிகள் அறிமுகப்படுத்தப்படுகின்றன. Cooc என்ற ஒரு மாதிரி, ரெசிபி co-occurrence-இல் மட்டும் பயிற்சி பெறுகிறது. Chem என்ற மற்றொரு மாதிரி, FlavorDB இரசாயனத் தரவுத்தளத்தைப் பயன்படுத்தி பகிரப்பட்ட சுவை மூலக்கூறுகளில் மட்டும் பயிற்சி பெறுகிறது. Core என்ற மூன்றாவது மாதிரி, இரண்டையும் இணைக்கிறது.

இந்த வேறுபாடு ஏன் முக்கியம்

எளிய கேள்விகளில் வேறுபாடு தெளிவாகத் தெரிகிறது. மூலம் உரையின் படி, Cooc “chicken” என்றால் garlic, onion மற்றும் black pepper போன்ற பொருட்களைத் திருப்பிக் கொடுக்கிறது; இது சமையல்காரர்கள் வழக்கமாக என்னவற்றை சேர்க்கிறார்கள் என்பதைக் காட்டுகிறது. அதற்கு மாறாக Chem beef அல்லது pork போன்றவற்றைக் காட்டுகிறது; அவை மிகச் சாதாரணமான ரெசிபி கூட்டிணைவுகள் அல்ல என்றாலும், மூலக்கூறு சுவை சுயவிவரத்தில் அருகிலுள்ளவை.

அதே மாதிரி மூலிகைகளிலும் தெரிகிறது. “basil” என்றால் Cooc parsley, olive oil மற்றும் parmesan போன்ற பழக்கமான பயன்பாடுகளோடு தொடர்புடைய பொருட்களைச் சொல்கிறது. Chem basil-ஐ oregano, tarragon மற்றும் rosemary போன்ற சுவை உறவுகளுடன் குழுவாக்குகிறது. மற்றொரு வார்த்தையில், ஒரு மாதிரி சமையல் புத்தகம் போல நடக்கிறது; மற்றொன்று இரசாயன வரைபடம் போல.

தரவின் அளவும் பன்மொழி பரப்பும்

Epicure 11 மூலங்களிலிருந்து, ஏழு மொழிகளில், சீனம், ரஷ்யம், வியட்நாமீஸ், துருக்கி, இந்தோனேசியன் மற்றும் ஜெர்மன் உள்ளிட்ட மொழிகளில் உள்ள 4.14 மில்லியன் ரெசிபிகளில் பயிற்சி பெற்றது. இந்த பன்மொழி பரப்பு, திட்டத்தின் பொருத்தத்தைக் குறிக்கும் முக்கிய பகுதி. பல உணவு தரவுத் தொகுப்புகள் ஆங்கில மூலங்களுக்கு அதிகமாக சாய்ந்துள்ளன; அதனால் பிராந்திய சமையல்கள் மங்கிப் போகலாம், மேற்கத்திய சமையல் முறைமைகள் அதிகமாக பிரதிநிதித்துவம் பெறலாம்.

மூல உரை கூறுவதாவது, பணிப்பாதை Claude மற்றும் Gemini embeddings-ஐப் பயன்படுத்தி, சுமார் 200,000 மூல ingredient terms-ஐ 1,790 சுத்திகரிக்கப்பட்ட ingredient labels-ஆக மாற்றவும் ஒரே மாதிரியாக்கவும் உதவியது. அத்தகைய data preparation, model design போல கவர்ச்சியாகத் தெரியாது; ஆனால் அது தான் ஒரு அமைப்பு உண்மையான கட்டமைப்பைப் பிடிக்கிறதா அல்லது இரைச்சலைப் பெருக்குகிறதா என்பதை தீர்மானிக்கிறது.

இரசாயன-முதன்மை கற்றலின் எதிர்பாராத செயல்திறன்

ஆய்வின் சுவாரசியமான கூற்றுகளில் ஒன்று, பயிற்சி தரவுகளில் நேரடியாகக் குறியாக்கப்படாத பண்புகளில்கூட இரசாயன-ஆதார மாதிரி நன்றாக செயல்படுகிறது என்பதாகும். மூலம் உரையின் படி, Chem sweet, sour, bitter போன்ற அம்சங்களிலும், protein மற்றும் fat போன்ற ஊட்டச்சத்து அச்சுகளிலும் தெளிவாக வகைப்படுத்துகிறது.

இந்த முடிவு நிலைத்தால், மூலக்கூறு உறவுகள் விரிவான சமையல் அறிவுக்கான சுருக்கமான பிரதிநிதியாக செயல்படலாம் என்பதை அது சுட்டிக்காட்டுகிறது. இரசாயனத்தை மட்டுமே கொண்டு உருவாக்கப்பட்ட மாதிரியும், மனிதர்கள் பொருட்களை எவ்வாறு உணர்கிறார்கள், சுவையை எவ்வாறு ஒழுங்குபடுத்துகிறார்கள், மற்றும் அருகிலுள்ள பண்புகளை எவ்வாறு கணிக்கிறார்கள் என்பதை அர்த்தமுள்ள வகையில் கற்றுக்கொள்ள முடியும்.

இதனால் என்ன மாறலாம்

Food AI இதுவரை பரிந்துரை, மாற்றீடு மற்றும் உள்ளடக்க உருவாக்கத்தில் கவனம் செலுத்தியுள்ளது. ஆனால் இந்த அமைப்புகள் முற்றிலும் வேறுபட்ட கேள்விகளை ஒரே பொதுவான similarity என்ற கருத்தில் ஒன்றாக்கிவிடுகின்றன. Epicure-ன் கட்டமைப்பு, எதிர்கால கருவிகள் தாங்கள் எந்த வகை ஒற்றுமையை மேம்படுத்துகின்றன என்பதில் வெளிப்படையாக இருக்க வேண்டுமென்று சொல்கிறது.

தயாரிப்பு வடிவமைப்பில் இந்த வேறுபாடு முக்கியமானதாக இருக்கலாம். ஒரு recipe assistant co-occurrence மற்றும் cuisine context-ஐ முன்னுரிமை கொடுக்க வேண்டும். ஒரு formulation அல்லது R&D கருவி molecular similarity-யை அதிகம் கவனிக்கலாம். புதிய உணவுகளை உருவாக்கும் சிருஷ்டிப்பூர்வ அமைப்புக்கு இரண்டிற்கும் இடையிலான சமநிலை தேவைப்படலாம்.

மேலும் முக்கியமாக, இந்தப் பணி குறுகியதாகத் தோன்றும் துறைகள்கூட model design-இன் பெரிய சிக்கல்களை வெளிப்படுத்த முடியும் என்பதை காட்டுகிறது. பயிற்சி தரவு வெறும் facts-ஐ மட்டும் நிரப்புவதில்லை. அமைப்பு உலகில் என்ன வகையான உறவு உள்ளது என்று நம்புகிறது என்பதையும் அது தீர்மானிக்கிறது.

மேலும் துல்லியமான food intelligence stack

இந்த திட்டத்தின் பரந்த மதிப்பு கருத்துத் தெளிவுதான். “இதுடன் என்ன பொருந்தும்?” என்பது ஒரே பிரச்சினை அல்ல. அது பல பிரச்சினைகள். recipe behavior-ஐ flavor chemistry-யிலிருந்து பிரிப்பதன் மூலம், Kaikaku.AI ingredient intelligence-ஐ ஒன்றாக average செய்வதைவிட பகுத்து பார்க்க வேண்டும் என்ற வாதத்தை முன்வைக்கிறது.

இது குறுகியதாகத் தோன்றலாம்; ஆனால் AI ஆராய்ச்சியில் பரவலாக காணப்படும் முறை இதுதான். ஒரு dataset-இல் உள்ள வேறுபட்ட கட்டமைப்புகளை மாதிரிகள் பிரித்தறியும்போது, அவற்றை ஒரே score-ஆக சுருக்குவதைக் காட்டிலும் பயனுள்ளதாக மாறுகின்றன. இந்தச் சூழலில், அதன் விளைவு சமையல் அறிவைப் பற்றி சுத்தமான முறையில் சிந்திக்க உதவுகிறது: பழக்கங்கள், மூலக்கூறுகள், மற்றும் அவை இணையும் இடம்.

இந்தக் கட்டுரை The Decoder செய்தியினை அடிப்படையாகக் கொண்டது. மூலக் கட்டுரையைப் படிக்கவும்.

Originally published on the-decoder.com