ఒక పదార్థానికి ఏమి సరిపోతుందో అడగడానికి రెండు మార్గాలు
చికెన్కు ఏమి సరిపోతుంది అని ఎవరు అడిగినా, కనీసం రెండు సరైన సమాధానాలు ఉంటాయి. ఒకటి వంటక సంబంధమైనది: నిజమైన రెసిపీల్లో చికెన్తో కలిసి కనిపించే పదార్థాలు ఏవి. మరొకటి రసాయన సంబంధమైనది: అణు స్థాయిలో సమానమైన ఫ్లేవర్ ప్రొఫైల్ను పంచుకునే పదార్థాలు ఏవి. Kaikaku.AI హైలైట్ చేసిన కొత్త పరిశోధనలో, అనేక AI సిస్టమ్స్ ఈ రెండు సమాధానాలను కలిపేస్తున్నాయని, దాంతో ఒక ముఖ్యమైన తేడా కనిపించకుండా పోతుందని వాదిస్తోంది.
కంపెనీ的新 పనిలో Epicure అనే పేరుతో మూడు దగ్గరగా సంబంధించిన మోడళ్లు ఉన్నాయి. Cooc అనే ఒక మోడల్ కేవలం recipe co-occurrence మీదనే ట్రెయిన్ చేయబడింది. Chem అనే మరో మోడల్ FlavorDB కెమిస్ట్రీ డేటాబేస్ను ఉపయోగించి shared flavor molecules మీద మాత్రమే ట్రెయిన్ చేయబడింది. Core అనే మూడవది ఈ రెండు విధానాలను కలుపుతుంది.
ఈ తేడా ఎందుకు ముఖ్యం
సాధారణ ప్రాంప్ట్లలో తేడా స్పష్టంగా కనిపిస్తుంది. మూల పాఠ్యం ప్రకారం, Cooc “chicken” కు garlic, onion, black pepper వంటి పదార్థాలను ఇస్తుంది, అంటే వంటకాలు సాధారణంగా ఏమిని కలిసి ఉపయోగిస్తాయో చూపిస్తుంది. Chem మాత్రం beef లేదా pork వంటి పదార్థాలను ఇస్తుంది, అవి తప్పనిసరిగా అత్యంత సాధారణ రెసిపీ సహచరాలు కాకపోయినా, మాలిక్యులర్ ఫ్లేవర్ ప్రొఫైల్లో దగ్గరగా ఉంటాయి.
అదే నమూనా herbs విషయంలోనూ కనిపిస్తుంది. “basil” కోసం Cooc parsley, olive oil, parmesan వంటి పరిచిత వినియోగ సందర్భాలతో సంబంధమైన పదార్థాలను సూచిస్తుంది. Chem basilను oregano, tarragon, rosemary వంటి flavor relativesతో సమూహీకరిస్తుంది. మరొక మాటలో చెప్పాలంటే, ఒక మోడల్ cookbookలా ప్రవర్తిస్తుంది; మరొకటి chemistry mapలా.
డేటా పరిమాణం మరియు బహుభాషా వ్యాప్తి
Epicureను ఏడు భాషల్లో, Chinese, Russian, Vietnamese, Turkish, Indonesian, German సహా, 11 sources నుండి 4.14 మిలియన్ రెసిపీలపై ట్రెయిన్ చేశారు. ఈ బహుభాషా వ్యాప్తి ప్రాజెక్ట్ ప్రాముఖ్యతలో కీలక భాగం. అనేక food datasets ఇంగ్లిష్ మూలాల వైపు ఎక్కువగా వాలుతాయి, దాంతో ప్రాంతీయ వంటకాలు సరిగా ప్రతిబింబించకపోవచ్చు మరియు Western cooking patterns అధికంగా కనిపించవచ్చు.
మూల పాఠ్యం ప్రకారం, pipeline Claude మరియు Gemini embeddingsను ఉపయోగించి సుమారు 200,000 raw ingredient termsను 1,790 clean చేసిన ingredient labelsగా మార్పు చేయడంలో సహాయపడింది. ఆ data preparation model design అంత ఆకర్షణీయంగా కనిపించకపోయినా, అది system నిజమైన structureను పట్టుకుంటుందా లేదా noiseను పెంచుతుందా అన్న దానిలో కీలకం.
కెమిస్ట్రీ-ముందుగా నేర్చుకోవడం నుంచి ఆశ్చర్యకరమైన పనితీరు
ఆ పరిశోధనలో అత్యంత ఆసక్తికరమైన వాదనలలో ఒకటి, chemistry-driven model training dataలో నేరుగా ఇవ్వని లక్షణాలపై కూడా బాగా పనిచేస్తుందని చెప్పడం. మూల పాఠ్యం ప్రకారం, Chem sweet, sour, bitter వంటి లక్షణాలతో పాటు protein, fat వంటి nutritional axes లో కూడా స్పష్టంగా వర్గీకరిస్తుంది.
ఈ ఫలితం నిలబడితే, molecular relationships broader culinary knowledge కోసం సంక్షిప్త ప్రతినిధిగా పనిచేయగలవని సూచిస్తుంది. కేవలం chemistry మీద నిర్మితమైన మోడల్ కూడా మనుషులు పదార్థాలను ఎలా గ్రహిస్తారు, flavorను ఎలా క్రమబద్ధీకరిస్తారు, మరియు పక్కన ఉన్న లక్షణాలను ఎలా ఊహిస్తారు అన్న దానిపై అర్థవంతమైన అవగాహన పొందగలదు.
ఇది ఏమి మార్చగలదు
Food AI ఇప్పటివరకు recommendation, substitution, content generation మీద దృష్టి పెట్టింది. కానీ ఈ systems తరచూ చాలా భిన్నమైన ప్రశ్నలను ఒకే generic similarity భావనలో కలిపేస్తాయి. Epicure framing భవిష్యత్ tools ఏ రకమైన similarityని optimize చేస్తున్నాయో స్పష్టంగా చెప్పాల్సిన అవసరం ఉందని సూచిస్తోంది.
Product designలో ఆ తేడా ముఖ్యం. ఒక recipe assistant co-occurrence మరియు cuisine contextను ఎక్కువగా ప్రాధాన్యం ఇవ్వాలి. ఒక formulation లేదా R&D tool molecular similarityను ఎక్కువగా పట్టించుకోవచ్చు. కొత్త dishes సృష్టించే creative systemకు రెండింటి మధ్య సర్దుబాటు అవసరమవచ్చు.
ఇంకా ముఖ్యంగా, ఈ పని చిన్నదిగా కనిపించే domains కూడా model designలో పెద్ద సమస్యలను బయటపెట్టగలవని చూపిస్తోంది. Training data కేవలం factsను నింపదు. system ప్రపంచంలో ఏ రకమైన సంబంధం ఉందని నమ్ముతుందో కూడా అది నిర్ణయిస్తుంది.
మరింత ఖచ్చితమైన food intelligence stack
ఈ ప్రాజెక్ట్ యొక్క విస్తృత విలువ conceptual clarity. “దీనితో ఏమి సరిపోతుంది?” అనే ప్రశ్న ఒకటే సమస్య కాదు. అది అనేక సమస్యలు. recipe behaviorను flavor chemistry నుంచి వేరు చేసి, Kaikaku.AI ingredient intelligenceను ఒకటిగా average చేయకుండా విభజించి చూడాలని వాదిస్తోంది.
ఇది nicheగా అనిపించవచ్చు, కానీ AI పరిశోధనలో పెద్ద patternకు సరిపోతుంది. ఒక datasetలోని వేర్వేరు structuresను models వేరుగా గుర్తించినప్పుడు అవి మరింత ఉపయోగకరంగా మారతాయి, వాటిని ఒకే scoreగా కుదించడంతో పోల్చితే. ఈ సందర్భంలో, ఫలితం culinary knowledgeను మరింత శుభ్రంగా ఆలోచించడానికి సహాయపడుతుంది: habits, molecules, మరియు అవి కలిసే స్థలం.
ఈ వ్యాసం The Decoder రిపోర్టింగ్పై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.
Originally published on the-decoder.com




