ఒక పదార్థానికి ఏమి సరిపోతుందో అడగడానికి రెండు మార్గాలు

చికెన్‌కు ఏమి సరిపోతుంది అని ఎవరు అడిగినా, కనీసం రెండు సరైన సమాధానాలు ఉంటాయి. ఒకటి వంటక సంబంధమైనది: నిజమైన రెసిపీల్లో చికెన్‌తో కలిసి కనిపించే పదార్థాలు ఏవి. మరొకటి రసాయన సంబంధమైనది: అణు స్థాయిలో సమానమైన ఫ్లేవర్ ప్రొఫైల్‌ను పంచుకునే పదార్థాలు ఏవి. Kaikaku.AI హైలైట్ చేసిన కొత్త పరిశోధనలో, అనేక AI సిస్టమ్స్ ఈ రెండు సమాధానాలను కలిపేస్తున్నాయని, దాంతో ఒక ముఖ్యమైన తేడా కనిపించకుండా పోతుందని వాదిస్తోంది.

కంపెనీ的新 పనిలో Epicure అనే పేరుతో మూడు దగ్గరగా సంబంధించిన మోడళ్లు ఉన్నాయి. Cooc అనే ఒక మోడల్ కేవలం recipe co-occurrence మీదనే ట్రెయిన్ చేయబడింది. Chem అనే మరో మోడల్ FlavorDB కెమిస్ట్రీ డేటాబేస్‌ను ఉపయోగించి shared flavor molecules మీద మాత్రమే ట్రెయిన్ చేయబడింది. Core అనే మూడవది ఈ రెండు విధానాలను కలుపుతుంది.

ఈ తేడా ఎందుకు ముఖ్యం

సాధారణ ప్రాంప్ట్‌లలో తేడా స్పష్టంగా కనిపిస్తుంది. మూల పాఠ్యం ప్రకారం, Cooc “chicken” కు garlic, onion, black pepper వంటి పదార్థాలను ఇస్తుంది, అంటే వంటకాలు సాధారణంగా ఏమిని కలిసి ఉపయోగిస్తాయో చూపిస్తుంది. Chem మాత్రం beef లేదా pork వంటి పదార్థాలను ఇస్తుంది, అవి తప్పనిసరిగా అత్యంత సాధారణ రెసిపీ సహచరాలు కాకపోయినా, మాలిక్యులర్ ఫ్లేవర్ ప్రొఫైల్‌లో దగ్గరగా ఉంటాయి.

అదే నమూనా herbs విషయంలోనూ కనిపిస్తుంది. “basil” కోసం Cooc parsley, olive oil, parmesan వంటి పరిచిత వినియోగ సందర్భాలతో సంబంధమైన పదార్థాలను సూచిస్తుంది. Chem basil‌ను oregano, tarragon, rosemary వంటి flavor relatives‌తో సమూహీకరిస్తుంది. మరొక మాటలో చెప్పాలంటే, ఒక మోడల్ cookbook‌లా ప్రవర్తిస్తుంది; మరొకటి chemistry map‌లా.

డేటా పరిమాణం మరియు బహుభాషా వ్యాప్తి

Epicureను ఏడు భాషల్లో, Chinese, Russian, Vietnamese, Turkish, Indonesian, German సహా, 11 sources నుండి 4.14 మిలియన్ రెసిపీలపై ట్రెయిన్ చేశారు. ఈ బహుభాషా వ్యాప్తి ప్రాజెక్ట్ ప్రాముఖ్యతలో కీలక భాగం. అనేక food datasets ఇంగ్లిష్ మూలాల వైపు ఎక్కువగా వాలుతాయి, దాంతో ప్రాంతీయ వంటకాలు సరిగా ప్రతిబింబించకపోవచ్చు మరియు Western cooking patterns అధికంగా కనిపించవచ్చు.

మూల పాఠ్యం ప్రకారం, pipeline Claude మరియు Gemini embeddings‌ను ఉపయోగించి సుమారు 200,000 raw ingredient terms‌ను 1,790 clean చేసిన ingredient labels‌గా మార్పు చేయడంలో సహాయపడింది. ఆ data preparation model design అంత ఆకర్షణీయంగా కనిపించకపోయినా, అది system నిజమైన structure‌ను పట్టుకుంటుందా లేదా noise‌ను పెంచుతుందా అన్న దానిలో కీలకం.

కెమిస్ట్రీ-ముందుగా నేర్చుకోవడం నుంచి ఆశ్చర్యకరమైన పనితీరు

ఆ పరిశోధనలో అత్యంత ఆసక్తికరమైన వాదనలలో ఒకటి, chemistry-driven model training data‌లో నేరుగా ఇవ్వని లక్షణాలపై కూడా బాగా పనిచేస్తుందని చెప్పడం. మూల పాఠ్యం ప్రకారం, Chem sweet, sour, bitter వంటి లక్షణాలతో పాటు protein, fat వంటి nutritional axes లో కూడా స్పష్టంగా వర్గీకరిస్తుంది.

ఈ ఫలితం నిలబడితే, molecular relationships broader culinary knowledge కోసం సంక్షిప్త ప్రతినిధిగా పనిచేయగలవని సూచిస్తుంది. కేవలం chemistry మీద నిర్మితమైన మోడల్ కూడా మనుషులు పదార్థాలను ఎలా గ్రహిస్తారు, flavor‌ను ఎలా క్రమబద్ధీకరిస్తారు, మరియు పక్కన ఉన్న లక్షణాలను ఎలా ఊహిస్తారు అన్న దానిపై అర్థవంతమైన అవగాహన పొందగలదు.

ఇది ఏమి మార్చగలదు

Food AI ఇప్పటివరకు recommendation, substitution, content generation మీద దృష్టి పెట్టింది. కానీ ఈ systems తరచూ చాలా భిన్నమైన ప్రశ్నలను ఒకే generic similarity భావనలో కలిపేస్తాయి. Epicure framing భవిష్యత్ tools ఏ రకమైన similarityని optimize చేస్తున్నాయో స్పష్టంగా చెప్పాల్సిన అవసరం ఉందని సూచిస్తోంది.

Product designలో ఆ తేడా ముఖ్యం. ఒక recipe assistant co-occurrence మరియు cuisine context‌ను ఎక్కువగా ప్రాధాన్యం ఇవ్వాలి. ఒక formulation లేదా R&D tool molecular similarity‌ను ఎక్కువగా పట్టించుకోవచ్చు. కొత్త dishes సృష్టించే creative system‌కు రెండింటి మధ్య సర్దుబాటు అవసరమవచ్చు.

ఇంకా ముఖ్యంగా, ఈ పని చిన్నదిగా కనిపించే domains కూడా model designలో పెద్ద సమస్యలను బయటపెట్టగలవని చూపిస్తోంది. Training data కేవలం facts‌ను నింపదు. system ప్రపంచంలో ఏ రకమైన సంబంధం ఉందని నమ్ముతుందో కూడా అది నిర్ణయిస్తుంది.

మరింత ఖచ్చితమైన food intelligence stack

ఈ ప్రాజెక్ట్ యొక్క విస్తృత విలువ conceptual clarity. “దీనితో ఏమి సరిపోతుంది?” అనే ప్రశ్న ఒకటే సమస్య కాదు. అది అనేక సమస్యలు. recipe behavior‌ను flavor chemistry నుంచి వేరు చేసి, Kaikaku.AI ingredient intelligence‌ను ఒకటిగా average చేయకుండా విభజించి చూడాలని వాదిస్తోంది.

ఇది nicheగా అనిపించవచ్చు, కానీ AI పరిశోధనలో పెద్ద pattern‌కు సరిపోతుంది. ఒక dataset‌లోని వేర్వేరు structures‌ను models వేరుగా గుర్తించినప్పుడు అవి మరింత ఉపయోగకరంగా మారతాయి, వాటిని ఒకే score‌గా కుదించడంతో పోల్చితే. ఈ సందర్భంలో, ఫలితం culinary knowledge‌ను మరింత శుభ్రంగా ఆలోచించడానికి సహాయపడుతుంది: habits, molecules, మరియు అవి కలిసే స్థలం.

ఈ వ్యాసం The Decoder రిపోర్టింగ్‌పై ఆధారపడింది. మూల వ్యాసాన్ని చదవండి.

Originally published on the-decoder.com