طريقتان للسؤال عمّا يناسب مكوّنًا ما

عندما يسأل شخص ما عمّا يناسب الدجاج، فهناك على الأقل إجابتان صحيحتان. الأولى طهيّة: ما المكونات التي تظهر عادةً مع الدجاج في الوصفات الحقيقية. والثانية كيميائية: ما المكونات التي تشترك في ملف نكهة متشابه على المستوى الجزيئي. وتقول أبحاث جديدة أبرزتها Kaikaku.AI إن كثيرًا من أنظمة الذكاء الاصطناعي تخلط بين هاتين الإجابتين، وإن هذا الخلط يخفي تمييزًا مهمًا.

ويقدم العمل الجديد للشركة ثلاثة نماذج مترابطة تحت اسم Epicure. أحدها، Cooc، يُدرَّب فقط على التشارك في الظهور داخل الوصفات. وآخر، Chem، يُدرَّب فقط على الجزيئات النكهية المشتركة باستخدام قاعدة بيانات الكيمياء FlavorDB. أما الثالث، Core، فيمزج بين النهجين.

لماذا يهم هذا التمييز

تظهر الفروق بوضوح في المطالبات البسيطة. ووفقًا للنص الأصلي، يستجيب Cooc لكلمة “chicken” بمكونات مثل الثوم والبصل والفلفل الأسود، وهو ما يعكس ما يخلطه الطهاة عادةً في الوصفات. أما Chem فيعيد مكونات مثل لحم البقر أو لحم الخنزير، وهي ليست بالضرورة أكثر رفقاء الوصفات شيوعًا، لكنها أقرب من حيث الملف الجزيئي للنكهة.

ويظهر النمط نفسه مع الأعشاب. بالنسبة لكلمة “basil”، يقترح Cooc مكونات مرتبطة بالاستخدامات المألوفة، بما في ذلك البقدونس وزيت الزيتون والبارميزان. أما Chem فيجمع الريحان مع أقربائه من حيث النكهة مثل الأوريغانو والطرخون وإكليل الجبل. وبعبارة أخرى، يتصرف أحد النماذج مثل كتاب طبخ، بينما يشبه الآخر خريطة كيميائية.

حجم البيانات والنطاق متعدد اللغات

تم تدريب Epicure على 4.14 مليون وصفة من 11 مصدرًا و7 لغات، بما في ذلك الصينية والروسية والفيتنامية والتركية والإندونيسية والألمانية. ويشكل هذا الاتساع متعدد اللغات جزءًا رئيسيًا من ادعاء المشروع بصلته وملاءمته. فكثير من مجموعات بيانات الطعام تميل بشدة إلى المصادر الإنجليزية، ما قد يؤدي إلى تسطيح المطابخ الإقليمية وإلى تمثيل مفرط لأنماط الطهي الغربية.

ويقول النص الأصلي إن خط المعالجة استخدم تضمينات من Claude وGemini للمساعدة في ترجمة وتوحيد نحو 200 ألف مصطلح خام للمكونات إلى 1790 تسمية نظيفة للمكونات. هذا النوع من إعداد البيانات أقل بريقًا من تصميم النموذج، لكنه غالبًا ما يكون الفارق بين نظام يلتقط البنية الحقيقية وآخر يضخم الضوضاء.

أداء مفاجئ من التعلم القائم على الكيمياء

إحدى أكثر النتائج إثارة في البحث هي أن النموذج المعتمد على الكيمياء يؤدي جيدًا حتى في الخصائص التي لم تُشفَّر مباشرة في بيانات التدريب. ويقول النص الأصلي إن Chem يصنف المكونات بشكل أوضح وفق أبعاد مثل الحلو والحامض والمر، وكذلك وفق محاور غذائية مثل محتوى البروتين والدهون.

إذا صمدت هذه النتيجة، فهذا يعني أن العلاقات الجزيئية قد تعمل تمثيلًا مضغوطًا لمعرفة طهوية أوسع. وقد يتعلم نموذج مبني على الكيمياء وحدها شيئًا ذا معنى عن كيفية إدراك البشر للمكونات وتنظيم النكهة وحتى استنتاج الخصائص المجاورة.

ما الذي قد يغيره هذا

لقد ركز الذكاء الاصطناعي الغذائي حتى الآن على التوصية والاستبدال وتوليد المحتوى. لكن هذه الأنظمة غالبًا ما تدمج أسئلة مختلفة جدًا في مفهوم عام واحد هو “التشابه”. ويشير إطار Epicure إلى أن الأدوات المستقبلية قد تحتاج إلى أن تكون صريحة بشأن نوع التشابه الذي تعمل على تحسينه.

وقد يهم هذا التمييز في تصميم المنتجات. فمن المرجح أن يعطي مساعد الوصفات أولوية للتشارك في الظهور وسياق المطبخ. أما أداة الصياغة أو البحث والتطوير فقد تهتم أكثر بالتشابه الجزيئي. وقد يحتاج نظام إبداعي لأطباق جديدة إلى توازن قابل للضبط بين الاثنين.

والأهم من ذلك أن هذا العمل يوضح أن حتى المجالات الضيقة ظاهريًا يمكن أن تكشف مشكلات أعمق في تصميم النماذج. فبيانات التدريب لا تملأ الحقائق فحسب، بل تحدد نوع العلاقة التي يعتقد النظام أن العالم يتضمنها.

طبقة أكثر دقة من ذكاء الطعام

القيمة الأوسع للمشروع هي الوضوح المفاهيمي. إن سؤال “ما الذي يناسب هذا؟” ليس مشكلة واحدة. بل هو عدة مشكلات. ومن خلال فصل سلوك الوصفات عن كيمياء النكهة، تقدم Kaikaku.AI حجة مفادها أن ذكاء المكونات يجب أن يُفكك بدلًا من أن يُمتَزَج متوسطًا.

قد يبدو ذلك مجالًا متخصصًا، لكنه يعكس نمطًا أوسع في أبحاث الذكاء الاصطناعي. تصبح النماذج أكثر فائدة عندما تميز بين هياكل مختلفة داخل مجموعة البيانات نفسها بدلًا من ضغطها في درجة واحدة. وفي هذه الحالة، تكون النتيجة طريقة أوضح للتفكير في المعرفة الطهوية نفسها: العادات، والجزيئات، والمساحة التي تتداخل فيها.

هذا المقال يستند إلى تقرير نشره The Decoder. اقرأ المقال الأصلي.

Originally published on the-decoder.com