两种方式来问一种食材适合配什么

当有人问鸡肉适合配什么时,至少有两个都合理的答案。一种是烹饪层面的:在真实菜谱中,哪些食材常与鸡肉一起出现。另一种是化学层面的:哪些食材在分子层面上有相似的风味特征。Kaikaku.AI 强调的新研究认为,许多 AI 系统把这两个答案混在了一起,而这样做掩盖了一个重要区别。

该公司推出了三个紧密相关的模型,统称为 Epicure。其一是 Cooc,只根据菜谱共现关系训练。其二是 Chem,只根据 FlavorDB 化学数据库中的共享风味分子训练。其三是 Core,将两种方法结合起来。

为什么这种区别很重要

在简单提示中,这种差异会立刻显现出来。根据原文,Cooc 对“chicken”的回应是大蒜、洋葱和黑胡椒等食材,反映了厨师在菜谱中通常的搭配方式。Chem 则会返回牛肉或猪肉等食材,它们未必是最常见的菜谱搭档,但在分子风味轮廓上更接近。

草本植物也呈现出同样模式。对于“basil”,Cooc 会给出与熟悉用法相关的食材,例如欧芹、橄榄油和帕玛森奶酪。Chem 则把罗勒与牛至、龙蒿和迷迭香等风味相近的成分分在一起。换句话说,一个模型更像菜谱,另一个更像化学地图。

数据规模与多语言范围

Epicure 使用来自 11 个来源、7 种语言的 414 万份菜谱进行训练,其中包括中文、俄语、越南语、土耳其语、印尼语和德语。这样的多语言覆盖是该项目主张其相关性的核心之一。许多食品数据集严重偏向英语来源,这会压平区域菜系,并让西方烹饪模式占比过高。

原文称,该流程使用 Claude 和 Gemini 的嵌入向量,帮助将约 20 万个原始食材术语翻译并规范化为 1790 个清洗后的食材标签。这样的数据准备远不如模型设计吸引人,但它往往决定系统是在捕捉真实结构,还是在放大噪声。

以化学优先学习获得意外表现

这项研究中最有意思的结论之一是,基于化学的模型即便在训练数据未直接编码的属性上也表现良好。原文称,Chem 在甜、酸、苦等维度,以及蛋白质和脂肪含量等营养维度上的分类更加清晰。

如果这一结果站得住脚,就意味着分子关系可能是更广泛烹饪知识的一种紧凑表示。仅基于化学构建的模型,仍然可能学到人类如何感知食材、组织风味,甚至推断相邻属性的有意义信息。

这可能改变什么

食品 AI 过去主要关注推荐、替代和内容生成。但这些系统往往把非常不同的问题压缩成一个笼统的“相似性”概念。Epicure 的框架表明,未来工具可能需要明确自己优化的究竟是哪一种相似性。

这种区分对产品设计很重要。食谱助手大概应该优先考虑共现和菜系语境。配方或研发工具则可能更看重分子相似性。用于创造新菜品的系统,也许需要在两者之间进行可调节的平衡。

同样重要的是,这项工作表明,即便是看似狭窄的领域,也能暴露更大的模型设计问题。训练数据不只是填充事实,它决定了系统认为世界中存在什么样的关系。

更精细的食物智能栈

这个项目更广泛的价值在于概念上的清晰。“什么适合搭配这个?”不是一个问题,而是多个问题。通过把菜谱行为与风味化学分开,Kaikaku.AI 试图说明:食材智能应该被拆分,而不是被平均在一起。

这听起来很小众,但它映射的是 AI 研究中的一个更大趋势。模型只有在区分同一数据集中的不同结构,而不是把它们压缩成一个单一分数时,才会更有用。在这个案例里,结果是让我们以一种更清晰的方式理解烹饪知识本身:习惯、分子,以及它们重叠的空间。

本文基于 The Decoder 的报道。阅读原文

Originally published on the-decoder.com