AI 将菜谱搭配与风味化学分离

两种方式来问一种食材适合配什么

当有人问鸡肉适合配什么时，至少有两个都合理的答案。一种是烹饪层面的：在真实菜谱中，哪些食材常与鸡肉一起出现。另一种是化学层面的：哪些食材在分子层面上有相似的风味特征。Kaikaku.AI 强调的新研究认为，许多 AI 系统把这两个答案混在了一起，而这样做掩盖了一个重要区别。

该公司推出了三个紧密相关的模型，统称为 Epicure。其一是 Cooc，只根据菜谱共现关系训练。其二是 Chem，只根据 FlavorDB 化学数据库中的共享风味分子训练。其三是 Core，将两种方法结合起来。

在简单提示中，这种差异会立刻显现出来。根据原文，Cooc 对“chicken”的回应是大蒜、洋葱和黑胡椒等食材，反映了厨师在菜谱中通常的搭配方式。Chem 则会返回牛肉或猪肉等食材，它们未必是最常见的菜谱搭档，但在分子风味轮廓上更接近。

草本植物也呈现出同样模式。对于“basil”，Cooc 会给出与熟悉用法相关的食材，例如欧芹、橄榄油和帕玛森奶酪。Chem 则把罗勒与牛至、龙蒿和迷迭香等风味相近的成分分在一起。换句话说，一个模型更像菜谱，另一个更像化学地图。

Google 正在将 AI 视频创作扩展到 Workspace 中，推出基于提示词的剪辑生成与编辑功能，以及可由自拍和录音创建的自定义头像。

Epicure 使用来自 11 个来源、7 种语言的 414 万份菜谱进行训练，其中包括中文、俄语、越南语、土耳其语、印尼语和德语。这样的多语言覆盖是该项目主张其相关性的核心之一。许多食品数据集严重偏向英语来源，这会压平区域菜系，并让西方烹饪模式占比过高。

原文称，该流程使用 Claude 和 Gemini 的嵌入向量，帮助将约 20 万个原始食材术语翻译并规范化为 1790 个清洗后的食材标签。这样的数据准备远不如模型设计吸引人，但它往往决定系统是在捕捉真实结构，还是在放大噪声。

这项研究中最有意思的结论之一是，基于化学的模型即便在训练数据未直接编码的属性上也表现良好。原文称，Chem 在甜、酸、苦等维度，以及蛋白质和脂肪含量等营养维度上的分类更加清晰。

如果这一结果站得住脚，就意味着分子关系可能是更广泛烹饪知识的一种紧凑表示。仅基于化学构建的模型，仍然可能学到人类如何感知食材、组织风味，甚至推断相邻属性的有意义信息。

食品 AI 过去主要关注推荐、替代和内容生成。但这些系统往往把非常不同的问题压缩成一个笼统的“相似性”概念。Epicure 的框架表明，未来工具可能需要明确自己优化的究竟是哪一种相似性。

这种区分对产品设计很重要。食谱助手大概应该优先考虑共现和菜系语境。配方或研发工具则可能更看重分子相似性。用于创造新菜品的系统，也许需要在两者之间进行可调节的平衡。

同样重要的是，这项工作表明，即便是看似狭窄的领域，也能暴露更大的模型设计问题。训练数据不只是填充事实，它决定了系统认为世界中存在什么样的关系。

这个项目更广泛的价值在于概念上的清晰。“什么适合搭配这个？”不是一个问题，而是多个问题。通过把菜谱行为与风味化学分开，Kaikaku.AI 试图说明：食材智能应该被拆分，而不是被平均在一起。

这听起来很小众，但它映射的是 AI 研究中的一个更大趋势。模型只有在区分同一数据集中的不同结构，而不是把它们压缩成一个单一分数时，才会更有用。在这个案例里，结果是让我们以一种更清晰的方式理解烹饪知识本身：习惯、分子，以及它们重叠的空间。

本文基于 The Decoder 的报道。阅读原文。

Originally published on the-decoder.com