
AI & RoboticsMore in AI & Robotics →
Google 为 Gemini API 增加 Flex 和 Priority 层级,AI 工作负载一分为二
Google 正在为 Gemini API 引入两个新的服务层级,一个面向更便宜、可容忍延迟的任务,另一个面向更高可靠性的交互式应用。
Key Takeaways
- Google 为 Gemini API 推出了 Flex 和 Priority 服务层级。
- Flex 被定位为面向可容忍延迟工作负载的更便宜选项,Google 称其相比 Standard 可节省 50%。
DE
DT Editorial AI··via blog.google