2026/6/23 11:16:39

Sakana Fugu:统一指挥多智能体,多领域性能卓越,2026 年定价与使用指南来了!

Sakana Fugu:统一指挥多智能体,多领域性能卓越,2026 年定价与使用指南来了! 什么是 Sakana FuguSakana Fugu 是统一指挥的单一模型可掌控多智能体。它无需依赖单一供应商就能达到前沿水平的性能能动态编排全球最优秀的模型处理复杂的多步骤任务。现在通过一个 API就能将集体智能直接融入工作流程。底层技术Sakana Fugu 基于 2026 年 ICLR 关于学习模型编排的两篇论文TRINITY 和 Conductor。这两篇论文展示了系统如何学会为每个任务组合、分配和协调专家智能体而非依赖手动设计的工作流程。若想深入了解该系统背后的理念可查看[技术报告](https://github.com/SakanaAI/fugu/blob/main/Fugu_technical_report.pdf)。TRINITY采用轻量级的进化协调器在多个回合中管理多个大语言模型为每个模型分配「思考者」「工作者」「验证者」的角色根据编码、数学、推理和知识等广泛任务自适应地分配工作。[论文](https://arxiv.org/abs/2512.04695)Conductor通过强化学习训练能够自主发现基于自然语言的协调策略。通过设计智能体之间的交互模式和精准的提示它能使多样化的大语言模型集合在高难度的推理基准测试中超越单个模型。[论文](https://arxiv.org/abs/2512.04388)使用方法Sakana Fugu 提供Fugu和Fugu Ultra两个模型均可通过与 OpenAI 兼容的 API 访问。你可以选择适合工作负载的模型也可以在不改变集成方式的情况下在两者之间切换。Fugu在高性能和低延迟之间取得平衡是日常工作的理想标准模型。可将其集成到 Codex 等工具中进行编码和代码审查或者驱动响应迅速的聊天机器人所有操作都可通过一个端点完成。还能根据数据、隐私和合规性要求从模型池中排除特定的智能体。Fugu Ultra协同更广泛的专业智能体池在高难度和重要问题上提供高质量的答案。早期用户已将其用于 Kaggle 竞赛、论文复现、网络安全分析以及文献和专利调查等场景。定量结果两款 Fugu 模型超越了公开可用的前沿模型在工程、科学和推理等各种具有挑战性的基准测试中与 Fable 5 和 Mythos Preview 表现相当。而且它能在不涉及出口管制风险的情况下展现出前沿水平的实力。定性结果将 Sakana Fugu 与Gemini 3.1 Prohigh、Opus 4.8max和GPT 5.5xhigh这三个前沿模型进行对比。为突出行为差异而非特定模型基线模型匿名表示为Model A、Model B和Model C。AutoResearch / 大语言模型学习AI 智能体借助 AutoResearch 框架自主优化小型 GPT 的训练配方Fugu - Ultra 在实验中表现出色最终平均 BPB 优于其他基线模型最佳单次运行也领先所有基线。假名消息的阅读顺序推定测试古典日语假名信件阅读顺序的推定Fugu - Ultra 表现远超其他前沿模型能几乎准确追踪阅读顺序而其他模型存在较大差距。鲁比克魔方求解器Fugu - Ultra 和前沿 Model A 成功编写求解器解决所有 300 个魔方Fugu - Ultra 在步数上更优且从未比 Model A 步数更多。CAD 机械虹膜在 CAD 中创建机械虹膜的任务中Fugu Ultra 生成的 CAD 能清晰地打开和关闭光圈而其他模型生成的 CAD 存在间隙、连接薄弱或光圈无法完全关闭等问题。盲棋Fugu 进行四局连续盲棋比赛战胜了三个前沿模型和 2100 - Elo 的 Stockfish 引擎在对手失误时保持准确每局都以将死获胜。股票交易在股票交易基准测试中Fugu - Ultra 在 50 周的历史数据窗口内将投资组合增长至 11,943.22 ± 633.86 美元平均回报率达 19.43%而其他前沿模型回报率均低于 15%。用户评价软件工程师在代码审查中Fugu Ultra 表现出色答案全面能发现其他模型遗漏的错误已成为代码审查的首选模型。企业研究者使用 Sakana Fugu 后能在几个小时内完成原本需要 3 - 4 天的专利态势分析还发现了以往难以察觉的论文关联。平台企业高管Sakana Fugu 的原始输出质量与顶尖前沿模型相当在长时间对话中能保持稳定的角色设定对智能体产品而言这一点可能比单纯的基准测试分数更为关键。研究者只需一个简单指令Sakana Fugu 就能自主工作约四小时完成论文阅读、实现、训练、评估和差距分析在某个 CUDA 任务中单次会话实现了超 100 倍的加速。安全工程师只需一个明确范围的指令Sakana Fugu 就能全面完成安全评估包括信息收集、XSS/SQLi 检查、认证审查并生成包含证据和复测步骤的清晰报告且能严格遵守指定范围避免进行破坏性操作。定价按需付费令牌计划企业版适用于对可靠性要求极高的高负载生产工作流程。按使用量计费的令牌处理优先级高于月订阅计划的令牌。Fugu单个智能体活跃时按特定基础模型的标准费率支付多个智能体活跃时根据涉及的顶级模型收取单一费率。Fugu Ultrafugu - ultra - 20260615 固定定价输入、输出和缓存输入在不同上下文有不同收费标准。订阅计划月订阅适合个人用户和日常使用所有套餐均提供Fugu和Fugu Ultra两个模型。2026 年 7 月底前订阅可在初始订阅层级享受第二个月免费。标准套餐$20 / 月适合轻量级日常使用如偶尔调用 API、进行小规模实验或在个人工作流程中试用。专业套餐$100 / 月使用量是标准套餐的 10 倍适合每周的集中工作。高级套餐$200 / 月使用量为标准套餐的 20 倍适用于长时间高负载工作。常见问题解答Q1Sakana Fugu 支持通过与 OpenAI 兼容的 API 访问。你只需将现有客户端或编码工具结合 API 密钥指向 Fugu 端点即可发送请求无需迁移 SDK。Q2Fugu 兼顾延迟和质量是日常编码和交互工作的理想标准模型。Fugu Ultra 则在复杂多步骤推理中优先保证答案质量在对精度和深度要求较高的场景下会协同更多专业智能体但响应时间可能较长。Q3Fugu Ultra 为保证性能使用固定的智能体池。而 Fugu 允许你通过控制台页面的设置菜单排除特定模型以满足数据、隐私和合规性要求。Q4新的前沿模型发布后预计用约两周时间完成更新版 Sakana Fugu 模型的训练和评估随后逐步提供服务。Q5提供订阅和按需付费两种计划均可使用 Fugu 和 Fugu Ultra。订阅计划有三个月套餐按需付费计划按令牌使用量计费提供灵活的容量适合企业用户。Q6Sakana Fugu 的定价是基于活跃智能体池的单一综合费率而非各模型费用之和。增加智能体不会增加费用只是确定适用的单一模型费率。Q7每次请求都会报告令牌使用量和对应成本你可以实时监控费用并在业务扩展前预估成本。Q8你可以随时在控制台页面选择是否将数据用于模型训练。若你愿意分享数据将有助于提升 Sakana Fugu 的性能。Q9Sakana Fugu 选择具体模型和协调方式属于专有技术设计上不对外公开路由信息。Q10Sakana Fugu 支持日本以外地区使用。但目前不向欧盟EU和欧洲经济区EEA成员国提供服务详情见服务条款。其他地区可能因网络或当地法规限制无法使用。联系我们如需了解访问方式、套餐详情和企业级部署方案请与我们联系。[立即开始使用 Sakana Fugu](https://console.sakana.ai/login) 联系我们[fugu - supportsakana.ai](mailto:fugu - supportsakana.ai)Sakana AI 官方网站 公司信息 招聘信息 隐私政策© 2026 Sakana AI 株式会社立即开始使用 Sakana Fugu