Sakana AI推出Marlin企业研究代理,实现百页报告与幻灯片自动生成
产品概述
Sakana AI本周在东京发布首款商业化产品 Marlin,定位为企业级“虚拟首席策略官”。用户仅需提供一个研究主题,系统便会在最长约八小时的自主运行后,交付一份结构完整的研究报告(60‑100页)以及对应的幻灯片。报告包含正文、参考文献与附录,幻灯片则由图像生成模型自动渲染。
核心技术:AB‑MCTS 与 AI Scientist
Marlin 的核心算法是 Adaptive Branching Monte Carlo Tree Search(AB‑MCTS),该方法来源于Sakana AI 2025 年在 NeurIPS 上的 spotlight 论文《Wider or Deeper? Scaling LLM Inference‑Time Compute with Adaptive Branching Tree Search》。AB‑MCTS 将推理过程视为树搜索,在每一步决定是 拓宽(生成新的候选答案)还是 加深(细化已有的高分支),并支持多模型协同(如 o4‑mini、Gemini 2.5 Pro 与 DeepSeek‑R1),在实验中提升了解决任务的比例至 27.5%。
此外,Marlin 结合了 Sakana AI 之前发布的 AI Scientist 工作流——一套已在《Nature》发表的自主科学发现框架,实现了从假设生成、文献检索到结果验证的全链路自动化。
产品功能与交付
- 长时运行:单次任务最长约 8 小时,期间会持续发起数百至上千次 LLM 调用。
- 深度报告:输出 60‑100 页的完整报告,引用 60‑80 篇文献,结构化呈现假设、方法、结果与结论。
- 自动幻灯片:基于图像生成模型自动生成配套 PPT,直接可用于高层审议。
- 多模型搜索:在关键步骤可切换至不同底层模型,利用各模型的优势提升答案质量。
定价与市场定位
Sakana 提供三种付费模式:
- 按次付费:每次运行 100 积分,单价 ¥98。
- Pro 套餐:月费 ¥150,000,含 2,000 积分。
- Team/Enterprise:分别为 ¥400,000/月(6,000 积分)以及定制化企业方案。
与传统的分钟级深度搜索工具(如 OpenAI Deep Research、Perplexity Deep Research)相比,Marlin 牺牲速度以换取更高的研究深度和交付完整性,目标客户为金融机构、咨询公司、企业战略部门等对信息质量要求极高的团队。
开源组件:TreeQuest
虽然 Marlin 本身为闭源商业产品,Sakana AI 同时在 GitHub 上以 Apache 2.0 许可证开源了 TreeQuest——AB‑MCTS 的实现库。开发者可自行定义生成函数、设定搜索预算,并在本地复现 Marlin 的树搜索过程。代码示例已在官方文档中提供,支持多模型搜索与检查点恢复,方便研究者进一步探索自适应推理的潜力。
优势与局限
优势
- 论文级别的研究深度,交付完整报告与演示材料。
- 采用经 NeurIPS 与 Nature 认证的算法,理论与实验均有支撑。
- 开源的 TreeQuest 为学术界提供了可复现的基准实现。
局限
- 运行时长远高于分钟级工具,迭代速度受限。
- 自动生成的报告仍需人工复核,潜在错误难以完全排除。
- 产品本身闭源,只有底层算法可供研究。
关键要点
- Marlin 能在约八小时内完成企业级研究任务,交付百页报告与配套幻灯片。
- 技术核心 AB‑MCTS 在 NeurIPS 2025 亮点论文中提出,已在多模型协同实验中提升任务解决率。
- 定价从按次 ¥98 起步,面向金融、企业战略等高价值场景。
- 底层搜索算法 TreeQuest 已开源,为学术与工业社区提供了实验平台。