1 Manus

1.1 概述

官网:https://manus.im/usecases

根据 Manus 发布会的数据,Manus 的功能覆盖了 76% 的垂直类 Agent 项目。其官网展示了 50 多个用例,主要应用于数据分析、调查研究和效率提升。工程方面,Manus 付出了大量努力,整体交互比其他产品优化了许多。

从个人体验来看,Manus 的推广和设计非常出色,与浏览器的整合也令人印象深刻。它有效填补了市场空白,市面上虽有众多开源的 agent 工具,但普遍缺乏易用性;即便是 coze 的图形化界面模块拼接,也存在一定的使用门槛。

Manus 的另一大优势在于其示例表现。一句简单提问,即能获得优质输出。在国内,类似体验的产品有 kimi(检索)和 deepseek-R1(推理),但它们通常只处理单个简单问题。而 Manus 不仅可以在线搜索数据,还能够进行多步操作,解决复杂问题。这一特点似乎填补了市场空白。不过,其实际效果及成本如何,尚需进一步观察和讨论。

1.2 用户交互

界面:打开网站上的实例,可以清晰看到工作过程,左侧展示模型思考,右侧展示工具调用,左右分区的交互流畅。

结果:交付结果令人惊喜,结构良好,交互体验极佳,回答精准适度,具备创新性,可能是通过一些 one shot 示例实现的,不知是否能举一返三。

信任度:Manus 的独特之处在于,不仅提供完整结果,还保存了过程中每个任务节点的产出,便于验证每个节点的输出是否正确。这类似于 DeepSeek R1 的思维链曝光,让用户能了解 Agent 的交付过程,增强对结果的信任度。

1.3 工作过程和原理

从具体步骤来看:

  1. 将大问题拆解为多个小问题;
  2. 分析每一步需要的数据和操作;
  3. 与用户互动,听取建议以指导下一步;
  4. 整合信息生成综合报告。

从工具使用角度:

  • 涉及文件处理、搜索、浏览器操作、图像识别和代码生成/运行。

关于模型应用:

  • 包括意图识别、任务规划、推理、完成情况判断和结果整合。

在当前大模型与多模态技术较为可信的背景下,这种结合能解决许多以往无法解决的问题。也可以说,Manus 对模型有较强的依赖。

1.4 创新和用户体验

  • 相较于现有的代理,创新有限:大模型负责思考,Agent 负责执行。
  • 交互不依赖本地环境,不接管电脑,也不占用本地资源,可并行多个任务,哪怕关闭网页也不影响运行。
  • 与传统智能体工具(如 Coze)相比,Manus 通过大模型实现多智能体的自动编排,取代手动工作流。
  • 工程化和用户体验出色,透明化展示 Agent 编排和执行过程,既酷炫又提升用户对结果的信任。

1.5 实现难度

  • 这可能是一个设计优雅的范例,但门槛并不高,难以限制竞品使用。
  • 即使了解其原理框架,由于某些场景已被优化,复制其效果仍然具有挑战性。

1.6 Manus 存在的问题

Manus 目前处于早期 demo 阶段,功能较有限,性能仍需优化。网上一些试用反馈:

  • 任务完成率偏低
  • 若任务上下文长度过长,Manus 可能会直接停止工作并报错
  • Manus 的 token 消耗较高,商业模式尚不明确
  • 还需在如 RAG 等方面进一步优化
  • 对未知或更复杂任务的处理效果尚不确定

2 OpenManus

Manus 技术门槛较低,已出现开源复刻版 OpenManus。

源码:https://github.com/mannaandpoem/OpenManus 34.9k Star

说明:https://github.com/mannaandpoem/OpenManus/blob/main/README_zh.md

3 代码分析

  • 目前代码:3000 行(250316),主要由 Python 实现

3.1 程序

程序的入口文件是 manus.py,可用工具包含:

  • PythonExecute:执行 Python 程序
  • WebSearch:通过 Google 和百度 API 进行网络搜索
  • BrowserUserTool:浏览器操作(包括滚动、点击等交互)
  • FileSaver:文件操作
  • Terminate:运行脚本

4 参考

Manus 技术报告:全球首款通用AI Agent工作方式拆解