Manus和OpenManus
1 Manus
1.1 概述
官网:https://manus.im/usecases
根据 Manus 发布会的数据,Manus 的功能覆盖了 76% 的垂直类 Agent 项目。其官网展示了 50 多个用例,主要应用于数据分析、调查研究和效率提升。工程方面,Manus 付出了大量努力,整体交互比其他产品优化了许多。
从个人体验来看,Manus 的推广和设计非常出色,与浏览器的整合也令人印象深刻。它有效填补了市场空白,市面上虽有众多开源的 agent 工具,但普遍缺乏易用性;即便是 coze 的图形化界面模块拼接,也存在一定的使用门槛。
Manus 的另一大优势在于其示例表现。一句简单提问,即能获得优质输出。在国内,类似体验的产品有 kimi(检索)和 deepseek-R1(推理),但它们通常只处理单个简单问题。而 Manus 不仅可以在线搜索数据,还能够进行多步操作,解决复杂问题。这一特点似乎填补了市场空白。不过,其实际效果及成本如何,尚需进一步观察和讨论。
1.2 用户交互
界面:打开网站上的实例,可以清晰看到工作过程,左侧展示模型思考,右侧展示工具调用,左右分区的交互流畅。
结果:交付结果令人惊喜,结构良好,交互体验极佳,回答精准适度,具备创新性,可能是通过一些 one shot 示例实现的,不知是否能举一返三。
信任度:Manus 的独特之处在于,不仅提供完整结果,还保存了过程中每个任务节点的产出,便于验证每个节点的输出是否正确。这类似于 DeepSeek R1 的思维链曝光,让用户能了解 Agent 的交付过程,增强对结果的信任度。
1.3 工作过程和原理
从具体步骤来看:
- 将大问题拆解为多个小问题;
- 分析每一步需要的数据和操作;
- 与用户互动,听取建议以指导下一步;
- 整合信息生成综合报告。
从工具使用角度:
- 涉及文件处理、搜索、浏览器操作、图像识别和代码生成/运行。
关于模型应用:
- 包括意图识别、任务规划、推理、完成情况判断和结果整合。
在当前大模型与多模态技术较为可信的背景下,这种结合能解决许多以往无法解决的问题。也可以说,Manus 对模型有较强的依赖。
1.4 创新和用户体验
- 相较于现有的代理,创新有限:大模型负责思考,Agent 负责执行。
- 交互不依赖本地环境,不接管电脑,也不占用本地资源,可并行多个任务,哪怕关闭网页也不影响运行。
- 与传统智能体工具(如 Coze)相比,Manus 通过大模型实现多智能体的自动编排,取代手动工作流。
- 工程化和用户体验出色,透明化展示 Agent 编排和执行过程,既酷炫又提升用户对结果的信任。
1.5 实现难度
- 这可能是一个设计优雅的范例,但门槛并不高,难以限制竞品使用。
- 即使了解其原理框架,由于某些场景已被优化,复制其效果仍然具有挑战性。
1.6 Manus 存在的问题
Manus 目前处于早期 demo 阶段,功能较有限,性能仍需优化。网上一些试用反馈:
- 任务完成率偏低
- 若任务上下文长度过长,Manus 可能会直接停止工作并报错
- Manus 的 token 消耗较高,商业模式尚不明确
- 还需在如 RAG 等方面进一步优化
- 对未知或更复杂任务的处理效果尚不确定
2 OpenManus
Manus 技术门槛较低,已出现开源复刻版 OpenManus。
源码:https://github.com/mannaandpoem/OpenManus 34.9k Star
说明:https://github.com/mannaandpoem/OpenManus/blob/main/README_zh.md
3 代码分析
- 目前代码:3000 行(250316),主要由 Python 实现
3.1 程序
程序的入口文件是 manus.py,可用工具包含:
- PythonExecute:执行 Python 程序
- WebSearch:通过 Google 和百度 API 进行网络搜索
- BrowserUserTool:浏览器操作(包括滚动、点击等交互)
- FileSaver:文件操作
- Terminate:运行脚本