Manus和OpenManus

1 Manus

1.1 概述

官网： https://manus.im/usecases

根据 Manus 发布会的数据，Manus 的功能覆盖了 76% 的垂直类 Agent 项目。其官网展示了 50 多个用例，主要应用于数据分析、调查研究和效率提升。工程方面，Manus 付出了大量努力，整体交互比其他产品优化了许多。

从个人体验来看，Manus 的推广和设计非常出色，与浏览器的整合也令人印象深刻。它有效填补了市场空白，市面上虽有众多开源的 agent 工具，但普遍缺乏易用性；即便是 coze 的图形化界面模块拼接，也存在一定的使用门槛。

Manus 的另一大优势在于其示例表现。一句简单提问，即能获得优质输出。在国内，类似体验的产品有 kimi（检索）和 deepseek-R1（推理），但它们通常只处理单个简单问题。而 Manus 不仅可以在线搜索数据，还能够进行多步操作，解决复杂问题。这一特点似乎填补了市场空白。不过，其实际效果及成本如何，尚需进一步观察和讨论。

1.2 用户交互

界面：打开网站上的实例，可以清晰看到工作过程，左侧展示模型思考，右侧展示工具调用，左右分区的交互流畅。

结果：交付结果令人惊喜，结构良好，交互体验极佳，回答精准适度，具备创新性，可能是通过一些 one shot 示例实现的，不知是否能举一返三。

信任度：Manus 的独特之处在于，不仅提供完整结果，还保存了过程中每个任务节点的产出，便于验证每个节点的输出是否正确。这类似于 DeepSeek R1 的思维链曝光，让用户能了解 Agent 的交付过程，增强对结果的信任度。

1.3 工作过程和原理

从具体步骤来看：

将大问题拆解为多个小问题；
分析每一步需要的数据和操作；
与用户互动，听取建议以指导下一步；
整合信息生成综合报告。

从工具使用角度：

涉及文件处理、搜索、浏览器操作、图像识别和代码生成/运行。

关于模型应用：

包括意图识别、任务规划、推理、完成情况判断和结果整合。

在当前大模型与多模态技术较为可信的背景下，这种结合能解决许多以往无法解决的问题。也可以说，Manus 对模型有较强的依赖。

1.4 创新和用户体验

相较于现有的代理，创新有限：大模型负责思考，Agent 负责执行。
交互不依赖本地环境，不接管电脑，也不占用本地资源，可并行多个任务，哪怕关闭网页也不影响运行。
与传统智能体工具（如 Coze）相比，Manus 通过大模型实现多智能体的自动编排，取代手动工作流。
工程化和用户体验出色，透明化展示 Agent 编排和执行过程，既酷炫又提升用户对结果的信任。

1.5 实现难度

这可能是一个设计优雅的范例，但门槛并不高，难以限制竞品使用。
即使了解其原理框架，由于某些场景已被优化，复制其效果仍然具有挑战性。

1.6 Manus 存在的问题

Manus 目前处于早期 demo 阶段，功能较有限，性能仍需优化。网上一些试用反馈：

任务完成率偏低
若任务上下文长度过长，Manus 可能会直接停止工作并报错
Manus 的 token 消耗较高，商业模式尚不明确
还需在如 RAG 等方面进一步优化
对未知或更复杂任务的处理效果尚不确定

2 OpenManus

Manus 技术门槛较低，已出现开源复刻版 OpenManus。

源码：https://github.com/mannaandpoem/OpenManus 34.9k Star

说明：https://github.com/mannaandpoem/OpenManus/blob/main/README_zh.md

3 代码分析

目前代码：3000 行（250316），主要由 Python 实现

3.1 程序

程序的入口文件是 manus.py，可用工具包含：

PythonExecute：执行 Python 程序
WebSearch：通过 Google 和百度 API 进行网络搜索
BrowserUserTool：浏览器操作（包括滚动、点击等交互）
FileSaver：文件操作
Terminate：运行脚本

4 参考

Manus 技术报告：全球首款通用AI Agent工作方式拆解