OpenAI的CUA_ComputerUseAgent
2025 年 1 月 24 日,OpenAI 发布了其首款 AI 智能体
Operator。这是一款能够在浏览器上执行简单在线任务的网络应用,例如预订音乐会门票和在线购买杂货。
Operator 由新模型 Computer-Using Agent(CUA)驱动,该模型基于 GPT-4o
构建。目前,该应用仅面向订阅每月 200 美元 ChatGPT Pro
服务的美国用户开放,未来将逐步向其他用户推广。
官方介绍: https://openai.com/index/computer-using-agent/
原理:
将 GPT-4
的推理能力结合视觉功能,用于操作电脑桌面(类似于操作浏览器)。
基于桌面解析和文字识别技术,可以控制键盘和鼠标,并在沙箱环境中进行操作。
问题:
安全问题:适合操作商场中机器人,对于个人数据/公司数据可能涉及安全问题。
目标用户是谁:像 Dify,扣子也有此问题。
应用场景:
浏览器使用:语法检查、退款总计、更新许可证、客户查询。
电脑使用:下载讲座、合并 PDF、压缩图像、计算价格、导出图像。
其它:
要 200 刀的 pro 才能用,而 ...
MCP协议解析
1 简介
MCP(Model Context Protocol,模型上下文协议)是 Anthropic 在 2024
年底推出的一种开放协议,旨在实现大语言模型(LLM)与外部数据源、工具和应用程序之间的安全、高效互动。
MCP 使得不同 AI
模型能够轻松连接到外部工具和数据源,而无需单独整合多个
API。传统上,整合外部工具需要处理各个 API
的代码、文档、认证方式、错误处理以及后续维护,增加了开发复杂度。MCP
的特点在于其“即插即用”功能,工具只需封装一次,即可与多种大模型 API
组合使用。
2 现有方法的问题
常用方法:
方法一:将数据上传到服务器
将数据存储在他人服务器中,存在安全风险。
上传过程中,数据大小和类型受到严格限制。
方法二:给予大模型本地管理员权限,自动处理本地数据。
同样存在安全隐患。
例如:Open Interpreter、CUA。
MCP 的优势:
统一协议:MCP 作为统一接口,只需一次集成即可连接多个服务。
动态发现:AI
模型能够自动识别并使用可用工具,无需提前固定每个接口。
双向通信:支持数据拉取和操作触发。
安全性:确保只有授 ...
MCP服务器与客户端指南
1 MCP Server
1.1 准备
12pip install mcp# 安装后就可运行 mcp 命令
1.1.1 提供本地服务
12345678910111213141516171819202122# server.pyfrom mcp.server.fastmcp import FastMCP# Create an MCP servermcp = FastMCP("Demo")# Add an addition tool@mcp.tool()def add(a: int, b: int) -> int: """Add two numbers""" return a + b# Add a dynamic greeting resource@mcp.resource("greeting://{name}")def get_greeting(name: str) -> str: """Get a personalized g ...
MCP服务配置指南
1 资源分类
MCP 服务主要包括以下几种:
搜索:搜索和爬虫功能
数据:本地文件、GitHub
工具:为已有工具提供 MCP 调用方法
2 mcp.so
收集了大量 MCP Servers,可在 mcp.so
上使用,而无需本地安装,只需简单配置(如配置 API Key),即可通过 URL
访问各种 MCP Server。
截至目前,http://mcp.so/ 已提供超过 4000 项服务(250328)。
3 tavily
功能:网络搜索 & 智能提取
申请 apikey:https://tavily.com/
3.1 SSE 方式
使用 host 方式访问,需要设置 https://mcp.so/server/tavily-mcp
3.2 本地方式
123456apt install npmgit clone https://github.com/tavily-ai/tavily-mcp.gitcd tavily-mcpnpm installnpm run buildnpx build/index.js # 运行试试
3.3 注意事项
在本地调用时,请勿将 ...
Manus和OpenManus
1 Manus
1.1 概述
官网:https://manus.im/usecases
根据 Manus 发布会的数据,Manus 的功能覆盖了 76% 的垂直类 Agent
项目。其官网展示了 50
多个用例,主要应用于数据分析、调查研究和效率提升。工程方面,Manus
付出了大量努力,整体交互比其他产品优化了许多。
从个人体验来看,Manus
的推广和设计非常出色,与浏览器的整合也令人印象深刻。它有效填补了市场空白,市面上虽有众多开源的
agent 工具,但普遍缺乏易用性;即便是 coze
的图形化界面模块拼接,也存在一定的使用门槛。
Manus
的另一大优势在于其示例表现。一句简单提问,即能获得优质输出。在国内,类似体验的产品有
kimi(检索)和 deepseek-R1(推理),但它们通常只处理单个简单问题。而
Manus
不仅可以在线搜索数据,还能够进行多步操作,解决复杂问题。这一特点似乎填补了市场空白。不过,其实际效果及成本如何,尚需进一步观察和讨论。
1.2 用户交互
界面:打开网站上的实例,可以清晰看到工作过程,左侧展示模型思考,右侧展示工具调用,左右分区的交互流畅。
...
成瘾与控制感
1 总结
有时候会有一些不受控的行为,即使发生了也打断不了内部的重复动作。也许这些只是小事,把小事看得太严重,是否也是一个问题?与
4o
讨论到习惯、掌控感、不甘心和一些应对方法,最后聊到如何构建自我,犯错在其中扮演着怎样的角色。
2 精华
控制感错觉:通过“做点什么”,即使是无效的,也能
假装自己掌控了局面。因为比起什么都不做,这至少是个行动。
本质上成瘾不仅仅是“喜欢某件事”,而是
大脑依赖某种方式来缓解焦虑,重建掌控感。
“焦虑”背后一方面是不确定,也可能是这个问题实际上我无法解决,而又面对不了这样的自己?接受不了现实中的自己?
真正的掌控不是“必须解决它”,而是“知道什么时候该停下来”。
高效的人调整方向,低效的人撞南墙。
每一次“失败”其实都是一次数据更新,帮助你不断调整参数,让自己变得更强。真正的失败是“停止学习”,而不是“做错了什么”。
3 对谈
3.1 强迫症
我:发信息没收到回复,就不停刷新;不停打开股票账户看……有点强迫症的感觉。如果没得到答案,或者没得到想要的答案,就停不下来,这是什么问题?好像这种无法控制和成瘾有点像。
4o:这种行为确实和“强迫性重复”或“ ...
对谈_250321_爱好当职业&爱人当配偶
总结
爱好与爱人,激情,物我两忘,很大程度上的作用是抽离现实。而一旦变成了工作或者配偶关系,它就变成了现实,成为压力源的一部分。
精华
限定自己**“3 秒决定,10
分钟执行”,先不纠结完美与否,先动起来,哪怕只是迈出一小步。
对谈
我:今天想聊要不要把爱好当职业,要不要和最爱的人结婚
4o:这两个问题有点像——“最喜欢的东西,适不适合作为人生的核心选择?”。当爱好带来生存压力时,你还爱它吗?如果“最爱”意味着强烈的情绪波动,可能适合铭记,而不是厮守。所以,这两个问题的核心可能是:你更在意纯粹的热爱,还是稳定长久的陪伴?
我:爱好和爱人,有一个重要的作用:抽离现实,给自己留一个避风港。而工作和配偶是生活的主线,不得不面对一些好的坏的,再遇到问题的时候可能就逃无可逃了。他们和昨天聊那个艺术有点相似,激情带来的临在状态,美好却不是实实在在的生活。我觉得都可以有,但不是一个东西,这么说有点背德感啊。
4o:不背德,反而很现实。激情确实能带来“临在”感,但它往往是短暂的,不足以支撑长久的生活。而工作和婚姻,涉及到责任、妥协、共同成长,它们要求的不是“沉浸于美好”,而是“面对一切”。这和艺 ...
对谈_250321_公平与谦让
1 对谈
我:想聊聊先人后己这个逻辑他是怎么来的。其实他是以集体主义和社会和谐为出发点的对吧。
4o:是的,“先人后己”的理念确实植根于集体主义和社会和谐等传统价值观。这个逻辑强调将他人或集体的利益置于个人利益之上,追求整体的和谐与共同繁荣。
比如:儒家文化强调人与人之间的关系和社会责任,通过历史文化、社会结构和经济政治因素,倡导集体主义和团队合作,以实现发展生产、社会稳定和伦理公正。
当然,在现代社会,随着个人主义的兴起和多元价值观的出现,先人后己的理念也受到了一些挑战和重新评估。现代社会注重个人的权利、自由和自主性,因此在追求社会和谐和个人发展之间需要寻找一个平衡。
我:我现在遇到的问题是,假设一件事情出了错,我和对方各有 50%
的责任,如果我基于温良恭俭让的原则,从内在就觉得我应该承担更多,更习惯反省。久而久之,老是把责任往自己身上揽,这会造成一种对自己偏负面的评价和关系的扭曲。
4o:你的处境反映了一种普遍的心理倾向,就是在问题中过多地归咎于自己,这可能源于对和谐美德的追求。然而,长期持有这样的责任分配习惯确实可能导致对自己负面的评价和人际关系的紧张。
我:我觉得对外界怎么表 ...
对谈_250322_责任与被动
精华
如果能把限制看作“游戏规则”,在规则内玩出自己的节奏,而不是单纯接受或抗拒,就更容易保持蓬勃的状态。
选择适合自己的领域
哪些事情或环境让你更容易进入主动状态?
是创造性的工作?探索性的学习?自由度高的合作?
你有没有哪种状态是“就算不强迫自己,也会主动去做”的?
哪些领域的“被动性”最让你难受?
具体是什么让你觉得被压制?是规则太死?外部评价太重?需要迎合?
有没有什么方式可以减少这些“被动性”,哪怕不能完全避免?
对谈
接上次:对谈_250321_爱好当职业&爱人当配偶
我:对于爱好与工作,爱情与婚姻,我觉得还有一个因素:责任,上次我们聊过责任,好像结论是谁对后果负责。我觉得责任还有一个重要特点:带有强制性,情理法上的“不得不”。当我们遇到问题,做决策或者反思时,动机很重要。有了责任,动机就没那么自发自主,主动和被动其实会有很大差别。
4o:是的,责任的“不得不”会改变动机的性质,从“我想做”变成“我必须做”,这种转变会直接影响我们的心理能量和体验感。
当一件事是主动选择时,它带来的动力是内生的,甚至会让人感到兴奋。但一旦责任介入,它就可能变成负担,即 ...
对谈_250323_合理的目标
精华
“做更好的自已”,这作为愿景还行,但不能作为目标。它没有清晰的终点,就会陷入无尽的追逐,最终既得不到满足,也可能失去动力。
我们从小被教育永不放弃,如果选择退而求其次,还是挺难的。不过分步走,我觉得这个真的可以。
怎么判断目标是否合理?
是否有清晰的完成标准?(而不是“还要更好”)
是否符合自己的核心需求?(而不是被外界评价驱动)
是否可行,是否能在一定时间内完成?(避免陷入无限优化)
自己想要的生活
什么样的日常让我感觉充实?
哪些状态下最有能量?
过去的哪些体验让我真正满足,而不是短暂兴奋?
对谈
我:前几天我录了一个视频,因为录的不够好,感觉有一种非常强烈的羞耻感,我把感觉写出来,就觉得说的好像有点重了,一个小东西你做不好可以有自卑感,但是羞耻感是对整个人的否定,理性上讲不至于,但那个感觉确实有点:恨不得找个地方钻进去。
4o:这种情绪与自尊、自我认同密切相关。自卑感通常与特定行为或表现有关,而羞耻感则涉及到对整个自我的负面评价,仿佛这个失败定义了你这个人。
这种羞耻感可能源自几种心理机制。首先,我们往往对自己抱有过高的期望,尤其是在表现型任务中。出现未达预期的 ...