Agent具体实现
1 适用场景
- 需要多步组合、选择路径的复杂问题。
- 该问题可以被拆分成多个子模块,每个子模块都能清晰地定义输入、输出和功能,并能判断是否达成目标。
- 可能感觉有解决的方法,但不能确定具体的每一步方法。
- 可能存在多种组合方式,而不仅限于单一的方法,并且我们无法确定最优的解决方案。
- 对于单个模块而言,只需将接口描述清楚,无需过多考虑它与其他模块之间的调用关系。
2 原理
Thought->Action->Observation (Repeated many times)。
代理根据用户输入及当前状态选择一个动作,执行该动作并观察结果,然后继续下一个动作。
有了代理,就不需要手动编写 if/else 逻辑了,只需将选项提供给模型,让其进行判断。
(图片来自网络)
3 langchain agent
Langchain 本身提供一些工具,例如 Google 搜索、GitHub 和 Python 等。如果需要自己实现工具,则需要继承 BaseTool 类,并实现 run 方法。模型根据工具的描述调用相应的方法,并观察其返回结果。
3.1.1 类别
- 计划代理:通过 llm 制定计划
- 执行代理:通过 llm 和 tools 实现计划
3.1.2 Chain 与 Agent 的差别
Chain 和 Agent 都用于解决多步问题。Chain 是静态的,过程是事先设计好的;而 Agent 则是动态的,由大模型来决策整个过程。
4 示例
1 | from langchain.llms import ChatGLM |
5 想法和启发
- 手动或自动将需要复用的方法封装成代理程序,以实现模块化并形成可重复使用的积木块。
- 让大语言模型组装这些积木块。
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.