avatar
Articles
851
Tags
236
Categories
189

Yan 的杂物志_个人主页分享
Search
Category - Agent
2024
2024-03-19
大模型+强化学习_在线交互调参_GLAM
2024-03-19
大模型+强化学习_自我对弈偏好优化
2024-03-19
大模型+强化学习_精典方法_RLHF
2024-03-16
大模型+强化学习_通过强化学习对齐大模型和环境
2024-01-11
论文阅读_训练大模型用于角色扮演
2023
2023-12-08
论文阅读_反思模型_Reflexion
2023-11-21
论文阅读_生成式Agent
2023-09-04
论文阅读_大模型_ToolLLM
2023-03-11
论文阅读_PaLM-E
12
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
851
Tags
236
Categories
189
Follow Me
Announcement
This is my Blog
Recent Post
LLM+知识库_总结篇2026-04-10
LLM_知识库_02_记忆宫殿2026-04-10
LLM_知识库_03_LLM_Wiki2026-04-10
模仿欲望_读后感2026-04-07
OpenAI的CUA_ComputerUseAgent2026-04-07
Categories
  • 0_IMO2
    • 工作1
    • 方法1
      • 工作1
  • 1_Data11
    • 生活9
      • 主食3
      • 菜3
Tags
Arduino 生物医学/重症 阅读 Pytorch 知识库 生物医学 知识图/知识表示 思维整理 安卓开发 笔记工具 嵌入表示 浏览器 饮食 音视频处理 网络环境 开发 旅行 智能家居 自动化 插件推荐 #编程语言/前端 算法实战 菜谱 后端测试 旅游 烹饪 项目管理 代码模型 情绪分析 后端 语言学 读书 自然语言处理/大模型 法律 阅读/心理学 日常记录 历史 模型优化 Web服务 插件开发
Archives
  • April 202616
  • March 20265
  • February 202637
  • January 20262
  • December 20252
  • November 202511
  • October 20258
  • September 20254
Info
Article :
851
Total Count :
1084.3k
UV :
PV :
Last Push :
©2020 - 2026 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database