avatar
Articles
845
Tags
265
Categories
177

Yan 的杂物志_个人主页分享
Search
Category - LLM_RL
2024
2024-03-24
强化学习与大模型结合研究
2024-03-21
大模型+强化学习_利用AI反馈扩展强化学习_RLAIF
2024-03-19
大模型+强化学习_在线交互调参_GLAM
2024-03-19
大模型+强化学习_自我对弈偏好优化
2024-03-19
大模型+强化学习_精典方法_RLHF
2024-03-16
大模型+强化学习_通过强化学习对齐大模型和环境
2023
2023-12-08
论文阅读_反思模型_Reflexion
1
avatar
Yan.xie
顺流而下还是逆流而上?
Articles
845
Tags
265
Categories
177
Follow Me
Announcement
This is my Blog
Recent Post
基金交易量预测比赛_1_数据分析2025-08-03
基金交易量预测比赛_基金交易量与净值讨论2025-08-03
视频_后处理2025-08-01
以色列一个民族的重生_读后感2025-07-29
以色列一个民族的重生_背景知识2025-07-29
Categories
  • 0_IMO84
    • 工作1
    • 方法1
      • 工作1
    • 说给一个人听82
      • 01_自我建构32
        • 实修3
        • 思考与觉悟16
Tags
生物医学/重症 图形图像 个人信息 阅读/经济学 商业化 技术 禅宗 深度学习/图形图像 软件版权 日常记录 开源许可 操作系统 知识图/知识图谱 #Python 深度学习/模型结构 Obsidian 阅读/哲学 理财规划 关系维护 程序员 智能家居 聊天 多代理系统 自动驾驶 沟通 阅读心理学 视频处理 强化学习 网络服务 嵌入表示 社会现象 旅游 远视镜 技巧 焦虑 工作思考 大语言模型 辅助编程 LLM 数据存储/ES
Archives
  • August 20253
  • July 202540
  • June 202538
  • May 202529
  • April 202516
  • March 20258
  • February 20252
  • January 20256
Info
Article :
845
Total Count :
1176.6k
UV :
PV :
Last Push :
©2020 - 2025 By Yan.xie
Framework Hexo|Theme Butterfly
京公网安备11010802043346号
京ICP备2023029600号-1
Search
Loading the Database