Articles
845
Tags
265
Categories
177
Yan 的杂物志_个人主页分享
Search
Category - LLM_RL
2024
2024-03-24
强化学习与大模型结合研究
2024-03-21
大模型+强化学习_利用AI反馈扩展强化学习_RLAIF
2024-03-19
大模型+强化学习_在线交互调参_GLAM
2024-03-19
大模型+强化学习_自我对弈偏好优化
2024-03-19
大模型+强化学习_精典方法_RLHF
2024-03-16
大模型+强化学习_通过强化学习对齐大模型和环境
2023
2023-12-08
论文阅读_反思模型_Reflexion
1
Yan.xie
顺流而下还是逆流而上?
Articles
845
Tags
265
Categories
177
Follow Me
Announcement
This is my Blog
Recent Post
基金交易量预测比赛_1_数据分析
2025-08-03
基金交易量预测比赛_基金交易量与净值讨论
2025-08-03
视频_后处理
2025-08-01
以色列一个民族的重生_读后感
2025-07-29
以色列一个民族的重生_背景知识
2025-07-29
Categories
0_IMO
84
工作
1
方法
1
工作
1
说给一个人听
82
01_自我建构
32
实修
3
思考与觉悟
16
Tags
生物医学/重症
图形图像
个人信息
阅读/经济学
商业化
技术
禅宗
深度学习/图形图像
软件版权
日常记录
开源许可
操作系统
知识图/知识图谱
#Python
深度学习/模型结构
Obsidian
阅读/哲学
理财规划
关系维护
程序员
智能家居
聊天
多代理系统
自动驾驶
沟通
阅读心理学
视频处理
强化学习
网络服务
嵌入表示
社会现象
旅游
远视镜
技巧
焦虑
工作思考
大语言模型
辅助编程
LLM
数据存储/ES
Archives
August 2025
3
July 2025
40
June 2025
38
May 2025
29
April 2025
16
March 2025
8
February 2025
2
January 2025
6
Info
Article :
845
Total Count :
1176.6k
UV :
PV :
Last Push :
Search
Loading the Database