Articles
921
Tags
297
Categories
201
Yan 的杂物志_个人主页分享
Search
Category - LLM_RL
2024
2024-03-24
强化学习与大模型结合研究
2024-03-21
大模型+强化学习_利用AI反馈扩展强化学习_RLAIF
2024-03-19
大模型+强化学习_在线交互调参_GLAM
2024-03-19
大模型+强化学习_自我对弈偏好优化
2024-03-19
大模型+强化学习_精典方法_RLHF
2024-03-16
大模型+强化学习_通过强化学习对齐大模型和环境
2023
2023-12-08
论文阅读_反思模型_Reflexion
1
Yan.xie
顺流而下还是逆流而上?
Articles
921
Tags
297
Categories
201
Follow Me
Announcement
This is my Blog
Recent Post
DeepSeek V3.2技术解析
2026-01-23
基金投顾跟车服务指南
2026-01-23
DeepSeek条件记忆Engram
2026-01-23
论文阅读_使用LLM对大脑的影响
2026-01-23
3D 打印手办上色的材料与优化
2026-01-20
Categories
0_IMO
90
工作
1
方法
1
工作
1
说给一个人听
88
01_自我建构
36
实修
3
思考与觉悟
17
Tags
机器学习/自动建模
阅读
美食
灵感创意
大型语言模型
理财规划
关系维护
语音
卷积神经网络
Python/股票
表达自由
舞台感
饮食
数据存储/MYSQL
3D打印
聊天
Ubuntu
感知
关系反转
文化反思
程序员
思维整理
编程语言/C
Obsidian
概率分布
社会关系
机器学习/时序
推荐系统
Python
自然语言处理/大模型
模型解释
图形图像
基金
禅宗
世界观
LLM
Django
文件管理
网络环境
读书
Archives
January 2026
14
December 2025
25
November 2025
12
October 2025
9
September 2025
5
August 2025
17
July 2025
38
June 2025
37
Info
Article :
921
Total Count :
1283.2k
UV :
PV :
Last Push :
Search
Loading the Database