Articles
806
Tags
240
Categories
164
Yan 的杂物志_个人主页分享
Search
Tag - 强化学习
2025
2025-05-07
对谈_250411_人的奖励函数
2025-05-05
对谈_250319上_有的人更需要价值观
2025-03-21
论文阅读_Search-R1:大模型+搜索引擎
2024
2024-04-22
股票预测强化学习模型解析
2024-03-24
强化学习与大模型结合研究
2024-03-19
大模型+强化学习_精典方法_RLHF
2023
2023-04-15
医学论文_ICU_强化学习_SEPSIS
2023-03-10
7_1_强化学习_ChatGPT为什么使用强化学习
2023-03-04
论文阅读_近端策略优化_PPO
2023-02-17
论文阅读_AlphaGo_Zero
1
2
Yan.xie
顺流而下还是逆流而上?
Articles
806
Tags
240
Categories
164
Follow Me
Announcement
This is my Blog
Recent Post
250523_对谈_用叙事打磨世界观
2025-05-23
250512_对谈_股票操作中的概率与心理
2025-05-21
250520_对谈_最近发展区理论与实践
2025-05-21
论文阅读_现实的叙事构建
2025-05-21
2505xx_对谈_家长的角色2
2025-05-20
Categories
0_IMO
54
工作
1
说给一个人听
53
01_自我建构
21
思考与觉悟
11
行动与进化
10
02_情绪心理
12
03_关系互动
9
Tags
开源项目
模型解释
android
后端
关系反转
Web服务
情感
嵌入技术
编程
价值观
模型优化
工作思考
自我构建
开发
菜谱
Arduino
性能
戏剧中的心理真实
远视镜
阅读/经济学
自动化
音频处理
音视频处理
操作系统/Linux
目标管理
咖啡拉花
艺术
自我表达
Pytorch
思维整理
自动驾驶
奖励机制
操作系统
阅读/哲学
网络
深度学习/工具
阅读/育儿
机器学习/自动建模
阅读哲学
Obsidian
Archives
May 2025
65
April 2025
16
March 2025
12
February 2025
2
January 2025
6
December 2024
2
November 2024
6
October 2024
4
Info
Article :
806
Total Count :
1095.3k
UV :
PV :
Last Push :
Search
Loading the Database