Category: LLM_RL | Yan 的杂物志_个人主页分享

Category - LLM_RL

2024

2024-03-24

强化学习与大模型结合研究

2024-03-21

大模型+强化学习_利用AI反馈扩展强化学习_RLAIF

2024-03-19

大模型+强化学习_在线交互调参_GLAM

2024-03-19

大模型+强化学习_自我对弈偏好优化

2024-03-19

大模型+强化学习_精典方法_RLHF

2024-03-16

大模型+强化学习_通过强化学习对齐大模型和环境

2023

2023-12-08

论文阅读_反思模型_Reflexion

Loading the Database