DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning - Concepedia

Concepedia

Publication | Open Access

DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning

DOI Full Paper Access

268

Citations

9

References

2025

Year

Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Peiyi Wang, Qihao Zhu, Runxin Xu, Ruoyu Zhang, Shirong Ma, Xiao Bi,

References

	Year	Citations

Page 1