→
返回主页
阅读
MLAI
DeepSeek-R1:基于强化学习的大语言模型推理能力激励方法
发布于
2026-2-1
•
作者: DeepSeek-AI
介绍
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
的阅读笔记
笔记
探索主题
设计
统计
操作系统
MLAI
Rust
数据库
阅读
C++
计算机架构
k8s
记录
分布式
风格
网络
Go
编程范式
算法
编译器