→
返回主页
切换主题
阅读
MLAI
DeepSeek-R1:基于强化学习的大语言模型推理能力激励方法
发布于
2026-2-1
•
作者: DeepSeek-AI
介绍
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
的阅读笔记
笔记
探索主题
算法
MLAI
计算机架构
Rust
记录
操作系统
编程范式
商业
网络
统计
k8s
数据库
风格
编译器
C++
Go
分布式
阅读
设计