→
返回主页
阅读
MLAI
DeepSeek-R1:基于强化学习的大语言模型推理能力激励方法
发布于
2026-2-1
•
作者: DeepSeek-AI
介绍
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
的阅读笔记
笔记
探索主题
数据库
阅读
统计
操作系统
MLAI
计算机架构
Rust
记录
分布式
设计
风格
网络
C++
Go
编译器
k8s
编程范式
算法