→
返回主页
阅读
MLAI
Oobleck:大模型分布式训练的容错革命
发布于
2026-1-31
•
作者: Insu Jang et al.
介绍
Oobleck: Resilient Distributed Training of Large Models Using Pipeline Templates
的阅读笔记
笔记
探索主题
Go
编译器
k8s
编程范式
算法
操作系统
MLAI
数据库
阅读
统计
风格
网络
C++
计算机架构
Rust
记录
分布式
设计