→
返回主页
阅读
MLAI
Oobleck:大模型分布式训练的容错革命
发布于
2026-1-31
•
作者: Insu Jang et al.
介绍
Oobleck: Resilient Distributed Training of Large Models Using Pipeline Templates
的阅读笔记
笔记
探索主题
网络
Go
记录
分布式
风格
编程范式
算法
编译器
MLAI
Rust
设计
统计
操作系统
计算机架构
k8s
数据库
阅读
C++