归档

So far, all thoughts and records sorted by time.

探索主题

2026(47篇)

METIS:具备配置自适应能力的快速高质量感知 RAG 系统 DeepSeek-R1:基于强化学习的大语言模型推理能力激励方法 AReaL:用于语言推理的大规模异步强化学习系统 TrainVerify:基于等价性的分布式大语言模型训练验证方法 Oobleck:大模型分布式训练的容错革命 xv6内核扩展8:文件系统 FSMoE:一种用于稀疏混合专家模型的灵活且可扩展的训练系统 Alpa:用于分布式深度学习的算子间与算子内并行自动化 xv6:一个简单的unix-like操作系统译文(十) Pie:面向新兴 LLM 应用的可编程服务系统 xv6内核扩展7:锁 零气泡流水线并行 WLB-LLM:用于大语言模型训练的工作负载均衡4D 并行方案 Parrot:通过语义变量高效服务基于 LLM 的应用 xv6:一个简单的unix-like操作系统译文(七) E1000网卡用户开发手册(节选) xv6内核boot流程(参考) xv6内核扩展6:网络 MIT 6.1810 课程笔记汇总 Rust智能指针 xv6内核扩展5:写时复制fork() xv6:一个简单的unix-like操作系统译文(五) xv6:一个简单的unix-like操作系统译文(六) 基于 Megatron-LM 的 GPU 集群上高效大规模语言模型训练 编译器:Let 绑定和简单栈分配 编译器相关内容汇总 类Python编译器项目Spec(一) 认证 Kubernetes 应用开发者(CKAD)学习指南(三) OpenHands:面向 AI 软件开发者的通用代理开放平台 编译器:抽象语法树和解释器 The Illustrated Transformer 认证 Kubernetes 应用开发者(CKAD)学习指南(一、二) Patching until the COWs come home SystemVerilog Tips 可扩展智能体系统相关汇总 机器学习集群效率:使用 ML 生产力吞吐量分析与优化大规模 Google TPU 系统 xv6内核扩展4:traps 关于评估大语言模型(LLM)推理系统性能 数据中心即计算机(一、二章节) xv6内核扩展3:页表 如何阅读论文 xv6:一个简单的unix-like操作系统译文(三) xv6内核扩展2:系统调用 xv6内核相关内容汇总 ELF,汇编,符号与重定向表 xv6:一个简单的unix-like操作系统译文(四) xv6:一个简单的unix-like操作系统译文(二)