METIS:具备配置自适应能力的快速高质量感知 RAG 系统
发布于
介绍 METIS: Fast Quality-Aware RAG Systems with Configuration Adaptation的阅读笔记 笔记 notes notes notes...
继续阅读 →Next Door 0.5x Engineer
发布于
介绍 METIS: Fast Quality-Aware RAG Systems with Configuration Adaptation的阅读笔记 笔记 notes notes notes...
继续阅读 →发布于
介绍 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning的阅读笔记 笔记 notes ...
继续阅读 →发布于
介绍 AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning的阅读笔记 笔记 no...
继续阅读 →发布于
介绍 TrainVerify: Equivalence-Based Verification forDistributed LLM Training的阅读笔记 笔记 notes notes notes...
继续阅读 →发布于
介绍 Oobleck: Resilient Distributed Training of Large Models Using Pipeline Templates的阅读笔记 笔记 notes no...
继续阅读 →发布于
大文件 在这个作业中,你将增加 xv6 文件的最大大小。目前 xv6 文件的大小限制为 268 个块,或 268*BSIZE 字节(BSIZE 在 xv6 中为 1024)。这个限制源于 xv6 的 ...
继续阅读 →发布于
摘要 近年来,大型语言模型(LLMs)倾向于利用稀疏性来减少计算量,常用的方法是采用稀疏激活的混合专家(Mixture-of-Experts, MoE)技术。MoE 引入了四个模块,包括令牌路由(to...
继续阅读 →发布于
介绍 本文是Alpa: Automating Inter- and Intra-Operator Parallelism for Distributed Deep Learning的译文与笔记。 摘要...
继续阅读 →发布于
结构笔记 alt text 文件系统 文件系统的目的是组织和存储数据。文件系统通常支持用户和应用之间的数据共享,以及持久性,从而保证在系统重启后数据仍然可用。 xv6 文件系统提供了类 Unix 的文...
继续阅读 →发布于
介绍 本文是Pie: A Programmable Serving Systemfor Emerging LLM Applications的笔记与译文。 Notes notes notes notes...
继续阅读 →