HNSW算法笔记
发布于
介绍 Hierarchical Navigable Small World(HNSW)算法过程笔记。 hnsw-1 hnsw-2 hnsw-3 hnsw-4 hnsw-5 hnsw-6...
继续阅读 →Next Door 0.5x Engineer
发布于
介绍 Hierarchical Navigable Small World(HNSW)算法过程笔记。 hnsw-1 hnsw-2 hnsw-3 hnsw-4 hnsw-5 hnsw-6...
继续阅读 →发布于
目录 引言 基础 规划与设计 测试与迭代 分发与共享 模式与故障排除 资源与参考 引言 技能(Skill) 是一组指令——以一个简单的文件夹形式打包——用于教会 Claude 如何处理特定任务或工作流...
继续阅读 →发布于
介绍 METIS: Fast Quality-Aware RAG Systems with Configuration Adaptation的阅读笔记 笔记 notes notes notes...
继续阅读 →发布于
介绍 DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning的阅读笔记 笔记 notes ...
继续阅读 →发布于
介绍 AReaL: A Large-Scale Asynchronous Reinforcement Learning System for Language Reasoning的阅读笔记 笔记 no...
继续阅读 →发布于
介绍 Oobleck: Resilient Distributed Training of Large Models Using Pipeline Templates的阅读笔记 笔记 notes no...
继续阅读 →发布于
介绍 TrainVerify: Equivalence-Based Verification forDistributed LLM Training的阅读笔记 笔记 notes notes notes...
继续阅读 →发布于
大文件 在这个作业中,你将增加 xv6 文件的最大大小。目前 xv6 文件的大小限制为 268 个块,或 268*BSIZE 字节(BSIZE 在 xv6 中为 1024)。这个限制源于 xv6 的 ...
继续阅读 →发布于
摘要 近年来,大型语言模型(LLMs)倾向于利用稀疏性来减少计算量,常用的方法是采用稀疏激活的混合专家(Mixture-of-Experts, MoE)技术。MoE 引入了四个模块,包括令牌路由(to...
继续阅读 →发布于
介绍 本文是Alpa: Automating Inter- and Intra-Operator Parallelism for Distributed Deep Learning的译文与笔记。 摘要...
继续阅读 →