高级计算机架构(一):当摩尔定律不再“自动奏效”:计算产业如何从更快更便宜走到更贵更难
发布于
过去几十年里,人们几乎默认计算机会一年比一年更快、更小、更便宜。这个直觉并不是凭空来的。半导体、架构、制造、软件和市场在很长一段时间里确实一起推动了指数级进步。但如果把这段历史看得更仔细一点,就会发现...
继续阅读 →Next Door 0.5x Engineer
发布于
过去几十年里,人们几乎默认计算机会一年比一年更快、更小、更便宜。这个直觉并不是凭空来的。半导体、架构、制造、软件和市场在很长一段时间里确实一起推动了指数级进步。但如果把这段历史看得更仔细一点,就会发现...
继续阅读 →发布于
前言 论文原文Code Review Agent Benchmark 自动代码评审离真正理解人类反馈还有多远 AI 写代码越来越快,代码评审反而更容易成为新的瓶颈。 今天的问题已经不是“模型能不能写...
继续阅读 →发布于
很多人第一次接触指令级并行时,直觉都是一样的:只要处理器一次能发更多指令,程序就会更快。真正的情况没有这么简单。指令之间的依赖、分支是否能提前预测、前端每周期能取多少条、后端每周期能发多少条、功能单元...
继续阅读 →发布于
一台处理器能不能把宽发射、乱序执行、多个功能单元真正喂饱,关键往往不在后端,而在前端。后端再宽,取不到足够多、足够连续、足够正确的指令,吞吐量就上不去。理解宽取指,真正要看的不是“每周期能取几条”这句...
继续阅读 →发布于
在现代乱序执行(Out-of-Order Execution)处理器中,分支预测错误(branch misprediction) 是性能的重要瓶颈之一。 Fast Branch Recovery 的目...
继续阅读 →发布于
概述 原文Harness design for long-running application development 核心背景与行业挑战 在全栈软件工程与前端设计的代理化(Agentic)开发前沿...
继续阅读 →发布于
引言 原文ARC-AGI-3: A New Challenge for Frontier Agentic Intelligence。 过去几年,AI 的进步快得惊人。 大模型会写代码、会做题、会对话,...
继续阅读 →发布于
引言 原文Claude Code auto mode: a safer way to skip permissions 背景与面临的挑战 批准疲劳(Approval Fatigue):在默认状态下,C...
继续阅读 →发布于
编译器优化(二)数据流分析与编译器前端 1 学习目标 本次讲座的核心目标包括: 完成 Snake 语言的程序分析与优化:探讨可能值分析(Possible values)以及断言消除(Assertion...
继续阅读 →发布于
本讲义主要探讨编译器的优化技术与数据流分析方法。 1 学习目标与课程引言 本课程的核心学习目标包括: 了解在编译器的不同阶段(抽象语法树 AST、静态单赋值中间表示 SSA IR、后端 Backend...
继续阅读 →