前沿系统算力与上下文回路战争 · Anjney Midha
2026-06-09 · 由 PodLens 生成的忠实解读
原节目:https://youtu.be/O5PfU_uDhS0?si=NqN33V5MiP7ergT8 · 时间戳可点击,就地跳转播放器
前沿系统算力竞争上下文窗口开源模型地缘技术
这期讲了什么
本期是 Stanford CS153(Frontier Systems)课程的讲座,由联合授课教师、AMP PBC 联合创始人 Anjney Midha 主讲。讲座核心围绕 AI 领域前沿系统的 compute 基础设施与 context 反馈循环展开,探讨在 AI 大模型时代,如何突破 context、compute、capital 与 culture 这四大瓶颈以持续推进前沿技术的发展。讲座逻辑架构从个人的 life scaling laws 与人际关系投资出发,过渡到 AI 制造模型与商业化飞轮,重点剖析了 context 反馈循环在强化学习中的关键性,以及 compute 基础设施的非同质化、周期性、难以预测性及标准化趋势,最后呼吁学生思考如何在 compute 非商品化的时代积极参与并推动 compute 基础设施的建设与公共标准的制定。
时间线主题地图
- [00:11-02:44]:开场与课程管理介绍。介绍联合授课教师 Mike,探讨增设虚拟 office hours 的可能性,并回应 Twitter 上关于本课程是“AI Coachella”的调侃。
- [02:45-07:35]:Anjney Midha 个人的人生经验与 life scaling laws。强调人际关系、信任与友情在大型组织 and 人生长周期中的不对称优势,不应为工作牺牲真正重要的东西。
- [07:36-09:57]:讲师个人背景介绍。分享其 India 出生、Singapore 求学以及在 Stanford 攻读数学与计算科学、生物信息学的经历,以及在过去 10-15 年中早期投资或联合创立 10 余家 AI 实验室(如 Anthropic, Mistral, Black Forest Labs)的背景。
- [09:58-12:03]:行业 stack 的重构与 CS 系统的伟大转型。从 capital、land power shell、compute chips 到 model、agent、application 及 governance 层,阐述整个行业系统正经历由 AI 驱动的全面假设重构。
- [12:04-16:45]:大模型工业化生产流程与强化学习的崛起。阐述模型开发从 bespoke 过程向规模化工业工程的转变,介绍 base model、mid training、continuous post training 的周期,并强调强化学习在最后一步消耗了巨大 compute 并驱动了前沿能力的提升。
- [16:46-23:37]:算力商业化与 context 反馈飞轮。回顾四年前与 Anthropic 创始人筹资被拒的经历,解析“筹资购买 compute -> 获得数据与预训练 -> 部署 inference -> 获得用户 context 反馈 -> 通过 RL 提升能力”的闭环,提出价值捕获的核心在于对独特 context 的控制。
- [23:38-29:16]:Context 回路战争与 sovereign AI 的崛起。以 OpenAI 收购 Windsurf IDE 导致 Anthropic 随即对其切断 API 访问为例说明 context 泄露的行业防范;介绍 Mistral 的创立初衷,解释 Europe 因 CLOUD Act 对敏感 context 的本地化控制诉求,从而推动了云基础设施的全球洗牌。
- [29:17-37:09]:系统层面的 recursive self-improvement。探讨通过 state-of-the-art 任务,运行 compute 与 context 反馈飞轮,最终在系统层面实现自我提升。分析 RL 的局限性:在代码等易验证领域发展极快,但在美学、写作等难以验证的领域极易陷入平庸与幻觉。
- [37:10-46:43]:算力基础设施的预测与不确定性。分析算力跳跃与 Anthropic 营收的强相关性,展示 compute 转化为高价值软件营收的投资回报比,指出五大科技巨头正以前所未有的 CapEx 构建基础设施。
- [46:44-58:32]:算力周期与历史上的基础设施规律。通过对比钢铁(Panic of 1873)、光纤(2000 年前后网络泡沫)、DRAM、铀(1970 年代核能繁荣)等非同质化、不可替换资源的暴涨、恐慌性囤积、破裂与标准化过程,说明 compute 同样具有极强的周期性、非同质化及难以预测的微观特征。
- [58:33-01:05:02]:算力商品化的未来路径与公共利益。指出打破囤积和算力垄断需要通过“技术标准”(类似 AC/DC、TCP/IP)与“协调机构”来解决可替代性、pooling、计量与结算问题,呼吁 Stanford 学生作为活跃参与者为未来的公共标准出谋划策,并以 Grant Sanderson(3Blue1Brown)的教育 taste 讨论收尾。
核心观点清单
-
真正的优势是那些无法在大型组织中被轻易扩展的资产,如人际关系、信任与友情。
证据 [06:34-07:11]
类型 观点
说明 Anjney Midha 认为大型组织虽拥有庞大资源,但小团队的专注和对彼此的深厚信任是无法被大组织规模化扩展的。
-
AI 大模型的开发已经从手工定制(bespoke)过程转变为规模化的工业工程流程。
证据 [15:08-16:06]
类型 事实
说明 行业现在以每年至少两次 base model 训练、配合频繁的中段训练和持续后训练构建模型。
-
强化学习(RL)阶段消耗的算力正在逼近整个大模型管道其余部分的总和。
证据 [16:07-16:45]
类型 事实
说明 这一趋势在最近的模型能力跃升中体现得尤为明显,属于新的行业共识。
-
AI 产业的终极价值捕获取决于对特定 context 和环境的主权或独占控制权。
证据 [24:51-27:48]
类型 观点
说明 谁能拥有独特且受保护的 context 反馈环,谁就能在 compute 飞轮的驱动下胜出;失去 context 控制力的团队会被边缘化。
-
OpenAI 收购 Windsurf IDE 导致 Anthropic 封禁其 API,标志着 context 回路战争的开始。
证据 [27:49-29:00]
类型 例子
说明 这打破了“模型公司会无条件为应用层公司提供接口”的假设。
-
出于国家安全 and 主权诉求,sovereign AI 的崛起正促使全球云基础设施格局重组。
证据 [30:57-34:17]
类型 事实
说明 受 US 的 CLOUD Act 等政策影响,Europe 等国需要本地部署、由自己掌控敏感 context 的开源模型(如 Mistral)。
-
强化学习(RL)在前沿的进展速度与领域的易验证性成正比。
证据 [38:39-39:35]
类型 观点
说明 在代码、材料科学等有明确单元测试或物理指标的领域,AI 可实现指数级自我改进;但在美学、创意写作等难以验证的领域,容易陷入平庸与幻觉。
-
前沿 AI 算力与 Anthropic 等大模型公司的软件营收存在极强的 predictable 对应关系。
证据 [44:03-45:32]
类型 事实
说明 将 3-4 倍估值的重资产 compute 投入转化为 30-40 倍估值的软件收入,是当前资本市场最清晰的套利交易。
-
GPU 算力并非同质化的普通商品,其价格正因恐慌性囤积而逆势上升。
证据 [48:28-51:01]
类型 事实
说明 不仅 AMD 与 NVIDIA 之间的芯片无法替换,甚至同一厂商的不同代芯片(如 H100 与 B300)在微观上也无法兼容。
-
要将算力转化为真正普惠的商品,必须建立统一的技术标准与多方协调机构。
证据 [17:02-17:44]
类型 预测
说明 当前处于算力标准化的 pre-standardization era,未来需类似 AC/DC 或 TCP/IP 的算力池化、结算与交割协议。
内部张力与自我修正
- [37:30-38:05] vs [38:39-41:17]:哲学家视角(如果给予足够的 compute 和 context,智能体能学会任何事,包括自我构建新环境)与经验主义视角(大模型在难以验证的美学、taste 和长文创作上极易撞墙,甚至在 AMP PBC 内部已被禁止使用 AI 生成工作文档)之间的张力,反映出 compute 规模化无法直接解决复杂的人类验证与品味问题。
大白话重讲
那我们来聊聊本期 Anjney Midha 带来的前沿系统课。听完这一期,你会发现很多关于 AI 和算力的流行论调其实都站不住脚。
首先,Anjney Midha 给 Stanford 的学生泼了瓢冷水,也给所有人提供了一个观察行业的框架:AI 领域的竞争正在从“模型参数的军备竞赛”,悄悄转向“context 回路的争夺战”。这就像训练宠物,如果你把宠物放在公园里,这个公园的物理特性、草地、雨水,就是它的 context。AI 模型也是一样,模型能走多远,取决于它所处的验证环境是否足够精准。
为什么写代码和材料科学的 AI 发展得这么快?因为这两个领域极度“可验证”。写代码有单元测试,行就是行,不行就报错;材料科学有物理实验和测试仪器,超导就是超导。在这种黑白分明的环境里,强化学习就可以没完没了地跑飞轮,实现算力与能力的狂飙。但在美学、品味、创意写作甚至爱情这些“无法被硬性验证”的领域,AI 就极容易撞墙。这也是为什么 Anjney Midha 的团队 AMP PBC 内部严禁使用 AI 生成的工作文档——那种带着典型“game changer”、“not just x but y”的 AI 腔调,一眼就会被识破。
这就引出了本期的另一个震撼观点:算力根本不是普通的商品。现在很多经济学家和媒体都在炒作“算力泡沫”,说 GPU 很快就会像电力或煤炭一样过剩贬值。但实际上,云厂商 of GPU 租金在过去几个月里不降反升,甚至像 H100 这种两年前的芯片依然极度紧俏。原因在于,算力是高度“非同质化”的。不同代甚至同一代不同型号 of GPU 在系统微观层面上根本无法无缝替代。由于算力需求是高度 spiky 且难以预测的,各个大厂都在像历史上恐慌性囤积钢铁、铀和光纤一样,不计成本地把重资产(土地、电力、厂房)转化为高估值的 bits(智能)。
为了打破这种大厂的算力囤积和垄断,算力行业必须迎来它的“标准化时代”。就像当年电力的交流/直流电标准,或者互联网的 TCP/IP 协议一样,只有建立了算力池化、计量和跨厂商结算的统一行业标准,算力才能真正走向商品化。这也是 Anjney Midha 给所有年轻研究者和开发者的建议:不要觉得只有去大厂、花几十亿买显卡才能做前沿创新。你的 taste、你对特定不可扩展(non-scalable)context 的敏锐度,以及对行业技术标准的定义权,才是真正能够抗衡大厂垄断的“非对称武器”。
值得精听的片段
- [06:34-07:11]:Anjney Midha 谈到在面对巨头投入巨额算力时,小团队的“非对称赌注”和“特殊武器”。他提到信任、友情和对特定事物的热爱与痴迷,是大型组织无法通过 scale 来复制的资产。这段话语速诚恳,带着强烈的个人感悟,是整场讲座中极具人文温度的时刻。
- [27:49-29:00]:关于 OpenAI 收购 Windsurf IDE 导致 Anthropic 立即切断其 API 访问的 context 战争爆料。Anjney Midha 用极为平静的行业视角拆解了这个事件背后的底层逻辑——这并非普通的商业摩擦,而是各方为防范自身模型在用户开发 context 中的“知识蒸馏”和泄露所采取的防御手段,展现了商业底层的残酷竞争。
- [38:39-41:17]:Anjney Midha 承认自己在创意写作上尝试使用 LLM 时碰壁,并透露其 co-founder 如何在 30 秒内识破 AI 腔调,进而促成 AMP PBC 制定“禁止在内部传递 AI 生成文档”的铁律。听这段时可以注意他语气中的自嘲与坦率,生动地揭示了即使是前沿 AI 实验室的早期投资者,也在时刻面对模型能力的边界与品味的缺陷。
- [48:28-51:01]:对 GPU 算力不降反升、以及“算力即毒品”的行业黑话的探讨。他分享了当天早上某融了数十亿美元的创始人因“算力恐慌”紧急求购 H100 且“价格不是问题”的真实聊天记录,活画出当前硅谷算力囤积狂潮的紧迫状态。
与往期的呼应
- 印证→ 前沿 AI 的现实与个人英雄主义的终结 · Yao Shunyu
两者高度一致地指出,编程之所以成为人工智能进化最快的场景,核心在于其拥有极度明确且易于验证的反馈信号(如单元测试),这使得强化学习能够进行高效的闭环自我改进。
本期[38:39-39:35] 强化学习(RL)在前沿的进展速度与领域的易验证性成正比。在代码、材料科学等有明确单元测试或物理指标的领域,AI 可实现指数级自我改进;但在美学、创意写作等难以验证的领域,容易陷入平庸与幻觉。
- 补充→ 经验时代:超越人类数据的强化学习 · David Silver
两者在机制上互为补充:前者指出强化学习的成败取决于领域本身的易验证性,而后者从理论上解释了原因——只有摆脱人类主观预判、依赖来自客观环境的具地反馈,智能体才能突破瓶颈并实现真正的指数级自我改进。
本期[38:39-39:35] 强化学习(RL)在前沿的进展速度与领域的易验证性成正比。在代码、材料科学等有明确单元测试或物理指标的领域,AI 可实现指数级自我改进;但在美学、创意写作等难以验证的领域,容易陷入平庸与幻觉。
往期Rewards · "Relying on human prejudgement in this manner usually leads" 依赖人类预判的奖励会给智能体性能设定无法逾越的上限,而来自环境的具地/接地奖励(grounded rewards)能让智能体发现超越人类现有知识的新策略。
- 同构← 算力底座与智能的连续运行 · Jensen Huang
黄仁勋阐述的“极致协同设计”(将芯片、网络、软件栈深度绑定以榨取性能)在底层机制上解释了为什么不同代际和厂商的算力在微观上高度不兼容、无法成为同质化商品。
本期[48:28-51:01] 图形处理器(GPU)算力并非同质化的普通商品,不仅不同厂商之间的芯片无法替换,甚至同一厂商的不同代芯片(如 H100 与 B300)在微观上也无法兼容。
往期[10:02-12:20] 芯片设计必须转向硬件、编译器与软件栈的极端协同设计(Codesign),通过对处理器、高速互联、交换机和库的全局协同来提升性能,而非依赖单一硬件微缩。
- 补充← 风险投资的系统设计与智能时代的范式转移 · Ben Horowitz
两者均指出传统的软件代码和界面在人工智能时代已失去防御性,并从不同维度指出了新护城河的本质:前者强调物理世界的供应链与专属销售渠道,后者则强调对特定上下文反馈闭环的独占控制。
往期[21:53-22:10] 在 AI 泛在的 SaaSpocalypse 时代,代码和用户界面不再具有防御性,真正的防线是物理供应链和特定的销售渠道。
- 印证← 风险投资的系统设计与智能时代的范式转移 · Ben Horowitz
前者从技术底层解释了为什么人工智能打破了传统软件工程的限制(即算力和数据规模能直接转化为能力突破),后者则从资本层面印证了这一规律,展示了重资产的算力投入如何能够精准、可预测地转化为高估值的软件营收。
本期[44:03-45:32] 前沿 AI 算力与 Anthropic 等大模型公司的软件营收存在极强的 predictable 对应关系,将重资产 compute 投入转化为软件收入是当前最清晰的套利交易。
往期[20:39-21:22] AI 正在打破软件工程“无法通过资本和人力进行并行加速”的历史规律。充足的 GPU 与数据能够直接转化为能力突破,这使资金规模成为核心竞争要素。
- 延伸← 风险投资的系统设计与智能时代的范式转移 · Ben Horowitz
两者共同探讨了国家安全焦虑对人工智能地缘格局的深刻塑造。前者警示了政府因安全恐惧进行防御性过度监管可能导致的技术竞争失败,后者则指出了这种国家主权与安全诉求正在物理层面上重塑全球云基础设施的分布格局。
- 印证← 视觉智能的物理根基与多模态飞轮 · Andreas Blattmann
两方均指出,物理规律或明确的验证指标提供了天然且客观的边界约束,这使得动作、代码等可验证领域的模型优化路径比主观且难以量化的美学评估更为清晰和高效。
本期[38:39-39:35] 强化学习(RL)在前沿的进展速度与领域的易验证性成正比。在代码、材料科学等有明确单元测试或物理指标的领域,AI 可实现指数级自我改进;但在美学、创意写作等难以验证的领域,容易陷入平庸与幻觉。
往期[36:45-37:06] 物理边界条件是检验和自动约束动作生成模型最天然的单元测试,这与难以量化的图像审美评估有着本质的区别。
- 印证← 语音 AI 的前沿系统与未来 · Mati Staniszewski
两者从应用表现与底层机制两个维度共同解释了 AI 无法在创意领域实现全自动生成的深层原因:由于美学与创意缺乏明确的验证指标,模型在没有人工干预的情况下极易陷入平庸或产生低质垃圾内容,因此必须采用保留人类导演控制的协同工具形态。
本期[38:39-39:35] 强化学习(RL)在前沿的进展速度与领域的易验证性成正比。在美学、创意写作等难以验证的领域,AI 难以实现自我改进,容易陷入平庸与幻觉。
往期[59:31-1:01:11] AI 在文化创意领域的最佳应用形态是“中到中”(middle-to-middle)的协同工具,而非“端到端”(end-to-end)的直接生成。直接生成容易导致低质垃圾内容(AI Slop),而精细化的导演控制才是落地关键。
- 补充← 语音 AI 的前沿系统与未来 · Mati Staniszewski
前者为后者提供了微观层面的实践路径:通过社区和产品驱动增长模式建立的紧密用户互动闭环,正是初创企业在宏观上获取并独占“上下文反馈环”以捕获终极价值的具体手段。
本期[24:51-27:48] AI 产业的终极价值捕获取决于对特定上下文(context)和环境的主权或独占控制权,拥有独特且受保护的上下文反馈环的企业才能在算力飞轮驱动下胜出。
往期[03:37-04:03] 社区驱动与产品驱动增长(PLG)模式是 AI 新创企业获取用户反馈和发现非预测性用例的最佳路径,例如通过 Discord 社区维持与创作者和开发者的紧密闭环。
这是以原文为依据的一次解读,不能替代原文。每条要点都标注了出处,欢迎回到原文核对——也欢迎指出任何细微的偏差。