AI 原生公司与个人软件工厂的崛起 · Garry Tan & Diana Hu
2026-06-09 · 由 PodLens 生成的忠实解读
原节目:https://youtu.be/Lri2LNYtERM?si=_SvQjVHNn81sZO26 · 时间戳可点击,就地跳转播放器
AI原生公司个人软件工厂创业范式工程效率YC
这期讲了什么
本期是 Stanford CS153(Frontier Systems)课程的讲座,由 YC 总裁兼 CEO Garry Tan 与 YC 合伙人 Diana Hu 主讲。讲座核心围绕 AI 时代下“AI 原生公司(AI-Native Company)”的组织变革与“个人软件工厂(Personal Software Factory)”的崛起展开。通过对比 2011 年前资本市场的混乱状态(Paul Graham 与 Jessica Livingston 推出 The SAFE 予以标准化)与当前算力设施的“前标准化时代”,讲师们指出 AI 正在重构生产的最小单元。讲座深入探讨了智能体开发中的核心原语(Skill, Resolver, Check resolvable 等)、基于 Karpathy 维基建立的 GBrain 三层记忆系统,以及如何通过扁平化的 closed-loop(闭环控制)系统消灭中间管理层。最后,讲师们呼吁 Stanford 学生发挥 Taste(品味)这一无法被 AI 委派的壁垒,深入垂直领域捕获暗数据,开启属于个人软件工厂的独角兽时代。
时间线主题地图
- [00:09-02:15]:Anjney Midha 课程引言。介绍 CS153 课程起源与斯坦福创业课程传统(Peter Thiel 的 CS183,Sam Altman 的 YC 课程),指出 Garry Tan 重回斯坦福的闭环意义。
- [02:16-04:06]:算力瓶颈与基础设施标准化。Anjney Midha 阐述前沿算力如同工业革命时期的电力,处于“前标准化时代”;而资本分配层级在 2011 年前也是一片混乱,直到 YC 推出 The SAFE(简单未来股权协议)这一标准。
- [04:07-06:57]:The SAFE 的历史意义与系统设计。剖析 The SAFE 作为两页纸的法律标准如何 unblock 创新的资本瓶颈,并说明系统设计(systems design)不仅用于工程,更可用于解决任何领域的基础设施瓶颈。
- [06:58-08:33]:Garry Tan 个人引言。分享其作为 Stanford '03 毕业生的经历,鼓励新一代开发者去构建社会底层的“认知层(cognitive layer)”。
- [08:34-09:28]:Diana Hu 个人引言。分享 YC 初创公司实现“零到数千万美元营收仅需一年”的史无前例增长,指出当前 AI 原生代际的独特特征。
- [09:29-11:15]:生产单元的根本改变与“个人软件工厂”。Garry Tan 对比 2008 年创立 Posterous 时的团队规模、资本与时间成本,指出现在依靠 Claude Code 等 agent 辅助,个人只需几天和极低成本即可完成同样的工作。
- [11:16-14:17]:GStack、百万行代码与测试覆盖率。探讨 AI 编程 agent 带来的 10x-100x 生产力提升。Garry Tan 回应“百万行代码”的争议,强调 LOC 的真实指标在于客户是否愿意付钱,以及如何通过 80%-90% 的测试覆盖率对抗 AI slop(垃圾代码)。
- [14:18-18:04]:智能体开发中的 Persona 与 Office Hours Skill。Garry Tan 阐述 GStack 与 Claude Code 的实践,如何将 YC 合作伙伴数千次对话的 Office Hours 经验蒸馏并压缩 90% 后形成开源 of Office Hours Skill。
- [18:05-23:14]:智能体编程原语(Agentic Primitives)与 Skillify 流程。Garry Tan 拆解 OpenClaw 和 Hermes 中的概念:Skill(squishy human 运行手册)、Resolver(组织架构图)、Check resolvable(审计合规)、Skillify(沉淀复用)。
- [23:15-25:57]:记忆系统与 GBrain 的三层架构。拆解 GBrain 记忆层,包括向量搜索、RRF 融合、typed 知识图谱以及动态本体论,强调知识系统需要真实捕捉人类的思考轨迹与直觉演化。
- [25:58-29:16]:智能体角色与公司组织结构的同构映射。将 agent 原语(Skill, Resolver, Filing rules)映射到人类组织结构(员工、组织架构图、审计合规、绩效评估),展示 AI 原生公司的运行法则。
- [29:17-31:11]:从开放回路向闭环控制系统(Closed-loop)的转变。Diana Hu 引入控制系统概念(如 PID 控制器),对比传统企业的 lossy 决策流,阐述如何将 AI 智能体嵌入组织,使企业转化为能够自愈的“闭环系统”。
- [31:12-33:14]:AI 时代公司组织的三种新角色。拆解 AI 原生公司的扁平化结构:构建者(Builder)、直接责任人(DRI)以及深度参与技术前沿的 AI 创始人(AI Founder)。
- [33:15-36:03]:唯一无法委派的资产:味觉/品味(Taste)。Diana Hu 强调,当代码成本归零时,人类的 Taste(判断、直觉、甄别力)是最终壁垒。如何通过 evals 将 Taste 嵌入系统,从而捕获商业价值。
- [36:04-40:03]:跨模态评估(Cross-modal Evals)与 Meta Prompt 演进。Garry Tan 分享使用 frontier 级模型(Opus, GPT-5.5, DeepSeek V4)进行交叉评估和元提示,以实现 10x 的代码和技能优化。
- [40:04-42:57]:前置部署工程师(Forward Deployed Engineer)与垂直工作流痛点。Diana Hu 以 YC portfolio 里的 Salient(贷款服务语音 agent)、HappyRobot(物流货运代理 agent)、Reducto(文档解析)为例,说明如何通过深入垂直领域获取“非训练集”数据来实现指数增长。
- [42:58-47:00]:行业渗透率与 YC 批次增长奇迹。展示 Anthropic 关于各行业 AI 渗透率的数据,强调非 CS 领域的巨大空白;分享 YC 批次中 10% 周增长以及 3 个月 3 倍增长的常态化,呼吁学生走出课堂,开始构建自己的单人前沿公司。
核心观点清单
-
The SAFE(简单未来股权协议)的推出是硅谷历史上的关键分水岭,它标准化了早期创业投资。
证据 [04:07-05:54]
类型 事实
说明 在 2011 年之前,风险投资交易极其混乱、缺乏标准。Paul Graham 和 Jessica Livingston 引入 The SAFE,以两页纸的法律文本统一了种子轮融资标准,极大降低了交易摩擦。
-
算力基础设施目前正处于类似工业革命早期电力的“前标准化时代(pre-standardization era)”。
证据 [03:04-03:54]
类型 观点
说明 Anjney Midha 认为,如同当年电力的交流/直流电之争和电网设施建设,目前的 GPU 算力依然缺乏统一的池化、计量和跨厂商结算标准,这也是导致目前算力瓶颈与恐慌性囤积的主要原因。
-
在 AI 编程 agent 辅助下,单个开发者的开发效率与时间成本被缩减了数百倍。
证据 [10:21-11:15]
类型 事实
说明 Garry Tan 指出,他 2008 年创立 Posterous 时需要 10 个人、400 万美元和 2 年时间写出软件;而现在借助 Claude Code 的 $200/月套餐,个人只需 5 天就能重现全部开发。
-
对抗 AI slop 并将其投入生产环境的关键在于维持 80%-90% 的测试覆盖率。
证据 [12:04-13:00]
类型 观点
说明 尽管 AI 能迅速生成代码,但大量的代码行数(LOC)若无严格测试就会沦为难以维护的废料。通过“Plan-Code-Review”的持续测试和 evals 是唯一的解决方案。
-
智能体开发的底层操作需要将模糊的 Latent 空间与确定性的 Deterministic 空间解耦并协同。
证据 [18:37-19:28]
类型 观点
说明 如果只依赖 LLM 的 latent 空间去处理确定性的逻辑(如地理位置与时间校准),系统极易因幻觉而崩溃;应当将确定性操作写进具体的 TypeScript/JS 脚本中,并将其包装为 Skill 供 Agent 调用。
-
“Skillify”是一种将单次经验转化为模块化、可复用认知原语的高阶开发模式。
证据 [24:45-26:13]
类型 事实
说明 开发 agent 不仅是写代码,更需要使用“Skillify”流程,把成功的 trace 转化为包含单元测试、LLM Evals、触发器(agents.md)以及 schema 定义的标准运行手册。
-
传统的公司组织运行方式是高度“开环(open loop)”且充满信息损耗的,而 AI 能够使其转变为“闭环控制系统(closed loop)”。
证据 [31:39-33:32]
类型 预测
说明 Diana Hu 认为,传统公司将信息存在员工脑中,通过无序 of Slack DMs 和会议进行路由,效率极低。引入嵌入式 agent 实时读取所有公司工件,可以构建自愈的、类似 PID 控制器的闭环信息与决策回路。
-
在 AI 原生组织中,传统的层层汇报与信息中继将被抹平,只剩下三种核心角色。
证据 [35:03-36:32]
类型 观点
说明 中间管理层是 lossy 路由的产物。在 AI 原生组织里,人员将被极度压缩并扁平化为:Builder(构建者)、DRI(直接责任人)以及亲自在第一线探索工具的 AI 创始人(AI Founder)。
-
当编写和实施代码的成本归零时,人类唯一无法被委托和替代的资产是“味觉/品味(Taste)”。
证据 [37:18-38:29]
类型 观点
说明 通用的 benchmarks 无法判定一个特定垂直领域的 AI 是否好用。人类的 Taste(对细微产品体验的把握和对对错的甄别力)是决定商业价值捕获的终极防线,这需要通过构建特有的 evals 将 Taste 嵌入系统。
-
垂直领域 AI 公司最强大的商业壁垒在于深入垂直场景捕获未在公开训练集(Not in the training set)中的数据。
证据 [42:18-44:51]
类型 观点
说明 Diana Hu 指出,Salient 和 HappyRobot 等公司的指数级增长,得益于创始人直接扮演前置部署工程师的角色,进入银行或货运现场,提取公开 LLM 根本无法获得的行业暗数据。
内部张力与自我修正
- [11:56-12:03] vs [13:11-13:24]:Garry Tan 提到的“用 Claude Code 编写了上百万行代码”与随后承认“代码行数(LOC)是一个垃圾指标且为之前的反向嘲讽(trolling)道歉”之间的张力。他修正指出,衡量代码的真实指标不在于代码量的堆砌(AI 生成的代码极易 verbose),而在于系统是否能实际运行、客户是否愿意付钱,以及是否有 80% 以上的测试覆盖率。
大白话重讲
那我们来聊聊 Garry Tan 和 Diana Hu 带来的这期 CS153 讲座。听完这一期,你会对 AI 时代的公司组织和个人开发效率产生全新的理解,甚至发现很多流行观念其实已经过时了。
首先,Garry Tan 提出了一个非常震撼的对比:2008 年他创立 Posterous 时,需要十个人、融四百万美元,花两年时间去写出软件。而今天,在 Claude Code 的辅助下,个人只需买一个两百美元每月的最高套餐,五天时间就能重现当年所有的软件开发工作。这意味着,传统的“以雇佣人数和融资额来衡量创业规模”的模式彻底失效了。在 2026 年,一个只有六个人的开发团队,就可以凭借 AI Native 的架构和工具,冲到一千万美元的营收。
但这并不意味着开发变成了一件零摩擦的简单事情。相反,因为 AI 具有极强的“脑补”和“生成废话”的属性,如果你只顾着用它去堆砌代码,最终得到的只会是无法运行的“AI Slop”。Garry Tan 强调,他每天会重复使用“Plan-Code-Review”这一技能包二十次以上,目的就是为了让代码拥有 80%-90% 的测试覆盖率。真正的秘诀在于,智能体开发必须把确定性逻辑(Deterministic)与潜空间逻辑(Latent)解耦。比如时间校准这种需要百分百准确的操作,绝对不能交给大模型去猜,而是必须用 TypeScript/JS 脚本写死成一个 Skill 供 agent 调用。你把这套操作标准化了,把它沉淀成含有 evals、触发器和 schema 的运行手册,这就是所谓的 “Skillify”。
Diana Hu 则把这个逻辑推到了公司组织层面。她说,传统的公司就像一个“开环系统(Open Loop)”,信息散落在员工脑子里,通过 Slack 私聊和没有记录的会议零散流动,决策极其滞后且充满了漏损。而有了 AI,我们可以把 agent 嵌入到 GitHub 代码库、Discord、甚至是会议录音中,让它实时读取公司的所有工件(artifacts)。这就像在组织里装了一个 PID 控制器,把公司改造成了一个能自动发现错误并自我愈合的“闭环系统”。在这种公司里,中间管理层将被彻底消灭,因为他们过去存在的唯一作用就是做这种高损耗的信息路由。未来只会有三种人:Builder(负责写代码和自动化销售渠道的构建者)、DRI(对结果负全责的直接责任人),以及每天在第一线测试新工具的 AI 创始人(AI Founder)。
那么,在代码成本无限趋于零的时代,人的壁垒到底在哪里?答案是“Taste(品味)”。通用的基准测试(如 MMLU)无法告诉你产品是不是好用,唯有人类的品味、直觉和对细微体验的把控,才能制定出有效的 evals(评估指标)去指导智能体进化。同时,你也不用去跟大厂比拼算力,你只需要像个前置部署工程师一样,深入到银行或物流车队中,去捕获那些“不在公开训练集里(not in the training set)”的垂直场景暗数据,你就能在两三个月内实现营收的三倍增长。
值得精听的片段
- [10:33-11:15]:Garry Tan 详细对比 2008 年与 2026 年的开发生产力。他用极具张力的语速和实在的数据,戳破了“AI 只能写 demo”的成见,极其生动地描绘了“个人软件工厂”对开发边界的重构。
- [14:18-15:47]:关于 YC 如何蒸馏 Office Hours 经验的分享。Garry Tan 谈及他们如何从数千次真实的合伙人对话中提炼出 Office Hours Skill,并进行 90% 的体积压缩,揭示了“把人类隐性认知转化为模块化算法技能”的真实路径。
- [19:50-21:19]:Garry Tan 谈及 OpenClaw 地理位置校准出错的例子。这一段极其形象地拆解了为什么不能迷信 LLM 的 latent 空间,以及为什么必须用确定性代码(TypeScript/JS)来锁定基础原语的工程逻辑。
- [31:39-33:32]:Diana Hu 阐述“开环公司 vs 闭环控制系统”。她借助控制工程中的闭环 PID 控制器概念来解构企业组织,是全场讲座中在组织学和系统论层面的高光时刻,非常值得反复聆听。
- [37:18-38:29]:Diana Hu 论述人类 Taste(品味)的 durableness 与不可 delegate 属性。她深入分析了为什么品味是防范 AI slop 的唯一工具,并指出这才是 AI 原生时代真正的价值捕获点。
与往期的呼应
- 印证→ AI时代的产品构建与职业进化 · Nikhyl Singhal
两者均指出 AI 能够直接获取并路由底层真实数据,从而消除传统组织中因信息中继而存在的“有损”中间管理层,推动组织结构走向极度扁平化。
本期[35:03-36:32] 在 AI 原生组织里,传统的层层汇报与信息中继将被抹平,中间管理层作为有损的信息路由器将被极度压缩,组织将扁平化为构建者(Builder)、直接责任人(DRI)和亲自下场的 AI 创始人。
往期[41:36] 现代企业正在通过扁平化和“去会议化”来消除“职场表演”,AI 助手可以通过直接收集底层真实数据来削减中间管理层。
- 补充→ 风险投资的系统设计与智能时代的范式转移 · Ben Horowitz
两者都认为在 AI 时代,单纯的软件代码和界面已失去防御性,企业的核心壁垒必须向物理世界或线下延伸——无论是通过物理供应链与专属销售渠道,还是通过深入真实物理场景捕获未公开的行业暗数据。
本期[42:18-44:51] 垂直领域 AI 公司最强大的商业壁垒在于深入垂直场景捕获未在公开训练集(Not in the training set)中的行业暗数据。
往期[21:53-22:10] 在 AI 泛在的 SaaSpocalypse 时代,代码和用户界面不再具有防御性,真正的防线是物理供应链和特定的销售渠道。
- 同构→ 统一智能与物理世界模拟器 · Amit Jain
两者在人机协同的终局上达成高度共识,即在 AI 极大地将执行与生成成本降至零后,人类的核心价值将收敛于定义高标准的“品味”、“审美”与“价值偏好”,并将其作为评估和指导 AI 运行的终极杠杆。
本期[37:18-38:29] 当编写和实施代码的成本归零时,人类唯一无法被委托和替代的资产是“品味(Taste)”,需要通过构建特有的 evals 将这种品味嵌入系统以决定商业价值。
往期[49:18-50:51] AI 不会抹杀人类的创造力,而是改变了创造的杠杆:人类的作用在于在“技能层”定义高标准的价值与审美偏好,通过 AI 让优秀艺术家的创意能被高效地运行和放大万亿倍。
- 承接→ 统一智能与物理世界模拟器 · Amit Jain
两者提出了完全一致的智能体架构范式,即不能让大模型直接处理确定性逻辑,而应将大模型作为中央推理引擎,去调用顶层被模块化的“专家技能(Skills)”来完成确定性任务。
本期[18:37-19:28] 智能体开发需要将模糊的 Latent 空间与确定性的 Deterministic 空间解耦,将确定性操作写进具体的 TypeScript/JS 脚本中,并将其包装为 Skill 供 Agent 调用。
往期[31:58-33:27] 统一模型时代的计算架构由三层组成:底层的统一多模态模型作为中央处理单元,中间的工具线束(如 API、操作系统接口),以及顶层的专家技能层(Skills)。
- 印证← 心智重组与物理仿真的商业边界 · Yuanming Hu
两者在系统架构的设计哲学上高度一致,都主张不应让神经网络(大模型或潜空间)强行去显式拟合确定性的规则(如物理定律或精确逻辑),而应将大模型定位为协调者,去调用外部的确定性工具(如仿真引擎、代码或脚本)。
本期[18:37-19:28] 智能体开发的底层操作需要将模糊的 Latent 空间与确定性的 Deterministic 空间解耦并协同。如果只依赖 LLM 的 latent 空间去处理确定性的逻辑(如地理位置与时间校准),系统极易因幻觉而崩溃;应当将确定性操作写进具体的 TypeScript/JS 脚本中,并将其包装为 Skill 供 Agent 调用。
往期[01:24:09] 实现 AGI 并不意味着需要在神经网络中显式建模并计算出复杂的物理定律,更高效的路径是让大模型作为工具操纵者,学会调用外部物理仿真引擎或执行 Python 代码。
- 印证← 心智重组与物理仿真的商业边界 · Yuanming Hu
两者都强调了科技公司创始人在管理中保持“动手能力”和“一线感知”的重要性,避免因脱离底层技术细节(如调试底层逻辑或亲自探索工具)而导致决策悬空。
本期[35:03-36:32] 在 AI 原生组织中,传统的层层汇报与信息中继将被抹平,只剩下三种核心角色:Builder(构建者)、DRI(直接责任人)以及亲自在第一线探索工具的 AI 创始人(AI Founder)。
往期[02:59:01] 一个理解技术的科技公司 Founder 应当维持 Hands-on 的底层 sample 能力,不亲自写业务代码,本必须能 debug 和理顺底层逻辑,以防决策浮于表面。
- 同构← 计算设计与合成生物学 · Neri Oxman
两者在对“美”与“品味”的本质认知上高度同构。Oxman 认为美是系统设计底层逻辑正确性的物理显现(不美的解预示着底层逻辑错误);而 Garry Tan 强调的“人类品味”本质上正是对这种底层逻辑对错与系统设计优劣的敏锐甄别力。
本期[37:18-38:29] 当编写和实施代码的成本归零时,人类唯一无法被委托 and 替代的资产是“味觉/品味(Taste)”。人类的 Taste(对细微产品体验的把握和对对错的甄别力)是决定商业价值捕获的终极防线...
往期[1:13:06-1:13:55] 美是代理权(Agency)的显现:美并不是孤立的视觉装点,而是主体设计或系统在其特定目标函数下完美展现其代理权的物理体现。如 Bucky Fuller 所言,非美的解通常预示着底层逻辑的错误。
- 同构← 大模型后训练强化学习基建的探索与反思 · Weng Jiayi
两者在组织架构设计上达成了高度共识,均指出中间管理层会导致信息传递的损耗,因此必须通过极度扁平化的架构来实现信息的无损传递与高效决策。
本期[35:03-36:32] 在 AI 原生组织中,传统的层层汇报与信息中继将被抹平,只剩下三种核心角色。中间管理层是 lossy 路由的产物。在 AI 原生组织里,人员将被极度压缩并扁平化为:Builder(构建者)、DRI(直接责任人)以及亲自在第一线探索工具的 AI 创始人(AI Founder)。
- 印证← 大模型后训练强化学习基建的探索与反思 · Weng Jiayi
两者均指出了定量指标或通用基准在评估 AI 模型性能时的局限性,强调在面对复杂的评估噪音和奖励黑客行为时,最终必须引入人类的主观评判(人工反馈或人类的“品味”)作为最终的甄别标准。
本期[37:18-38:29] 当编写和实施代码的成本归零时,人类唯一无法被委托和替代的资产是“味觉/品味(Taste)”。通用的 benchmarks 无法判定一个特定垂直领域的 AI 是否好用。人类的 Taste(对细微产品体验的把握和对对错的甄别力)是决定商业价值捕获的终极防线,这需要通过构建特有的 evals 将 Taste 嵌入系统。
往期[01:25:31 - 01:26:58] 衡量强化学习模型性能的痛点在于难以区分 checkpoint 的真实好坏,因为单一的奖励值容易发生奖励黑客行为(reward hacking),导致评估方差和噪音过大,最终仍需依赖人工评估(Human Feedback)。
- 补充← 大模型后训练强化学习基建的探索与反思 · Weng Jiayi
两者均指出了传统组织规模扩大时的核心痛点:信息(上下文)仅存储在员工个人大脑中,难以在组织内实现高效、一致的分享,从而导致决策和迭代效率下降。
本期[31:39-33:32] 传统的公司组织运行方式是高度“开环(open loop)”且充满信息损耗的,而 AI 能够使其转变为“闭环控制系统(closed loop)”。Diana Hu 认为,传统公司将信息存在员工脑中,通过无序的 Slack DMs 和会议进行路由,效率极低。引入嵌入式 agent 实时读取所有公司工件,可以构建自愈的、类似 PID 控制器的闭环信息与决策回路。
往期[01:52:01 - 01:52:48] 组织规模扩大后不可避免地会导致迭代速度变慢,其根本原因在于人类大脑存储的上下文(context)是有限的,难以在庞大组织中实现完整且一致的上下文分享(context sharing)。
- 同构← 饥饿与口渴的神经生物学 · Zachary Knight
大脑饥饿神经元在看到食物时瞬间关闭,是一种克服消化系统物理延迟的提前预测机制,通过前馈控制实现稳态;这与企业管理中利用人工智能将“开环”系统改造为“闭环控制系统”以消除信息滞后与损耗的控制论逻辑完全同构。
本期[31:39-33:32] 传统的公司组织运行方式是高度“开环(open loop)”且充满信息损耗的,而 AI 能够使其转变为“闭环控制系统(closed loop)”。
往期[32:45] -
[35:20] AgRP 神经元在动物“看到”或“闻到”食物时会瞬间关闭,这是一种大脑的提前预测机制,而非依赖食物进入胃部后的物理反馈。
- 补充← 安全危机与组织韧性的现实拷问 · Joe Sullivan
前者指出了非技术人员使用 AI 编写代码并直接合并入生产环境所带来的安全漏洞隐患,后者提出的高比例测试覆盖率正是过滤和防范此类低质量 AI 代码(AI slop)流入生产环境的技术解法。
往期[38:19-38:45] 非技术人员使用 AI 工具编写代码并合并入生产环境,创造了安全团队无法通过传统协作方式修补的漏洞。
与往期的张力
这是以原文为依据的一次解读,不能替代原文。每条要点都标注了出处,欢迎回到原文核对——也欢迎指出任何细微的偏差。