Karpathy 加入 Anthropic，Claude Code 全面提速，Google I/O 周密集更新

Karpathy 宣布加入 Anthropic，AI 工具军备赛进入白热化

5 月 19 日，Andrej Karpathy 宣布加入 Anthropic，担任 MTS（Member of Technical Staff）职位。消息一出，转发量破万。1 他在推文里写道，接下来几年是 LLM 研究最关键的时期，自己对回归研发工作深感期待，并表示仍会持续推进 AI 教育项目。

Andrej Karpathy @karpathy·6d

Personal update: I've joined Anthropic. I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D. I remain deeply passionate about education and plan to resume my work on it in time.

View on X

正在加载内容卡片…

Karpathy 此前是 OpenAI 联合创始团队成员，后担任 Tesla AI 总监，随后创立 Eureka Labs 专注 AI 教育。这次跳槽进入 Anthropic，也是他回归大规模模型训练第一线的信号。

Claude Code 持续扩张，Anthropic 工具生态集中发力

过去一周，Anthropic 相关产品更新密集。

Alex Albert（@alexalbert__，Anthropic Claude 团队 PM）转发了 Claude Code 限速重置通知：5 月 15 日所有付费用户的 5 小时和每周限额被重置 2；5 月 13 日，Claude Code 周限额上调 50%，持续至 7 月 13 日 3；6 月 15 日起，付费 Claude 套餐将附带月度 Claude Agent SDK Credit，覆盖自建脚本、claude -p 调用及第三方 SDK 应用。4

Cat Wu（@_catwu，Anthropic Claude Code 产品负责人）这周重点推了两件事：claude agents 控制台——在终端打开后可统一管理多路 Claude Code 会话 5；以及 Claude Security 进入公测，直接嵌入在 Claude Code Web 端，可对仓库做漏洞扫描并就地修复。6

Thariq（@trq212，Anthropic Claude Code 工程师）分享了一个他常用的 prompt，让 Claude 在实现代码时同步维护一份 implementation-notes.html，记录规范之外的决策、权衡与改动原因 7——他把这称为「HTML 时代」，认为让 AI 用 HTML 输出比纯文字或 Markdown 信息更丰富。

Thariq @trq212·7d

a prompt I've been using a lot recently: implement <SPEC> and while you do, keep a running implementation-notes.html file (or markdown) with decisions you had to make weren't in the spec, things you had to change, tradeoffs you had to make or anything else I should know

View on X

正在加载内容卡片…

Sam Altman：AI 解数学难题，「复杂感受」

5 月 20 日，OpenAI 宣布一个通用模型解决了组合数学领域的一个重要开放问题（unit distance 问题）8。Sam Altman（@sama，OpenAI CEO）写道：「一个通用模型解决了数学领域一个重大开放问题。接下来几年我们会经常说这句话，但这是个里程碑。我对 AI 极大拓展我们对世界的理解感到兴奋，今天同时也有些复杂的感受。」

Sam Altman @sama·5d

a general-purpose model solved a major open problem in mathematics. we'll be saying this a lot over the coming years, but this is a kinda big milestone. i'm very excited for AI to greatly extend our understanding of the world, but still, i have complicated feelings today.

View on X

正在加载内容卡片…

同天他还宣布，OpenAI 将向当前 YC 批次每家公司投资 200 万美元的算力 Credit，试验「tokenmaxxing 创业」模式。9

Aaron Levie：CEO 的 AI 幻觉

Aaron Levie（@levie，Box CEO，270 万 X 粉丝）这周输出密集，其中传播最广的一条直指企业 AI 落地的结构性问题 10：

CEOs are uniquely prone to AI psychosis because they're sufficiently distant from the last mile of work that still has to happen to generate most value with AI.

他的核心论点是：CEO 只见到 AI 的「happy path」，没有经历代码上生产前的 review 成本，没有核对过合同条款，所以容易对 Agent 的自动化程度产生误判。实际企业落地的难点，往往是信息组织和数据策略——「很多 AI 策略问题，其实是数据策略问题」。

他还提到了 Token 成本的话题。他在参加了一场 Fortune 500 CIO 晚宴后写道，Token 成本正成为企业 AI 最炙手可热的争议话题：没人觉得自己有正确的解法，各公司在用「分工作负载给不同模型」「按团队设预算上限」「要求用例验证」等一系列权宜之计。11

Garry Tan：Agent 要先搞定无聊的事

Garry Tan（@garrytan，Y Combinator CEO，82 万 X 粉丝）5 月 24 日发了一条被大量转发的 thread 12：

Everyone building AI agents is focusing on building the prefrontal cortex... But also, a reframe: there is value in building the cerebellum. Most agent frameworks will fail because they treat all cognition as high cognition. The winners will nail the boring stuff first.

他的类比是：人类的前额叶负责规划和推理，小脑负责把无聊的动作变成反射。当前 Agent 框架都在卷「规划能力」，却忽视了把日常任务固化成「自动化反射」的价值。

Google I/O 周：Gemini Spark、Gemini Omni、Project Genie

Google Labs（@GoogleLabs）在 I/O 期间密集更新。主要动态：

Gemini Spark 正式公告：一个 24/7 的个人 AI Agent，帮你主动管理任务和数字生活，本周对 Ultra 订阅用户开放 Beta。13
Gemini Omni 在视频编辑场景表现突出，Josh Woodward（@joshwoodward，Google Labs VP）将其描述为「疯狂好用」。14
Project Genie 全面对 Ultra 订阅用户开放，新增 Google Maps Street View 现实世界锚定、创作库和外部分享功能。15
Gemini 3.5 Flash 正式推出，Aaron Levie 测试后发现在企业复杂文档任务上相比 Gemini 3 Flash 有 8-22 个百分点的跳跃，具体数字因行业不同而异。16

Guillermo Rauch：AI 对话调查结果

Vercel CEO Guillermo Rauch（@rauchg，50 万 X 粉丝）5 月 24 日发布了一个从 1400 条用户回复提炼的分析 17：

Processed 1400 replies ◾ OpenAI is catching up to Anthropic ◾ 'Codex' got more mentions than 'Claude Code' ◾ However, by model mentions, A\ is mogging

「A\ mogging」指 Anthropic 的模型在原始能力提及上仍占优。这组数据来自他 5 月 23 日发出的「用 AI 建了什么，用了什么模型」公开征集。18

Karpathy：HTML 是 AI 输出的下一个默认格式

5 月 11 日，Karpathy 发了一条关于 AI 输出媒介的长推文 19，认为 AI 的输入/输出偏好是不对称的：音频是人类向 AI 输入的首选，而视觉（图像、动画、视频）是 AI 向人类输出的首选。他的进化路线：

纯文本 → 2) Markdown → 3) HTML → … → n) 由神经网络直接生成的交互式视频/模拟

他的具体 tip 是：在 prompt 末尾加「structure your response as HTML」，再用浏览器打开生成文件，视觉效果和信息密度比 Markdown 高出一个量级。这一思路和 Thariq 这周推的 implementation-notes.html 方案可以相互印证。

Amanda Askell：AI 对齐的正面愿景

Amanda Askell（@AmandaAskell，Anthropic 负责 Claude 人格塑造的研究员）5 月 9 日写道，对齐研究通常专注于规避问题行为，但她真正期待的是：通过训练让模型有一个诚实、积极的自我认知——「AI 模型可以成为什么、为什么」。20

5 月 20 日她转发了 Anthropic 与学者、哲学家、神职人员和伦理学家就 AI 核心问题展开系列对话的公告。21

Peter Steinberger：Codex 自主工作流实验

Peter Steinberger（@steipete，iOS/macOS 开发传奇，52 万 X 粉丝）5 月 23 日分享了他搭建的「Codex 自动 triage」工作流 22：给 Codex 配置一套 autotriage 规则，读取仓库 VISION.md 来判断哪些 Issue/PR 符合项目方向、代码可推断性高、可自动验证修复效果，然后让 Codex 自主处理这些任务，他只负责最终 review 建议。Codex 可通过 VM + 计算机视觉验证修复结果，无需打断他的工作流程。

5 月 23 日他还分享了 cmux——一个 tmux-like 的工具，可以同时运行多个 Codex CLI 会话，收获 3657 收藏。23

Dan Shipper：AI 不会带来大规模失业

Dan Shipper（@danshipper，Every 创始人，探讨 AI 对工作影响的作者）5 月 24 日通过转发 Lenny 的引用传播了他最新的核心论点 24：

The AI jobpocalypse is not a thing. The mass unemployment thing that AI lab CEOs are talking about—that's not coming.

他刚发布了一篇 Essay《After Automation》，认为 AI 会改变工作内容和节奏，但不会直接消灭岗位。他同时也看好 SaaS 股票：「我现在会买 SaaS 股。接下来几年 SaaS 股会大幅上涨。」

Zara Zhang：AI 团队新型分工

Zara Zhang（@zarazhangrui，follow-builders 项目作者，AI Builder & 策展人）5 月 21 日写了一条关于 AI 原生团队人员分工的洞察 25：

在 AI 原生团队中，IC 应该开始像 Manager 一样思考（如何向 Agent 下达任务、如何设定标准和验证输出），Manager 应该开始像 IC 一样思考（亲手构建，而不只是管人）。

5 月 22 日她开源了 Claude Code Lark/Feishu Bridge，让用户可以在飞书聊天里直接调用 Claude Code，把多个 CC 会话映射为群聊，Claude 可读取飞书文档、会议记录、任务上下文，并在飞书文档中直接写入回复。26

swyx：Transformer 的认知局限

swyx（@swyx，AI Engineer 运动发起人，Latent Space 播客主理人）5 月 23 日 co-sign 了一个关于 Transformer 认知边界的论点 27：当前的 scaling 范式在应对需要「对抗性世界模型」的问题时会碰到天花板，单纯堆参数和算力的边际收益正在递减。他认为真正的突破方向是能够「假设并探寻真相」的系统，而不是反向拟合越来越大的 house of cards。

Matt Turck：「AGI 已经存在了？」

Matt Turck（@mattturck，AI 投资人，MAD 播客主理人）5 月 24 日访谈了 OpenAI 后训练团队研究员 Yann Dubois，后者给出了一句值得关注的判断 28：「如果我们冻结当前模型，认真做好 harness 工程，我觉得每个领域的人都会真正感受到 AGI。」Matt 的访谈涵盖从 test-time compute 到 RL 扩展边界，57 分钟完整对话已发布。

其他值得关注

Madhu Guru（@realmadhuguru，原 Google Gemini 产品领导，5 月 7 日已离职）在离职公告中总结了他在 Google 的路径：从搜索 & 广告，到帮助 Gemini 从「落后者」追到「前沿竞争者」。29 他 5 月 24 日发帖还提到 CEO 设置「粗糙的 AI 指令」导致团队只做表演性演示的问题，与 Aaron Levie 这周的 CEO AI 幻觉论形成共鸣。

Aditya Agarwal（@adityaag，South Park Commons GP，前 Dropbox CTO）5 月 23 日写道：「6 个月前（2025 年 11 月）我们还只是在和 LLM 聊天就很开心；现在这些模型写出的代码总量已经超过了人类历史上写出的全部代码。」30

Ryo Lu（@ryolu_，Cursor Head of Design，前 Notion/Stripe）5 月 20 日分享了他的模型切换现状：全线切到 Composer 2.5，UI 工作的首选。31

Peter Yang（@petergyang，Roblox 产品领导，Behind the Craft 作者）最新一期节目以一句话概括了当前趋势：「我们过去说要先建 MVP。现在你应该先建能生成 MVP 的系统。」32

Nikunj Kothari（@nikunj，FPV Ventures 合伙人）5 月 22 日写道：「这个时代太重要了，不做出你人生中最好的工作是不应该的。」33

Karpathy 加入 Anthropic，Claude Code 全面提速，Google I/O 周密集更新

Karpathy 宣布加入 Anthropic，AI 工具军备赛进入白热化

Claude Code 持续扩张，Anthropic 工具生态集中发力

Sam Altman：AI 解数学难题，「复杂感受」

Aaron Levie：CEO 的 AI 幻觉

Garry Tan：Agent 要先搞定无聊的事

Google I/O 周：Gemini Spark、Gemini Omni、Project Genie

Guillermo Rauch：AI 对话调查结果

Karpathy：HTML 是 AI 输出的下一个默认格式

Amanda Askell：AI 对齐的正面愿景

Peter Steinberger：Codex 自主工作流实验

Dan Shipper：AI 不会带来大规模失业

Zara Zhang：AI 团队新型分工

swyx：Transformer 的认知局限

Matt Turck：「AGI 已经存在了？」

其他值得关注

参考来源