首页
首页> 软件教程> 华人AI大神霸气离职:绝不接受反华

华人AI大神霸气离职:绝不接受反华

作者:佚名时间:2025-10-09 18:33:01

近日,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)已离开Anthropic,加入 Google DeepMind。

从2025年10月加入,到2025年9月离开,入职仅一年,姚顺宇为何要离开?

他在个人博客中提及,40%的原因是反对Anthropic最新发言中将中国称为敌对国家,另外60%因素源于无法公开的内部信息判断。

在海外的华人大拿里,有几个知名的Yao Shunyu。

前述所提及的,是物理学出身的姚顺宇,2025年毕业到加州伯克利做了几个月博士后,于当年10月加入了Anthropic,从量子计算的研究正式转向了人工智能。在 Anthropic期间,他参与将 Claude从 3.7提升到 4.5。

Anthropic,与你共事很棒,但没有你我会更好。在回顾自己过往一年从业经历的博文中,姚顺宇最后霸气总结道。

华人AI大神霸气离职:一篇文章挑明中美大模型暗战

为何频频与华开战?

在姚顺宇公开博文中,明确点出了自己离开的缘由:Anthropic愈演愈烈的反华气质。

2025年以来,Anthropic在业务扩张和资本层面可以说是一路高歌猛进,但其官方政策明确将中国相关资本与市场排除在外。

9月5日,Anthropic官方发布公告《更新对不支持地区的销售限制》,宣布立即停止向多数股权由中国资本持有的公司或其子公司提供Claude服务。

Anthropic在公告中不仅明确表示中国等国是敌对国家,也明确对于中资占比超过50%的实体一律禁止使用服务。这直接波及了部分新加坡、香港等地的中资子公司。

就在宣布断供前两天,Anthropic宣布完成 130亿美元(约合人民币928亿元)的F轮融资,投后估值为1830亿美元(约合人民币1.3万亿元),是半年前的三倍。

其创始人和 CEO达里奥阿莫迪(Dario Amodei),曾经是 OpenAI研究团队灵魂人物之一,还是百度的深度学习实验室早期员工。

在此前决绝断供前,他就多次呼吁对华实施算力管控,以及于今年1月直接发万字博文质疑,称DeepSeek- V3模型不可能用600万美元的低成本训练而成。

一方面,达里奥的贬损源于对自身技术路线的维护:DeepSeek在推理模型上的创新对Anthropic坚持的Scaling Law(缩放定律)和预训练模型主导的技术路径构成了挑战。

更大的危机感则源于以DeepSeek为代表采用的蒸馏技术,让大模型厂商能够站在教师模型肩膀上,以更快速度、更低成本训练自己的模型。

对Anthropic来说,与其被动资敌,不如从源头上掐断可能性,以放弃一部分短期收入为代价,来维护其技术壁垒。

Anthropic从一开始就将企业级服务API销售作为其主要收入来源,在 Claude 3.5推出之后,将商业的重心迁移到 AI编程上,进而推出了独立编程产品 Claude Code。

在海外,公认第一梯队的AI Coding(AI编程)产品几乎只有两个最佳选择,即Anthropic旗下的Claude,或者谷歌旗下的Gemini。

在国内,中国的科技巨头正在公开使用最擅长编程的 Claude的模型能力,推出它们自己的 AI编程产品:

字节跳动的Trae,国际版集成了 Claude 4和 GPT-5等主流模型,国内版则集成了豆包和DeepSeek;腾讯的 CodeBuddy,面向所有用户开放使用,无需邀请码;阿里的 Qoder不仅接入了 Claude、GPT、Gemini等最新大模型,并围绕上下文工程能力进行了全方位升级,官方宣称其 AI编程能力已比肩 Claude 4.0。

在主动疏远中国市场的同时,Anthropic也积极开源其他国际市场。例如,宣布将于2026年在印度班加罗尔设立办事处,因为印度已成为其Claude模型的第二大消费市场,尤其在编程方面表现出强劲需求。

继实施断供后,达里奥的对华封禁言论频出。9月17日,在一场人工智能峰会(AI+ DC Summit)上,达里奥宣称,美国在芯片领域的主导地位,可能是其目前仍对中国拥有的唯一优势,应当予以保护。

将这些芯片卖给中国,无异于拿我们国家的未来做赌注。达里奥谈到英伟达公司推出多款对华减配特供版芯片的新闻时无理评价道。

2025年以来,美国政府对华技术封锁持续加码,硅谷科技公司在此政策下也进一步收紧了对中国的技术出口和商业合作——主要的封锁迹象就集中在芯片设计软件(EDA)的全面断供、将更多中国科技企业列入实体清单,连续扩大 AI出口管制清单,试图遏制中国AI等领域的发展。

悄然打响的技术暗战

面对此禁令,不少大模型厂商都嗅到了国产替代机会,一场技术暗战已然打响。

有行业人士告诉凤凰网科技,率先出战的正是‘御三家’,即阿里通义千问、DeepSeek和Kimi。

9月的云栖大会上,阿里一口气拿出了7个大模型,尤其是新版旗舰模型Qwen3-Max能力继续提升;9月5日Anthropic断供当天,六小龙之一的Kimi火速更新了K2-0905,在兼容性,输出速度,编程能力,上下文长度等模型能力上都进行了升级,随后几日更是宣布高速版API限时半价,承接Claude用户的意图昭然若揭。

其实Kimi很早就看准了Coding的方向,和Claude在过往的一些技术演进上也有一定的路径相似。代码也好,审美也罢,好像大家都感觉Kimi在朝Claude这个方向前进。有接近Kimi的行业人士对凤凰网科技评价道,毕竟Kimi这次也只对比了Claude 4,感觉就是追着打。

华人AI大神霸气离职:一篇文章挑明中美大模型暗战

DeepSeek在海外的影响力自不必说,在很长一段时间内,都是海外企业热议的中国科技企业代表。过去几个月,其两度小更新,在优化编码能力的同时,还在持续降低API价格。

除此之外,多家不同类型的国产大模型,都有意合力围攻。

同为六小龙的智谱为Claude API用户提供一键搬家服务,并将为新用户提供2000万Tokens免费体验,其为开发者打造的GLM-4.5编码专属包月套餐,价格仅为Claude的七分之一。

商汤科技的日日新SenseNova,也为原Claude用户提供了快速切换服务,附赠5000万Tokens的体验包,并提供了API迁移专属的顾问和培训业务;京东云表示,推出Claude Code接入京东云JoyBuilder大模型服务方案,以及JoyCode+JoyBuilder大模型的智能编程解决方案,帮助开发者平稳过渡。

不过,在Claude禁令带来的窗口期中,国内大模型厂商面临的内卷压力也并不小。

开源模型公司提供API服务,不仅会被卷入厂商间一折更比一折狠的价格战,更要面对各大云厂商们低价打包它们自己的开源模型——阿里云、腾讯云们完全可以将任何一个流行的开源模型以远低于官方API的价格提供服务,以此来截胡客户。

就像在Kimi K2发布后,不仅海外平台各大AI和云平台都部署上线了该模型,就连Perplexity CEO也在社交媒体表示,基于K2的良好表现,公司后续可能会利用其进行后训练。

因此,开源玩家如何不仅仅为他人做嫁衣,陷入商业化泥潭中,也成了必答题。

就像Anthropic对华断供两周后,AWS宣布在亚马逊Bedrock上线阿里巴巴的Qwen3系列和DeepSeek V3.1——这是一次史无前例的开放,毕竟,某种程度上亚马逊和阿里云同为云厂商对手。

AWS上架竞争对手的模型,是在构建一个更强大的护城河。其CEO Matt Garman就在最近的采访中明确表示:我们不认为会有一个模型能适应所有场景。

如果客户在AWS上可以找到市面上几乎所有主流模型时,就无需迁移到其他平台。AWS也便能沉淀其客户资源,稳固平台优势。

AWS的选择其实也说明了一个问题,在这场全球AI角逐的竞赛中,中国企业早已占据核心位置,这是越来越多华人AI科学家的底气来源。

另一位AI大拿、曾任OpenAI研究员的姚顺雨也在近期考虑加入国产大模型团队。

以上就是全部内容,喜欢的话记得收藏本站,我们将持续为您带来更多精彩内容。

相关阅读

热门文章

人气下载推荐