电话: 邮箱:

华游娱乐(中国)官方IOS|Android手机app下载 「选了谷歌,过时一年!」好意思国AI首脑「砸场」谷歌:省点钱却输了时刻!英伟达笑醒?

发布日期:2026-05-30 00:22 作者:admin 来源:未知 点击:100

华游娱乐(中国)官方IOS|Android手机app下载 「选了谷歌,过时一年!」好意思国AI首脑「砸场」谷歌:省点钱却输了时刻!英伟达笑醒?

AI短剧中的情节照进现实。

就在谷歌年度斥地者大会进行时,AI业界首脑却绝不见谅地砸场子!到底有多大怨念?

就在几天前的谷歌I/O大会进行期间,文生图AI有名企业Midjourney独创东说念主兼CEO大卫·霍茨( David Holz)却绝不见谅地公开吐槽谷歌TPU,激发了硅谷AI圈的平庸接洽。

霍茨在X平台上暗示,因为早年遴荐了谷歌TPU而非英伟达GPU算作中枢测验基础法子,Midjourney的延续程度比本不错达到的水平过时了整整一年。“如若不错回到以前,我会一开动就所有这个词选择英伟达芯片。”

这句话之是以具有广泛杀伤力,因为这是来自一家与谷歌有深度阿谀的有名AI企业,当初是谷歌云引申自家芯片的一张牌号,并且他们还靠谷歌TPU节俭了三分之二的推理本钱。此次吐槽相等于给英伟达作念了最佳的背书。

霍茨为什么如斯不给谷歌颜面,要在谷歌发布新芯片的时候砸场子?

开云2026世界杯中国官网

一场真实代价的公开复盘

固然,霍茨不是随口衔恨,而是用真实代价作念出的公开复盘。它涉及了面前AI基础法子竞争最中枢的矛盾:硬件性能的竞赛以外,软件生态的护城河才是实在决定输赢的战场。

要分解霍茨的怨恨,需要先厘清谷歌TPU和英伟达GPU在延续场景下的实质各异。

举个例子,GPU相等于通用并行筹划的瑞士军刀。英伟达的CUDA平台从2007年就开动布局,今天一经蕴蓄了快要二十年的生态千里淀,成为AI行业通用的平台。

AI延续员最常用的框架PyTorch与CUDA深度绑定,Hugging Face上险些扫数开源模子权重默许GPU格式发布,Nsight性能分析器、NCCL通讯库、TensorRT推理优化器用——这是一套完好的延续器用链。天下的AI延续员从学校开动就在CUDA上写代码,PyTorch是他们的母语。

而TPU则是另一种生态。它是专用集成电路,底层架构围绕脉动阵列想象,有意优化深度学习张量运算,在大限制厚实测验任务上效果极高。但它要求使用JAX或TensorFlow框架,对PyTorch的维持长期一鳞半瓜。社区资源匮乏,调试器用不老练,险些扫数的排错齐要依赖谷歌我方的文档。

回到Midjourney的具体需求,他们作念的是图像生成延续,需要大宗自界说算子实验、快速原型迭代,以及随时调用Hugging Face生态里的扩散模子组件。这些责任在GPU+PyTorch的环境下水乳交融,在TPU上却秩序维艰。

举个节略例子,一个延续员思考证一个新思法,在GPU上可能只需要几小时;在TPU上,光是配置环境和适配框架就可能消费几天。长期累积下来,即是霍茨所说的“过时了一年”。

当初为何遴荐谷歌TPU?

不外需要强调的是,霍茨的吐槽有意针对延续和测验阶段。在推理阶段,这个逻辑就所有这个词不同。这亦然他们当初为什么迁徙到谷歌TPU的平直能源,因为用谷歌TPU不错实打实地省钱,并且无须和巨头们争抢英伟达显卡。

早在2023年,谷歌云就高调官宣,Midjourney 一经遴荐谷歌算作其中枢基础法子供应商。Midjourney 运用谷歌的 TPU v4/v5(基于 JAX 框架)来测验其第四代和第五代的文生图大模子;同期,租用谷歌云上的 英伟达 GPU 集群,来处理天下用户数以亿计的平日生成推理。

Midjourney的遴荐很现实。其时英伟达的 H100 被抢疯了,Midjourney 算作一个莫得巨头撑腰的稀少AI公司,压根排不上号。而谷歌的 TPU 算力管够,且对图像这种大限制矩阵运算的性价比(不错省下六成的本钱)在纸面上特别诱东说念主。

2025年第二季度,Midjourney将主力推理集群也从英伟达A100/H100迁徙到谷歌Cloud TPU v6e,月度推理支拨从约210万好意思元骤降至70万好意思元以下,年化节俭卓绝1680万好意思元,回本周期仅11天。

换句话说,TPU在限制化推理上的性价比上风是真实的。霍茨实在颓唐的是:我方应该在延续阶段用英伟达打磨模子,推理阶段再迁徙到谷歌TPU降本;而不是从一开动就在TPU上作念延续,为此付出一年的程度代价。

英伟达护城河是生态?

霍茨的公开吐槽,实质上是一份对英伟达生态护城河的证词。英伟达的护城河不在于H100比TPU快些许,而在于无数延续员的责任民俗、数见不鲜的开源代码库,以及扫数这个词学术界默许GPU算作实验平台的行业惯性。

2026年,PyTorch在延续论文中的占有率仍高达85%。险些扫数前沿延续的代码齐基于英伟达硬件。这意味着,任何思要使用TPU作念延续的团队,齐必须承担一个隐性本钱:将我方与主流社区阻遏,覆没大宗现成的器用和资源,在一个相对小众的时刻栈里独自探索。

这即是为什么即便TPU在某些缠绵上一经与GPU相等以致更优,业界大多数延续实验室仍然默许遴荐GPU。冒昧硬件性能不错追逐,生态蕴蓄无法速成。黄仁勋花了快要二十年时刻成就的这条护城河,恰是英伟达最值钱的钞票。

谷歌赫然厚实到了问题方位。在本年的谷歌云Next大会上,谷歌发布了第八代TPU,并初次选择双芯片策略:TPU 8t(测验)和TPU 8i(推理)。这是TPU历史上第一次将测验和推理分拆成两颗架构所有这个词不同的专用芯片,即是为了管束霍茨吐槽的问题。

TPU 8t代号Sunfish,由博通阿谀想象,面向大限制预测验。超等Pod限制达9600颗芯片、分享2PB HBM,测验性价比比上代Ironwood提高2.7倍。TPU 8i代号Zebrafish,由联发科想象,专攻推理和serving,将片上SRAM扩大至384MB,芯片互联带宽翻倍至19.2 Tb/s,并引入全新的Boardfly采集拓扑,将1024芯片配置的最大采集跳数从16跳降至7跳,在大型MoE模子低蔓延推理上性价比比Ironwood提高80%。两款芯片选择台积电2纳米工艺,展望2027年量产。

谷歌此次双芯片计谋自己即是一次伏击的计谋承认:测验和推理一经分化成两种所有这个词不同款式的责任负载,一颗芯片无法再同期优化两头。这与英伟达“一块GPU通吃”的阶梯形成了赫然对比,亦然谷歌对英伟达Vera Rubin NVL72和亚马逊Trainium3的正面回击。

并且谷歌此次不仅仅发布了新硬件。针对霍茨对TPU生态的衔恨,谷歌同步推出了TorchTPU相貌——一个让PyTorch原生运行在TPU上的工程贪图,面前处于预览版现象。

按照谷歌的阶梯图,TorchTPU将维持PyTorch的Eager Mode、与vLLM和TorchTitan深度集成、并最终实现到完好Pod限制的线性蔓延。如若TorchTPU实在老练,那些信守PyTorch的延续团队将第一次能够在不重写代码的前提下使用TPU。

但是,TorchTPU面前仍是预览版,不是厚爱发布版。霍茨那种“改个架构、调个算子、快速考证思法”的延续责任流,在TPU 8t上是否的确像在H100上一样顺滑,还需要大宗实战考证。一扇门一经掀开,但门后的路有多平坦,2027年厚爱量产之后身手见分晓。

Claude为什么横跨三平台?

如若Midjourney对TPU的测验生态有这样多不悦的话,那么面前AI行业新领头羊Anthropic是怎样管束脚踏三条船的挑战的?要知说念他们同期在英伟达GPU、谷歌TPU和亚马逊Trainium三套硬件上测验和运行Claude。

Anthropic原来是处于AI第一集团的追逐者脚色,财力远远弗成和谷歌和OpenAI比较,因此他们给与了谷歌和亚马逊的无数投资,交换条目之一即是使用这两个巨头的TPU和Trainium芯片。

谷歌和亚马逊齐是Anthropic的计谋投资者,华游娱乐中国官网入口两家巨头先后给Anthropic投资了近100亿好意思元。再加上微软投资的50亿好意思元,相等于天下三大云筹划巨头在协力抚养着Anthropic。

巨头们可不是单纯的财务投资。这些投资有一大部分齐折现成了谷歌和亚马逊的营收,因为Anthropic面前使用着卓绝百万张亚马逊Trainium芯片,有意用于测验和部署最新的Claude模子,同期使用着数十万张谷歌TPU,并贪图在改日逐步拓展到百万TPU阵列。

与此同期,谷歌云、AWS以及微软Azure亦然Claude在天下B端商场的主要分发平台。三大万亿级巨头齐思用我方的销售采集帮Claude卖货,我方获取营收提成,更伏击的是,把算力流量留在自家的做事器里,同期搭售自家的云做事。

这种全面通吃的场面,也让 Anthropic 成为硅谷历史上成长速率最快、底牌最足的稀少AI巨头。最近他们还与SpaceX达成了算力租出条约,每年要支付150亿好意思元使用马斯克在田纳西州超算中心囤积的英伟达GPU芯片带来的算力。

那么,Anthropic是怎样作念到同期使用三大平台芯片的?

Anthropic官方表述是:不同责任负载匹配最合乎的芯片。英伟达GPU相连延续实验和快速原型;谷歌TPU和亚马逊Trainium永别相连大限制测验和推理的主力责任负载,两家超等筹划机供应商之间形成制衡,防范单一平台要挟订价权。

Anthropic与亚马逊的阿谀限制尤其引东说念主肃肃。两边已签署条约,Anthropic将在改日十年向AWS干预卓绝1000亿好意思元,获取最多5吉瓦的算力容量,笼罩Trainium2到Trainium4。

真理的是,在最新谷歌云Next大会晓谕与Anthropic久了阿谀的时候,亚马逊站出来“公开邀赏”,宣称Claude的测验所有这个词在Trainium上完成,Project Rainier——这个面前运行卓绝100万颗Trainium2芯片的集群——是天下最大的AI测验集群之一。

与此同期,Anthropic在谷歌Cloud Next大会前不久晓谕扩大与谷歌和博通的阿谀,获取多吉瓦的下一代TPU容量,展望2027年干预使用。

Anthropic靠什么脚踩三条船?

Anthropic能走出这条路,有一个关节的时刻DNA:公司中枢独创团队来自Google Brain,JAX是他们的母语。从一开动,Anthropic就将JAX算作中枢测验框架——JAX的想象形而上学是硬件无关,合并套代码通过XLA编译器不错在GPU、TPU乃至Trainium上运行。

这与Midjourney的旅途偶合违犯:Midjourney先在PyTorch+GPU的生态里建好延续责任流,再试图迁徙到TPU,迁徙本钱才形成了一年的耗损。

但是这种多平台策略亦然有代价的,Anthropic每次模子更新齐要在三套架构上永别测试,每个bug齐有三个潜在成因,部署复杂度是单一平台决议的三倍。这是三平台策略必须承付的工程账单。

谷歌的 TPU 体系基于传统的 JAX 和 XLA 编译器。亚马逊的 Trainium 体系则基于 AWS 自研的 Neuron SDK。 这意味着,Anthropic 中枢的散布式测验框架,弗成平直平移。

因此,Anthropic的工程团队必须派驻顶尖的底层硬件优化大师,与谷歌和亚马逊的芯片团队闭门结合斥地,将复杂的算子、夹杂精度测验代码,用三套所有这个词不同的硬件底层汇编逻辑重写并优化。这种东说念主力本钱和时刻千里淀,确乎远超隧说念使用英伟达生态的 OpenAI。

比较之下,Midjourney 的团队限制极小,压根莫得 Anthropic 那种不错跟巨头芯片团队闭门魔改底层的千东说念主工程兵团。在濒临 TPU小众的 JAX/XLA 编译环境时,一朝碰到诡异的硬件级 Bug,扫数这个词团队只可停工去死磕底层代码。

此外,2025年8至9月,Claude用户陈诉了赫然的性能着落。Anthropic的过后复盘泄漏了三个稀少的基础法子马虎:高下文窗口路由颠倒影响了某一平台上16%的Sonnet 4苦求;TPU做事器配置颠倒导致Opus 4和Sonnet 4输出损坏;XLA编译器马虎困扰Haiku 3.5长达两周。

Anthropic在我方的延续论文中反复强调:不要使用复杂的框架,保合手架构的特别节略与可组合性。模子层想象得越隧说念、越少花活,在濒临多芯片平台交叉测试时,底层暴领路的硬件 Bug 就越少,从而用“想象上的克制”化解了“平台上的繁复”。

付出了这笔崇高的工程账单后,Anthropic 收货了全行业最羡慕的果实。笔据最新的 TCO(总领有本钱)数据,谷歌 TPU 和亚马逊 Trainium 在大限制推理时的性价比,比英伟达平台整整跨越 50% 以上。

比较较OpenAI 赌的是“英伟达纯血生态+ Stargate 级单点超大算力”;而 Anthropic 则是用三倍的工程本钱,硬生生把我方逼成了一个“跨平台黏合体”。

这种底层基建的全面跑通,让 Claude 在如今多模态智能体大限制并发、大流量朦拢的工业落地斗争中,领有了全行业最低廉、最不被单一方卡脖子的无穷算力大后方。这即是多平台策略殉难短期东说念主力、交流长期计谋制高点的终极实现。

改日款式:专用芯片期间的竞争逻辑

话题回到霍茨的那条推文,某种程度上是AI基础法子进入新阶段的一个缩影。接下来几年的竞争款式,一经开动清亮。

测验侧的款式是:英伟达仍然是延续实验和快速迭代的首选平台,但在超大限制厚实测验上,TPU和Trainium正在以性价比上风侵蚀份额。谷歌TPU 8t的2.7倍性价比提高、亚马逊Trainium3的合手续进化,意味着前沿AI实验室将越来越倾向于“延续用GPU、测验用专用芯片”的夹杂策略。

推理侧的款式愈加成心于挑战者。推理是AI基础法子中增速最快的部分——2026岁首推理已占AI算力总支拨的55%,展望到2030年将占75%。在这个场景下,TPU和Trainium的专用优化能带来Midjourney那样65%的本钱削减,经济账算得通。谷歌TPU 8i恰是针对这一趋势的定向火器。

生态侧的战局则更为长期。TorchTPU能否实在让PyTorch延续员无缝迁徙到TPU,是谷歌2027年最伏击的挑战。亚马逊的策略则更为求实:Trainium与PyTorch的兼容性一直是其主打卖点,通过Bedrock平台上十万家以上的企业客户蕴蓄,正在偷偷构建我方的应用层生态。

但英伟达绝不会坐视敌手侵蚀我方的护城河,CUDA的合手续进化和Blackwell架构的推出,是对“GPU不是延续唯独遴荐”论调的最平直反击。

供给侧的变量也通常值得热心,谷歌TPU的大限制量产受制于台积电的先进封装产能,原贪图2026年达到400万颗的标的已推迟至2027年。台积电现存AP8工场已满负荷,新的AP7平台首期产能已一起分拨给苹果处理器,第二期年底身手干预。这意味着即便需求新生,TPU的供给在2026年仍将是制约成分,反而给英伟达留住了缓冲空间。

对大多数中袖珍AI公司而言,霍茨的颓唐仍然具有试验意旨:延续阶段全用英伟达,生态摩擦最低,迭代速率最快。比及模子架构厚实、推理限制上来,再评估TPU迁徙的经济账。这不是因为英伟达更好,而是因为生态本钱在限制较小时会压倒硬件本钱。

对Anthropic这个量级的前沿实验室,三平台策略的逻辑截然有异:它不仅仅为了省钱,而是为了确保在职何单一供应商出现问题时,Claude的测验和做事齐不会中断;同期用多平台需求算作筹码,在与亚马逊和谷歌的谈判中保合手议价才略。

硬件性能vs生态效果,性价比vs延续速率,专用优化vs通用无邪,这是面前AI芯片干戈最中枢的几大矛盾张力。谷歌用双TPU计谋试图两头兼顾,亚马逊用Trainium的兼容性策略绕过生态壁垒,英伟达则用二十年蕴蓄的软件护城河抗击扫数挑战者。

莫得东说念主能买到扫数筹码,也莫得哪家公司的遴荐是错的华游娱乐(中国)官方IOS|Android手机app下载,齐要付出不同的代价。在AI基础法子的棋盘上,芯片性能早已不是唯独的计分方式。(新浪科技)

海量资讯、精确解读,尽在新浪财经APP
相关标签: