闲对子(PlayerPair)

百家乐官网 OpenAI 硬件端庄东说念主的闭门共享,向咱们揭示了为什么硬件「止境」仍是智妙手机

发布日期:2026-05-01 22:58    点击次数:112

百家乐官网 OpenAI 硬件端庄东说念主的闭门共享,向咱们揭示了为什么硬件「止境」仍是智妙手机

「你必须为模子将要去的场合遐想硬件,而不是为今天的模子。」

作家|张勇毅

剪辑|靖宇

 

昨天,当 OpenAI 作念智妙手机的具体规格与供应链爆料发布时,我第一响应不是「他们要作念手机了」,而是「OpenAI 最终也不得不踏出这一步」,同期念念起两周前 Richard Ho 在 Stanford 那场相易。

Richard Ho 是 OpenAI 的硬件端庄东说念主,从 Google 作念 TPU 出来。

Richard Ho |图片起原:Synopsys

那场在 IEEE 里面组织的相易上,他莫得讲过一次「手机」这个词。但把昨天的新闻和他那时说过的话放在一说念看,整条旅途其实还是被讲得很了了——仅仅那时莫得一个具体的居品形态来锚定它。

OpenAI 作念手机这件事,在外界看来像一次跨界。但顺着 Richard Ho 那场相易的逻辑往下推,你会发现这是一条早就铺好的路。

毕竟对于总共模子厂商来讲,手机皆仅仅止境之一,不是伊始。

01

模子的下一次「跃迁」,出身自硬件

那场相易的中枢,是对于 OpenAI 为什么必须我方作念硬件。

Richard Ho 反复强调的一句话是:「果真的竣事不再仅仅模子,而是算力、能耗、本钱、延迟,是通盘系统。」

听起来像一句平素的时期述说。但放在 OpenAI 的位置上,这句话的重量十足不一样——它意味着这家公司还是不把我地契纯四肢一家模子公司。

GPU 是为通用并行缠绵遐想,在推选系统、传统的并行任务,跑得很好。

但靠近今上帝流的 Transformer、agent、长落魄文推理,其实还是偏离了 GPU 当初的遐想假定。尤其是 agent ——多轮、不绝奉行、跨任务协同,通盘系统层的低效会被放大好多倍。Richard Ho 那时的原话是:「GPU 把咱们带到了今天,但它并不是为这种(AI 负载任务)而遐想的。」

这句话背后的含义其实是:陆续依赖 NVIDIA 所设定好的硬件旅途,OpenAI 始终没方针把模子推到下一个量级。不是说 GPU 不成用,而是说在能耗、本钱、效果这些维度上,OpenAI 无法一直被迫地剿袭外部的硬件节拍。

是以这件事的内容从一初始就不是「OpenAI 插足芯片 / 硬件行业」,而是 OpenAI 念念再行拿回 AI 运行的底层适度权。

要是只看媒体报说念,你会认为 OpenAI 在作念的事情是「拼装一台手机」或者更深入一些的「自研一颗 AI 芯片」。但 Richard Ho 我方长远得很径直:「咱们不是在作念一颗芯片,而是在作念一个系统。」

这个「系统」包括芯片、机架、采集、电力、散热、数据中心——和 Google 当年作念 TPU 的旅途很像,但更强调端到端的适度。

程度的部分有点出乎我预念念。Richard Ho 说团队是从零搭起来的,但「两年时辰还是从空缺走到 tape-out(芯片遐想完成录用流片出产)」,况兼还是有芯片在果真 workload 中跑了——他成心强调这不是纸面上的数据,而是「还是在果真环境里 work 的东西」。

两年从零到 tape-out 是个什么意见?传统芯片公司从架构到流片,五到七年很正常。Google TPU 第一代用了简略三年,而且是有 Jeff Dean 这种基础要领大牛背书、又有 Google 里面完竣的工程协同体系作因循。OpenAI 能作念到两年——背后只但是两件事:要么是从 TPU、Apple、Google 等公司挖了无数还是老练的硬件团队(这是事实),要么是 Broadcom 这类相助方在底层 IP 上提供了相等大的支柱(这也部分是事实)。

但更值得说的是 OpenAI 和硬件供应商之间的关系界限。

「他们会参与 IP、physical design、packaging。」Richard Ho 谈到 Broadcom 时说得很克制,紧接着补了一句——「他们并不看到完竣的架构。」他还专门证明,「好多时候他们只看到一部分,但看不到举座是怎样拼起来的。」

这句话其实败露了 OpenAI 自身的一个判断:架构层和工程层是两件事,前者必须十足持在我方手里。Broadcom 提供的是模块和制造才智,系统级的遐想逻辑——也便是「这颗芯片到底要怎样和模子配合」这件事——必须留在里面——就像苹果作念硬件的逻辑一样。

Richard Ho 提到,外界看到的模子是几个月发布一次,但里面其实是一条衔接的 pipeline ——「咱们能看到接下来 6 到 9 个月模子会怎样变」。

这句话才是整段最枢纽的。它意味着 OpenAI 的硬件团队不是在为今天的模子遐想芯片,而是在为还没出现的模子「筹划」遐想。

具体到细节上,这种「上前看」会影响好多决定:模子对内存压力的变化会径直决定 HBM 应该用 8-high、12-high 如故 16-high;采集带宽要扩到若干;新的 compression algorithm 出现会不会蜕变数据流的体式;inference 和 training 的比例正在快速变化(推理负载越来越重),这对硬件的条目又是另一套。

Richard Ho 把这少量总结成一句话:

「你必须为模子将要去的场合遐想硬件,而不是为今天的模子。」

这便是 OpenAI 的芯片和 NVIDIA、AMD 的根柢不同之处——它不是一颗对外售售的通用 GPU,而是高度贴合 OpenAI 自身模子旅途的、简直一双一定制的系统。从这个角度看,OpenAI 作念芯片更像 Google 作念 TPU,而不是像 NVIDIA 作念 H100。

但即便如斯,硬件优化的天花板远莫得到。Richard Ho 反对「晶体管高出变慢,是以芯片红利竣事」这个结论。他的判断是:单颗芯片如实在变慢,但通盘系统层面还远远莫得被优化好。memory hierarchy、networking、data movement ——这些大瓶颈皆没解。他举的例子很具体:现时高速 copper 互联在高带宽下只可支柱简略 2 米的距离,这对数据中心布局口舌常大的竣事。

简便说一句:OpenAI 在作念的事情不是把一颗芯片作念得更快,而是把通盘 AI 缠绵系统再行优化一遍。

手机这件事,是这个系统的最结尾。

02

「手机不是为 agent 遐想的」

回笔直机。

Richard Ho 在那场相易上有一句话,今天回头看简直便是 OpenAI 作念手机的全部事理——「手机不是为 agent 遐想的」。

「今天的手机交互是 app-based、session-based 的,你翻开一个 app,作念一件事,关掉。但 agent 需要的是不绝存在、不绝奉行、跨任务协同。一个果真的 agent 不会等你翻开它再初始使命,它会在后台一直长远你的情景、调治你的任务、跟其他 agent 通讯。」

这种交互范式,径直等同于在说:今天的 iOS 和 Android 皆不是为它遐想的。

这便是为什么 OpenAI 必须我方作念。Richard Ho 的判断是「改日不是 cloud-only,也不是 edge-only,而是两者招引」——个东说念主落魄文、狡饰数据、低延迟交互必须在建立端,复杂推理留在云霄。要是一个 agent 念念随时拿到用户的「当下情景」,它必须在操作系统层有完竣权限。

现存手机系统在雀跃 AI 期间原生用户需求眼前有自然的短板 | 图片起原:io

这件事在 iOS 和 Android 上很难干净地作念——不是时期问题,百家乐是利益问题。Apple 不会把系统级权限十足绽开给一个第三方 agent,Google 也不会。

亦然从这个角度,客岁 OpenAI 收购 Jony Ive 团队关联的公司(io)的逻辑就了了了。Richard Ho 说,作念端侧个东说念主建立这部单干作「是现时最有敬爱的一块」——因为这是第一次把基础要领和破坏电子建立果真接在一说念。

这其实是 OpenAI 通盘硬件计谋里最有念念象力的部分,亦然最危机的部分。有念念象力是因为它在作念 Apple 当年没作念的事:用 AI agent 把操作系统重写一遍。危机是因为破坏电子是另一套游戏功令——居品节拍、供应链、零卖、品牌——不是从云霄工程师团队里能长出来的才智。

但 io 的存在处理了一部分问题。Jony Ive 不是来作念芯片或者操作系统的,他是来作念硬件形态和工业遐想的——这原本便是 Apple 这些年从 OpenAI 手里能移时保住的终末一块地。

03

不是总共 AI 公司皆在作念合并件事

破坏电子的难度有多大,看昔日两年其他 AI 公司在硬件上的尝试就了了了。

每一家皆念念用 AI 再行界说某个硬件形态。但每一家走的旅途不一样,扫尾也很不一样。

最早的是 Rabbit R1。

2024 岁首的 CES 上,吕骋拿出那台橙色小盒子,喊出「干翻总共 App」——用 LAM(大动作模子)替代手机里 App 的交互式样,一句话订外卖、打车、订机票。那时激勉的存眷度堪比「AI 期间的 iPhone 时刻」,开售两周卖出 5 万台。

Rabbit R1 是首批 AI 硬件中为数未几「口碑回转」的居品|图片起原:Rabbit

但首批用户体验出来之后,事情翻得很快。先是被斥地者证据是套壳安卓—— Rabbit OS 推行上是 AOSP 的修改版,APK 不错径直装到 Pixel 6a 上跑。LAM 被发现依赖 OpenAI 的 API。续航 4 小时,订一次外卖要试十几次。

Rabbit 失败的果真原因不是居品性量,而是旅途——它只作念了硬件壳子,没碰底层。芯片是联发科 Helio P35(初学手机水平),系统是套壳 Android,模子靠第三方 API。这种作念法的天花板很赫然:你作念的事情,一个手机 App 皆能作念,而且作念得更好。

Meta 选了一条十足不同的路。

Meta 的判断是不挑战手机这个形态,让 AI 借眼镜这个还是存在的硬件形态插足日常。Ray-Ban Meta 作念对了三件事:找 EssilorLuxottica(雷一又母公司)作念相助方,让眼镜回首眼镜自己——前锋、轻、惬意;把 AI 作念成「附加项」,299 好意思元起售;不彊求每个用户皆用 AI,先把一副好眼镜卖出去,AI 是 bonus。

扫尾是 Ray-Ban Meta 卖出越过 200 万副,Meta 一家拿下众人智能眼镜商场 75% 以上的份额。

但这条路的界限也了了—— Meta 处理的是「AI 怎样插足日常」这个问题,不是「AI 怎样再行界说缠绵」这个问题。眼镜仅仅一个加了录像头和麦克风的进口,它不会替代手机,也没规划替代。

阿里千问基本上是 Meta 旅途的中国版块。本年 2 月 MWC 发布、3 月 G1 系列发售(国补笔直价 1997 元起)、4 月 S1 上市(国补笔直价 3499 元),节拍很快。逻辑也清楚:千问 App 还是作念到超 3 亿月活、8000 万 DAU,眼镜是把 AI 助手才智从手机延迟到日常教导形态——支付宝、高德、淘宝、飞猪一整套阿里生态皆接进来,用户对眼镜说「点外卖」「打车」「翻译」就能办事。芯片是高通骁龙 AR1,系统在 Android 之上,模子用千问。

千问眼镜内容上是一次生态延迟,不是底层重构。它的上风是阿里生态裕如厚,眼镜成为阿里 AI 服务的一个新进口。

把这三条路放在一说念看,再对比 OpenAI ——你会发现 OpenAI 是惟逐一家在作念「全栈再行界说」的公司:

Rabbit 念念绕过 App 但没动操作系统,扫尾是空中楼阁;Meta 采取不挑战手机,让眼镜作念副角,作念对了爆款但天花板便是副角;千问奴婢 Meta 的形态采取,把眼镜作念成 AI 服务的延迟进口;而 OpenAI ——从芯片、基础要领、动力、操作系统、建立一齐买通。

这是另一个量级的事。

04

果真的护城河,不在模子层

那场相易的终末,Richard Ho 还给了一句对改日神态的判断:

「(模子公司)不再是在芯片层赢,而是在系统层赢。」

这句话的敬爱是,改日的 AI 竞争不仅仅模子才智的竞争,而是整套系统才智的竞争——相似的功耗下能提供若骚扰备、能服务若干用户、延迟能压到多低。这种系统级的上风,单靠模子自己是没法替代的。

放在 OpenAI 的位置上看,这是一种相等自洽的逻辑:模子团队在 GPT、o 系列、agent 这些方进取往前推,但一朝推到某个体量,模子自己的高出就要被基础要领的瓶颈竣事住。是以 OpenAI 必须从模子公司酿成基础要领公司——再酿成建立公司。

这亦然为什么 Richard Ho 在被问到改日算力限度时,给出的数字是  20GW。把 OpenAI、Oracle、SoftBank 等相助方的筹划加起来,改日需要的算力简略相等于十几到二十个核电站的发电量。

这个数字第一次听到的时候我没响应过来。20GW 还是不是数据中心能处理的问题——它是国度电网和动力政策的问题。Richard Ho 我方也说,「当你初始谈这种限度,就必须谈电力,以至是国度安全」。

把这件事和「OpenAI 作念手机」放在一说念看,才能看了了通盘图景:一边是国度级别的动力基础要领,一边是用户兜里的一台建立,中间是一整套自研的芯片、系统、操作系统。OpenAI 念念作念的,是把这两头连起来。

把总共的点串起来——模子、基础要领、自研芯片、动力、edge device、操作系统——会发现 OpenAI 作念手机不是一个单点方案,而是这条旅途当然长出来的扫尾。

手机仅仅第一个被外界看见的形态。但果真的变化是更下面的那一层:缠绵范式正在从 app 为中心,转向 agent 为中心。

一朝默许进口酿成 agent,今天的建立、芯片、操作系统,皆会被再行界说一次。

这一次再行界说里,OpenAI 不再仅仅一家作念模子的公司。

* 头图起原:AI 生成

本文为极客公园原创著述,转载请议论极客君微信 geekparkGO

极客一问

当 agent 成为默许进口,

今天的操作系统会被重写吗?

开云体育(kaiyun)官方网站

上一篇:百家乐官网 一个1.5万东谈主的加勒比小岛,靠卖.ai域名收了一半的政府预算
下一篇:没有了