高通打响围攻英特尔的第一枪

2023-10-26 10:08

通过一场发布会，高通摇身一变成为“终端 AI”的代表，成功让人们忽视了英特尔才是最早主张 AI 端侧计算的企业。

“Oryon CPU 的开发进度甚至超过了我们自己的预期。”

北京时间 10 月 25 日凌晨，高通骁龙技术峰会正式召开。不同于以往手机厂商们排队抢首发的循规蹈矩，这次业界把焦点放在了高通专为 AI 打造的 PC 处理器骁龙 X Elite 上，一枚基于高通自研内核“Oryon”的 CPU。

在介绍这枚芯片时，高通 CEO 克里斯蒂亚诺·安蒙（Cristiano Amon）的喜悦之情也是溢于言表，苹果的 M2 Max 和英特尔的 i9-13980HX 成为活动现场的“对照组”，从单线程性能到峰值性能功耗，再到 GPU 算力和 AI 处理速度，安蒙试图用数据证明骁龙 X Elite 是一款全方位*的产品。

在移动旗舰芯片方面，虽然全新骁龙 8Gen 3 被 X Elite 抢了风头，但凭借“*专为生成式 AI 打造的移动平台”这一名头，依旧在发布会上博得满堂彩。

通过一场发布会，高通摇身一变成为“终端 AI”的代表，成功让人们忽视了英特尔才是最早主张 AI 端侧计算的企业。

而就在高通技术峰会召开前的一天，10 月 24 日，路透社报道称，英伟达和 AMD 正在开发能够用于 Windows 系统的 PC 处理器。虽然还不清楚上述产品的研发进展，但可以确定的是，两家公司的 PC 处理器同骁龙 X Elite 一样采用 ARM 架构。

英特尔曾凭借 x86 架构垄断 PC 处理器市场三十余年，但眼下英特尔的行业霸主地位，似乎在一夜之间迎来变数。

高通的蜕变，有多彻底？

在发布会开始，安蒙介绍了在端侧完成 AI 计算的必要性，基本还是那些老生常谈的观点：低成本、低时延、安全性高。但令人惊喜的是，高通把移动端平台的生成式 AI 能力抬上了一个新的高度。

相较上代产品，骁龙 8Gen 3 的 CPU 性能提升了 30%，GPU 性能提升了 25%，NPU 性能提升 25%，目前骁龙 8Gen 3 已支持运行 100 亿参数的生成式 AI 模型。如果使用搭载 8Gen 3 平台的智能手机运行 Stable Diffusion，只需不到 1 秒就可以用文本生成图像。

图片来源：高通

如果只对比参数，100 亿模型参数要较 GPT 4 和 Llama2 等云端模型少了几个数量级，但对于手机厂商而言，这样的硬件能力在现阶段已基本够用。

以小米为例，该公司在今年 4 月完成了大模型团队的搭建，8 月成功在端侧跑通 13 亿参数大模型，但目前还未正式进入公测阶段。以此推断，在下一代骁龙移动旗舰平台发布之前，骁龙 8Gen 3 足以应对手机端的训练需要。

另外，在发布会现场，高通还拉出一票软件公司站台，并表示骁龙平台现已支持微软、Meta、OpenAI、安卓、百度等公司的端侧大模型。根据此前高通与 Meta 的合作计划，最早在明年应该就能看到 Llama 2 模型在骁龙平台上运行。

相较于多模态生成式 AI 能力，骁龙 8Gen 3 在其他方面则稍显平庸，只能算是中规中矩的常规升级，但眼下行业内似乎也并不关心骁龙新的移动平台，在游戏、影像等场景下有多少提升，全场的关注点都集中在骁龙 X Elite 上。

图片来源：高通

高通方面表示，这个专为 AI 打造的骁龙 X Elite 其 AI 处理能力是竞品的 4.5 倍，异构 AI 引擎性能可达 75TOPS，支持在端侧运行超过 130 亿个参数的生成式 AI 模型，当使用基于 70 亿参数的端侧聊天助手时，每秒可处理 30 个 Token。

虽然发布会现场高通并没有标注这个“竞品”是哪款 CPU，但还是以数据的形式展示了下 Oryon 内核的“基础能力”：单线程性能超过苹果的 M2 Max 和英特尔的 i9-13980HX，峰值功耗比 M2 Max 少 30%，比 i9-13980HX 少 70%。而在多线程方面，高通还对比了英特尔的 i7-1355U，称骁龙 X Elite 的性能可达其两倍，且峰值功耗减少 68%。

图片来源：高通

即便这种对比方式稍有“田忌赛马”之嫌，但不得不说，作为 Oryon 内核的首代商用产品，骁龙 X Elite 的表现远超过行业预期。

实际上，在 Oryon 项目上，高通某种意义上是沾了苹果的光。

2021 年 3 月，高通收购了初创芯片设计公司 Nuvia，这家公司的主营业务就是打造高性能 ARM 架构芯片，其创始人团队包括苹果前 CPU 首席架构师 Gerard Williams 以及曾参与苹果 A7-A14 芯片研发的 John Bruno、Manu Gulati 等人。

在完成对 Nuvia 收购后，高通在 Oryon 项目上进展神速，并于去年骁龙技术峰会上宣布推出 Oryon 内核。

值得一提的是，在高通 2022 年三季度财报发布后的电话会议上，安蒙曾表示过，“我们预计，2024 年骁龙 Windows PC 将出现拐点。”但在当时，考虑到高通在 PC 市场少得可怜的占有率，这句话并没有引起行业太多的关注。

三家分 Intel？

骁龙 X Elite 芯片的推出，让高通在 PC 领域的野心暴露无遗。尽管这家公司一度凭借手机芯片成为全球*的 Fabless 厂商，但在 PC 行业，高通始终默默无名。

在 2018 年，高通曾在骁龙 855 芯片的基础上，推出了面向 PC 端的骁龙 8cx 处理器，但性能十分羸弱，甚至不及当时 iPhone 上的 A12 芯片。以至于当时有种观点认为，骁龙 8cx 存在的意义就是为了证明，ARM 架构不适合作为电脑处理器，它注定只能是移动端架构。

此后，鲜有芯片厂商再进行 ARM 架构在 PC 上的尝试。直到 2020 年，基于 ARM 架构的苹果 M1 芯片问世，人们才发现 ARM 架构在功耗大幅* x86 架构处理器的同时，性能同样可以有不俗的表现。

反映在市场表现上，根据 CouterPoint Research 的统计数据，自 2020 年苹果推出 M1 芯片后，截至 2022 年底，全球基于 ARM 架构处理器的笔记本市场份额从 2% 迅速增长至 12% 以上，其中 90% 都是苹果的产品。

需要说明的是，除了英特尔和 AMD 外，大部分厂商根本没有 x86 架构授权，此前连进入 PC 市场的资格都没有，而苹果凭借 ARM 架构在 PC 市场上取得的成功，给许多芯片设计厂商打入了一针强心剂。

与此同时，在“端侧 AI”概念兴起的当下，厂商们发现 ARM 架构芯片的另外一个优势非常适合端侧大模型的场景——低功耗。

相较于云端大模型，端侧大模型*的意义在于可以在离线状态下使用，而在日常应用场景中，涉及到离线使用的基本都是笔记本电脑、平板电脑等便携式设备，这类产品往往因为续航的需求对 CPU 功耗有着很高的要求。

因此，过去被 x86 架构“卡脖子”的芯片厂商们，现在都心照不宣的开始了对 ARM 架构的研发工作，试图在“端侧 AI”时代从英特尔嘴里抢下一块肉。

值得一提的是，过去被认为和英特尔组成“Wintel 联盟”的微软，在“Arm on Windows”这件事上表现得甚至比芯片厂商还要积极。10 月 17 日，微软宣布了一项名为“ARM 咨询服务”的计划，以帮助开发者开发基于 ARM 的应用程序。

这其实也不难理解，虽然有着联盟之名，但长久以来，微软始终希望能够摆脱单一合作方的束缚。

从上述背景来看，眼下开发基于 ARM 架构的 PC 处理器，似乎占尽了天时、地利、人和。

不过，现在还远没有到能危及英特尔的时候。一方面，英特尔代表的 x86 PC 处理器市场仍然有着*的*优势。

另一方面，英特尔在端侧 AI 上的努力同样不遑多让，在前不久的 Intel On 大会上，英特尔宣布年底推出的代号为“Meteor Lake 的酷睿 Ultra 处理器，将全系集成神经网络处理单元（NPU），而且还准备通过 OpenVINO 套件，帮助开发者进行 AI 训练、测试，及模型优化工作。

但无论如何，友商们通过 ARM 架构来描述端侧 AI 的蓝图，对于英特尔来说*是个值得警醒的信号。

高通 AI 芯片

*本文作者丸都山，由新芽NewSeed合作伙伴虎嗅网授权发布，转载请联系原出处。如内容、图片有任何版权问题，请联系新芽NewSeed处理。

打开客户端体验更多精彩

热门搜索

高通打响围攻英特尔的第一枪

猜你喜欢

OpenAI陷入生存烦恼

OpenAI史诗级暴涨

OpenAI做芯片，只因钱太多