英伟达主导人工智能芯片市场,但竞争比以往任何时候都激烈

英伟达主导人工智能芯片市场,但竞争比以往任何时候都激烈

五年内,人工智能芯片市场的年收入可能达到 4000 亿美元。

英伟达(Nvidia)5 月份的涨幅达到 27%,市值升至 2.7 万亿美元,在全球市值最高的上市公司中仅次于微软和苹果。受人工智能处理器需求飙升的推动,这家芯片制造商的销售额连续三个季度同比增长三倍。

瑞穗证券(Mizuho Securities)估计,在用于训练和部署 OpenAI 的 GPT 等模型的人工智能芯片市场,英伟达控制了 70% 到 95% 的份额。Nvidia的毛利率高达78%,这对于一家需要制造和运输实体产品的硬件公司来说是一个惊人的高数字,凸显了Nvidia的定价能力。

竞争对手英特尔和 Advanced Micro Devices 最新季度的毛利率分别为 41% 和 47%。

一些专家将英伟达在人工智能芯片市场的地位形容为护城河。它的旗舰 AI 图形处理器(GPU),如 H100,再加上公司的 CUDA 软件,在竞争中占据了先机,转而使用其他替代产品似乎几乎是不可想象的。

尽管如此,Nvidia 首席执行官黄仁勋(他的净资产在过去五年中从 30 亿美元激增到约 900 亿美元)表示,他对自己这家拥有 31 年历史的公司失去优势感到忧心忡忡。他在去年年底的一次会议上承认,有许多强大的竞争对手正在崛起。

黄说,我不认为人们想让我倒闭。我可能知道他们想这么做,所以这不一样。

Nvidia 已承诺每年发布一种新的人工智能芯片架构,而不是像历史上那样每隔一年发布一次,并将推出新的软件,使其芯片更深入地融入人工智能软件。

但是,能够运行作为生成式人工智能基础的复杂数学运算的,并非只有 Nvidia 的 GPU。如果功能较弱的芯片也能完成同样的工作,黄仁勋就有理由疑神疑鬼了。

从训练人工智能模型过渡到所谓的推理(或部署模型),也会给公司提供一个取代英伟达 GPU 的机会,尤其是如果它们的购买和运行成本更低的话。Nvidia 的旗舰芯片售价约为 3 万美元或更高,这让客户有足够的动力寻求替代品。

竞争对手 D-Matrix 的联合创始人 Sid Sheth 说:"Nvidia 很想 100% 拥有它,但客户不希望 Nvidia 100% 拥有它。这个机会太大了。如果任何一家公司独占所有的机会,那就太不健康了。

D-Matrix 成立于 2019 年,计划在今年晚些时候发布一款用于服务器的半导体卡,旨在降低运行人工智能模型的成本和延迟。该公司于 9 月份融资 1.1 亿美元。

据市场分析师和 AMD 称,未来五年,人工智能芯片市场的年销售额可能达到 4000 亿美元。英伟达(Nvidia)在过去四个季度中创造了约 800 亿美元的收入,美国银行估计该公司去年的 AI 芯片销售额为 345 亿美元。

许多与英伟达的 GPU 竞争的公司都在打赌,不同的架构或某些权衡可以为特定任务提供更好的芯片。设备制造商也在开发一种技术,这种技术最终可能会为人工智能提供大量计算,而目前这种计算是在云端基于 GPU 的大型集群中进行的。

3Fourteen Research公司的联合创始人费尔南多-维达尔(Fernando Vidal)告诉CNBC,没有人可以否认,如今Nvidia是训练和运行人工智能模型的首选硬件。但是,从研发自己芯片的超级计算机,到设计自己芯片的小型初创公司,在创造公平竞争环境方面一直在逐步取得进展。

AMD 首席执行官苏丽莎希望投资者相信,在这个领域,许多成功的公司都有广阔的发展空间。

苏珊娜在 12 月公司推出最新的人工智能芯片时告诉记者,关键在于有很多选择。我认为我们将会看到这样一种局面:不仅有一种解决方案,还会有多种解决方案。

AMD 生产用于游戏的 GPU,并与 Nvidia 一样,将其应用于数据中心内的人工智能。其旗舰芯片是 Instinct MI300X。微软已经购买了 AMD 处理器,并通过其 Azure 云提供访问。

在发布会上,Su 强调了该芯片在推理方面的卓越性能,而不是与 Nvidia 在训练方面展开竞争。上周,微软表示正在使用 AMD Instinct GPU 为其 Copilot 模型提供服务。摩根士丹利(Morgan Stanley)分析师认为,这一消息表明 AMD 的人工智能芯片销售额今年可能会超过 40 亿美元,这是该公司的公开目标。

去年在营收方面被英伟达(Nvidia)超越的英特尔也正试图在人工智能领域占据一席之地。该公司最近发布了第三版人工智能加速器高迪 3。这一次,英特尔直接将其与竞争对手相提并论,称其为性价比更高的替代品,在运行推理方面优于 Nvidia 的 H100,同时在训练模型方面速度更快。

美国银行分析师最近估计,英特尔今年在人工智能芯片市场的份额将不足1%。英特尔表示,它有 20 亿美元的芯片积压订单。

阻碍更广泛应用的主要障碍可能是软件。AMD 和英特尔都参加了一个名为 UXL 基金会的大型行业组织,其中包括谷歌,该组织正致力于为控制人工智能应用硬件的 Nvidia CUDA 开发免费的替代软件。

Nvidia 面临的一个潜在挑战是,它正在与一些最大的客户竞争。包括谷歌、微软和亚马逊在内的云计算提供商都在制造内部使用的处理器。这三大科技公司加上甲骨文公司,占 Nvidia 公司收入的 40% 以上。

亚马逊在 2018 年推出了自己的面向 AI 的芯片,品牌名称为 Inferentia。目前,Inferentia 已推出第二个版本。2021 年,亚马逊网络服务公司首次推出了针对培训的 Tranium。客户无法购买这种芯片,但可以通过 AWS 租用系统,AWS 称这种芯片比 Nvidia 的芯片更具成本效益。

谷歌可能是最专注于自有芯片的云计算提供商。自 2015 年以来,该公司一直在使用其所谓的张量处理单元(TPU)来训练和部署人工智能模型。今年 5 月,谷歌发布了其芯片 Trillium 的第六个版本,公司称该芯片用于开发其模型,包括 Gemini 和 Imagen。

谷歌也使用英伟达芯片,并通过其云服务提供这些芯片。

微软还没有走得这么远。该公司去年表示,它正在打造自己的人工智能加速器和处理器,名为 Maia 和 Cobalt。

Meta 不是一家云计算供应商,但该公司需要大量的计算能力来运行其软件和网站,并提供广告服务。虽然 Facebook 母公司正在购买价值数十亿美元的 Nvidia 处理器,但它在今年 4 月表示,它的一些国产芯片已经在数据中心使用,而且与 GPU 相比能实现更高的效率。

摩根大通分析师 5 月份估计,为大型云计算提供商构建定制芯片的市场价值可能高达 300 亿美元,每年的潜在增长率为 20%。

风险投资家们看到了新兴公司跃跃欲试的机会。根据 PitchBook 的数据,他们在 2023 年向人工智能半导体公司投资了 60 亿美元,略高于上一年的 57 亿美元。

对于初创企业来说,这是一个艰难的领域,因为半导体的设计、开发和制造成本都很高。但也有机会实现差异化。

对于位于硅谷的人工智能芯片制造商 Cerebras Systems 来说,重点是人工智能的基本操作和瓶颈,而不是 GPU 的通用性。据彭博社报道,该公司成立于 2015 年,最近一次融资时估值为 40 亿美元。

首席执行官安德鲁-费尔德曼(Andrew Feldman)说,Cerebras芯片WSE-2将GPU功能、中央处理器和额外内存整合到一个设备中,更适合训练大型模型。

费尔德曼说,我们使用一个巨大的芯片,而他们使用很多小芯片。他们面临着数据移动的挑战,而我们没有。

费尔德曼说,他的公司的客户包括梅奥诊所、葛兰素史克公司和美国军方,即使与英伟达公司竞争,其超级计算系统也能赢得业务。

费尔德曼说,竞争很充分,我认为这对生态系统来说是健康的。

D-Matrix公司的Sheth说,他的公司计划在今年晚些时候发布一款带有chiplet的显卡,它可以在内存中进行更多计算,而不是像GPU那样在芯片上进行计算。D-Matrix公司的产品可以与现有的GPU一起装入人工智能服务器,但它可以省去Nvidia芯片的工作,有助于降低生成式人工智能的成本。

Sheth 说,客户非常乐于接受新的解决方案,也非常愿意将其推向市场。

Nvidia 数据中心业务面临的最大威胁可能是处理地点的变化。

开发人员正越来越多地打赌,人工智能工作将从服务器群转移到我们拥有的笔记本电脑、个人电脑和手机上。

像 OpenAI 开发的大型模型需要大量功能强大的 GPU 集群来进行推理,但苹果和微软等公司正在开发小型模型,这些模型所需的电力和数据更少,而且可以在电池供电的设备上运行。它们可能不如最新版的 ChatGPT 那么熟练,但它们也能执行其他应用,比如总结文本或可视化搜索。

苹果公司和高通公司正在更新它们的芯片,以便更高效地运行人工智能,为人工智能模型增加了称为神经处理器的专门部分,这可以带来隐私和速度方面的优势。

高通公司最近发布了一款 PC 芯片,允许笔记本电脑在设备上运行微软的人工智能服务。该公司还投资了多家芯片制造商,生产低功耗处理器,以便在智能手机或笔记本电脑之外运行人工智能算法。

苹果公司一直在推销其最新的笔记本电脑和平板电脑,称其芯片上的神经引擎已为人工智能进行了优化。在即将举行的开发者大会上,苹果公司计划展示一系列新的人工智能功能,这些功能很可能在该公司支持 iPhone 的芯片上运行。