业内人士和技术分析师表示,中国的人工智能模型已经大受欢迎,其性能正在赶上甚至超过美国的人工智能模型。人工智能已成为中美之间的最新战场,双方都将其视为一项战略技术。由于担心人工智能技术会威胁到美国的国家安全,华盛顿继续限制中国获得旨在为人工智能提供动力的尖端芯片。
这促使中国采用自己的方法来提高人工智能模型的吸引力和性能,包括依靠开源技术和开发自己的超快软件和芯片。与该领域的一些美国领先企业一样,中国的人工智能企业也在开发所谓的大型语言模型,这些模型在海量数据的基础上进行训练,是聊天机器人等应用的基础。
不过,与为大受欢迎的ChatGPT提供动力的OpenAI模型不同,许多中国公司正在开发开源或开放重量级的LLM,开发人员可以免费下载并在其基础上进行构建,而无需从发明者那里获得严格的许可要求。
据Hugging Face公司的机器学习工程师Tiezhen Wang称,在Hugging Face国际手机版下载模型库中,中国人工乐虎国际手机版下载模型的下载量最高。他说,Qwen是中国电子商务巨头阿里巴巴创建的人工智能模型系列,在Hugging Face上最受欢迎。
Qwen因其在竞争性基准测试中的出色表现而迅速受到欢迎。Qwen拥有非常有利的许可模式,这意味着公司无需进行广泛的法律审查即可使用。Qwen有不同的大小或参数,这在LLM世界中是众所周知的。大参数模型功能更强大,但计算成本更高,而小参数模型运行成本更低。
无论选择哪种尺寸,Qwen都可能是目前性能最好的机型之一。初创公司DeepSeek最近也推出了一款名为DeepSeek-R1的模型,引起了不小的轰动。DeepSeek上个月表示,它的R1模型将与OpenAI的o1展开竞争,后者是专为推理或解决更复杂任务而设计的模型。
这些公司声称,它们的模型可以在各种功能上与Meta的Llama等其他开源产品以及OpenAI等封闭式LLM竞争。Lux Capital合伙人格蕾丝-伊斯福德表示,在过去一年里,我们看到了中国对人工智能的开源贡献的崛起,这些贡献具有真正的高性能、低服务成本和高吞吐量。
将一项技术开源有许多目的,包括让更多的开发人员能够使用这项技术,从而推动创新,以及围绕产品建立一个社区。不仅仅是中国企业推出了开源LLM。Facebook母公司Meta和欧洲初创公司Mistral也推出了开源版本的人工智能模型。
但是,随着科技行业陷入华盛顿和中国政府之间地缘政治斗争的风口浪尖,开源乐虎国际客户端下载为中国企业带来了另一个优势:使他们的模型能够在全球范围内使用。
虽然目前的焦点集中在人工智能模型上,但人们也在争论在其基础上将会构建什么样的应用,以及谁将主导未来的全球互联网格局。如果假定这些前沿基础人工智能模型是桌面赌注,那么问题就在于这些模型的用途,比如加速前沿科学和工程技术的发展。
如今的人工智能模式已被比作操作系统,如微软的Windows、谷歌的Android和苹果的iOS,有可能像这些公司在移动和个人电脑领域一样主导市场。
人工智能模型是在海量数据的基础上训练出来的,需要巨大的计算能力。目前,英伟达是所需芯片(即图形处理器)的主要设计者。大多数领先的人工智能公司都在使用英伟达最高性能的芯片来训练他们的系统,但在中国并非如此。
在过去的一年多时间里,美国加强了对中国先进半导体和芯片制造设备的出口限制。这意味着Nvidia的尖端芯片无法出口到中国,该公司不得不制造符合制裁要求的半导体产品出口。尽管有这些限制,但中国企业仍设法推出了先进的人工智能模型。
中国的主要技术平台目前有足够的计算能力来继续改进模型。DGA集团的特里奥罗说,这是因为它们储备了大量的英伟达GPU,同时也在利用华为和其他公司的国产GPU。事实上,中国公司一直在加大力度,以创造出可以替代英伟达的产品。华为一直是中国追求这一目标的领军企业之一,而百度和阿里巴巴等公司也一直在投资半导体设计。
不过,随着时间的推移,特别是明年Nvidia推出基于Blackwell的系统后,在先进硬件计算方面的差距将越来越大,而这些系统仅限于出口到中国。中国一直在系统地投资和发展Nvidia之外的整个国内人工智能基础设施堆栈,并使用百度等公司的高性能人工智能芯片。
无论Nvidia芯片是否在中国被禁用,都不会妨碍中国投资和建设自己的基础设施来构建和训练人工智能模型。