多年来,苹果公司在谈论其产品时一直避免使用 AI 这个缩写。现在不会了。
2022年底,OpenAI催生了生成式人工智能的蓬勃发展,这已成为近期科技行业最大的新闻,使芯片制造商英伟达(Nvidia)的市值达到3万亿美元,并使微软、谷歌和亚马逊的工作重点发生了重大转变,它们都在争先恐后地将这项技术添加到自己的核心服务中。
投资者和客户现在都想看看这家 iPhone 制造商会有什么惊喜。
苹果全球开发者大会(WWDC)将于本周一在加州库比蒂诺的苹果公司园区举行,会上将推出新的人工智能功能。苹果公司首席执行官蒂姆-库克(Tim Cook)预告了一些重大计划,这对于一个不喜欢在产品发布前谈论产品的公司来说是一个改变。
WWDC 通常不是吸引投资者的主要活动。在第一天,该公司会公布 iOS、iPadOS、WatchOS 和 MacOS 软件的年度更新,通常由库克主持两小时的主题发布视频录制。今年,发布会将在苹果总部放映。然后,应用程序开发人员将有一周的时间参加聚会和虚拟研讨会,学习新的苹果软件。
苹果粉丝可以预览即将在 iPhone 上使用的软件。开发人员可以着手更新他们的应用程序。新硬件产品即使出现,也不是展示的重点。
但今年,每个人都会关注科技界最热门的缩写词。
随着超过 10 亿部 iPhone 的使用,华尔街想知道哪些人工智能功能将使 iPhone 在与安卓竞争对手的竞争中更具竞争力,以及公司如何证明其投资开发自己的芯片是合理的。
投资者对那些展示了清晰的人工智能战略和愿景的公司给予了奖励。Nvidia 是人工智能处理器的主要制造商,其股价在过去一年中上涨了两倍。正在积极将 OpenAI 纳入其产品的微软,其股价在过去一年中上涨了 28%。同期,苹果公司仅上涨了 9%,市值已被其他两家公司超越。
Wedbush 分析师丹-艾夫斯(Dan Ives)告诉 CNBC,这是库克和库比蒂诺十多年来最重要的事件。人工智能战略是苹果公司增长拼图中缺失的一块,这次发布会需要成为一个亮点,而不是一个耸耸肩的事件。
包括软件主管克雷格-费德里吉(Craig Federighi)在内的多位高管将上台发言,他们可能会讨论苹果人工智能在现实生活中的应用,人工智能是应该在本地运行还是在大规模云集群中运行,以及应该内置在操作系统中还是分布在应用程序中。
隐私也是一个关键问题,与会者很可能想知道苹果公司如何在不损害用户隐私的情况下部署这种对数据要求极高的技术,而用户隐私是该公司半个多世纪以来的营销核心。
戴维森公司(D.A. Davidson)分析师吉尔-卢里亚(Gil Luria)在本周的一份报告中写道:"在 WWDC 大会上,我们预计苹果公司将围绕在其多样化的个人设备生态系统中实施生成式人工智能,公布其长期愿景。我们认为,生成式人工智能对苹果业务的影响是所有技术领域中最深远的,与影响开发者或企业的许多人工智能创新不同,苹果显然有机会向数十亿消费设备提供生成式人工智能功能。
上个月,OpenAI 推出了一款名为 ChatGPT-4o 的人工智能软件语音模式。
在一个简短的演示中,OpenAI 的研究人员手持 iPhone,直接与 ChatGPT 应用程序中的机器人对话。对话非常流畅,机器人给出了建议,声音听起来也很像人类。现场活动的进一步演示显示,机器人可以唱歌、教三角函数、翻译和讲笑话。
苹果用户和专家立即明白,OpenAI 演示了苹果 Siri 未来的预览版。苹果公司的语音助手于 2011 年首次亮相,自推出以来一直以不实用而声名狼藉。它很死板,只能回答一小部分定义明确的询问,部分原因是它基于较老的机器学习技术。
苹果下周可能与 OpenAI 合作升级 Siri。据《纽约时报》报道,苹果也在讨论从其他公司获得聊天机器人技术的许可,其中包括谷歌和 Cohere。
苹果公司拒绝就与 OpenAI 的合作发表评论。
一种可能是,苹果的新 Siri 不会直接与功能齐全的聊天机器人竞争,而是会改进其现有功能,并把只能由聊天机器人回答的问题交给合作伙伴。这与苹果 Spotlight 搜索和 Siri 现在的工作方式很相似。苹果的系统会尝试回答问题,但如果无法回答,它就会求助于谷歌。这项协议是苹果公司每年价值 180 亿美元交易的一部分。
苹果公司可能也不会全力支持 OpenAI 合作或聊天机器人。其中一个原因是,如果聊天机器人出现故障,可能会引发令人尴尬的头条新闻,并有损公司对用户隐私和用户数据个人控制的重视。
花旗银行分析师阿提夫-马利克(Atif Malik)在最近的一份报告中说,数据安全将是该公司的一个关键优势,我们预计他们在 WWDC 期间也会花时间讨论他们在隐私保护方面所做的努力。
OpenAI 的技术基于网络搜索,而 ChatGPT 用户互动被用来改进模型本身,这种技术可能违反苹果公司的一些隐私原则。
像OpenAI这样的大型语言模型仍然存在不准确或幻觉的问题,比如上个月谷歌的搜索人工智能就曾说巴拉克-奥巴马总统是第一位穆斯林总统。OpenAI 首席执行官山姆-阿尔特曼(Sam Altman)最近发现自己正处于一场关于深度伪造和欺骗的棘手社会争论之中,他否认了女演员斯嘉丽-约翰逊(Scarlett Johansson)关于 OpenAI 的语音模式盗用了她的声音的指控。这种冲突正是苹果公司高管们乐于避免的。
在苹果公司之外,人工智能已经开始依赖大型服务器群,使用强大的英伟达(Nvidia)处理器和 TB 级内存来计算数字。
相比之下,苹果公司则希望其人工智能功能能在 iPhone、iPad 和 Mac 上运行,因为它们都是靠电池供电的。库克强调,苹果自己的芯片在运行人工智能模型方面更胜一筹。
库克在今年 5 月的一次财报电话会议上对投资者说,我们相信人工智能的变革力量和前景,我们相信我们拥有在这个新时代脱颖而出的优势,包括苹果公司将硬件、软件和服务无缝整合的独特组合、开创性的 Apple Silicon 与我们业界领先的神经引擎,以及我们对隐私的坚定不移的关注。
摩根大通(JPMorgan)分析师萨米克-查特吉(Samik Chatterjee)在本月的一份报告中写道:"我们预计,苹果公司在 WWDC 主题演讲中的重点将是功能和设备上的功能,以及为实现这些功能而在设备上运行的 GenAI 模型。
今年 4 月,苹果公司发布了有关人工智能模型的研究报告,该公司称这些模型为高效语言模型,可以在手机上运行。微软也发布了关于同一概念的研究。苹果公司的一个 OpenELM 模型有 11 亿个参数或权重,远远小于 OpenAI 的 2020 GPT-3 模型,后者有 1750 亿个参数,甚至小于 Meta 的 Llama 一个版本的 700 亿个参数,而 Llama 是使用最广泛的语言模型之一。
在论文中,苹果公司的研究人员在运行苹果 M2 Max 芯片的 MacBook Pro 笔记本电脑上对该模型进行了基准测试,结果表明,这些高效模型并不一定需要连接到云端。这可以提高响应速度,并提供一层隐私保护,因为敏感问题可以在设备本身得到回答,而不是发回苹果服务器。
据彭博社报道,苹果软件内置的一些功能可能包括为用户提供未读短信摘要、为新表情符号生成图像、在公司开发软件 Xcode 中完成代码或起草电子邮件回复。
据彭博社报道,苹果公司还可能决定在其数据中心加载 M2 Ultra 芯片,以处理需要更多马力的人工智能查询。
WWDC 并不完全是关于人工智能的。
该公司有超过 22 亿台设备在使用中,客户需要改进的软件和新的应用程序。
一个潜在的升级可能是苹果公司采用了 RCS,这是对旧的短信系统(即 SMS)的改进。苹果的信息应用会将 iPhone 之间的短信转发到自己的 iMessage 系统,该系统会以蓝色气泡显示对话内容。当 iPhone 向 Android 手机发送短信时,气泡显示为绿色。许多功能都无法使用,例如打字通知。
谷歌主导了 RCS 的开发,为短信增加了加密和其他功能。去年年底,苹果公司确认将在 iMessage 的基础上增加对 RCS 的支持。iOS 18 的首次亮相将是展示其工作的合理时机。
今年 2 月,苹果公司在美国发布了虚拟和增强现实头盔 Vision Pro,此次发布会也将是该产品发布一周年纪念日。苹果可能会宣布将其业务扩展到更多国家,包括中国和英国。
苹果公司在 WWDC 发布会上表示,Vision Pro 将成为焦点。Vision Pro 目前处于其操作系统的第一个版本,其核心功能,如 Persona 视频会议模拟,仍处于测试阶段。
对于使用 Vision Pro 的用户,苹果将在 3D 环境中提供一些虚拟课程。
观看:坎特罗维茨对 WWDC 上最新发布的芯片进行了评测