北京时间 5 月 15 日消息,12 年前,苹果公司推出的 AI 语音助手 Siri 惊艳了世界。但是现在,在如火如荼的生成式 AI 竞争中,它正危险地落后于竞争对手。
苹果在 AI 竞争中落后了
苹果前高级营销主管迈克尔・加滕伯格 (Michael Gartenberg) 日前发文称,苹果以其时尚的设计、尖端的技术和创新的消费产品而著称,但是谈到 AI,尤其是 Siri,苹果已经从领先者变成了落后者。
在如今的科技行业,微软公司凭借其对 OpenAI 的投资在 AI 竞争中一飞升天。谷歌也不甘落后,在刚刚结束的开发者大会上打响反击战,推出了全新生成式谷歌搜索和大语言模型 PaLM 2。
两家死对头都在磨刀霍霍,但是苹果却不声不响,在 AI 领域的进展乏善可陈。
在谈到目前火热的 AI 竞争时,苹果 CEO 蒂姆・库克 (Tim Cook) 似乎并不着急,他强调的是负责任的 AI 开发。库克在第二财季财报电话会议上称,AI 的潜力“非常有趣”,但他同时指出,在如何使用这项技术方面,“深思熟虑和考虑周到非常重要”。
落后的 Siri
Siri 在 2011 年面世,当时被誉为 AI 技术的一项突破,那时候确实如此。然而,多年过去了,Siri 并没有发挥出它的潜力。虽然这项技术自推出以来也得到了改进,但谷歌和 OpenAI 在 AI 上投入的努力已经大大超过了 Siri。
Siri 受到的最大限制之一是它缺乏自然语言处理能力。Siri 很难理解对话的语境,只能可靠地完成一些简单的任务,比如设置提醒或计时器。即使经过了这么多年,让 Siri 正确回答问题或口述文本,并将其发送给正确的人仍然有可能出错。
Siri 只懂基本命令
相比之下,谷歌助手和 OpenAI 的 ChatGPT (已集成在微软必应和其他微软应用中) 拥有先进的自然语言处理能力。这使得它们能够理解人类语言的细微差别,并做出相应的反应。
例如,当要求必应聊天说出它能做而 Siri 不能做的事情时,它说出了它如何总结复杂的政治局势,或者如何与 DuckDuckGo 等其他搜索引擎一起使用。但是,当 Siri 被问到它能做而必应聊天做不到的事情时,它给出的是如何启动必应,“打开必应”。尽管必应确实不能在 iPhone 上启动,但 Siri 并没有抓住问题的关键。
封闭的生态
Siri 的另一个不足之处是对于第三方应用的整合。Siri 只能在苹果的生态系统范围内执行任务,而谷歌助手和 ChatGPT 已经与各种各样的应用程序整合,使它们能够执行远远更多的任务。
苹果封闭的生态系统也限制了 Siri 可以访问的数据量。由于机器学习算法需要大量数据才能有效运行,数据的缺乏使得 Siri 很难随着时间的推移而学习和改进。虽然人们已经在争论谷歌和 OpenAI 使用人们数据来训练他们的 AI 模型上存在的道德问题,但没有人反对一个事实:他们对大量数据的访问使得他们能够不断提高 AI 能力。
而且,苹果在拥抱开源技术方面进展缓慢,该技术对 AI 的研发至关重要。开源技术允许开发人员展开协作并为 AI 项目做出贡献,从而实现更快、更有效的开发周期。
苹果 CEO 库克
与此同时,苹果还拥有悠久的保密文化,包括它的 AI 项目,这让它多年来一直置身于尖端研究的圈子之外。这种情况正在改变,但不明显。2015 年,苹果没有发表任何关于 AI 的研究论文。而现在,它设置了一个网站,公开分享自 2017 年以来发表的大约 370 篇论文。尽管如此,谷歌在开源领域拥有更悠久的历史,每年发表数百篇 AI 研究论文。
虽然苹果也一直在参与像 Hugging Face 这样的开源技术社区,后者是一个供 AI 研究人员在那里分享他们用来训练 AI 应用的模型地方,但苹果的参与相对较少。苹果总共分享了 11 款模型,而微软共有 245 款,谷歌有 587 款。苹果对其他大型 AI 开源项目的贡献,包括 TensorFlow (源自谷歌的一个项目) 和 PyTorch (源自脸书),都是为了让开发者在 Mac 上运行这些技术。虽然这很有帮助 (尤其是对于将 Mac 销售给 AI 开发人员而言),但这并不是开源社区所依赖的那种高度底层级共享。
据科技博客 The Information 上个月报道,一些苹果工程师已经离开公司,转而从事驱动 OpenAI 的大语言模型开发,这表明 Siri 的开发已经变得多么停滞和孤立。
如何破局?
在如此被动的情况下,苹果该如何破局呢?苹果前高级营销主管加滕伯格在文章中给出了三点建议:
1.将 Siri 的功能扩展到基本命令之外:苹果应该投资,加强 Siri 处理更复杂任务的能力,比如预约、预订和点餐;
2.提高 Siri 的自然语言处理能力:Siri 目前的自然语言处理能力不如谷歌助手或 ChatGPT 先进。苹果可以投资改进 Siri 的语言理解能力,让用户更容易与语音助手互动;
3.开放 Siri 平台:苹果几年前就应该这么做了。允许非苹果的软件与 Siri 集成,这会让 Siri 更有用得多,鼓励更多人使用它,进而改进 Siri。通过开放 Siri 平台,苹果还可以鼓励开发人员利用 Siri 的语音识别和自然语言处理能力,开发出更具创新性和复杂性的应用程序。
根据 The Information 的报道,一些内部人士表示,苹果正在着手上述所有功能的开发,并计划在未来的 iOS 版本中发布一个新的、经过改进的 Siri。苹果或许在 6 月份的全球开发者大会上公布相关进展。
目前来看,Siri 就是这个水平。苹果用户要想在生活中使用更强大的 AI,只能到苹果的竞争对手那里找了。苹果对此不予置评。