不久前,有传言称苹果内部正在研发一种名为Apple GPT的东西,这是一种基于公司自己的AI模型的聊天机器人,旨在模仿OpenAI的ChatGPT。随后的几个月里,我们看到各种生成式AI产品如雨后春笋般涌现,从谷歌Pixel和三星的Galaxy S24手机,到像Nothing Phone 2a这样的新兴产品。
与此同时,我们从苹果这里得到的只有模糊而大胆的宣称。苹果CEO蒂姆·库克告诉投资者,苹果的生成式AI推动将在今年晚些时候到来时“开创新局面”。然而,看起来苹果将从谷歌那里得到帮助来实现这些梦想。或者甚至OpenAI也会出手相助。
据彭博社报道,苹果据说正在与谷歌就iPhone授权Gemini AI模型进行谈判。这听起来就像三星为Galaxy S24系列手机采取的策略一样,这些手机可以在设备上运行谷歌的Gemini Nano模型,而更强大的版本则可在云端使用。
这项交易的条款尚未最终确定,因为据说讨论还在进行中。然而,据报道,苹果也在与OpenAI进行谈判。回想一下,OpenAI的基础技术,如GPT-4模型和Dall-E,目前已经可以在微软的一系列产品以及像ChatGPT Plus这样的独立应用和服务中使用。这是苹果AI雄心勃勃的一个有趣发展,让我既兴奋又担忧。
苹果的AI之旅(到目前为止)
在2023年的最后一个月,苹果悄无声息地推出了一系列在其专有硅上运行的模型库和框架,属于MLX组。这一举动旨在向Mac系列引入生成式AI功能,类似于高通使用其Snapdragon X Elite平台的努力。
在今年年初,苹果的研究部门发布了一篇关于一种名为Keyframer的生成式AI工具的论文,使用户能够制作动画内容。它基本上是基于OpenAI的GPT-4模型,但它还结合了矢量图形来处理静态图像。
此外,苹果的专家还发布了一篇研究论文,描述了一种通过简单的口头指令进行图像编辑的AI工具。这个功能类似于高通最新的旗舰Snapdragon芯片宣传的语音辅助媒体编辑工具包。
彭博社的一份后续报告突显了苹果一直在加强的负责检查生成式AI功能的专门团队,并以到2024年使这些工具对开发者可用为宏伟目标。
据传言,苹果首批生成式AI功能将在预定于6月发布的iOS 18中首次亮相。但根据彭博社的最新报道,这些功能是面向本地设备系统的,并不是像ChatGPT、Gemini或Perplexity等通常与云相连的生成式AI功能。
在九月,《信息》披露,苹果一直在开发旨在增强Siri的“基础模型”。这一举措据称类似于Gemini如何推进谷歌助手。
Gemini在iPhone上能做什么?
现在,Gemini在本地运行时并连接到互联网时,为手机带来了许多功能。当在设备上实现时,就像在Google Pixel 8 Pro上一样,它甚至可以在手机脱机时在录音器应用中总结对话。
对于运行Gboard键盘应用的人来说,Gemini Nano为其带来了智能回复功能,从WhatsApp等应用开始。简而言之,它会读取你的对话,并根据上下文相应地提供建议性回复。本地AI还添加了脱机翻译功能,这个功能已经在支持Gemini的三星Galaxy S24系列手机上使用。
现在,有了Gemini应用程序安装在手机上,它可以完成以下任务。
- 就像Google助手或ChatGPT一样,您可以与Gemini进行自然语言对话,并获得写作、构思等方面的帮助。
- 在激活Workspace扩展后,可以快速总结您的电子邮件或文件中的信息。信息可以以列表、图表和表格等格式进行总结。
- 使用文本提示生成图像,类似于OpenAI的Dall-E引擎。
- 以新的方式使用您的相机。在Gemini应用中,将相机对准场景,并询问AI有关画面中物体的信息。
- 了解屏幕上显示的内容。使用“Hey Google”命令召唤Gemini完成工作。例如,它可以总结您当前正在阅读的文章。
- 使用Google地图和Google Flights规划旅行,甚至创建定制例行程序。
苹果-谷歌AI交易可能会如何展开
如上所述,三星与谷歌密切合作,使Gemini Nano AI模型在其旗舰手机上运行。但Gemini不仅仅局限于
旗舰手机。今年二月,联发科宣布,其中端Dimensity 8300芯片现已优化支持谷歌Gemini,与旗舰Dimensity 9300并列。
为苹果做类似的事情应该不会太麻烦。如果设备上的授权交易不成功,总还有应用程序途径。目前尚不清楚苹果会采取什么策略,假设这笔交易首先达成。
更重要的问题是,Gemini授权交易是否会有意义地改变用户与iPhone的互动方式。更重要的是,Gemini是否会对Siri产生任何影响?直截了当地说,Siri在赶超谷歌助手之前还有很长的路要走。
但即便如此,甚至谷歌也尚未完全弄清楚Gemini的存在,或者说Gemini是否完全取代了谷歌助手。目前,当您在Android手机上安装Gemini时,它会取代谷歌助手。或者至少试图取代。
您的手机仍然依赖谷歌助手执行一系列平凡但有意义的任务——如打电话、设置闹钟、发送短信、控制智能家居设备和创建日历条目。同样,在导航、Gboard的语音输入和Android Auto中,谷歌助手仍然是值得信赖的AI,而不是Gemini。
此外,谷歌助手仍然是智能显示器和Wear OS智能手表上的首选AI助手。考虑到苹果在硬件生态系统之间,尤其是在iPhone和Apple Watch之间紧密交织其软件的方式,如果Gemini、谷歌助手和/或Siri只负责部分责任,将会给普通用户带来很多困惑。
或者,苹果可以与谷歌密切合作,创建独家集成,将Gemini与苹果生态系统功能(如Siri、Mail、Notes、Safari、Calendar、Health等)绑定在一起。然而,考虑到Gemini数据存储政策的当前状态,我们对这种紧密的系统级集成并不抱太大希望。
对苹果而言,Gemini的风险
当然,苹果错过了智能手机上生成式AI的第一波浪潮,如果报道属实,公司正在拼命赶上。但Gemini的授权交易也意味着我们可能永远不会看到苹果在Ajax项目下的生成式AI开发的成果。或者也许我们只会以一种淡化的形式看到它,而Gemini在iPhone上进行AI的大量工作。
但是Gemini并不是没有缺陷的。相反,它比任何其他主流生成式AI工具都更加失误。几个星期前,Gemini用户注意到它生成的图像明显不准确,特别是在处理肤色、种族和历史准确性方面。
争议升级到谷歌暂停了Gemini的文本到图像生成。谷歌首席执行官桑达尔·皮查伊在一份内部备忘录中写道:“很明显,这是完全不可接受的,我们搞错了。”这篇备忘录被NPR报道。
在大西洋的另一边,当Gemini的有关印度总理纳伦德拉的言论被认为是贬低性的,并在社交媒体上疯传时,Gemini又陷入了另一场争议。“仅仅说‘…抱歉,这是未经测试的’是不符合我们对法律合规性的期望的,”印度联合部长拉吉夫·钱德拉塞卡尔通过NDTV警告道。
这场争议再次将AI监管推到了争论中,还发布了一份指南,要求主要的AI参与者在像Gemini这样的工具发布之前获得明确的批准。
对于像苹果这样对政府监管极为谨慎的公司来说,在全球数亿设备上授权Gemini并不是小风险。特别是当谷歌自己警告说“Gemini会犯错误”,并表示您应该始终仔细检查不准确性时。
文章来源于互联网:苹果的人工智能未来更加引人注目