自上周在我的Pixel 8 Pro上开始使用Gemini Live以来,我发现自己经常使用它。这并不是因为它是最新最热的趋势,而是因为与Google Assistant相比,Gemini Live解决了几乎所有我讨厌的使用Assistant时遇到的问题。两者之间的差异非常明显。
虽然我有很多话想说,但今天我想专注于几个使得与Gemini Live对话远胜于使用Google Assistant或常规Gemini的方面。
Gemini Live目前正在多个语言和国家推广,但仅限于Gemini Advanced订阅用户,也就是任何拥有Google AI Premium订阅的人。你不需要Pixel 9手机就能使用它;我们已经验证了它在Pixel 8 Pro和Galaxy S24 Ultra上也能运行。
请注意,如果你购买了Pixel 9 Pro手机,还可以获得一整年的Google AI Premium免费试用,这让你可以在无需订阅的情况下体验Gemini Live。
Table of Contents
1. Gemini Live 理解我所说的话
英语是我的第三语言,虽然我已经说了几十年,但它仍然不是我最自然的语言。此外,我的大脑思维跳跃很快,因此每次我想激活Google Assistant时,我都必须在说“Hey Google”之前,想好准确的句子或问题。因此,与Assistant对话对我来说从未感觉自然。它总是预先计划好的,并且总是需要我暂停手头的工作,集中注意力。
Google Assistant希望我像机器人一样说话以适应它的模式,而Gemini Live让我随心所欲地说话。
Gemini Live能够理解自然的人类语言。对我来说,它能够适应我的言语习惯,因此我可以在不事先思考或准备完整问题的情况下开始说话。我可以在句子中间“呃”或“啊”,重复自己,改变主要问题,并在说话时弄清楚问题的内容,而Live仍然能够理解这一切。
我甚至可以提出多个问题,并尽可能地模糊或具体。完全没有如何说话或说什么的限制,没有特定的命令,也没有特定的提问方式——完全没有任何限制。这完全改变了我与AI聊天机器人的互动体验。
2. 这才是真正的连续对话
Google Assistant多年前就增加了连续对话的设置,但那从未感觉自然或真正连续。我会说“Hey Google”,然后请求某件事,等待完整的回答,等待一秒钟它再次开始监听,然后再说第二个指令。如果我沉默几秒钟,对话就结束了,我必须重新触发Assistant。
而且,Assistant将每个命令单独处理。没有真正的“聊天”感觉,只是一系列独立的问题或命令和答案。
打断、纠正、澄清、连续性、话题转换——Gemini Live处理所有这些。
Gemini Live则不同。每次对话都是一次真正的开放交流,我可以来回对话一段时间,它仍然记得之前的所有内容。所以如果我说我喜欢《Happy Endings》并请求类似的电视剧推荐,我可以继续听下去,然后问更多问题,它会记住我对类似《Happy Endings》剧集的偏好。
我还可以随时打断它,如果它误解了我或答案不满意,我可以纠正它。我不需要手动大喊让它停止,或者等它用错误答案啰嗦两分钟。我还可以瞬间改变对话话题,或者在需要时提出更精确的问题。
此外,Gemini Live不会在我们沉默几秒钟后关闭对话。因此,我可以花几秒钟时间好好消化答案,并想出其他的澄清或问题,就像一个正常人一样,而不是一个在一秒钟内准备好后续问题的机器人。
更妙的是,我可以将Live最小化,继续使用其他应用程序,同时保持对话继续。我发现这在浏览或与朋友聊天时非常有用。我可以在浏览时调用Live提问并获取我所阅读内容的澄清,或者启动常规的Live对话,然后打开浏览器双重检查Gemini告诉我的内容。
3. TL;DR?让它给你总结
如前所述,Google Assistant将每个命令视为一个独立的实例。而Gemini Live则将整个聊天视为一个整体,这让我能够做Assistant从未能做到的事情:请求总结。
所以如果我有一次关于巴黎跑步地点和测试Pixel 9系列新全景模式的聊天,我可以在最后请求它总结,它会列出所有内容。这在尝试理解复杂话题或获取建议列表时非常有帮助。
4. 想更深入探讨某个话题?继续之前的聊天
有一次,我打开Gemini Live,随口说了句“嘿,我们可以继续讨论巴黎全景照片的聊天吗?”它回答说可以。我有点吃惊。因此我继续说下去,似乎它真的知道我们之前讨论到哪儿了。我又试了几次,每次都成功。Google Assistant根本没有类似的功能。
另一种更可靠的方式是打开Gemini,展开整个Gemini应用,点击“最近”,然后打开之前的聊天。在这里点击右下角的Gemini Live图标,可以让你继续进行现有的聊天,好像你从未停止或退出过一样。
5. 查看旧聊天记录并分享至Drive或Gmail
查看我的Google Assistant历史记录一直是一个复杂的过程,需要进入我的Google账号,找到我的个人历史记录,并查看我最近的几个命令。
使用Gemini,打开之前的Live聊天记录并阅读其中的所有内容非常简单。更好的是,每个聊天记录都可以重命名、置顶或彻底删除。此外,每个回复都可以复制、分享或快速导出到Google Docs或Gmail中。这让我更容易管理我的Gemini Live数据,删除需要删除的内容,并分享或保存我关心的内容。
Google Assistant 仍有明显优势
尽管Gemini Live有很多优点,但在使用过程中我仍然感受到了它的局限性。首先,Live会话与主Gemini体验是分开的,Live只处理常规知识问题,而不涉及个人数据。因此,我可以用Gemini(而非Live)查询我的日历、发送信息、启动计时器、查看我的Drive文档、控制我的智能家居等,就像用Assistant一样,但我无法用Gemini Live做这些。后者更像是一个更生动的Google搜索体验,所有常规的Gemini扩展在Live中都无法访问。不过Google表示正在努力将这些功能引入,这也是我最期待的事情。
由于其构建方式和当前功能,Gemini Live需要持续的互联网连接,否则无法执行任何操作。Assistant能够处理一些本地基本命令,如设备控制、计时器和闹钟,而Gemini Live则无法做到这一点。
目前,我在多语言支持方面的体验也不是很好——虽然Assistant的多语言支持也不完美,但至少可以用。在我的手机上,系统设置为英语(美国),Gemini Live只能理解我用英语说话。我可以让它用法语回答,它会这样做,但如果我开始用法语说话,它就无法理解我或识别我的话。我希望Google能为它带来更自然的多语言体验,因为对于像我这样同时用三种语言思考和说话的人来说,这可能会改变生活。
从操作上来说,我最大的问题是我还不能通过语音控制Gemini Live。我的“Hey Google”命令会打开主Gemini语音命令界面,这很不错,但我需要手动点击Live按钮才能触发对话。而且当我结束对话时,聊天不会自动结束,除非我手动点击结束按钮。无论是“谢谢”、“就这样”、“我们结束了”还是“再见”等词语都无法结束对话,只有点击红色结束按钮才能结束。
Google Assistant 对每条信息的来源要求非常严格;而Gemini Live则完全不在乎信息的来源。
从实际情况来看,我对Gemini Live的最大问题是它没有任何信息来源。Assistant过去对所有内容的来源要求非常严格;你可能多次听到Assistant说“根据[某网站]”或“在[某网站]上,他们说……”Gemini Live则直接陈述事实,而没有立即验证它们的方式。我所能做的就是结束聊天,查看聊天记录,然后在某些消息下方查找Google按钮,该按钮显示与验证该信息相关的搜索。
文章来源于互联网:https://www.tephone.com/article/28149