Gemini 的“询问此页面”工具的早期实践

在 2024 年 I/O 大会上,谷歌宣布了其所有主要产品中一系列由人工智能驱动的功能。事实上,该公司在主题演讲结束时开了个小玩笑,统计了台上有人提到“人工智能”一词的次数(超过 120 次)。然而,正如谷歌的习惯,该公司当天推出的许多功能实际上尚未向公众开放。不过,今天,Android Authority提前看到了在 I/O 大会上推出的Gemini功能“Ask This Page”。

顾名思义,Ask This Page 允许您先让 Gemini “阅读”网页,然后从网页中收集特定信息。您可以将其视为交互式个人助理。它会阅读整个网页,为您完成繁重的工作,然后您只需询问它您要查找的特定信息,从而为您节省大量时间。

这与谷歌在 I/O 大会上推出的另外两个“Ask This…”功能非常相似:“Ask This PDF”和“Ask This Video”。我们已经有机会在 I/O 大会上用一台借来的 Pixel 手机测试了 Ask This PDF,效果非常好(查看上面嵌入的视频了解该体验)。然而,那次测试是在一台不是我们的设备上的一个非常受控的环境中进行的,而且只有一个测试 PDF。不过,由于我们提前访问了 Ask This Page,我们有了更多的时间来推动系统,看看它是否有任何漏洞——果然,它确实有漏洞。

在深入探讨之前,我要先声明,这一切都是基于对该功能的初步了解。谷歌可能会在向公众推出之前做出重大改变。换句话说,对这里的一切持保留态度。

Gemini 的 Ask This Page:工作原理

Gemini 的“询问此页面”工具的早期实践
Gemini 的“询问此页面”工具的早期实践

C.斯科特·布朗/Android Authority

要激活 Ask This Page,您只需在Android 手机上查看网页时按住电源按钮,即可拉出 Gemini 叠加层。由于 Gemini 现在具有上下文感知功能(谷歌在 I/O 2024 上花了大量时间讨论这个话题),它会知道您已将其拉出网页。这将触发您在上图中看到的 Ask This Page 图标。

点按该按钮会提示 Gemini 扫描页面。这可能需要一点时间,具体时间取决于页面的长度/复杂程度。一旦准备就绪,它会向您显示一个文本框提示:“获取有关此页面内容的帮助。”

看到该提示后,你可以用自然语言询问有关该页面的问题。查看下面的一些屏幕截图,了解此功能在 Android Authority 的一篇有关Microsoft OneNote 新功能泄露的文章中是如何运作的。

Gemini 的“询问此页面”工具的早期实践
Gemini 的“询问此页面”工具的早期实践

在此示例中,我们将 Gemini 叠加层拉到文章上方,扫描页面,然后询问文章中描述的功能是否实际发布。您可以在第三张屏幕截图中看到 Gemini 的回答:“根据文章,提醒功能目前正在开发中,尚未发布。”这是准确的,因此我们对 Ask This Page 进行了一次很棒的测试!

文章来源于互联网:Gemini 的“询问此页面”工具的早期实践

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注