防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

小白 • 2024年 4月 14日 pm10:33 • AI • 阅读 328

3 月 31 日消息，无论当下 AI 聊天机器人有多么强大，都会或多或少存在一大饱受诟病的行为 —— 以看上去令人信服的方式，向用户提供与事实不符的回答。简单来说，AI 有时会在回答中“满口跑火车”，甚至“造谣”。

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

图源 Pixabay

防止 AI 大模型出现这种行为并非易事，且是一项技术性的挑战。不过据外媒 Marktechpost 报道，谷歌 DeepMind 和斯坦福大学似乎找到了某种变通办法。

研究人员推出了一种基于大语言模型的工具 —— 搜索增强事实评估器（IT之家注：原名为 Search-Augmented Factuality Evaluator，简称 SAFE），可对聊天机器人生成的长回复进行事实核查。其研究结果与实验代码、数据集现已公布，点此查看

该系统可通过四个步骤对聊天机器人生成的回复进行分析、处理和评估，以验证准确性和真实性：将答案分割成单个待核查内容、对上述内容进行修正、再与谷歌搜索结果进行比较。随后，该系统还会检查各个事实与原始问题的相关性。

为评估其性能，研究人员创建了包含约 16000 个事实的数据集 LongFact，并在来自 Claude、Gemini、GPT、PaLM-2 的 13 个大语言模型上测试了该系统。结果显示，在对 100 个有争议的事实进行的重点分析中，SAFE 的判定在进一步审查下正确率达到 76% 。与此同时，该框架还具备经济性优势：成本比人工注释便宜 20 多倍。

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

文章来源于互联网:防止聊天机器人“造谣”，谷歌 Deepmind、斯坦福大学研究人员推出 AI 事实核查工具

赞 (0)

0

Apple Vision Pro 为商业带来了空间计算的新时代

上一篇 2024年 4月 14日 pm10:33

iPadOS 17.5确认下一代iPad Pro将采用新显示技术

下一篇 2024年 4月 14日 pm10:33

AI

2025 in artificial intelligence

[Jump to content](https://en.wikipedia.org/wiki/2025_in_artificial_intelligence#bodyConten…

2026年 4月 16日
0
AI

2025 in artificial intelligence

[Jump to content](https://en.wikipedia.org/wiki/2025_in_artificial_intelligence#bodyConten…

2026年 4月 17日
0
AI

苹果研究人员称其设备端模型 ReALM 性能优于 GPT-4，可大幅提升 Siri 智能程度

4 月 2 日消息，虽然目前 Siri 可以尝试描述信息中的图像，但效果并不稳定。不过，苹果公司并没有放弃人工智能领域的探索。在最近的一篇研究论文中，苹果的人工智能团队描述了一种可…

2024年 4月 14日
0
AI

Google Cloud Next 2024：到目前为止已宣布的所有内容

谷歌的 Cloud Next 2024 活动将于周四在拉斯维加斯举行，这意味着将有大量新的以云为中心的新闻，涉及从谷歌人工智能驱动的聊天机器人 Gemini到人工智能、开发运营和安…

2024年 8月 24日
0
AI

Google AI Studio

[](https://accounts.google.com/ServiceLogin?continue=https%3A%2F%2Faistudio.google.com%2F)…

2026年 4月 18日
0
AI

‎Google Gemini App：App Store

Google Gemini app is your personal, proactive and powerful AI Assistant. With Gemini on yo…

2026年 4月 20日
0
AI

MWC 2024：联想首次展示透明屏笔记本和自适应智能手机

2024年2月26日，世界移动通信大会（MWC）在西班牙巴塞罗那盛大开幕。在此次MWC上，联想集团带来了一场技术创新的盛宴，展示了全景式AI终端、基础设施和解决方案，同时推出了两款…

2024年 4月 16日
0
AI

2025 in artificial intelligence

[Jump to content](https://en.wikipedia.org/wiki/2025_in_artificial_intelligence#bodyConten…

2026年 4月 18日
0
AI

iPhone 16 Pro：全新A18 Pro芯片提供强大的设备端人工智能性能

根据海通国际科技研究的分析师Jeff Pu发布的一份新报告，该报告被9to5Mac获悉，苹果计划针对设备端人工智能对A18 Pro芯片进行改进。Pu还写道，苹果正在提前启动A18 …

2024年 4月 16日
0
AI

What is GPT? Everything you need to know

GPT is a family of AI models built by OpenAI. It stands for Generative Pre-trained Transfo…

2026年 4月 15日
0

发表回复