当前位置:首页 > 元宇宙 > AI

OpenAI 借 Reddit 论坛测试 AI 说服能力,太强可能会带来危险

来源: 责编: 时间:2025-02-04 18:10:50 126观看
导读 2 月 3 日消息,OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露,该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论

2 月 3 日消息,OpenAI 在其最新发布的“推理”模型 o3-mini 的系统文档中透露,该公司利用 Reddit 的子论坛 r / ChangeMyView 来测试其 AI 模型的说服能力。r / ChangeMyView 是一个拥有数百万用户的 Reddit 论坛,用户在此发布观点并希望通过讨论了解他人的不同看法。其他用户则会以具有说服力的论点回应,试图改变原帖作者的观点。vla28资讯网——每日最新资讯28at.com

vla28资讯网——每日最新资讯28at.com

对于 OpenAI 等科技公司而言,r / ChangeMyView 等 Reddit 论坛是高质量人类生成数据的宝库,可用于训练 AI 模型。OpenAI 表示,其从 r / ChangeMyView 收集用户帖子,并要求 AI 模型在封闭环境中撰写回复,以试图改变 Reddit 用户对某一主题的看法。随后,OpenAI 将这些回复展示给测试者进行评估,并将 AI 模型的回复与人类回复进行比较,以衡量其说服力。vla28资讯网——每日最新资讯28at.com

尽管 OpenAI 与 Reddit 达成了内容授权协议,允许其使用 Reddit 用户帖子进行训练并在其产品中展示这些内容,但 OpenAI 表示,此次基于 r / ChangeMyView 的评估与其 Reddit 协议无关。目前尚不清楚 OpenAI 如何获取该子论坛的数据,且该公司表示暂无计划向公众发布这一评估结果。vla28资讯网——每日最新资讯28at.com

值得注意的是,Reddit 近年来与多家 AI 公司达成了授权协议,但也曾公开批评部分 AI 公司未经许可抓取其网站内容。Reddit 首席执行官史蒂夫・霍夫曼去年曾表示,微软、Anthropic 和 Perplexity 等公司拒绝与其谈判,并称阻止这些公司抓取数据“非常麻烦”。此外,OpenAI 也因涉嫌未经授权抓取《纽约时报》等网站内容以训练 ChatGPT 及其底层 AI 模型而面临多起诉讼。vla28资讯网——每日最新资讯28at.com

注意到,在 r / ChangeMyView 基准测试中,o3-mini 的表现并未显著优于或劣于 o1 或 GPT-4o。然而,OpenAI 的最新 AI 模型在说服力方面似乎超过了 r / ChangeMyView 子论坛中的大多数用户。OpenAI 在 o3-mini 的系统文档中表示:“GPT-4o、o3-mini 和 o1 均展现出强大的说服性论证能力,处于人类前 80-90% 的水平。目前,我们尚未发现模型表现远超人类或具备明显的超人类能力。”vla28资讯网——每日最新资讯28at.com

OpenAI 的目标并非开发具有超强说服力的 AI 模型,而是确保 AI 模型不会变得过于具有说服力。随着推理模型在说服和欺骗方面表现越来越出色,OpenAI 已开发出新的评估方法和保障措施来应对这一问题。OpenAI 担心,如果 AI 模型过于擅长说服人类用户,可能会带来危险。理论上,这可能导致高级 AI 按照自己的目标或者其控制者的目标行动,而不一定符合人类的整体利益。vla28资讯网——每日最新资讯28at.com

尽管 OpenAI 已抓取了大部分公共互联网数据并通过授权获取其他数据,但 r / ChangeMyView 基准测试表明,AI 模型开发者仍在努力寻找高质量数据集来测试其模型。然而,获取这些数据并非易事。vla28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-10431-0.htmlOpenAI 借 Reddit 论坛测试 AI 说服能力,太强可能会带来危险

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 360携手DeepSeek,打造安全大模型新标杆,“自动驾驶”安全时代来临

下一篇: 欧盟已封禁存在“不可接受风险”的 AI 系统,违规企业面临巨额罚款

标签:
  • 热门焦点
  • AI大模型“战火”烧到了教育领域

    作者:刘旷自2023年开年以来,AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火,再度掀起了一波AI热浪,无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
  • 超跑与NFT的首次结合,兰博基尼能否破局?

    兰博基尼公司近日称即将推出它的首款NFT,并且将加速进军区块链领域。这家闻名遐迩的意大利汽车厂商野心勃勃地将目光投向混合动力和电动跑车,并宣布将拍卖与瑞士
  • Meta展示AI系统Builder Bot;《Pistol Whip》增加派对模式

    今日热点:Meta展示AI系统Builder Bot;招聘信息显示Meta正在探索具有蜂窝连接功能的VR/AR头显;英国VR工作室Coatsink Games正在为PSVR 2开发新游戏;VR节奏射击游戏
  • Kitten Coup社区反转Cool Kittens NFT骗局

    当狂热的加密爱好者将金钱投入到NFT图片时,浑水摸鱼的骗局随之而来,Cool Kittens NFT便是其中一个作恶者,该项目于去年11月在Sonala链上启动小猫形象的NFT铸造及
  • 从英式拍到荷兰拍,看传统金融拍卖玩法如何玩转NFT市场交易

    作者:鲁拍卖是一种从古至今的商业活动。从古代的典当到现代的拍卖市场、我们熟知的拍卖行,以及知名街头艺术家Bansky名画拍卖成功后,竟自毁粉碎,现价值又翻倍的拍
  • 与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • 头像类NFTs的统治能持续多久?

    在过去的一两年里,NFTs在互联网世界中掀起了一场风暴。今天,当我们想到NFTs时,我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
  • 你连元宇宙都不知道吗?快来看看这四本元宇宙书籍吧

    前有腾讯、阿里申请商标注册,后有Facebook宣布改名,若论当前互联网最火最热的概念,当属“元宇宙”。“阿里元宇宙”“淘宝元宇宙”“钉钉元宇宙”“QQ元宇宙”“
  • 虚拟人行业研究报告

    最早的虚拟人出现于 20 世纪 80 年代,受限于技术,当时的虚拟人制作以手绘为主。21 世纪初,随着动捕、渲染等技术的逐步发展,虚拟人相关技术开始在影视领域逐渐普及
Top