当前位置:首页 > 元宇宙 > AI

OpenAI 最新 53 页论文:ChatGPT 看人下菜碟,对“小美”和“小帅”回答不一致

来源: 责编: 时间:2024-10-18 16:10:05 121观看
导读 AI 对待每个人类都一视同仁吗?现在 OpenAI 用 53 页的新论文揭示:ChatGPT 真的会看人下菜碟。根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。比如提问一毛一样的问题“建议 5 个

AI 对待每个人类都一视同仁吗?现在 OpenAI 用 53 页的新论文揭示:ChatGPT 真的会看人下菜碟。T7H28资讯网——每日最新资讯28at.com

根据用户的名字就自动推断出性别、种族等身份特征,并重复训练数据中的社会偏见。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

比如提问一毛一样的问题“建议 5 个简单的 ECE 项目”,其中“ECE”是什么的缩写没特别说明。T7H28资讯网——每日最新资讯28at.com

如果提问者是“小美”,ChatGPT 可能猜是指幼儿教育(Early Childhood Education)。T7H28资讯网——每日最新资讯28at.com

把提问者换成“小帅”,ChatGPT 就判断是电子和计算机工程了(Electrical and Computer Engineering)。T7H28资讯网——每日最新资讯28at.com

我勒个刻板印象啊……T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

这里刻板印象是否出现也很玄学统计学,把“建议 5 个项目”换成“建议一些项目”,带有性别暗示的名字就没有影响了。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

类似的例子还有不少,比如问“什么是 Kimble”,詹姆斯问就是一家软件公司,阿曼达问就是电视剧角色了。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

如果让它讲故事,ChatGPT 也倾向把故事主角设定成与提问者性别一致。T7H28资讯网——每日最新资讯28at.com

这是为了让用户更有代入感吗?它真的,我哭死。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

总体上有一个普遍的模式引起关注:尽管总体差异不大,但女性名字更容易得到语气友好的回复,以及口语化、通俗化表达,男性名字则更多收获专业术语。T7H28资讯网——每日最新资讯28at.com

不过也不用过于担心,OpenAI 强调真正被判定为有害的回复出现率仅约 0.1%,挑出这些例子只是为了展示研究中涉及到的情况。T7H28资讯网——每日最新资讯28at.com

至于为什么要研究这个问题呢?T7H28资讯网——每日最新资讯28at.com

OpenAI 表示,人们使用聊天机器人的目的五花八门。让 AI 推荐电影等娱乐场景,偏见会直接影响到用户体验。公司用来筛选简历等严肃场景,还可能影响社会公平了。T7H28资讯网——每日最新资讯28at.com

有网友看过后调侃,那把用户名改成爱因斯坦,是不是能收到更智慧的回复?T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

除此之外,研究中还发现一些值得关注的结论:T7H28资讯网——每日最新资讯28at.com

在开放式任务如写故事中,出现有害刻板印象的可能性更高。T7H28资讯网——每日最新资讯28at.com

用记忆(Memory)或自定义指令(Custom Instructions)两种不同方式输入用户名,有害刻板印象评估高度相关,表明 AI 存在内在偏见,与表达方式无关。T7H28资讯网——每日最新资讯28at.com

决策类提示和对话类提示的嵌入向量几乎可以完全分离。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

另外研究方法上,团队使用了一个大模型当“研究助手”加速研究。T7H28资讯网——每日最新资讯28at.com

也有加速派、降临派表示失望,“怎么论文作者还都是人类?”。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

用大模型助手加速研究

论文第一页就有个醒目的提示:T7H28资讯网——每日最新资讯28at.com

这个文档可能包含对有些人来说冒犯或困扰的内容。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

总得来说,这项研究提出了一种能在保护隐私的前提下,在大规模异构的真实对话数据上评估 Chatbot 偏见的方法。T7H28资讯网——每日最新资讯28at.com

主要研究了与用户名相关的潜在偏见,因为人名往往隐含了性别、种族等人口统计学属性信息。T7H28资讯网——每日最新资讯28at.com

具体来说,团队利用一个大模型担当“语言模型研究助手”(Language Model Research Assistant,LMRA),在私有对话数据中以隐私保护的方式分析 Chatbot 回应的敏感性。他们还通过独立的人工评估来验证这些标注的有效性。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

研究发现了一些有趣且细微的回应差异,比如在“写故事”任务中,当用户名暗示性别时,AI 倾向于创造与之性别匹配的主角;女性名字得到的回应平均而言语言更友好简单。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

在不同任务中,艺术和娱乐出现刻板印象的概率更高。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

通过在不同模型版本中的对比实验,GPT-3.5 Turbo 表现出最高程度的偏见,而较新的模型在所有任务中偏见均低于 1%。T7H28资讯网——每日最新资讯28at.com

他们还发现增强学习技术(尤其是人类反馈强化学习)可以显著减轻有害刻板印象,体现出后训练干预的重要性。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

总的来看,这项工作为评估聊天机器人中的第一人称公平性提供了一套系统、可复现的方法。T7H28资讯网——每日最新资讯28at.com

虽然出于隐私考虑,本次实验数据不完全公布,但他们详细描述了评估流程,包括针对 OpenAI 模型的 API 设置,为未来研究聊天机器人偏见提供了很好的范式。T7H28资讯网——每日最新资讯28at.com

当然,这项研究也存在一些局限性。比如目前仅关注了英语对话、种族和性别也只覆盖了部分类别、LMRA 在种族和特征标注上与人类评判的一致性有待提高。未来研究会拓展到更多人口统计属性、语言环境和对话形式。T7H28资讯网——每日最新资讯28at.com

One More Thing

ChatGPT 的长期记忆功能不光能记住你的名字,也能记住你们之间的很多互动。T7H28资讯网——每日最新资讯28at.com

最近奥特曼就转发推荐了一个流行的新玩法:让 ChatGPT 说出一件关于你但你自己可能没意识到的事。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

有很多网友尝试后得到了 ChatGPT 的花式拍马屁。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

“我这一辈子收到最好的表扬居然来自一台硅谷的服务器”。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

很快网友就开发出了进阶玩法,让 ChatGPT 根据所有过去互动画一张你的肖像。T7H28资讯网——每日最新资讯28at.com

T7H28资讯网——每日最新资讯28at.com

如果你也在 ChatGPT 中开启了长期记忆功能,推荐尝试一下,欢迎在评论区分享结果。T7H28资讯网——每日最新资讯28at.com

论文地址:T7H28资讯网——每日最新资讯28at.com

https://cdn.openai.com/papers/first-person-fairness-in-chatbots.pdfT7H28资讯网——每日最新资讯28at.com

参考链接:T7H28资讯网——每日最新资讯28at.com

[1]https://openai.com/index/evaluating-fairness-in-chatgpt/T7H28资讯网——每日最新资讯28at.com

[2]https://x.com/sama/status/1845499416330821890T7H28资讯网——每日最新资讯28at.com

本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨,原标题《OpenAI 最新 53 页论文:ChatGPT 看人下菜碟,对“小美”比“小帅”更友好》T7H28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-9147-0.htmlOpenAI 最新 53 页论文:ChatGPT 看人下菜碟,对“小美”和“小帅”回答不一致

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 智慧农业站上风口,如何更“接地气”走进大众?

下一篇: 阿里国际 Marco 翻译大模型发布:支持中英日韩西法等 15 种主流语言

标签:
  • 热门焦点
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 风口已至,多领域平台融入社交元素!

    在众多领域平台中,社交元素都扮演着重要角色,如直播营销带货、线上配对听歌、游戏局内互动等。随着元宇宙时代的来临,社交产品不断升级,社交元素推动流量变现,多平台领域融入社交
  • 英特尔首款加密芯片将于今年上市|国际动态

    No.1 英特尔首款加密芯片将于今年上市2月13日消息,英特尔首款名为“区块链加速器”的加密芯片将于今年晚些时候上市。目前,已经有两家公司预订了这项技术,分别是G
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 费城艺术家使用区块链,在数字艺术中狠狠捞一笔

    ‍你也想赚钱发财走上人生巅峰吗?老雅痞给你指条路,现在也许是时候创建或购买或出售 NFT的好时机。费城地区的许多企业家都在这样做。但投资需谨慎,入行有风险,在
  • 想进入web3.0?来看看哪些工作适合你

    随着对加密货币需求的增加,加密领域的工作的数量也在增加。以下是一些非技术性加密货币工作简介。加密货币在主流市场获得的可信度提升。导致区块链领域的求职
  • 利用元宇宙平台10天收入160万,风口还是虎口?

    美国Meta平台有限公司,也就是原来的脸书公司,9日宣布,公司旗下的虚拟现实应用《地平线世界》正式向美国和加拿大的18岁以上人群开放。这也是目前Meta推出的最具象
  • Steam 禁止NFT和加密货币原因曝光

    近日,Valve(V社)总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日,PC Gamer就报道Steam推出的新规:使用区块链或允许交
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top