当前位置:首页 > 元宇宙 > AI

清华北航博士生「强迫」Gemma-2 说中文!弱智吧、角色扮演、数学问题表现惊喜

来源: 责编: 时间:2024-07-09 18:14:05 330观看
导读 【新智元导读】谷歌的 Gemma 2 刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。众所周知,很多国外 LLM 一直

【新智元导读】谷歌的 Gemma 2 刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。WZv28资讯网——每日最新资讯28at.com

众所周知,很多国外 LLM 一直存在非英语歧视问题,英语和其他语言在 LLM 中存在的性能差距有时可以用悬殊来形容。WZv28资讯网——每日最新资讯28at.com

之前就有网友发现,GPT-4o 分词器语料库中,中文数据污染非常严重,赌博色情网站是一个也不少,严重影响了我们用中文和 AI 机器人好好聊天。WZv28资讯网——每日最新资讯28at.com

最近发布的 Gemma 2 模型虽然既开源又强悍,但比较遗憾的是,其中文水平相较英文水平还有一定的距离。WZv28资讯网——每日最新资讯28at.com

不过,我们可以用微调来解决,Fine-tune it!WZv28资讯网——每日最新资讯28at.com

7 月 1 日,Gemma 2 刚发布 4 天,清华大学的一名人工智能博士生王慎执就在 X 上隆重推出了一款微调模型 Gemma-2-9B-Chinese-Chat。WZv28资讯网——每日最新资讯28at.com

WZv28资讯网——每日最新资讯28at.com

郑耀威WZv28资讯网——每日最新资讯28at.com

郑耀威目前仍在北航读博,他曾以第一作者在 CVPR、AAAI、WWW 等顶会发表多篇论文,并担任 AAAI、EMNLP、Neural Computation 等会议和期刊审稿人。WZv28资讯网——每日最新资讯28at.com

他也是大模型微调框架 LLaMA Factory 的发起人和主要开发者,GitHub 开源项目获得超过 2 万星标。WZv28资讯网——每日最新资讯28at.com

在这些优秀的贡献者的不断努力之下,开源模型之路会越走越宽广,模型的中文能力也会逐渐增强。WZv28资讯网——每日最新资讯28at.com

参考资料:WZv28资讯网——每日最新资讯28at.com

https://x.com/ShenzhiWang_THU/status/1807640624402923779WZv28资讯网——每日最新资讯28at.com

https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-ChatWZv28资讯网——每日最新资讯28at.com

https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-ChatWZv28资讯网——每日最新资讯28at.com

本文来自微信公众号:新智元(ID:AI_era)WZv28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5050-0.html清华北航博士生「强迫」Gemma-2 说中文!弱智吧、角色扮演、数学问题表现惊喜

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI 公司被指不重视安全,未披露和报告 2023 年入侵事件

下一篇: 快手可灵 AI 网页端上线:所有功能限时免费,单次视频生成时长增至 10 秒

标签:
  • 热门焦点
  • 茅台的元宇宙App火了,也被骂惨了

    元宇宙从概念走向大众生活,并不是一件简单的事情。技术、世界观、填充内容、载体形式,每一个环节都需要层层叠叠的逻辑。但正如赛博朋克奠基人威廉·吉布
  • 林俊杰、余文乐等明星相继入局,元宇宙虚拟土地究竟有何魔力?

    上周的元宇宙和明星圈因为一则“林俊杰在推特上宣布持有Decentraland元宇宙虚拟地块”的新闻而备受关注,该新闻一方面在娱乐圈引起了吃瓜群众的好奇,另一方面在
  • 中文在线的“元宇宙”故事,资本听腻了?

    被誉为“元宇宙”龙头之一的中文在线,这下尴尬了。2022年1月11日,中国移动通信联合会元宇宙产业委员会揭牌,接纳涉足“元宇宙”的8家上市公司,包括中青宝、天下秀
  • 新款英特尔芯片将使NFT铸造变得更加方便

    科技巨头和微处理器制造商英特尔(Intel)正在发布一款适用于 NFT 铸造和挖矿的新芯片。新产品专注于效率、易操作性和可持续性,该公司的战略是从加密兴起与 NFT爆
  • 元宇宙是数字共识生态的集成逻辑表达

    作者: 李鸣元宇宙是数字共识生态的集成逻辑表达,是以区块链技术为核心的可信数字化价值交互网络,是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • NFT高玩必备:NFT分析工具大盘点

    NFT市场的火热让越来越多的投资者投身其中,但当前的 NFT 生态系统存在几个问题却困扰了大多数人,如难以准确评估 NFT 项目的资产价格、缺乏 NFT 市场动态信息、
  • 百度虚拟人——AI手语主播首次亮相冬奥会!

    除了火遍全国的冰墩墩,虚拟人也成为这届冬奥会的一大亮点元素。以体育明星谷爱凌为原型的数智人Meet Gu最先亮相。在2月5日谷爱凌首秀、2月7日谷爱凌首金的两天
Top