当前位置:首页 > 元宇宙 > AI

360智脑7B大模型开源,长文本处理能力达50万字

来源: 责编: 时间:2024-04-13 16:08:24 225观看
导读4月13日消息,360公司近日在GitHub上公开了其360智脑7B(70亿参数模型),这一大模型是基于3.4万亿Tokens的语料库进行训练的,主要涵盖了中文、英文和代码。该模型提供了4K、32K、360K三种不同的文本长度选项,其中360K(大约50

4月13日消息,360公司近日在GitHub上公开了其360智脑7B(70亿参数模型),这一大模型是基于3.4万亿Tokens的语料库进行训练的,主要涵盖了中文、英文和代码。该模型提供了4K、32K、360K三种不同的文本长度选项,其中360K(大约50万字)被360自称为当前国内开源模型中最长的文本长度。8CI28资讯网——每日最新资讯28at.com

8CI28资讯网——每日最新资讯28at.com

360在多个主流评测数据集上,包括C-eval、AGIeval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、Humaneval、MBPP、BBH以及LAMBADA,对其模型性能进行了全面验证。这些评测主要考察了模型的自然语言理解、知识储备、数学计算和推理、代码生成以及逻辑推理等能力。结果显示,360模型在四个评测数据集上取得了领先的排名,整体平均成绩位列第三。8CI28资讯网——每日最新资讯28at.com

8CI28资讯网——每日最新资讯28at.com

在专门为大语言模型设计的长文本理解能力评测基准LongBench中,360选择了与中文长文本应用最为相关的任务进行测试。结果显示,360Zhinao-7B-Chat-32K模型在中文单文档问答、多文档问答、摘要以及Few-shot等任务中取得了平均第一的好成绩。8CI28资讯网——每日最新资讯28at.com

同时,在英文大海捞针测试以及360自行构造的中文大海捞针测试中,360Zhinao-7B-Chat-360K模型均达到了98%以上的准确率,显示出优异的长文本处理能力。8CI28资讯网——每日最新资讯28at.com

除了模型权重之外,360还开源了该模型的微调训练代码和推理代码等全套工具集,使得大模型相关开发者能够非常方便地使用这些资源,实现“开箱即用”。8CI28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,360公司董事长周鸿祎曾表示,大模型行业在文本长度上有所追求,100万字将很快成为行业的标配。他透露,360之所以将模型文本长度定为360K,并选择开源这一能力,是为了让整个行业能够共享这一成果,避免重复劳动。周鸿祎自称是“开源的信徒”,坚信开源能够推动行业的进步。8CI28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5156-0.html360智脑7B大模型开源,长文本处理能力达50万字

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI全球推介会:阿尔特曼保证ChatGPT升级不涉API用户数据

下一篇: 智能养宠迎来新时代,petgugu全自动猫马桶重磅上新

标签:
  • 热门焦点
  • 新周期,谁在坚守窄门?

    来源:锦缎今日的投资者恐怕已经忘记了,在OpenAI创造出ChatGPT这一杀器的前夜,生成式AI也曾经是一道窄门,窄到连马斯克都差点失去了信心。在当时的舆论眼中,AGI的道路不够性感,不够
  • 在数字世界再造世界杯,元宇宙体育正变得越来越丰满

    撰文/ 葱鲔鱼本届世界杯可能不是最精彩的一届,却绝对是看点十足的一届:后疫情时代的首届世界杯、耗资2200亿美元打造的“史上最贵”世界杯、足坛黄金
  • 米哈游推出元宇宙品牌;VR/AR老牌企业当红齐天完成B轮+融资

    今日热点:苹果AR/VR头显的FaceTime或基于Memojis和SharePlay构建而成;VR/AR老牌企业当红齐天完成B轮+融资;米哈游推出元宇宙品牌HoYoverse;国产VR射击游戏《Contra
  • 影响元宇宙土地价格的五个因素

    参考来源 | cryptonews编译 | Ciel@iNFTnews.com元宇宙中的房地产价格主要取决于使用它的人数,以及为所有者创造收益的能力。专注于数字资产的投资公司LedgerPr
  • 虚拟数字人:元宇宙的主角破圈而来

    虚拟数字人市场逐步进入成熟期,商业化进程加速。1982年世界第一位虚拟歌姬林明美诞生,虚拟数字人行业经历了萌芽、探索、初级和成长四个阶段。随技术逐年突破,制
  • 「国产良心」NFT嘲讽了谁?

    2月23日,一个名为「国产良心」的NFT项目被许多活跃的加密用户注意到。该项目的官网风格尤为「不正经」,它丝毫没有避讳自己的小作坊出身,还将「中国人不骗中国人
  • 纽约证券交易所母公司ICE收购tZero股份以探索代币化股票

    2 月 22 日,纽约证券交易所 (NYSE) 的母公司洲际交易所 (ICE) 宣布,它将持有私人数字证券市场 tZERO 的所有权。根据公告,ICE 将成为 tZero 的“重要”少数股东,但
  • 传统互联网与区块链场景下数据权利法律分析

    数据权益的复杂性在于数据涉及多环节多主体、内容不同质且与不同场景紧密联系、对软硬件技术环节紧密相关等方面的复杂性。在传统互联网与区块链模式下,数据处
  • Web 3如何改变传统HR

    互联网自诞生以来,经历了三次迭代。Web1是第一阶段,包括ISP服务器上的个人网页或免费的虚拟主机服务。然后Web2出现了,它引入了动态的用户生成内容、互操作性、增
Top