当前位置：首页 > 元宇宙 > AI

阿里云通义千问系列 AI 开源模型升至 Qwen2：5 个尺寸、上下文长度最高支持 128K tokens

来源：责编：时间：2024-06-11 17:44:56 348观看

导读 6 月 7 日消息，通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。附上 Qwen 2.0 主要内容如下：5 个尺寸的预训练和指令微调模型

6 月 7 日消息，通义千问（Qwen）今天宣布经过数月的努力，Qwen 系列模型从 Qwen1.5 到 Qwen2 的重大升级，并已在 Hugging Face 和 ModelScope 上同步开源。

附上 Qwen 2.0 主要内容如下：

5 个尺寸的预训练和指令微调模型，包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 以及 Qwen2-72B

在中文英语的基础上，训练数据中增加了 27 种语言相关的高质量数据；

多个评测基准上的领先表现；

代码和数学能力显著提升；

增大了上下文长度支持，最高达到 128K tokens（Qwen2-72B-Instruct）。

模型基础信息

Qwen2 系列包含 5 个尺寸的预训练和指令微调模型，其中包括 Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B 和 Qwen2-72B。

模型Qwen2-0.5BQwen2-1.5BQwen2-7BQwen2-57B-A14BQwen2-72B参数量0.49B1.54B7.07B57.41B72.71B非 Embedding 参数量0.35B1.31B5.98B56.32B70.21BGQATrueTrueTrueTrueTrueTie EmbeddingTrueTrueFalseFalseFalse上下文长度32K32K128K64K128K

在 Qwen1.5 系列中，只有 32B 和 110B 的模型使用了 GQA。这一次，所有尺寸的模型都使用了 GQA，以便让大家体验到 GQA 带来的推理加速和显存占用降低的优势。

模型评测

相比 Qwen1.5，Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。

在针对预训练语言模型的评估中，对比当前最优的开源模型，Qwen2-72B 在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的模型，如 Llama-3-70B 以及 Qwen1.5 最大的模型 Qwen1.5-110B。

附上参考地址

你好，Qwen2

本文链接：http://www.28at.com/showinfo-45-4549-0.html阿里云通义千问系列 AI 开源模型升至 Qwen2：5 个尺寸、上下文长度最高支持 128K tokens

声明：本网页内容旨在传播知识，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。邮件：2376512515@qq.com

上一篇：五粮液浓香酒：劳动节送礼的精致艺术

下一篇：号称效果对标 Sora：快手视频生成大模型“可灵”开放邀测

标签：

热门焦点

字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

正当互联网商业踌躇不前，互联网大厂为了在存量中的增长挤破头皮之时，元宇宙的概念被资本点燃。先是Facebook更名Meta正式进军元宇宙，然后字节跳动收购了一家VR硬
传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

今日热点：传腾讯已推出全新XR业务；摩托罗拉与Verizon合作打造5G XR颈戴式计算组件；小米AR购物导航专利获授权；VR一体机Simula One放弃众筹并开放直接预订；VR游戏《
字节觅《原神》，腾讯元宇宙，游戏新王战旧神？

文 | 陈桥辉陈奕迅的《红玫瑰》中有一句歌词，“得不到的永远在骚动”，这句话用到如今国内头部游戏平台再合适不过。随着《原神》的异军突起，使得头部游戏大厂感受
元宇宙是数字共识生态的集成逻辑表达

作者: 李鸣元宇宙是数字共识生态的集成逻辑表达，是以区块链技术为核心的可信数字化价值交互网络，是基于Web3.0技术体系和运作机制支撑下的数字新生态。本体论是
量子计算在未来能否提高区块链技术的效率

区块链技术的主要成功之处在于对不透明的金融流程进行了去中心化的访问量子计算机的内在目标是解决传统计算机不可能解决的问题随着区块链技术的使用案例逐渐
独立故事片“Calladita”将使用 NFT 筹集资金

导演 Miguel Faus 正在转向加密来资助他的处女作，由 Paula Grimaldo 和 Emily Mortimer 主演。“Calladita”（导演 Miguel Faus）。图片：米格尔·福斯在过去的一年
头像类NFTs的统治能持续多久？

在过去的一两年里，NFTs在互联网世界中掀起了一场风暴。今天，当我们想到NFTs时，我们主要想到的是那些充斥着我们的社交媒体屏幕的数字卡通--无聊猿、punks 和介于
2022年元宇宙系列报告：UGC当道，XR带来新交互体验

UGC作为元宇宙的主要内容创作模式，已经越来越多的呈现于游戏、娱乐、社交、传媒等方面，UGC模式勾勒了元宇宙的边界，现今元宇宙UGC模式的主要呈现方式以元宇宙概念
虚拟人行业研究报告

最早的虚拟人出现于 20 世纪 80 年代，受限于技术，当时的虚拟人制作以手绘为主。21 世纪初，随着动捕、渲染等技术的逐步发展，虚拟人相关技术开始在影视领域逐渐普及

首页

元宇宙

NFT

区块链

虚拟人

AR/VR

AI

元宇宙百科

阿里云通义千问系列 AI 开源模型升至 Qwen2：5 个尺寸、上下文长度最高支持 128K tokens

字节、腾讯、网易鏖战元宇宙背后，大厂究竟在争夺什么？

传腾讯已推出全新XR业务；摩托罗拉正打造5GXR颈戴式计算组件

字节觅《原神》，腾讯元宇宙，游戏新王战旧神？

元宇宙是数字共识生态的集成逻辑表达

量子计算在未来能否提高区块链技术的效率

独立故事片“Calladita”将使用 NFT 筹集资金

头像类NFTs的统治能持续多久？

2022年元宇宙系列报告：UGC当道，XR带来新交互体验

虚拟人行业研究报告

最新推荐

一份全面清单：Web3行业高薪酬的13种工作

刷完一场元宇宙世界杯音乐盛典，我爽了

完美世界被元宇宙“拒之门外”

元宇宙社交啫喱、希壤爆款迭出，腾讯慌了吗？

Meta展示AI系统Builder Bot；《Pistol Whip》增加派对模式

重温 1602 年：DAO 是新的企业范式吗？

猜你喜欢

热门推荐

相关资讯