当前位置:首页 > 元宇宙 > AI

英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

来源: 责编: 时间:2024-09-27 16:34:24 166观看
导读 9 月 25 日消息,英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。Llama-3.1-Nemotron-51

9 月 25 日消息,英伟达 9 月 23 日发布博文,宣布推出 Llama-3.1-Nemotron-51B AI 模型,源自 Meta 公司的 Llama-3.1-70B,不过创新使用神经架构搜索(NAS)方法,建立了一个高度准确和高效的模型。vKU28资讯网——每日最新资讯28at.com

Llama-3.1-Nemotron-51B 简介

Llama-3.1-Nemotron-51B AI 模型基于Meta 公司 2024 年 7 月发布的 Llama-3.1-70B 模型,共有 510 亿参数。vKU28资讯网——每日最新资讯28at.com

该 AI 模型主要采用了神经架构搜索(NAS)技术微调,平衡性能和效率,在高工作负荷下,只需要一片 H100 GPU 即可运行,大大降低了内存消耗、计算复杂性以及与运行此类大型模型相关的成本。vKU28资讯网——每日最新资讯28at.com

英伟达认为这种方式在保持了出色的精度前提下,显著降低了内存占用、内存带宽和 FLOPs,并证明可以在创建另一个更小、更快的变体来加以推广。vKU28资讯网——每日最新资讯28at.com

Llama-3.1-Nemotron-51B 性能

相比较 Meta 的 Llama-3.1-70B 模型,Llama-3.1-Nemotron-51B 在保持了几乎相同的精度情况下,推理速度提高了 2.2 倍。vKU28资讯网——每日最新资讯28at.com

准确率能效 MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8.9980.2%6472653Llama 3.1-70B- Instruct8.9381.66%2975339Llama 3.1-70B- Instruct (single GPU)——1274301Llama 3-70B8.9480.17%2975339效率和性能方面的突破

开发 LLM 过程中面临的主要挑战之一是如何平衡精度与计算效率。许多大规模模型都能提供最先进的结果,但却需要耗费大量的硬件和能源资源,这限制了它们的适用性。vKU28资讯网——每日最新资讯28at.com

英伟达的新模型在这两个相互竞争的因素之间取得了微妙的平衡。vKU28资讯网——每日最新资讯28at.com

vKU28资讯网——每日最新资讯28at.com

Llama-3.1-Nemotron-51B 实现了令人印象深刻的精度与效率权衡,减少了内存带宽,降低了每秒浮点运算次数 (FLOP),并减少了总体内存占用,同时不影响模型执行推理、总结和语言生成等复杂任务的能力。vKU28资讯网——每日最新资讯28at.com

改进工作量管理,提高成本效益

Llama-3.1-Nemotron-51B 的一个突出特点是能够在单个 GPU 上管理更大的工作负载。该型号允许开发人员在更具成本效益的环境中部署高性能 LLMs,在一个 H100 设备上运行以前需要多个 GPU 才能完成的任务。vKU28资讯网——每日最新资讯28at.com

Llama-3.1-Nemotron-51B 模型还减少了内存占用,在推理过程中可以在单个 GPU 上运行 4 倍以上的工作负载,从而带来了一系列新的机遇。vKU28资讯网——每日最新资讯28at.com

架构优化:成功的关键

Llama-3.1-Nemotron-51B 的成功主要归功于一种新颖的结构优化方法。传统上,LLMs 是使用相同的块构建的,这些块在整个模型中重复出现。vKU28资讯网——每日最新资讯28at.com

这虽然简化了构建过程,但也带来了效率低下的问题,特别是在内存和计算成本方面。vKU28资讯网——每日最新资讯28at.com

英伟达通过采用 NAS 技术来优化推理模型,从而解决了这些问题。该团队采用了分块蒸馏过程,即训练更小、更高效的学生模型(student model),以模仿更大的教师模型(teacher model)的功能。vKU28资讯网——每日最新资讯28at.com

vKU28资讯网——每日最新资讯28at.com

通过完善这些学生模型并评估其性能,英伟达开发出了 Llama-3.1 版本,在大幅降低资源需求的同时,还能提供类似的准确度。vKU28资讯网——每日最新资讯28at.com

Puzzle 算法和知识蒸馏

Llama-3.1-Nemotron-51B 有别于其他模型的另一个关键组件,就是 Puzzle 算法。vKU28资讯网——每日最新资讯28at.com

vKU28资讯网——每日最新资讯28at.com

该算法对模型中的每个潜在区块进行评分,并确定哪些配置能在速度和精度之间取得最佳平衡。vKU28资讯网——每日最新资讯28at.com

跑分 Llama-3.1 70B-instructLlama-3.1-Nemotron-51B- Instruct 准确率winogrande85.08%84.53%99.35%arc_challenge70.39%69.20%98.30%MMLU81.66%80.20%98.21%hellaswag86.44%85.58%99.01%gsm8k92.04%91.43%99.34%truthfulqa59.86%58.63%97.94%xlsum_english33.86%31.61%93.36%MMLU Chat81.76%80.58%98.55%gsm8k Chat81.58%81.88%100.37%Instruct HumanEval (n=20)75.85%73.84%97.35%MT Bench8.938.99100.67%

通过使用知识蒸馏技术,Nvidia 缩小了参考模型(Llama-3.1-70B)与 Nemotron-51B 之间的精度差距,同时显著降低了训练成本。vKU28资讯网——每日最新资讯28at.com

场景 Input/Output Sequence LengthLlama-3.1- Nemotron- InstructLlama-3.1-70B-InstructRatioLlama (TP1)Chatbot128/1285478 (TP1)2645 (TP1)2.072645Text generation128/10246472 (TP1)2975 (TP4)2.171274Long text generation128/20484910 (TP2)2786 (TP4)1.76646System 2 reasoning128/40963855 (TP2)1828 (TP4)2.11313Summarization/ RAG2048/128653 (TP1)339 (TP4)1.92300Stress test 12048/20482622 (TP2)1336 (TP4)1.96319

vKU28资讯网——每日最新资讯28at.com

附上参考地址vKU28资讯网——每日最新资讯28at.com

Advancing the Accuracy-Efficiency Frontier with Llama-3.1-Nemotron-51BvKU28资讯网——每日最新资讯28at.com

Nvidia AI Releases Llama-3.1-Nemotron-51B: A New LLM that Enables Running 4x Larger Workloads on a Single GPU During InferencevKU28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-7797-0.html英伟达发布 Llama-3.1-Nemotron-51B AI 模型:创新神经架构搜索等技术让单 H100 GPU 运行 4 倍以上负载

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 星纪魅族正在开发星纪战车、机器人等新品

下一篇: 微软发布新工具,检测和纠正 AI 幻觉内容

标签:
  • 热门焦点
  • 《从营销AIGC化到AIGC营销化》报告发布

    来源:清元宇宙7月2日上午,清华大学元宇宙文化实验室举办元宇宙在线沙龙“AIGC热潮与应用”。会议中,清华大学新闻与传播学院教授、元宇宙文化实验室主任、新媒体研究
  • 聚焦虚拟数字人技术,这三大商机要抓住!

    关于虚拟数字人,企业可以从三个方面入局,分别是ToG(To Government,面向政府),即为数字政府和数字城市提供支持服务;ToB(To Business,面向企业),即为企业提供虚拟员工解决方案;ToC(To Cons
  • 元宇宙风口下,视觉中国如何重估?

    要说横跨2021年和2022年,到目前仍然很火的概念,元宇宙肯定要算一个。不仅互联网巨头们纷纷布局,上市公司们趋之若鹜,还被不少地方政府写入了产业规划,大有在2022年
  • 搭上“谷爱凌”,“柳夜熙们”站上风口?

    作者:张琳 曹杨从“永不塌房”的艺人到频频亮相北京冬奥会,作为元宇宙细分赛道之一的虚拟数字人又火了一把。2月7日,即谷爱凌摘得冬奥会自由式滑雪大跳台金牌的
  • 《刀剑神域》VR展开幕;《Puzzling Places》发布第二个付费DLC

    今日热点:《刀剑神域:Ex-Chronicle Online Edition》VR展开幕;虚拟活动平台EventX再获800万美元B轮融资;VR射击游戏《Outlier》确认将于3月17日登陆Steam平台等。
  • 纽约街头出现NFT自动贩卖机

    一家初创公司宣布在纽约市开放一台NFT自动售货机,允许任何人——即使是没有加密资产的人也能购买NFT。该交易平台名为Neon,上个月完成了一轮300万美元的种子募捐
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • 大厂打造元宇宙平台的业务重心是什么?

    知名市场研究机构IDC发布《2022年中国元宇宙市场十大预测》报告,其中提出互联网大厂各自独立布局元宇宙平台。事实上,在2021年的最后一个季度,包括Meta、英伟达、
  • 虚拟人的3大纪律和6种品牌孵化模式

    作者:陈格雷(老小格)及团队虚拟人很热,我们最近广泛收集和研究了、各种消费品牌企业在虚拟人开发上的一些主要特点,整理出6种最主要的品牌虚拟人模式,后面一一介绍。
Top