当前位置:首页 > 科技  > 手机

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

来源: 责编: 时间:2025-09-30 10:15:53 75观看
导读 快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。DeepSeek v3.2的亮点很多,但是大家不必

快科技9月29日消息,今天下午DeepSeek突然发布了DeepSeek v3.2-Exp大模型,这是前几天发布DeepSeek v3.1终结版之后的又一大动作,很符合重大节日前DeepSeek发新模型的习惯。tQu28资讯网——每日最新资讯28at.com

DeepSeek v3.2的亮点很多,但是大家不必关注于这个模型能力有多好,从她exp的后缀就可以看出它本质上是DeepSeek探索新技术用的,这方面才有价值。tQu28资讯网——每日最新资讯28at.com

DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。tQu28资讯网——每日最新资讯28at.com

DeepSeek v3.2还是小版本进步,大家关心的还是DeepSeek重大版本升级,也就是传闻了很久的DeepSeek v4及r2,尤其是v4这种基座大模型。tQu28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练tQu28资讯网——每日最新资讯28at.com

推上一个名为DeepSeek News Commentary的账号表示v4将于10月发布,带来100万上下文、GRPO驱动推理及NSA/SPCT等技术,数学、编程能力大幅提升,同时速度极快,成本也极低。tQu28资讯网——每日最新资讯28at.com

这个账号的属地也是杭州,但目前来看并非DeepSeek官方账号,消息真实性值得商榷。tQu28资讯网——每日最新资讯28at.com

不过10月份发布DeepSeek v4也不是完全没可能,毕竟DeepSeek v3.2是技术验证方向的,是在为DeepSeek v4重大技术升级探路。tQu28资讯网——每日最新资讯28at.com

还有一点需要注意,DeepSeek v4早在四五月份就说要发布,但官方一直不为所动,期间还被传出什么训练失败之类的负面消息,只是这些传闻不足为信,无非是抹黑国产大模型及算力不及美国罢了。tQu28资讯网——每日最新资讯28at.com

DeepSeek v4发布应该是需要一个重要契机,那就是与国产算力芯片全面适配,这一点DeepSeek官方之前已经明确了,下一代将支持FP8算法,与国产芯片全面适配。tQu28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练tQu28资讯网——每日最新资讯28at.com

现在已经不少国产AI芯片宣布支持FP8算法了,但是这方面的适配显然需要一个领头羊,那就是华为昇腾,联系一下前几天的大约上华为高调宣布昇腾路线图,明年Q1时候的昇腾950PR不仅支持FP4,还支持FP4,算力达到1PFLOPS(FP8)/ 2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8 /HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s,内存容量和带宽做到了144GB、4TB/s。tQu28资讯网——每日最新资讯28at.com

显然昇腾950PR上市的时候,DeepSeek V4才是佳的登场时刻,此前也早有消息称DeepSeek已经使用国产AI芯片训练,v3.2就同时支持CUDA和TileLang,v4自然也不会落下。tQu28资讯网——每日最新资讯28at.com

后续DeepSeek v4肯定还会有其他国产AI芯片的适配版的,包括寒武纪、海光等。tQu28资讯网——每日最新资讯28at.com

DeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练tQu28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-22-186418-0.htmlDeepSeek V4被曝下月发布:100M上下文 全面用国产AI芯片训练

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 华为首次公开!MatePad Mini全系麒麟芯片:典藏版确认麒麟9010

下一篇: 余承东被任命为华为公司IRB主任:仍继续负责华为终端、鸿蒙智行等业务

标签:
  • 热门焦点
  • 三言两语说透设计模式的艺术-简单工厂模式

    一、写在前面工厂模式是最常见的一种创建型设计模式,通常说的工厂模式指的是工厂方法模式,是使用频率最高的工厂模式。简单工厂模式又称为静态工厂方法模式,不属于GoF 23种设计
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 不容错过的MSBuild技巧,必备用法详解和实践指南

    一、MSBuild简介MSBuild是一种基于XML的构建引擎,用于在.NET Framework和.NET Core应用程序中自动化构建过程。它是Visual Studio的构建引擎,可在命令行或其他构建工具中使用
  • Java NIO内存映射文件:提高文件读写效率的优秀实践!

    Java的NIO库提供了内存映射文件的支持,它可以将文件映射到内存中,从而可以更快地读取和写入文件数据。本文将对Java内存映射文件进行详细的介绍和演示。内存映射文件概述内存
  • 企业采用CRM系统的11个好处

    客户关系管理(CRM)软件可以为企业提供很多的好处,从客户保留到提高生产力。  CRM软件用于企业收集客户互动,以改善客户体验和满意度。  CRM软件市场规模如今超过580
  • 每天一道面试题-CPU伪共享

    前言:了不起:又到了每天一到面试题的时候了!学弟,最近学习的怎么样啊 了不起学弟:最近学习的还不错,每天都在学习,每天都在进步! 了不起:那你最近学习的什么呢? 了不起学弟:最近在学习C
  • iQOO Neo8系列或定档5月23日:首发天玑9200+ 安卓跑分王者

    去年10月,iQOO推出了iQOO Neo7系列机型,不仅搭载了天玑9000+,而且是同价位唯一一款天玑9000+直屏旗舰,一经上市便受到了用户的广泛关注。在时隔半年后,
  • OPPO K11样张首曝:千元机影像“卷”得真不错!

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top