当前位置:首页 > 元宇宙 > AI

字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口

来源: 责编: 时间:2025-04-16 07:19:36 199观看
导读 4 月 14 日消息,从豆包大模型团队获悉,字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节今日公开,该模型将于 4 月 17 日通过火山引擎开放接口供用户体验。该模型在数学、编程、科学推理等专业领域及创意写作

4 月 14 日消息,从豆包大模型团队获悉,字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节今日公开,该模型将于 4 月 17 日通过火山引擎开放接口供用户体验。4Yw28资讯网——每日最新资讯28at.com

该模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,同时,模型采用 MoE 架构,总参数 200B,激活参数为 20B,具备显著的推理成本优势,单位推理成本相比 DeepSeek R1 降低 50%。4Yw28资讯网——每日最新资讯28at.com

技术报告链接:https://github.com/ByteDance-Seed/Seed-Thinking-v1.54Yw28资讯网——每日最新资讯28at.com

模型各方面具体表现:

专业领域:数学推理(AIME 2024 得分 86.7,追平 OpenAI o3-mini-high)、编程竞赛(Codeforces pass@8 达 55.0%,接近 Gemini 2.5 Pro)、科学推理(GPQA 得分 77.3%,接近 o3-mini-high),均达到或接近业界第一梯队水平。4Yw28资讯网——每日最新资讯28at.com

通用任务:人类评估表现超 DeepSeek R1 8%,覆盖多场景需求。4Yw28资讯网——每日最新资讯28at.com

成本优势:单位推理成本相比 DeepSeek R1 降低 50%,实现性能与效率的平衡。4Yw28资讯网——每日最新资讯28at.com

4Yw28资讯网——每日最新资讯28at.com

数据体系:融合可验证与创意性数据

针对推理与生成任务的不同需求,团队优化了数据处理策略:4Yw28资讯网——每日最新资讯28at.com

可验证数据(如数学、代码题):通过百万级数据三重清洗(人工筛选 → 模型过滤 → 多模型验证),保留 10 万道高难度题目;设计答案整数化改造、离线沙箱验证等机制,确保模型输出真实推理过程;4Yw28资讯网——每日最新资讯28at.com

非可验证数据(如创意写作):基于豆包 1.5 Pro 训练集,剔除低价值样本,采用两两对比奖励法,优化生成质量;4Yw28资讯网——每日最新资讯28at.com

全新评测基准:构建了超难数学数据集 BeyondAIME(100 道无答案题干题目),解决现有测试区分度不足问题。4Yw28资讯网——每日最新资讯28at.com

奖励模型:双轨体系校准训练方向

团队提出双轨奖励机制,兼顾“对错分明”与“见仁见智”任务:4Yw28资讯网——每日最新资讯28at.com

可验证任务:开发了两代验证器(Seed-Verifier → Seed-Thinking-Verifier),从字符匹配升级为推理步骤逐行对比(训练 / 测试集准确率超 99%),杜绝模型“奖励欺骗”;4Yw28资讯网——每日最新资讯28at.com

非可验证任务:引入 pairwise 对比训练,通过千万次“AB 测试”,捕捉人类对创意、情感等的隐性偏好,避免“众口难调”;4Yw28资讯网——每日最新资讯28at.com

双轨融合:针对混合场景设计协调机制,硬指标(对错)与软偏好(优劣)互补,支撑全场景训练。4Yw28资讯网——每日最新资讯28at.com

训练方法:“监督精调 + 强化学习”双阶段优化

Seed-Thinking-v1.5 采用“打基础 + 磨能力”的全链路训练:4Yw28资讯网——每日最新资讯28at.com

监督精调(SFT):基于 40 万高质量实例(30 万可验证 +10 万非可验证数据),结合人工与模型协同筛选,构建长思考链数据集,确保模型“像人类一样思考”;4Yw28资讯网——每日最新资讯28at.com

强化学习(RL):通过三重数据引擎(可验证 / 通用 / 混合数据)、算法创新(价值预训练、解耦 GAE 等)以及在线数据适配技术,解决训练不稳定、长链推理断层等问题,动态调整数据分布以保持最佳训练状态。4Yw28资讯网——每日最新资讯28at.com

训练框架:支撑 20B MoE 的底层架构

为应对20BMoE(总参数 200B)的复杂训练需求,团队优化了底层架构:4Yw28资讯网——每日最新资讯28at.com

HybridFlow 编程模型:支持算法快速探索与分布式并行运行;4Yw28资讯网——每日最新资讯28at.com

流式推理系统(SRS):通过“流式推理”技术解耦模型演进与异步推理,将训练速度提升 3 倍,万亿参数下稳定性达 95%;4Yw28资讯网——每日最新资讯28at.com

三层并行架构:结合张量 / 专家 / 序列并行,动态均衡负载,基于 KARP 算法优化 GPU 算力利用率。4Yw28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12277-0.html字节跳动最新思考模型 Seed-Thinking-v1.5 技术细节公开,4 月 17 日开放接口

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: OpenAI CEO 奥尔特曼:DeepSeek 并未影响 GPT 的增长,将推更好的开源模型

下一篇: 我国团队研发,全球首个基因挖掘大模型 SYMPLEX 问世

标签:
  • 热门焦点
  • FMIFAwards奖项即将揭晓!

    来源:X增强现实FMIF Awards未来元宇宙创新奖是由未来元宇宙创新论坛、ARinChina以及多家投资机构、媒体、研究院联合发起的一项评选活动。旨在推动新技术的融合与集成低成本
  • 文心一言排名垫底,却成为百度业绩增长杠杆

    文/侯煜编辑/罗卿知识增强大预言模式文心一言发布后,百度公司热度大幅提升,文心一言到底能为百度的业绩带来多大的增益成为业内关注焦点。近日,百度(NASDAQ:BIDU/09888.HK)公布了
  • 汽车元宇宙,是概念还是未来?

    作者|何文 元宇宙是未来趋势已经无需验证。 从概念上来看,元宇宙是两种存在多年的概念的融合:虚拟现实和数字第二人生。这也就意味着,元宇宙所代表的是一种新的数
  • 林俊杰、余文乐等明星相继入局,元宇宙虚拟土地究竟有何魔力?

    上周的元宇宙和明星圈因为一则“林俊杰在推特上宣布持有Decentraland元宇宙虚拟地块”的新闻而备受关注,该新闻一方面在娱乐圈引起了吃瓜群众的好奇,另一方面在
  • 与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • 对讽刺无动于衷,Nori将碳市场放在区块链上

    当我们聊气候问题的解决方案时,以太坊区块链应该不是最首想到的,但这正是Nori所选择的方案,它建立了一个引擎,鼓励农民使用负碳耕作方法,将空气中的碳抽出并放回地
  • 元宇宙+剧本杀:“在异世界里当演员”

    你玩过剧本杀吗?体验过“元宇宙+剧本杀”吗?2月,恒信东方推出了一款次时代剧本杀原创作品——《失落的王朝》。其剧本和线索以数字化资产打造,通过VR技术塑造了与
  • 从概念到落地 Web3.0初具雏形

    加密资产热潮催生出的链上应用中,除了DeFi、NFT、链游GameFi等场景外,还有一个热词叫「Web3.0」。Web3.0的概念最早出现在2014年,由以太坊联合创始人及波卡创建者
  • 超级账本Julian Gordon:联盟链与公链的竞争不是非此即彼

    在2021年《福布斯》区块链50强榜单中,29家企业使用Hyperledger超级账本技术,占比近60%。同年,研究机构Blockdata发布了的调查报告显示,访问Top100上市公司中,有 81
Top