当前位置:首页 > 元宇宙 > AI

英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

来源: 责编: 时间:2025-05-08 17:51:06 148观看
导读 5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。Parakeet TDT 0.6B 的核心优势在于

5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开源。own28资讯网——每日最新资讯28at.com

Parakeet TDT 0.6B 的核心优势在于其无与伦比的速度和转录质量。该模型仅需 1 秒即可处理 60 分钟音频,是现有主流开源 ASR 典型模型速度的 50 倍。own28资讯网——每日最新资讯28at.com

在 Hugging Face 的 Open ASR Leaderboard 上,其字错率(WER)低至 6.05%,成为开源模型中的佼佼者。这一性能为实时转录、语音分析、呼叫中心智能和音频内容索引等企业级应用提供了强大支持。own28资讯网——每日最新资讯28at.com

own28资讯网——每日最新资讯28at.com

该模型基于 Transformer 架构,结合高质量转录数据进行微调,并针对英伟达硬件优化推理。own28资讯网——每日最新资讯28at.com

援引博文介绍,该模型关键特性包括:6 亿参数的编码-解码结构、量化和融合内核以提升推理效率、支持 TDT(Transducer Decoder Transformer)架构,以及精确的时间戳、数字格式化和标点恢复功能。own28资讯网——每日最新资讯28at.com

此外,该模型还开创性地支持歌曲转歌词转录,这一罕见功能拓展了音乐索引和媒体平台的用例,依托英伟达的 TensorRT 和 FP8 量化技术,其实时率(Real Time Factor,RTF,模型处理时间和音频长度的比值)达到 3386。own28资讯网——每日最新资讯28at.com

Parakeet TDT 0.6B 不仅关注速度和精度,还内置了多项独特功能。该模型能将歌曲内容转为歌词,适用于音乐和媒体领域;支持数字和时间戳格式化,提升会议记录、法律转录和医疗记录的可读性;标点恢复功能则增强了下游自然语言处理(NLP)应用的表现。这些特性大幅提升转录质量,减轻后期处理或人工编辑的负担,尤其适合企业级部署。own28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12737-0.html英伟达 Parakeet TDT 0.6B 成开源 ASR 模型新王:1 秒 AI 转录 60 分钟音频,字错率低至 6.05%

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 谷歌推 I O 版 Gemini 2.5 Pro 模型,AI 助力前端开发与复杂编程

下一篇: “活化”敦煌 IP:商汤科技与敦煌当代美术馆达成战略合作

标签:
  • 热门焦点
  • ChatGPT访问量增速下滑,AI真的是一场泡沫吗?

    来源:首席商业评论2023年,最火的莫过于ChatGPT,席卷全球的同时也引发了生成式AI(人工智能)的投资热潮。在美股,ChatGPT相关概念股飙涨,以AI算力龙头英伟达为例,其股价年内一度累计上
  • 雷克萨斯高管,“受贿”5000万?

    来源:毒舌科技作者:潘磊雷克萨斯的高管,好像出事了。五六家日本小媒体,突然曝出了一个与中国市场有关的大新闻——雷克萨斯中国区一个高管受贿10亿日元(约合人民币5000
  • AI大模型“战火”烧到了教育领域

    作者:刘旷自2023年开年以来,AI大模型这股风是越吹越猛烈了。随着ChatGPT的出圈爆火,再度掀起了一波AI热浪,无论是在国内还是国外都有不少企业宣布入局或者跟进AI大模型领域。与
  • AIGC产品测评TOP25丨谁能抢到下个十年的“船票”?

    Tech星球(微信ID:tech618) 文 | 何煦阳策划 | 杨晓鹤封面来源 | 图虫创意 2016年,李彦宏站在百度联盟峰会的讲台上,向所有人宣布:互联网的下一幕是人工智能。同年,Google 旗下 Dee
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • 中国区块链产业生态地图报告(2021)

    区块链是技术整合创新、金融创新、组织方式创新、产业应用创新的多维度创新,以服务实体经济、政务民生以及公共服务等领域为落脚点,以期实现整个地区和产业的资
  • Meta正在研发元宇宙语音助手;广东省462家企业申请元宇宙商标

    今日《元宇宙新鲜事》有:扎克伯格透露正在为元宇宙研发语音助手;完美世界声明称不会以“元宇宙投资项目”等名义吸收资金。广东省申请元宇宙商标的企业达462家位
  • 与元宇宙美少女艺术家的对话

    我最近宣布了我自己的NFT项目,这是我已经工作了几个月的事情。由于我之前只是一个收藏家,拥有自己的项目真的给了我一个新的视角来看待这个领域。我一直欢迎人们
  • Steam 禁止NFT和加密货币原因曝光

    近日,Valve(V社)总裁Gabe Newell接受PC Gamer采访时解释了该平台禁止NFT和加密货币的原因。早在2021年10月18日,PC Gamer就报道Steam推出的新规:使用区块链或允许交
Top