当前位置:首页 > 元宇宙 > AI

亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌

来源: 责编: 时间:2025-04-11 07:49:39 200观看
导读 4 月 9 日消息,亚马逊发布了名为 Nova Sonic 的新一代生成式 AI 模型,该模型能够原生处理语音并生成自然流畅的语音。据亚马逊声称,Nova Sonic 在速度、语音识别以及对话质量等关键指标的基准测试中,表现可与 Ope

4 月 9 日消息,亚马逊发布了名为 Nova Sonic 的新一代生成式 AI 模型,该模型能够原生处理语音并生成自然流畅的语音。据亚马逊声称,Nova Sonic 在速度、语音识别以及对话质量等关键指标的基准测试中,表现可与 OpenAI 和谷歌的前沿语音模型相媲美。Hte28资讯网——每日最新资讯28at.com

Hte28资讯网——每日最新资讯28at.com

Nova Sonic 的问世是亚马逊对新兴 AI 语音模型的有力回应,例如为 ChatGPT 语音模式提供支持的模型,相较于亚马逊早期的 Alexa 等较为刻板的模型,这些新模型在语音交互时更加自然。Hte28资讯网——每日最新资讯28at.com

Nova Sonic 通过亚马逊的 Bedrock 开发者平台提供给用户,该平台是用于构建企业级 AI 应用的工具,Nova Sonic 则通过一个全新的双向流式 API 进行接入。在一份新闻稿中,亚马逊称 Nova Sonic 是市场上“最具成本效益”的 AI 语音模型,其价格比 OpenAI 的 GPT-4o 便宜约 80%。Hte28资讯网——每日最新资讯28at.com

据亚马逊高级副总裁兼人工通用智能(AGI)部门首席科学家罗希特・普拉萨德介绍,Nova Sonic 的部分组件已经为亚马逊升级版数字语音助手 Alexa+ 提供了动力支持。Hte28资讯网——每日最新资讯28at.com

普拉萨德表示,与竞争对手的 AI 语音模型相比,Nova Sonic 在将用户请求路由到不同 API 方面表现出色。这一能力使得 Nova Sonic 能够知晓何时需要从互联网获取实时信息、解析专有数据源,或者在外部应用程序中采取行动,并使用合适的工具来完成任务。Hte28资讯网——每日最新资讯28at.com

在双向对话中,Nova Sonic 会等待“合适的时机”发言,会考虑到说话者的停顿和打断等情况。此外,Nova Sonic 还能够为用户的语音生成文本记录,开发者可以将这些文本用于各种应用场景。Hte28资讯网——每日最新资讯28at.com

据普拉萨德介绍,Nova Sonic 在语音识别错误方面比其他 AI 语音模型更少,这意味着该模型即使在用户咕哝、说错话或者处于嘈杂环境中时,也相对擅长理解用户的意图。在一项衡量跨语言和方言的语音识别基准测试 —— 多语言 LibriSpeech 中,亚马逊表示 Nova Sonic 在英语、法语、意大利语、德语和西班牙语上的平均单词错误率(WER)仅为 4.2%。也就是说,在这些语言中,该模型每 100 个单词中大约有 4 个与人工转录的结果不同。Hte28资讯网——每日最新资讯28at.com

注意到,在另一项衡量多人参与的高音量互动的基准测试 —— 增强多方互动中,亚马逊称 Nova Sonic 在单词错误率方面比 OpenAI 的 GPT-4o-transcribe 模型准确率高出 46.7%。Nova Sonic 还拥有行业领先的速度,其平均感知延迟为 1.09 秒,亚马逊表示。这一速度比为 OpenAI 的实时 API 提供动力的 GPT-4o 模型更快,后者响应时间为 1.18 秒,这是根据人工分析的基准测试结果得出的。Hte28资讯网——每日最新资讯28at.com

普拉萨德称,Nova Sonic 是亚马逊构建人工通用智能(AGI)这一更广泛战略的一部分,公司定义 AGI 为“能够在计算机上完成人类所能做的一切事情的 AI 系统”。展望未来,普拉萨德表示,亚马逊计划推出更多能够理解不同模态(包括图像、视频和语音)的 AI 模型,以及“其他在将事物引入物理世界时相关的感官数据”。Hte28资讯网——每日最新资讯28at.com

由普拉萨德负责的亚马逊 AGI 部门,如今似乎在公司产品战略中扮演着越来越重要的角色。就在上周,亚马逊刚刚推出了 Nova Act 的预览版,这是一个使用浏览器的 AI 模型,似乎为 Alexa+ 和亚马逊的“代我购买”功能的部分元素提供了支持。普拉萨德表示,从 Nova Sonic 开始,公司希望将更多内部的 AI 模型提供给开发者使用,以助力他们构建各种应用。Hte28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-12144-0.html亚马逊推出全新 AI 语音模型 Nova Sonic,叫板 OpenAI 和谷歌

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 皮尤报告:美国公众对 AI 态度消极

下一篇: 三星进军 AI 机器人领域,Ballie 本周公开亮相

标签:
  • 热门焦点
  • 蓝标亏钱、Meta裁员:天下秀还值得砸钱元宇宙吗?

    日前,天下秀数字科技集团正式公布了2022年报及2023年一季报。报告显示,2022年天下秀实现营收41.29亿元,同比下滑8.48%;归母净利润1.8亿元,同比下滑49.2%,几乎出现了盈利腰斩的态势
  • 挖来Meta AR高管,难道苹果也要进军元宇宙?

    “被曝光”的才是最吸引人的产品,相信有关注过苹果硬件消息的朋友们都明白这样的道理。往近了说有苹果“即将发布”的iPhone SE 3和M2芯片,往远了说有“折叠屏iP
  • 中文在线的“元宇宙”故事,资本听腻了?

    被誉为“元宇宙”龙头之一的中文在线,这下尴尬了。2022年1月11日,中国移动通信联合会元宇宙产业委员会揭牌,接纳涉足“元宇宙”的8家上市公司,包括中青宝、天下秀
  • 小众有趣NFT艺术作品欣赏(1)

    随着NFT发展火热,越来越多领域与NFT融合,NFT艺术在加密领域中占据了很大一部分。NFT艺术与传统艺术有相似之处,也有完全不同的地方。NFT艺术与传统艺术一样,表现了
  • 费城艺术家使用区块链,在数字艺术中狠狠捞一笔

    ‍你也想赚钱发财走上人生巅峰吗?老雅痞给你指条路,现在也许是时候创建或购买或出售 NFT的好时机。费城地区的许多企业家都在这样做。但投资需谨慎,入行有风险,在
  • 音乐NFT平台里的下一匹黑马是谁?

    NFT 销售额在 2021 年开始暴涨,从 2018 年的仅 4069 万美元的交易量,到 2021 年,NFT 交易量飙升至 442 亿美元以上,并不断刷新记录并达到新的高度。预测到2025 年N
  • Meta 在衰落吗?

    扎克伯格已经很久没有出现在公众视野里了,近日,他罕见的接受播客采访,在两个小时的时间里畅谈了Meta、Facebook、Instagram、元宇宙的未来。正方观点:是的阿伦·达
  • 以太坊面临来自Fantom的巨大挑战

    众所周知,区块链和加密货币项目经常因其对环境的影响而受到批评。但是有一个非营利性的加密货币和区块链项目说它比其他的更环保。今天老雅痞就给大家聊一聊加
  • TX加入的NFT数字收藏品,元宇宙的破圈之路?

    3月7日,澳大利亚 NFT 初创公司 Immutable 在新加坡淡马锡牵头的R资中以估值 25 亿美元完成2亿美元R资,腾讯参投。想必国人最熟知的应该就是TX,作为国内四大互联网
Top