当前位置:首页 > 科技  > 数码

阿里云万相2.1视频大模型开源,8.2GB显存轻松驾驭,性能超越Sora等竞品

来源: 责编: 时间:2025-02-26 12:26:19 258观看
导读阿里云近日宣布了一项重大举措,正式开源其视觉生成基座模型——万相2.1(Wan)。此次开源行动采用了极为宽松的Apache2.0协议,意味着全球开发者将能够无限制地访问和使用这一前沿技术。万相2.1模型包含14B和1.3B两种参数规

阿里云近日宣布了一项重大举措,正式开源其视觉生成基座模型——万相2.1(Wan)。此次开源行动采用了极为宽松的Apache2.0协议,意味着全球开发者将能够无限制地访问和使用这一前沿技术。2eR28资讯网——每日最新资讯28at.com

万相2.1模型包含14B和1.3B两种参数规格,阿里云不仅开放了全部推理代码,还提供了相应的权重文件。这一举措极大地方便了开发者进行文生视频和图生视频等任务的探索。开发者可以在Github、HuggingFace和魔搭社区等多个平台上轻松下载并体验这一模型。2eR28资讯网——每日最新资讯28at.com

据悉,14B参数的万相模型在指令遵循、复杂运动生成、物理建模以及文字视频生成等多个领域均展现出了卓越的性能。在评测集VBench中,万相2.1以86.22%的总分力压群雄,包括Sora、Luma、Pika等国内外知名模型,成功登顶。而1.3B版本的测试结果同样令人瞩目,它不仅超越了更大尺寸的开源模型,还逼近了部分闭源模型的表现。尤为该版本能够在消费级显卡上流畅运行,仅需8.2GB显存即可生成480P视频,这对于二次模型开发和学术研究来说无疑是一个巨大的福音。2eR28资讯网——每日最新资讯28at.com

2eR28资讯网——每日最新资讯28at.com

2eR28资讯网——每日最新资讯28at.com

万相视频模型采用了先进的DiT架构和线性噪声轨迹Flow Matching范式,并在此基础上研发了高效的因果3D VAE和可扩展的预训练策略等创新技术。特别是在3D VAE方面,万相团队通过实现特征缓存机制,成功支持了任意长度视频的编码和解码,实现了对无限长1080P视频的高效处理。通过将空间降采样压缩提前,万相模型在不损失性能的前提下,进一步减少了29%的推理时内存占用,从而提升了整体运行效率。2eR28资讯网——每日最新资讯28at.com

2eR28资讯网——每日最新资讯28at.com

在多个维度的测试中,万相模型均展现出了业界领先的表现。特别是在运动质量、视觉质量、风格和多目标等14个主要维度以及26个子维度的测试中,万相模型斩获了5项第一,充分证明了其强大的技术实力和广泛的应用潜力。2eR28资讯网——每日最新资讯28at.com

2eR28资讯网——每日最新资讯28at.com

对于想要深入了解和使用万相模型的开发者来说,以下是一些开源地址的链接:2eR28资讯网——每日最新资讯28at.com

Github:https://github.com/Wan-Video2eR28资讯网——每日最新资讯28at.com

HuggingFace:https://huggingface.co/Wan-AI2eR28资讯网——每日最新资讯28at.com

魔搭社区:https://modelscope.cn/organization/Wan-AI2eR28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-24-133592-0.html阿里云万相2.1视频大模型开源,8.2GB显存轻松驾驭,性能超越Sora等竞品

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 我国人形机器人技术新飞跃:任意地形自主站立,迈向智能新篇章

下一篇: 迈巴赫车主控诉尊界S800测试事件,江汽集团正面回应争议

标签:
  • 热门焦点
  • 一加Ace2 Pro真机揭晓 钛空灰配色质感拉满

    终于,在经过了几波预热之后,一加Ace2 Pro的外观真机图在网上出现了。还是博主数码闲聊站曝光的,这次的外观设计还是延续了一加11的方案,只是细节上有了调整,例如新加入了钛空灰
  • 一加首款折叠屏!一加Open渲染图出炉:罕见单手可握小尺寸

    8月5日消息,此前就有爆料称,一加首款折叠屏手机将会在第三季度上市,如今随着时间临近,新机的各种消息也开始浮出水面。据悉,这款新机将会被命名为“On
  • 线程通讯的三种方法!通俗易懂

    线程通信是指多个线程之间通过某种机制进行协调和交互,例如,线程等待和通知机制就是线程通讯的主要手段之一。 在 Java 中,线程等待和通知的实现手段有以下几种方式:Object 类下
  • 摸鱼心法第一章——和配置文件说拜拜

    为了能摸鱼我们团队做了容器化,但是带来的问题是服务配置文件很麻烦,然后大家在群里进行了“亲切友好”的沟通图片图片图片图片对比就对比,简单对比下独立配置中心和k8s作为配
  • 让我们一起聊聊文件的操作

    文件【1】文件是什么?文件是保存数据的地方,是数据源的一种,比如大家经常使用的word文档、txt文件、excel文件、jpg文件...都是文件。文件最主要的作用就是保存数据,它既可以保
  • 如何通过Python线程池实现异步编程?

    线程池的概念和基本原理线程池是一种并发处理机制,它可以在程序启动时创建一组线程,并将它们置于等待任务的状态。当任务到达时,线程池中的某个线程会被唤醒并执行任务,执行完任
  • 一文掌握 Golang 模糊测试(Fuzz Testing)

    模糊测试(Fuzz Testing)模糊测试(Fuzz Testing)是通过向目标系统提供非预期的输入并监视异常结果来发现软件漏洞的方法。可以用来发现应用程序、操作系统和网络协议等中的漏洞或
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • 微博大门常打开,迎接海外画师漂洋东渡

    作者:互联网那些事“起猛了,我能看得懂日语了”。“为什么日本人说话我能听懂?”“中文不像中文,日语不像日语,但是我竟然看懂了”…&hell
Top