当前位置:首页 > 科技  > 软件

Keras 3.0正式发布!一统TF/PyTorch/Jax三大后端框架,网友:改变游戏规则

来源: 责编: 时间:2023-11-30 09:28:48 340观看
导读Keras 3.0正式发布,被誉为改变了机器学习游戏规则:不仅支持TensorFlow、PyTorch、Jax三大框架作为后端,还能在它们之间无缝切换,甚至混合使用。图片Keras之父François Chollet认为,这样至少可以获得4大好处:始终让模型获得

Keras 3.0正式发布,被誉为改变了机器学习游戏规则:Qpd28资讯网——每日最新资讯28at.com

不仅支持TensorFlow、PyTorch、Jax三大框架作为后端,还能在它们之间无缝切换,甚至混合使用。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

Keras之父François Chollet认为,这样至少可以获得4大好处:Qpd28资讯网——每日最新资讯28at.com

  • 始终让模型获得最佳性能:

JAX通常在GPU、CPU各种PU上都最快,但不使用XLA(加速线性代数)的Tensorflow在GPU上偶尔更快。Qpd28资讯网——每日最新资讯28at.com

Keras 3.0能够动态为模型提供最佳性能的后端,而无需更改代码,保证以最高效率运行。Qpd28资讯网——每日最新资讯28at.com

  • 解锁多个生态系统

任何Keras 3模型都可以作为PyTorch模块实例化,可以导出为TF的SavedModel,或者可以实例化为无状态的 JAX 函数。Qpd28资讯网——每日最新资讯28at.com

这意味着可以将Keras 3模型与PyTorch生态的包,TensorFlow中的部署工具或生产工具,以及JAX大规模TPU训练基础设施一起使用,获得机器学习世界所提供的一切。Qpd28资讯网——每日最新资讯28at.com

  • 在开源社区扩大影响力

如果使用纯TensorFlow或PyTorch实现一个开源模型,都只有大约一半的人能使用。Qpd28资讯网——每日最新资讯28at.com

但如果使用Keras 3,任何人无论偏好哪个框架,(即使不是 Keras 用户)都能立刻使用。在不增加开发成本的情况下,使影响力翻倍。Qpd28资讯网——每日最新资讯28at.com

  • 使用任何来源的数据管道

无论使用哪个后端,Keras 3 都能与tf.data.Dataset对象、PyTorch DataLoader对象、NumPy 数组、Pandas数据框兼容。Qpd28资讯网——每日最新资讯28at.com

这意味着可以在PyTorch DataLoader上训练Keras 3 + TensorFlow模型,或在 tf.data.Dataset上训练Keras 3 + PyTorch模型。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

不少人都对这一进展表示祝贺,项目参与者、谷歌高级工程师Aakash Kumar Nain认为:Qpd28资讯网——每日最新资讯28at.com

Keras 3再次展示了心智模型的重要性。开发API 是一方面,而开发一个拥有出色心智模型的API则完全是另一个层次的工程实践。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

也有开发者表示:Qpd28资讯网——每日最新资讯28at.com

很高兴能够通过熟悉的Keras API获得框架可选性,让简单的用例变得容易,复杂的用例也成为可能。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

欢迎来到多框架机器学习

Keras 3.0发布公告中开篇写到,欢迎来到多框架机器学习。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

具体来说,Keras 3.0完全重写了框架API,并使其可用于TensorFlow、JAX和PyTorch。Qpd28资讯网——每日最新资讯28at.com

任何仅使用内置层的Keras模型都将立即与所有支持的后端配合使用。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

使用Keras 3可以创建在任何框架中都能以相同方式工作的组件,允许访问跨所有后端运行的keras.ops命名空间。Qpd28资讯网——每日最新资讯28at.com

只要仅使用keras.ops中的ops,自定义层、损失、指标和优化器等就可以使用相同的代码与JAX、PyTorch和TensorFlow配合使用。这意味着只需维护一个组件实现,就可以在所有框架中使用完全相同的数值。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

除此之外,还发布了用于大规模数据并行和模型并行的新分布式API,为多设备模型分片问题提供Keras风格的解决方案。Qpd28资讯网——每日最新资讯28at.com

为此设计的API使模型定义、训练逻辑和分片配置完全独立,这意味可以像在单个设备上运行一样编写代码,然后在训练任意模型时将任意分片配置添加到任意模型中。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

不过新的分布式API目前仅适用于JAX后端,TensorFlow和PyTorch支持即将推出。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

为适配JAX,还发布了用于层、模型、指标和优化器的新无状态API,添加了相关方法。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

这些方法没有任何副作用,它们将目标对象的状态变量的当前值作为输入,并返回更新值作为其输出的一部分。Qpd28资讯网——每日最新资讯28at.com

用户不用自己实现这些方法,只要实现了有状态版本,它们就会自动可用。Qpd28资讯网——每日最新资讯28at.com

如果从Keras 2迁移到3,使用tf.keras开发的代码通常可以按原样在Keras 3中使用Tensorflow后端运行。有限数量的不兼容之处也给出了迁移指南。Qpd28资讯网——每日最新资讯28at.com

在旧版Keras 2中开发的预训练模型通常也可以在Keras 3中使用TensorFlow后端开箱即用。Qpd28资讯网——每日最新资讯28at.com

如果旧版模型仅使用了Keras内置层,那么也可以在Keras 3中使用JAX和PyTorch后端开箱即用。Qpd28资讯网——每日最新资讯28at.com

也有人敲警钟

在迫不及待尝试新版本的开发社区氛围中,Cohere机器学习总监Nils Reimers提出“真心希望历史不要重演”,也获得不少关注。Qpd28资讯网——每日最新资讯28at.com

图片图片Qpd28资讯网——每日最新资讯28at.com

Reimers认为,Keras最初从支持单个后端(Theano)开始,陆续添加了Tensorflow、MXNet和CNTK等多后端。Qpd28资讯网——每日最新资讯28at.com

这引发了一系列问题:Qpd28资讯网——每日最新资讯28at.com

  • 某些功能只在特定后端可用
  • 各个后端的计算结果存在不一致:在一个后端上运行正常的代码,在另一个后端可能产生不同结果
  • 对于开源软件开发者来说体验糟糕:你刚完成了一个自定义的 Keras层想要分享?你是否愿意为其他后端重新实现和优化它呢?
  • 调试问题:代码在一个后端上表现完美,但在另一个后端的最新版本上却频繁出错…

随着时间推移,这些问题愈发严重:某些模块只能在 Theano 上运行良好,某些只适用于Tensorflow,还有一些模块可以在MXNet上进行推理,但无法训练…Qpd28资讯网——每日最新资讯28at.com

因此,2019年Keras转向单一后端(Tensorflow),是保障这一伟大项目继续存在的关键之举。Qpd28资讯网——每日最新资讯28at.com

我希望这一次的多后端能有更好的表现,但这无疑仍是一个挑战。Qpd28资讯网——每日最新资讯28at.com

您是否需要等到像FlashAttention v2这样的重要特性在JAX、TensorFlow和PyTorch 上都可用后,才能在 Keras 中使用它?还是说您只能在某些特定后端中使用它?Qpd28资讯网——每日最新资讯28at.com

对于未来,我们还面临着许多未解决的挑战。Qpd28资讯网——每日最新资讯28at.com

参考链接:
[1]https://keras.io/keras_3/[2]https://x.com/sampathweb/status/1729556960314339534[3]https://twitter.com/Nils_Reimers/status/1729612017340657993Qpd28资讯网——每日最新资讯28at.com


Qpd28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-35300-0.htmlKeras 3.0正式发布!一统TF/PyTorch/Jax三大后端框架,网友:改变游戏规则

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: 线程包括哪些状态,状态之间是如何变化?

下一篇: 一篇学会如何使用Trait来定义接口?

标签:
  • 热门焦点
  • 官方承诺:K60至尊版将会首批升级MIUI 15

    全新的MIUI 15今天也有了消息,在官宣了K60至尊版将会搭载天玑9200+处理器和独显芯片X7的同时,Redmi给出了官方承诺,K60至尊重大更新首批升级,会首批推送MIUI 15。也就是说虽然
  • 小米降噪蓝牙耳机Necklace分享:听一首歌 读懂一个故事

    在今天下午的小米Civi 2新品发布会上,小米还带来了一款新的降噪蓝牙耳机Necklace,我们也在发布结束的第一时间给大家带来这款耳机的简单分享。现在大家能见到最多的蓝牙耳机
  • 6月iOS设备性能榜:M2稳居榜首 A系列只能等一手3nm来救

    没有新品发布,自然iOS设备性能榜的上榜设备就没有什么更替,仅仅只有跑分变化而产生的排名变动,毕竟苹果新品的发布节奏就是这样的,一年下来也就几个移动端新品,不会像安卓厂商,一
  • 一篇聊聊Go错误封装机制

    %w 是用于错误包装(Error Wrapping)的格式化动词。它是用于 fmt.Errorf 和 fmt.Sprintf 函数中的一个特殊格式化动词,用于将一个错误(或其他可打印的值)包装在一个新的错误中。使
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 华为Mate 60保护壳曝光:硕大后置相机模组 凸起程度有惊喜

    这段时间以来,关于华为新旗舰的爆料日渐密集。据此前多方爆料,今年华为将开始恢复一年双旗舰战略,除上半年推出的P60系列外,往年下半年的Mate系列也将
  • 质感不错!OPPO K11渲染图曝光:旗舰IMX890传感器首次下放

    一直以来,OPPO K系列机型都保持着较为均衡的产品体验,历来都是2K价位的明星机型,去年推出的OPPO K10和OPPO K10 Pro两款机型凭借各自的出色配置,堪称有
  • 上海举办人工智能大会活动,建设人工智能新高地

    人工智能大会在上海浦江两岸隆重拉开帷幕,人工智能新技术、新产品、新应用、新理念集中亮相。8月30日晚,作为大会的特色活动之一的上海人工智能发展盛典人工
  • 电博会与软博会实现"线下+云端"的双线融合

    在本次“电博会”与“软博会”双展会利好条件的加持下,既可以发挥展会拉动人流、信息流、资金流实现快速交互流动的作用,继而推动区域经济良性发展;又可以聚
Top