当前位置:首页 > 科技  > 软件

一行 Python 代码搞定训练分类或回归模型

来源: 责编: 时间:2023-11-10 17:08:02 444观看
导读自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量,并加快了工作流程。AutoML 可用于自动化各种流水线组件,包括数据理解,EDA,数据处理,模型训练,超参数调整等。在本文中,我们

自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量,并加快了工作流程。AutoML 可用于自动化各种流水线组件,包括数据理解,EDA,数据处理,模型训练,超参数调整等。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

在本文中,我们将讨论如何使用开放源码的 Python 库 LazyPredict 来自动化模型训练过程。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

什么是 LazyPredict ?

Exb28资讯网——每日最新资讯28at.com

LazyPredict 是一个开源的 Python 库,它自动化了模型培训流水线并加快了工作流。LazyPredict 为一个分类数据集训练了大约30个分类模型,为一个回归数据集训练了大约40个回归模型。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

Lazypredicate 返回训练好的模型以及它的性能指标,而不需要编写很多代码。我们可以比较每个模型的性能指标,并优化最佳模型以进一步提高性能。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

安装

Exb28资讯网——每日最新资讯28at.com

可以通过以下方式从 PyPl 库安装 LazyPredict:Exb28资讯网——每日最新资讯28at.com

pip install lazypredict

安装完成后,可导入库进行分类和回归模型的自动训练。Exb28资讯网——每日最新资讯28at.com

from lazypredict.Supervised import LazyRegressor, LazyClassifier

用法

Lazypredicate 同时支持分类和回归问题,因此我们将进行这两个任务的演示:Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

波士顿住房(回归)和泰坦尼克号(分类)数据集用于演示 LazyPredict 库。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

() 分类任务:Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

LazyPredict 的使用非常直观,类似于 scikit-learn。首先,为分类任务创建一个估计器 LazyClassifier 的实例。可以通过自定义指标进行评估,默认情况下,每个模型都会根据准确度、ROC AUC 分数、F1 分数进行评估。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

在进行 lazypredict 预测模型训练之前,必须读取数据集并对其进行处理以使其适合训练。Exb28资讯网——每日最新资讯28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# Read the titanic datasetdf_cls = pd.read_csv("titanic.csv")df_cls = df_cls.drop(['PassengerId','Name','Ticket', 'Cabin'], axis=1)# Drop instances with null recordsdf_cls = df_cls.dropna()# feature processingdf_cls['Sex'] = df_cls['Sex'].replace({'male':1, 'female':0})df_cls['Embarked'] = df_cls['Embarked'].replace({'S':0, 'C':1, 'Q':2})# Creating train test splity = df_cls['Survived']X = df_cls.drop(columns=['Survived'], axis=1)# Call train test split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)

经过处理将数据拆分为训练测试数据后,我们可以使用 LazyPredict 进行模型训练。Exb28资讯网——每日最新资讯28at.com

# LazyClassifier Instance and fiting datacls= LazyClassifier(ignore_warnings=False, custom_metric=None)models, predictions = cls.fit(X_train, X_test, y_train, y_test)

Exb28资讯网——每日最新资讯28at.com

(2)回归任务:Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

类似于分类模型训练,lazypredicate 提供了用于回归数据集的自动模型训练。实现类似于分类任务,只是对实例 LazyRegressor 进行了更改。Exb28资讯网——每日最新资讯28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# read the datacolumn_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df_reg = pd.read_csv("housing.csv", header=None, delimiter=r"/s+", names=column_names)# Creating train test splity = df_reg['MEDV']X = df_reg.drop(columns=['MEDV'], axis=1)# Call train_test_split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)
reg = LazyRegressor(ignore_warnings=False, custom_metric=None)models, predictions = reg.fit(X_train, X_test, y_train, y_test)

Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

从以上性能指标来看,AdaBoost 分类器是分类任务的最佳执行模型,而 GradientBoostingRegressor 模型是回归任务的最佳执行模型。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

总结

Exb28资讯网——每日最新资讯28at.com

在本文中,我们讨论了 LazyPredict 库的实现,该库可以在几行 Python 代码中训练大约70个分类和回归模型。这是一个非常方便的工具,因为它提供了模型执行情况的总体图像,并且可以比较每个模型的性能。Exb28资讯网——每日最新资讯28at.com

Exb28资讯网——每日最新资讯28at.com

每个模型都使用其默认参数进行训练,因为它不执行超参数调整。选择性能最佳的模型后,开发人员可以调整模型以进一步提高性能。Exb28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-20054-0.html一行 Python 代码搞定训练分类或回归模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Python好用的可视化库(从低级到高级)

下一篇: Python文件读写实战:处理日常任务的终极工具!

标签:
  • 热门焦点
  • 影音体验是真的强 简单聊聊iQOO Pad

    大公司的好处就是产品线丰富,非常细分化的东西也能给你做出来,例如早先我们看到了新的vivo Pad2,之后我们又在iQOO Neo8 Pro的发布会上看到了iQOO的首款平板产品iQOO Pad。虽
  • 2023年Q2用户偏好榜:12+256G版本成新主流

    3月份的性能榜、性价比榜和好评榜之后,就要轮到2023年的第二季度偏好榜了,上半年的新机潮已经过去,最明显的肯定就是大内存和存储的机型了,另外部分中端机也取消了屏幕塑料支架
  • K8S | Service服务发现

    一、背景在微服务架构中,这里以开发环境「Dev」为基础来描述,在K8S集群中通常会开放:路由网关、注册中心、配置中心等相关服务,可以被集群外部访问;图片对于测试「Tes」环境或者
  • 量化指标是与非:挽救被量化指标扼杀的技术团队

    作者 | 刘新翠整理 | 徐杰承本文整理自快狗打车技术总监刘新翠在WOT2023大会上的主题分享,更多精彩内容及现场PPT,请关注51CTO技术栈公众号,发消息【WOT2023PPT】即可直接领取
  • “又被陈思诚骗了”

    作者|张思齐 出品|众面(ID:ZhongMian_ZM)如今的国产悬疑电影,成了陈思诚的天下。最近大爆电影《消失的她》票房突破30亿断层夺魁暑期档,陈思诚再度风头无两。你可以说陈思诚的
  • 阿里瓴羊One推出背后,零售企业迎数字化新解

    作者:刘旷近年来随着数字经济的高速发展,各式各样的SaaS应用服务更是层出不穷,但本质上SaaS大多局限于单一业务流层面,对用户核心关切的增长问题等则没有提供更好的解法。在Saa
  • OPPO Reno10 Pro英雄联盟定制礼盒公布:萨勒芬妮同款配色梦幻十足

    5月24日,OPPO推出了全新的OPPO Reno 10系列,包含OPPO Reno10、OPPO Reno10 Pro和OPPO Reno10 Pro+三款新机,全系标配了超光影长焦镜头,是迄今为止拍照
  • 苹果140W USB-C充电器:采用氮化镓技术

    据10 月 30 日 9to5 Mac 消息报道,当苹果推出新的 MacBook Pro 2021 时,该公司还推出了新的 140W USB-C 充电器,附赠在 MacBook Pro 16 英寸机型的盒子里,也支
  • 荣耀Magic4 至臻版 首创智慧隐私通话 强劲影音系统

    2022年第一季度临近尾声,在该季度内,许多品牌陆续发布自己的最新产品,让大家从全新的角度来了解当今的手机技术。手机是电子设备中,更新迭代十分迅速的一款产品,基
Top