当前位置:首页 > 科技  > 软件

一行 Python 代码搞定训练分类或回归模型

来源: 责编: 时间:2023-11-10 17:08:02 399观看
导读自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量,并加快了工作流程。AutoML 可用于自动化各种流水线组件,包括数据理解,EDA,数据处理,模型训练,超参数调整等。在本文中,我们

自动机器学习(Auto-ML)是指自动化数据科学模型开发流水线的组件。AutoML 减少了数据科学家的工作量,并加快了工作流程。AutoML 可用于自动化各种流水线组件,包括数据理解,EDA,数据处理,模型训练,超参数调整等。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

在本文中,我们将讨论如何使用开放源码的 Python 库 LazyPredict 来自动化模型训练过程。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

什么是 LazyPredict ?

iIm28资讯网——每日最新资讯28at.com

LazyPredict 是一个开源的 Python 库,它自动化了模型培训流水线并加快了工作流。LazyPredict 为一个分类数据集训练了大约30个分类模型,为一个回归数据集训练了大约40个回归模型。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

Lazypredicate 返回训练好的模型以及它的性能指标,而不需要编写很多代码。我们可以比较每个模型的性能指标,并优化最佳模型以进一步提高性能。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

安装

iIm28资讯网——每日最新资讯28at.com

可以通过以下方式从 PyPl 库安装 LazyPredict:iIm28资讯网——每日最新资讯28at.com

pip install lazypredict

安装完成后,可导入库进行分类和回归模型的自动训练。iIm28资讯网——每日最新资讯28at.com

from lazypredict.Supervised import LazyRegressor, LazyClassifier

用法

Lazypredicate 同时支持分类和回归问题,因此我们将进行这两个任务的演示:iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

波士顿住房(回归)和泰坦尼克号(分类)数据集用于演示 LazyPredict 库。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

() 分类任务:iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

LazyPredict 的使用非常直观,类似于 scikit-learn。首先,为分类任务创建一个估计器 LazyClassifier 的实例。可以通过自定义指标进行评估,默认情况下,每个模型都会根据准确度、ROC AUC 分数、F1 分数进行评估。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

在进行 lazypredict 预测模型训练之前,必须读取数据集并对其进行处理以使其适合训练。iIm28资讯网——每日最新资讯28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# Read the titanic datasetdf_cls = pd.read_csv("titanic.csv")df_cls = df_cls.drop(['PassengerId','Name','Ticket', 'Cabin'], axis=1)# Drop instances with null recordsdf_cls = df_cls.dropna()# feature processingdf_cls['Sex'] = df_cls['Sex'].replace({'male':1, 'female':0})df_cls['Embarked'] = df_cls['Embarked'].replace({'S':0, 'C':1, 'Q':2})# Creating train test splity = df_cls['Survived']X = df_cls.drop(columns=['Survived'], axis=1)# Call train test split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)

经过处理将数据拆分为训练测试数据后,我们可以使用 LazyPredict 进行模型训练。iIm28资讯网——每日最新资讯28at.com

# LazyClassifier Instance and fiting datacls= LazyClassifier(ignore_warnings=False, custom_metric=None)models, predictions = cls.fit(X_train, X_test, y_train, y_test)

iIm28资讯网——每日最新资讯28at.com

(2)回归任务:iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

类似于分类模型训练,lazypredicate 提供了用于回归数据集的自动模型训练。实现类似于分类任务,只是对实例 LazyRegressor 进行了更改。iIm28资讯网——每日最新资讯28at.com

import pandas as pdfrom sklearn.model_selection import train_test_split# read the datacolumn_names = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']df_reg = pd.read_csv("housing.csv", header=None, delimiter=r"/s+", names=column_names)# Creating train test splity = df_reg['MEDV']X = df_reg.drop(columns=['MEDV'], axis=1)# Call train_test_split on the data and capture the resultsX_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.2)
reg = LazyRegressor(ignore_warnings=False, custom_metric=None)models, predictions = reg.fit(X_train, X_test, y_train, y_test)

iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

从以上性能指标来看,AdaBoost 分类器是分类任务的最佳执行模型,而 GradientBoostingRegressor 模型是回归任务的最佳执行模型。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

总结

iIm28资讯网——每日最新资讯28at.com

在本文中,我们讨论了 LazyPredict 库的实现,该库可以在几行 Python 代码中训练大约70个分类和回归模型。这是一个非常方便的工具,因为它提供了模型执行情况的总体图像,并且可以比较每个模型的性能。iIm28资讯网——每日最新资讯28at.com

iIm28资讯网——每日最新资讯28at.com

每个模型都使用其默认参数进行训练,因为它不执行超参数调整。选择性能最佳的模型后,开发人员可以调整模型以进一步提高性能。iIm28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-26-20054-0.html一行 Python 代码搞定训练分类或回归模型

声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com

上一篇: Python好用的可视化库(从低级到高级)

下一篇: Python文件读写实战:处理日常任务的终极工具!

标签:
  • 热门焦点
  • 卢伟冰长文解析K60至尊版 对Redmi有着里程碑式的意义

    在今天的Redmi后性能时代战略发布会结束之后,Redmi总经理卢伟冰又带来了一篇长文,详解了为什么 Redmi 要开启后性能时代?为什么选择和 MediaTek、Pixelworks 深度合作?以及后性
  • 从 Pulsar Client 的原理到它的监控面板

    背景前段时间业务团队偶尔会碰到一些 Pulsar 使用的问题,比如消息阻塞不消费了、生产者消息发送缓慢等各种问题。虽然我们有个监控页面可以根据 topic 维度查看他的发送状态,
  • 微信语音大揭秘:为什么禁止转发?

    大家好,我是你们的小米。今天,我要和大家聊一个有趣的话题:为什么微信语音不可以转发?这是一个我们经常在日常使用中遇到的问题,也是一个让很多人好奇的问题。让我们一起来揭开这
  • 三万字盘点 Spring 九大核心基础功能

    大家好,我是三友~~今天来跟大家聊一聊Spring的9大核心基础功能。话不多说,先上目录:图片友情提示,本文过长,建议收藏,嘿嘿嘿!一、资源管理资源管理是Spring的一个核心的基础功能,不
  • 虚拟键盘 API 的妙用

    你是否在遇到过这样的问题:移动设备上有一个固定元素,当激活虚拟键盘时,该元素被隐藏在了键盘下方?多年来,这一直是 Web 上的默认行为,在本文中,我们将探讨这个问题、为什么会发生
  • 最“俊美”淘宝卖家,靠直播和短视频圈粉,上架秒光,年销3000万

    来源 | 电商在线文|易琬玉编辑|斯问受访店铺:Ringdoll戒之人形图源:微博@御座的黄山、“Ringdoll戒之人形”淘宝店铺有关外貌的评价,黄山已经听累了。生于1985年的他,哪
  • 阿里大调整

    来源:产品刘有媒体报道称,近期淘宝天猫集团启动了近年来最大的人力制度改革,涉及员工绩效、层级体系等多个核心事项,目前已形成一个初步的“征求意见版”:1、取消P序列
  • 7月4日见!iQOO 11S官宣:“鸡血版”骁龙8 Gen2+200W快充加持

    上半年已接近尾声,截至目前各大品牌旗下的顶级旗舰都已悉数亮相,而下半年即将推出的顶级旗舰已经成为了数码圈爆料的主流,其中就包括全新的iQOO 11S系
  • OPPO K11搭载高性能石墨散热系统:旗舰同款 性能凉爽释放

    日前OPPO官方宣布,将于7月25日14:30举办新品发布会,届时全新的OPPO K11将正式与大家见面,将主打旗舰影像,和同档位竞品相比,其最大的卖点就是将配备索尼
Top