刚刚发布了2.0版本,只需要写上几行Python代码
萧箫 发自 凹非寺
Python开源机器学习建模库 PyCaret , 刚刚发布了2.0版本 。
文章图片
从数据预处理到模型效果对比 , PyCaret都能 自动实现 。
所以 , PyCaret长啥样 , 2.0的版本又做了什么改进?
一起来看看 。
PyCaret说白了 , 有点像一个机器学习库的 炼丹炉 。
数据处理:pandas、numpy…
数据可视化:matplotlib、seaborn…
各种模型:sklearn、xgboost、catboost、lightgbm…
嗯…sklearn直接就给封装进去了 , 调用很方便 。
PyCaret这个炼丹炉 , 自带功能“按键” (定义了一些函数)包括数据预处理、模型训练、模型集成、模型分析、模型等 。
只需要写上几行Python代码 , 这些功能“按键”就会被按下 , PyCaret自动帮你实现 。
至于实现过程中需要调用什么基本库 , 那些 可以放弃思考不需要考虑 。
从下图来看 , 仅仅是 预处理阶段 , 就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能 。
文章图片
如果要实现必需的预处理功能 , 需要多少行代码来调用?
答案是 0行 。
因为 , 当使用setup进行初始化时 , PyCaret将 自动执行机器学习必需的数据预处理步骤 , 包括缺失值插入、分类变量编码、编码、数据集拆分等 。
例如 , 在数据处理前 , 你发现数据集有空缺的地方 (下图中NaN部分)
文章图片
别怕 , PyCaret会自动分析数据 , 进行缺失值插入 。
文章图片
【刚刚发布了2.0版本,只需要写上几行Python代码】预处理后 , PyCaret还贴心地帮你准备了各种模型 。
从模型训练、选用到 , 只有你想不到的 , 没有它做不了的 。
如果已经将数据处理好 , 并交给PyCaret , 一个 compare_models函数就能 训练库中的所有模型 , 进行结果比较后 , 标出最佳模型 。
如下图 , 各种模型指标的最优值会被一键标黄 , 就看你怎么选择了 。
文章图片
选好后 , 想对模型进行一点优化?一个 tune_model函数就能帮你搞定 。
或者 , 不想仅仅选用一个模型?
PyCaret也准备了 模型集成的函数 , blend和stack任你选 。
除此之外 , 模型参数的分析 (包括可视化)也只需要几行代码就能实现 , 功能非常强大 。
文章图片
- 威锋网微星发布新款显示器:支持 165Hz 刷新率
- 北青网综合|上海发布高温黄色预警,预计中心城区最高气温可达35℃
- 央视新闻客户端|教育部、国家邮政局联合发布:坚决杜绝录取通知书丢失损毁
- 上海发布高温黄色预警,预计中心城区最高气温可达35℃
- 每经午时丨恒大发布恒驰首期六款车
- 干衣机|米家互联网热泵干衣机发布:35分钟快烘 3499元
- 黑龙江省发布暴雨橙色预警信号
- 发布会|Google Pixel 4a发布会近日召开 或有5G机型亮相
- 复产|英国三分之二企业全面复工
- 《八佰》官方发布声明 否认下发发行通知