刚刚发布了2.0版本,只需要写上几行Python代码

萧箫 发自 凹非寺
Python开源机器学习建模库 PyCaret , 刚刚发布了2.0版本 。
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
从数据预处理到模型效果对比 , PyCaret都能 自动实现 。
所以 , PyCaret长啥样 , 2.0的版本又做了什么改进?
一起来看看 。
PyCaret说白了 , 有点像一个机器学习库的 炼丹炉 。
数据处理:pandas、numpy…
数据可视化:matplotlib、seaborn…
各种模型:sklearn、xgboost、catboost、lightgbm…
嗯…sklearn直接就给封装进去了 , 调用很方便 。
PyCaret这个炼丹炉 , 自带功能“按键” (定义了一些函数)包括数据预处理、模型训练、模型集成、模型分析、模型等 。
只需要写上几行Python代码 , 这些功能“按键”就会被按下 , PyCaret自动帮你实现 。
至于实现过程中需要调用什么基本库 , 那些 可以放弃思考不需要考虑 。
从下图来看 , 仅仅是 预处理阶段 , 就包含样本划分、数据预处理、缺失值处理、归一化、独热编码等功能 。
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
如果要实现必需的预处理功能 , 需要多少行代码来调用?
答案是 0行 。
因为 , 当使用setup进行初始化时 , PyCaret将 自动执行机器学习必需的数据预处理步骤 , 包括缺失值插入、分类变量编码、编码、数据集拆分等 。
例如 , 在数据处理前 , 你发现数据集有空缺的地方 (下图中NaN部分)
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
别怕 , PyCaret会自动分析数据 , 进行缺失值插入 。
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
【刚刚发布了2.0版本,只需要写上几行Python代码】预处理后 , PyCaret还贴心地帮你准备了各种模型 。
从模型训练、选用到 , 只有你想不到的 , 没有它做不了的 。
如果已经将数据处理好 , 并交给PyCaret , 一个 compare_models函数就能 训练库中的所有模型 , 进行结果比较后 , 标出最佳模型 。
如下图 , 各种模型指标的最优值会被一键标黄 , 就看你怎么选择了 。
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
选好后 , 想对模型进行一点优化?一个 tune_model函数就能帮你搞定 。
或者 , 不想仅仅选用一个模型?
PyCaret也准备了 模型集成的函数 , blend和stack任你选 。
除此之外 , 模型参数的分析 (包括可视化)也只需要几行代码就能实现 , 功能非常强大 。
刚刚发布了2.0版本,只需要写上几行Python代码
文章图片
刚刚发布了2.0版本,只需要写上几行Python代码