读芯术七个关键因素:如何选择出最佳机器学习算法?( 二 )


众所周知 , 神经网络需要大量的时间来训练一个模型 。 传统的机器算法 , 如k近邻算法和逻辑回归算法 , 花费的时间要少得多 。 一些算法 , 如随机森林 , 需要根据所使用的CPU内核不同的训练时间 。
预测时间
预测时间是模型进行预测所需要的时间 。 对于产品通常是搜索引擎或在线零售商店的互联网公司来说 , 快速预测时间是用户体验顺畅的关键 。 在这些情况下 , 速度非常重要 , 如果预测速度太慢 , 即使有良好结果的算法也没有用 。
然而 , 在一些业务需求中 , 准确性比预测时间更重要 。 比如在我们前面提到的癌细胞的例子中 , 或者在检测欺诈交易时 。 支持向量机、线性回归、逻辑回归和几种类型的神经网络等算法可以进行快速预测 。 然而 , 像KNN和ensemble模型这样的算法通常需要更多的时间来进行预测 。
读芯术七个关键因素:如何选择出最佳机器学习算法?
本文插图
【读芯术七个关键因素:如何选择出最佳机器学习算法?】图源:unsplash
存储需求
如果可以将整个数据集加载到服务器或计算机的RAM中 , 则可以应用大量算法 。 然而 , 当这是不可能的 , 你可能需要采用增量学习算法 。
增量学习是一种机器学习方法 , 通过输入数据不断地扩展已有模型的知识 , 即进一步训练模型 。 增量学习算法的目的是适应新的数据而不忘记已有的知识 , 因此不需要对模型进行再训练 。
在为机器学习任务选择算法时 , 性能似乎是最明显的指标 。 但仅凭性能还不足以选择出最佳算法 , 你的模型需要满足其他标准 , 如内存需求、训练和预测时间、可解释性和数据格式 。 通过综合更广泛的因素 , 你可以做出更自信的决定 。 如果很难在几个选定的模型中选择最佳算法 , 你也可以在验证数据集上测试它们 。
当决定实现一个机器学习模型时 , 选择正确的模型意味着分析你的需求和预期结果 。 虽然这可能需要一些额外的时间和努力 , 但回报是更高的准确性和改进的性能 。
读芯术七个关键因素:如何选择出最佳机器学习算法?
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
如转载 , 请后台留言 , 遵守转载规范
本文为***作者原创 , 未经授权不得转载