支持向量机:如何对不可分数据进行分类?
全文共1107字 , 预计学习时长3分钟
文章插图
图源:unsplash
在机器学习中 , 支持向量模型用于基于相关学习算法的监督学习 , 该算法用于分类和基于回归的分析 。 如果有数据示例被标记为属于其中一类 , 那么支持向量机训练算法会把新数据分配给其中一类作为非概率二元线性分类器 。
支持向量机模型是数据点在空间中的一种表示 , 映射到每一类中 , 从而使单独类的数据示例由最大化的明确间隔来划分 。 然后 , 新数据的示例被映射到同一空间 , 并根据它们落在间隔的哪一侧来预测它们属于哪一类 。
除了线性分类外 , 支持向量机还可以使用核技巧对非线性数据进行分类 。 当无法进行监督学习且数据未被标记时 , 采用数据聚类方法将数据归类 , 此时该学习不受监督 , 并采用支持向量聚类算法 。 该支持向量算法用于将未标记的数据归入到其最接近的类别 。
当原始问题在有限维平面上表示时 , 线性空间可能无法实现对数据的分类 。 因此 , 本文提出了一种高维的数据分离和分类方法 , 以保持较低的计算量 , 从而可以通过定义核函数来轻松地在空间中计算输入向量对 。
核技巧
核技巧实际上是在一个平面上给出一个解 , 而这个解本来并不存在于问题中 。 如果可以得到如下这组数据 , 你就会发现 , 这些数据不能用直线进行线性分类 。
文章插图
如果有下图中x-y轴的值 , 并将其绘制在x-y的二维平面上 , 就会发现其无法分类 。
文章插图
如果要添加一个新的平面 , 就需要有一个三维值 , 该值可轻松地分类红色和绿色数据点 。 此处尝试3个方程:
· x+y
· xy
· x**2
如上表所示 , 可以清楚地看到xy公式用数值0和2将红色和绿色的数据点分离 。
文章插图
现在添加第三维度作为z轴 , 并在其上绘制xy的值 。 可以看到 , 当红色数据点下降 , 绿色数据点上升时 , 这些数据点很容易分离 。
文章插图
在线性空间中 , 我们知道解在xy=0和xy=2之间 , 即xy=1 , y=1/x , 正是上图所示的线形 。
此外 , 我们还需注意 , 在高维特征空间中运行会增加支持向量机的泛化误差 , 但在样本量足够大的情况下 , 该算法仍能很好执行 。
文章插图
留言点赞关注
我们一起分享AI学习与发展的干货
【支持向量机:如何对不可分数据进行分类?】如转载 , 请后台留言 , 遵守转载规范
- 页面|如何简单、快速制作流程图?上班族的画图技巧get
- 光晕|PS插件:Oniric Glow Generator (光晕效果)支持ps 2021
- 培育|跨境电商人才如何培育,长沙有“谱”了
- 抖音小店|抖音进军电商,短视频的商业模式与变现,创业者该如何抓住机遇?
- 无国界|嘴上说着支持华为,却为苹果贡献了2000亿!还真是科技无国界啊?
- 计费|5G是如何计费的?
- 车轮旋转|牵引力控制系统是如何工作的?它有什么作用?
- 视频|短视频如何在前3秒吸引用户眼球?
- Vlog|中国Vlog|中国基建如何升级?看5G+智慧工地
- 涡轮|看法米特涡轮流量计如何让你得心应手