按关键词阅读: 选材 挖掘 数据 规则 关联 特选材料
可以是:置信度(类关联规则只能用置信度挖掘) , 提升度(lift) , 杠杆率(leverage) , 确信度(conviction) 。
在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度 , 它们分别是:a)Lift:P(A,B)/(P(A)P(B) Lift=1时表示A和B独立 。
这个数越大(1) , 越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage :P(A,B)-P(A)P(B)Leverage=0时A和B独立 , Leverage越大A和B的关系越 。
29、密切c)Conviction:P(A)P(!B)/P(A,!B)(!B表示B没有发生)Conviction也是用来衡量A和B的独立性 。
从它和lift的关系(对B取反 , 代入Lift公式后求倒数)可以看出 , 这个值越大, A、B越关联 。
minMtric度量的最小值0.9 。
numRules要发现的规则数为10 。
outputItemSets如果设置为真 , 会在结果中输出项集 。
removeAllMissingCols移除全部为缺省值的列 。
upperBoundMinSupport最小支持度上界 。
从1.0开始迭代减小最小支持度 。
2)结果解释使用默认设置数值没有发现规则 。
3) 修改数值修改lowerBoundMi 。
30、nSupport最小支持度下界为0.2 。
4)结果解释仅发现两条规则 。
I48与I39 有关联规则 conf:(0.69) lev:(0.06) cosv:(1.38)5) 修改数值修改lowerBoundMinSupport最小支持度下界为0.1 。
6) 结果解释发现8条规则7)修改数值修改lowerBoundMinSupport最小支持度下界为0.25 。
8)结果解释发现如下(二)IBM SPSS Modeler大数据1.操作步骤Apriori算法读取值然后将测量全部修改为标记 , 角色全部改为任意 。
最小置信度为50%结果分析:I48与I39 有关联规则 I41与I39 有关联规则 I39与I38有关 。
31、联规则 I48与I41 有关联规则 I42与I39 有关联规则 I48与I32 有关联规则I48与I38 有关联规则 最小置信度为60%I48与I39 有关联规则 I41与I39 有关联规则 I39与I38有关联规则 I48与I41 有关联规则 7 总结数据挖掘可以通过不同的工具来进行分析 。
通过使用WEKA和IBM SPSS Modeler发现两个软件适用的情况有所不同 。
WEKA的关联规则Apriori分析仅能用来作示范 , 不适合用来挖掘大型数据集 。
但是FPGrowth算法可以有效地处理大数据 , 修改不同的数值得出不同的结果 。
而且在显示的结果中看到置信度等数值结果 。
IBM SPSS Modeler需要修改数据的TYPE , 如读取值和输入输出 , 选择各种不同的模型 , 使输出的结果更加有效的解决实际问题 。
但是在操作的过程中 , 我们发现IBM SPSS Modeler建模运行的时候很慢 , 需要等待很长时间才能完成 , 而且需要修改的数值是分为不同的选项卡 , 一旦选定生成无法更改 , 过程不可逆 , 所以在修改数值查看不同结果时十分不方便 。
而WEKA可以反复查看不同的结果 。
材料a 。
来源:(未知)
【学习资料】网址:/a/2021/0321/0021742736.html
标题:特选材料|关联规则数据挖掘[特选材料]( 五 )