【特选材料|关联规则数据挖掘[特选材料]( 四 )】关联|规则|数据|挖掘|选材-学习资料

按关键词阅读： 选材挖掘数据规则关联特选材料

IBM SPSS Modeler是一个数据挖掘软件，其功能涵盖了整个数据挖掘流程，它主要提供三类重要功能来支持整个数据挖掘过程:数据整理、探索性数据分析、建立模型模型检验模型应用。
3.数据处理SPSS Modeler需要数据格式为csv 。
在刚刚介绍的WEKA软件中可以将txt格式的数据另存为csv格式的数据。
6 数据挖掘（1） WEKA1.Apriori算法小数据1）默认数值car如果设为真，则会挖掘类关联规则而不是全局关联规则。
classindex类属性索引。
如果设置为-1 ，最后的属性被当做类属性。
delta以0.05为迭代递减单位。
不断减小。

21、支持度直至达到最小支持度或产生了满足数量要求的规则。
lowerBoundMinSupport最小支持度下界为0.5 。
metricType度量类型。
设置对规则进行排序的度量依据。
可以是：置信度（类关联规则只能用置信度挖掘），提升度(lift) ，杠杆率(leverage) ，确信度(conviction) 。
在Weka中设置了几个类似置信度(confidence)的度量来衡量规则的关联程度，它们分别是：a)Lift：P(A,B)/(P(A)P(B) Lift=1时表示A和B独立。
这个数越大(1) ，越表明A和B存在于一个购物篮中不是偶然现象,有较强的关联度.b)Leverage :P(A,B)-P(A) 。

22、P(B)Leverage=0时A和B独立， Leverage越大A和B的关系越密切c)Conviction:P(A)P(!B)/P(A,!B)（!B表示B没有发生）Conviction也是用来衡量A和B的独立性。
从它和lift的关系（对B取反，代入Lift公式后求倒数）可以看出，这个值越大, A、B越关联。
minMtric度量的最小值0.9 。
numRules要发现的规则数为10 。
outputItemSets如果设置为真，会在结果中输出项集。
removeAllMissingCols移除全部为缺省值的列。
significanceLevel重要程度-0.1 。
重要性测试（仅用于置信度）。
upperBou 。

23、ndMinSupport最小支持度上界。
从1.0开始迭代减小最小支持度。
verbose如果设置为真，则算法会以冗余模式运行。
2）结果解释scheme -所选的关联规则挖掘方案：Apriori算法算法的参数设置：-I -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.5 -S -1.0 -c -1 ;
各参数依次表示：I -输出项集，若设为false则该值缺省;
N 10 -规则数为10;
T 0 度量单位选为置信度， (T1-提升度， T2杠杆率， T3确信度);
C 0.9 度量的最小值为0.9;
D 0.05 -递减迭代值为0.05;
U 1.0 -最小支持度上界为1.0;
M 0. 。

24、5 -最小支持度下届设为0.5;
S -1.0 -重要程度为-1.0;
c -1 -类索引为-1输出项集设为真(由于car, removeAllMissingCols, verbose都保持为默认值False ，因此在结果的参数设置为缺省，若设为True ，则会在结果的参数设置信息中分别表示为A, R,V)Minimum support: 0.5 (470 instances)/最小支持度0.5 ，即最少需要470个实例Minimum metric : 0.9/最小度量: 0.9Number of cycles performed: 10/进行了10轮搜索Generated sets of large。

25、itemsets:/生成的频繁项集Size of set of large itemsets L(1): 11/频繁1项集：11个剩余结果3）修改数值delta以0.1为迭代递减单位。
不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。
结果如下：4）结果解释scheme -所选的关联规则挖掘方案：Apriori算法算法的参数设置：-I -N 10 -T 0 -C 0.9 -D 0.1 -U 1.0 -M 0.5 -S -1.0 -c -1 ;
各参数依次表示：I -输出项集，若设为false则该值缺省;
N 10 -规则数为10;
T 0 度量单位选为置信度， (T1-提升度， T2杠杆率， T3 。

26、确信度);
C 0.9 度量的最小值为0.9;
D 0.1 -递减迭代值为0.1;
U 1.0 -最小支持度上界为1.0;
M 0.5 -最小支持度下届设为0.5;
S -1.0 -重要程度为-1.0;
c -1 -类索引为-1输出项集设为真(由于car, removeAllMissingCols, verbose都保持为默认值False ，因此在结果的参数设置为缺省，若设为True ，则会在结果的参数设置信息中分别表示为A, R,V)Minimum support: 0.5 (470 instances)/最小支持度0.5 ，即最少需要470个实例Minimum metric : 1.1/最小度量: 1.1N 。

27、umber of cycles performed: 3/进行了3轮搜索Generated sets of large itemsets:/生成的频繁项集Size of set of large itemsets L(1): 11/频繁1项集：11个Size of set of large itemsets L(2): 39/频繁1项集：39个Size of set of large itemsets L(3):4/频繁1项集：4个2.FP-Growth算法大数据1）默认数值delta以0.05为迭代递减单位。
不断减小支持度直至达到最小支持度或产生了满足数量要求的规则。
lowerBoundMi 。

28、nSupport最小支持度下界为0.5 。
metricType度量类型。
设置对规则进行排序的度量依据。

来源：(未知)

【学习资料】网址：/a/2021/0321/0021742736.html

标题：特选材料|关联规则数据挖掘[特选材料]( 四 )

傻大方

特选材料|关联规则数据挖掘[特选材料]( 四 )

体育课|体育课注意事项

公交站台候车亭施工方案[项目材料]

孕期|中孕期超声检查宫颈变化的临床意义课件

体育课|体育课教案高二5篇

自己|画扇‘窗’给自己作文700字

VSD|VSD负压引流的术后护理课件

特选材料|关联规则数据挖掘[特选材料]

别想让|你别想让河马走开

公交首末站建设标准[项目材料]

中心静脉置管护理PPT|中心静脉置管的护理课件