【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法( 二 )


【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
图2(a)信道编号为3 , 统计电平值较低 , 多数集中在-76.45dBm左右 , 且处于动态判决门限以下 , 被认定为噪声信道;图2(b)信道编号为61 , 统计电平值较高 , 多数集中在-67.45dBm左右 , 且处于动态判决门限以上 , 被认定为信号信道 。
各个信道的幅度-频率信号被动态门限分割之后就形成了CSI矩阵 , 如图3所示(图中黑色实心方块表示当前CSI=1 , 空白处则表示CSI=0) 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
2算法原理
2.1时间序列关联规则挖掘算法
【【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法】Apriori算法[6]是关联规则挖掘算法中经典的算法 , 多用于非时序项集 。 算法一般分为两部 , 一是生成频繁模式 , 二是根据频繁模式生成关联规则 。 而使用该算法处理时间序列数据时 , 必须对序列进行模式划分 。 对序列进行模式划分时 , 每次取一部分数据进行时间序列关联规则计算 , 然后向后滑动一个窗口 , 产生一个新的事务 , 再次计算时间序列关联规则 。 保持每个事务窗口一致 , 这样可以使当前事务区别于上一个事务 , 同时又不会漏掉可能产生的时间序列特征组合 , 如图4所示 。
时间序列关联规则挖掘过程中有两个重要判决条件:(1)当模式出现次数N大于最小支持度时 , 生成频繁模式;(2)频繁模式转移率P大于最小置信度时 , 生成关联规则 , 如图5所示 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
2.2基于关联规则挖掘的多步长频谱占用预测算法
本节将使用上文方法生成的关联规则进行多步长频谱占用预测 。
本文算法涉及概念和符号见表1 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
输入:原始幅度频率数据(File_level) 。
输出:预测的准确率以及丢失率 。
(1)将原始幅度频率数据通过动态门限分割、信道分割 , 生成由0和1组成的CSI序列 。
(2)当生成的CSI序列长度大于跨度L时 , 检测序列中异常值的情况 , 进行基于关联规则挖掘的多步长频谱占用预测 。
(3)对预测结果与实际监测结果进行对比 , 统计预测准确率和丢失率 。
算法中输入的原始数据为401×n的矩阵(File_level) , n为采集数据的时隙数(本文时隙间隔为1s) , 通过动态门限分割以及信道编号(1~401)的选择 , 形成单一信道的CSI序列 。 频繁项跨度(FrQ_length)限定了频繁子序列长度的最大值 , 取值范围可设为1~n之中的任意整数值 , 当其设为1时 , 算法可近似于两状态马尔可夫过程;当其设置为接近n时 , 频繁项数量太少 , 算法失效 , 故本文取10%n 。 最小支持度(Min_sup)与最小置信度(Min_conf)体现了频繁项的频繁程度以及规则的可靠性 。 最小预测长度(Min_span)的设定可以减少频繁子序列生成规则的数量 , 提升算法效率和精度 。
关联规则是频谱占用预测的主要依据 。 项集统计数大于Min_sup即为频繁项 , 若频繁项A统计数为a、频繁项B统计数为b , 则转移率Pab=a/b , 当Pab大于Min_conf时产生强关联规则 , 即当前序列为A时 , 预测结果为B的概率为Pab 。
图6为多步长频谱占用预测算法流程 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
在多步长预测过程中 , 算法没有在规则中找到适合的规则 , 则记为一次丢失 , 输出“-1” , 即异常值 , 异常值的出现会影响下一次的预测 , 所以要进行异常值替换 , 每个异常值“-1”都会分两次替换成“0”或“1” , 例如序列[10-10]会替换成[1000]和[1010] , 由这两个序列查找关联规则中置信度最高的规则进行预测或者继续丢失 , 即如果有m个异常值 , 则要进行2m次替换 , 最终由替换后的序列置信度最高值进行预测或者继续丢失 。 若Pred_length>1 , 即多步长 , 步长递增过程如图7所示 , 图中标注下划线并加粗的字符为预测序列值 , 算法使用预测结果更新CSI序列 , 直至完成多步长预测算法 。