【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法( 三 )


若当前序列满足预测条件 , 记预测次数(Predict)加1;若预测结果与下一时隙状态序列相同 , 记预测正确次数(Correct)加1;若最终没有找到满足预测条件的关联规则 , 记丢失次数(Loss)加1 , 丢失率记为Loss_Rate , 公式如下:
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
3实验及分析
3.1数据采集与预处理
本文中的频谱监测数据来自北京航空航天大学学院路校区连续约48h(2018年12月22日16时22分~2018年12月24日16时25分)频段为88MHz~108MHz , 即调频FM广播业务频段进行监测 , 监测设备包括是德公司E4407b频谱分析仪、PC以及SAS-521F-2接收天线 , 表2列出了监测参数 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
频谱仪每次扫描空间频谱获得400个频谱采样点 , 在监测时间内每一秒形成一个“场强-频率”对应关系的文本数据文件 , 因此每小时产生3600个数据集 。
数据的选取对预测模型的学习效果有着极为重要的影响 , 合适的数据能够为提高预测模型的正确率提供良好的支持 。 正常情况下 , 频谱的短期变化趋势是连续的 , 而长期变化具有明显的周期性 , 周期性具体体现在日、星期、年周期性以及节假日特性 。 为了提高信道频谱占用预测精度 , 在数据选择时应考虑这一周期性特点 。 故本文采用第一天100时隙作为训练集 , 第二天相同时间的100时隙作为测试集 。
图8为对所采集到的频谱数据进行“场强-频率-时间”三维可视化处理结果 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
3.2主要参数分析
3.2.1多步长对预测结果的影响
图9和图10分别展示了13号和86号信道中预测步长对预测结果的影响 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
通过信道13和信道86的10步预测结果可见 , 随着预测步长的增加 , 预测丢失率逐渐减少 , 虽然预测正确率也随步长增加呈下降趋势 , 但下降趋势较缓 , 总预测正确率由于丢失率的逐渐减少 , 随预测步长的增加呈略微上升的趋势 。 可见该算法在多步长预测中有效减少丢失率的同时 , 保持了较高的预测正确率 。
3.2.2信道占用度对预测结果的影响
本实验中选取了占用度由35%到94%依次升高的6个信道 。 图11展示了预测步长为1和10的结果 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
从图11中可以看出 , 总体上信道占用预测正确率保持较高的水准 , 其丢失率没有随着占用度的变化有正相关或者负相关的规律 。 由此可见总体上算法体现出了良好的性能 , 信道占用度的变化对预测结果的影响不大 。
3.2.3规则置信度对预测结果的影响
图12(a)和图12(b)分别展示了3个信道在最小置信度为0.7、0.8和0.9时的正确率和丢失率 。
【记忆的科技园】基于关联规则挖掘的多步长频谱占用预测方法
文章图片
从图12中可以看出 , 随着最小置信度由0.7升高至0.9 , 丢失率由15%左右升高至40%左右 。 可见 , 最小置信度的设置对丢失率影响很大 , 这是由于随着最小置信度的升高 , 可用的关联规则逐渐减少 , 即信道信息的可预测性降低 。 预测正确率随最小置信度的提高缓慢升高 , 而预测丢失率则随最小置信度的提高急剧升高 , 因此 , 设置适合的最小置信度对CSI序列的可预测性至关重要 。
4结论
本文提出类Apriori算法的频繁模式关联规则挖掘算法 , 实现对信道占用状态的多步长预测 。 实验表明 , 该算法在实际频谱预测中相比隐马尔科夫模型和神经网络模型等预测方法 , 不需要任何先验知识 , 可根据历史数据进行快速预测 , 达到了较好的预测效果 。