数据不平衡问题( 五 )


?同义词替换(Synonym Replacement, SR):从句子中随机选取n个不属于停用词集的单词 , 并随机选择其同义词替换它们;
?随机插入(Random Insertion, RI):随机的找出句中某个不属于停用词集的词 , 并求出其随机的同义词 , 将该同义词插入句子的一个随机位置 。 重复n次;
?随机交换(Random Swap, RS):随机的选择句中两个单词并交换它们的位置 。 重复n次;
?随机删除(Random Deletion, RD):以 p的概率 , 随机的移除句中的每个单词;