使用自然语言进行程序合成( 四 )


值得注意的是:WordNet 提供的同义词集合中可能会包含一些对目标特定领域没有意义的英文单词 。 这个问题由 5.1 节介绍的算法 3 解决:根据映射得分训练算法 , 这类单词的得分将会比较低 。 并且 , 本文的方法还会在得分分配完成后 , 舍弃掉得分低于某个阈值的所有映射;同理 , WordNet 也有可能无法提供对于某个特定领域极其重要的英语单词、或者 DSL 中终结符的名称不能有效地匹配到英语单词 。 由于在这种情况下 , 算法 4 将无法生成见证者映射 , 因此系统将能够自动检测到这种情况 , 并告知用户他/她的输入中有哪些无法和终结符正确对应的单词 。 这些不能正确对应到终结符的单词将被用作种子单词(Seed Word)输入到 WordNet , 以进一步生成更加全面的同义词集 。
致谢本文由南京软件学院 2020 级硕士钱瑞祥翻译转述 。