简简科技|复旦邱锡鹏团队最新成果fastHan:基于BERT的中文NLP集成工具( 二 )
CWS:AS、CITYU、CNC、CTB、MSR、PKU、SXU、UDC、WTB、ZX
NER:MSRA、OntoNotes
POS&Parsing:CTB9
注:模型在训练NEROntoNotes时将其标签集转换为与MSRA一致 。
最终模型在各项任务中取得的F值如下:
文章图片
表格中单位为百分数 。 CWS的成绩是10项任务的平均成绩 。 Parsing中的两个成绩分别代表F_{ldep}和F_{udep} 。 SOTA模型的数据来自笔者对网上资料及论文的查阅 , 如有缺漏请指正 , 不胜感激 。 这五项SOTA表现分别来自如下五篇论文:
[1]HuangW,ChengX,ChenK,etal.TowardFastandAccurateNeuralChineseWordSegmentationwithMulti-CriteriaLearning.[J].arXiv:ComputationandLanguage,2019.
[2]HangYan,XipengQiu,andXuanjingHuang.''AGraph-basedModelforJointChineseWordSegmentationandDependencyParsing.''TransactionsoftheAssociationforComputationalLinguistics8(2020):78-92.
[3]MengY,WuW,WangF,etal.Glyce:Glyph-vectorsforChineseCharacterRepresentations[J].arXiv:ComputationandLanguage,2019.
[4]DiaoS,BaiJ,SongY,etal.ZEN:Pre-trainingChineseTextEncoderEnhancedbyN-gramRepresentations[J].arXiv:ComputationandLanguage,2019.
[5]JieZ,LuW.Dependency-GuidedLSTM-CRFforNamedEntityRecognition[C].internationaljointconferenceonnaturallanguageprocessing,2019:3860-3870.
- 科技一哥|荣耀30青春版图集赏析:触觉与视觉的完美享受
- 科技犬君|vs 索尼A9G 谁强?,上半年用户喜爱手机盘点;小米电视大师65英寸OLED
- 精选泛科技|结果如何?,一加8续航遭质疑:上半年最全机型横评出炉
- HAO懂科技|小米“神机”要来了?,小米正式“反击”!上下对折+骁龙865
- 阿拉图图科技说|而给华为仅仅是800万枚!,台积电为苹果准备8000万枚芯片
- 网罗说科技|三星note10一夜成“中端机”,还是256GB+3500mAh,三星扛不住了
- 科技数码迷|华为+荣耀别不报!入门级机型你们真没有Redmi良心
- 「小米科技」小米11Pro宣布新技术!首发骁龙875+屏下镜头,米粉:价格有点小贵
- 小熊科技|你会考虑吗?,三星顶级旗舰清仓!5G网络+45W快充+2k屏幕
- 简简科技|联想:国内同步上市,支持5G,界读丨摩托罗拉折叠手机Razr2曝光