专访ACL2020最佳论文二作:全新NLP模型评测方法论,思路也适用于CV( 六 )


但是不可否认的是 , 使用CheckList创建的测试可以应用于任何模型 , 这使得它很容易被纳入当前的基准测试或评估pipeline中 。 用户研究表明 , CheckList很容易学习和使用 , 对已经对模型进行了长时间测试的专家用户以及在任务中缺乏经验的实践者都很有帮助 。
另外对吴同学的专访 , 我们相信 , 本篇论文工作确实开创地把软件测试系统引入NLP模型的测试之中并且提供了完善的测试工具 。 这将会给社区和企业带来很大的商业价值 , 比如CheckList测试工具将会节省很大的人力成本 。
最后 , 我们相信 , 这种系统引进软件测试的思想也将会在CV乃至整个AI领域大有作为 。
对代码有兴趣的同学可以尽情pull和issue:https://github.com/marcotcr/checklist
若还有进一步的学术交流和项目合作可联系吴同学的邮箱:wtshuang@cs.washington.edu
感谢吴同学的用心回答 , 祝吴同学一路优秀下去 , 心想事成~天天开心!
专访ACL2020最佳论文二作:全新NLP模型评测方法论,思路也适用于CV
本文插图