产业气象站|他们发现追求SOTA其实没什么意义,扒出了3万个基准测试结果( 二 )


在论文中 , 研究者也提到了 , 分析预印本论文而不是科学期刊接收论文可能会影响到研究结论 。 但有一点是没有疑问的:当前用于评估AI基准任务的大多数指标都可能存在无法充分反映分类器性能的问题 , 尤其是在和不平衡数据集一起使用的时候 。
越来越多的学者在呼吁 , 应该将重点放在人工智能的科研进展上 , 而不是在基准上取得更好的性能 。 谷歌大脑团队的前成员DennyBritz在今年六月的一次采访中表示 , 追求SOTA不是最明智的做法 , 因为存在着太多令人困惑的变量 , 更适合像OpenAI、DeepMind等资金雄厚的实验室去攻克 。
同时 , 他也提到:「实验室缺乏资金也许是一件好事 , 这迫使研究者进行深入思考并找到成本更低且可行的替代技术 。 」
参考链接:https://venturebeat.com/2020/08/10/researchers-find-inconsistent-benchmarking-across-3867-ai-research-papers/
【来源:机器之心Pro】
【产业气象站|他们发现追求SOTA其实没什么意义,扒出了3万个基准测试结果】声明:转载此文是出于传递更多信息之目的 。 若有来源标注错误或侵犯了您的合法权益 , 请作者持权属证明与本网联系 , 我们将及时更正、删除 , 谢谢 。 邮箱地址:newmedia@xxcb.cn