OpenAI 挑战《索尼克》，阿里南大队如何一举夺魁？( 四 ) 用AI打游戏

但正是因为有大量的固有的标记样本存在，使得监督学习在评估这件事情上的机制非常完善，类似CIFAR-10这样的数据集，都非常明确地划分好了训练集和测试集，算法只需要在这样的划分下测试算法的精度，就可以和其他算法进行公平的比较。如此简单、成熟而又公平的评估方法，促使了上一个十年的刷榜竞赛，把语音识别、图像检测和识别以及自然语言处理等任务的精度提升到前所未有的程度。

反观强化学习，由于没法在固定的测试数据上评测，所以通常是需要研究者自己实现一个环境，然后汇报算法在这个环境中的性能，其不确定性要远远大于在固定数据上的测试精度（如果环境实现的有问题，可能会导致完全相反的结论），使得早年很多强化学习论文中的实验结果被认可度，相较监督学习而言，其实要低很多。

新技术带来新挑战网络信息安全创新永远在路上
遂宁首届抖音挑战赛决赛现场，小伙的"特异功能"惊艳全
世界人工智能大赛·智能机器人创新挑战赛决出前三强
江津四面山生态五项国际挑战赛下月开赛总奖金50万等你来拿
挑战贝克汉姆老婆的健身餐，澳洲妹子直接吃到崩溃了！
刘鹤十年前提出的“经济挑战”都出现了！
离石白马仙洞举办山地自行车挑战赛精彩现场（视频/图）
刘鹤十年前提出的“经济挑战”都出现了
哈弗H9、传祺GS8、比亚迪唐出战，挑战日系最强硬汉，战况惨烈！
美国海军正式重启第二舰队叫嚣为应对中俄挑战