算法只要你的AI算法能比小白鼠聪明,DeepMind的这20万奖金请拿走
贾浩楠 发自 凹非寺量子位 报道 | 公众号 QbitAI 用你的AI算法和小白鼠一较高下 , 还能赢得3万美元(20万元)奖金 。
稳赚?快别这么想 。
实际情况是 , 机器学习算法一般都是在给定条件的任务中有较好的表现 , 但现实情况则要复杂很多 。 举例来说 , 一个老鼠在迷宫中或有遮挡的环境中寻找食物的表现要比一个AI好得多 。
DeepMind就以动物认知测试为基础开发了一套强化学习任务集Animal-AI , 用来供开发者测试自己的AI模型实用性 。
前两天 , Animal-AI2.0版本上线 , 并且在Github开源 。
本文插图
AI算法:我不如狗 游戏环境经常被用来评估AI的“能力” 。
一般都是给定状态转移概率( state transferring probability)和奖励函数 , 在这样的条件下来测试模型表现 。
那真实的世界真的是这样的吗?
当然不是 , 真实的世界要复杂地多 , 在面对复杂任务时 , 动物的表现往往优于AI 。
比如下图 , 简单的把食放在一个透明管中 , 狗能明白把头伸进管子里就能获得食物 , 而一个强化学习AI完全懵了 。
本文插图
本文插图
DeepMind研究人员基于动物认知的研究开发了这个测试环境 , 旨在让强化学习算法的开发者 , 通过动物的行为模式中获得启发 , 改善算法性能 。
这个项目包含了训练环境、训练库以及900个测试和/或训练任务 。 900个任务由浅入深 , 被分为不同的类别 , 以反映不同的认知能力 。
该环境使用Unity ml-agent建立 。 其中包含一个固定大小的竞技场 , 和一个已经训练好的模型 。
竞技场中包含各种物体 , 包括正负奖励(绿色、黄色和红色球体)、障碍物、雷区、不同的地形等 。 你的AI任务是在场地中收集正激励(黄绿球) 。
安装教程 Animal-AI可以在Mac、Linux、Windows上运行 , 要求Python3 。
首先安装必要运行环境 , Github项目主页提供了不同系统的环境下载:
本文插图
将安装包解压到examples/env文件夹下 。 Linux系统可能需要先运行一行代码:
chmod +x env/AnimalAI.x86_64
Animal-AI包里面是一个Unity环境交互应用接口 , 包括一个gym环境、一个扩展Unity ml-agent环境 。 通过以下代码安装: pip install animalai
项目还提供一个可以用来训练模型的包 , 通过以下代码安装: pip install animalai-train
环境配置好以后 , 在examples路径下运行: pip install -r requirements.txt
启动jupyter notebook并运行environment和training 。测试实例 这里测试的算法是在2019年Animal-AI Olympic大赛中获得第一名的算法 。
一个简单的寻找食物的任务:
本文插图
更进一步 , 在一个有静止负激励的复杂环境中寻找食物 , AI面对复杂环境时直接卡死在场地右下角:
本文插图
让红色的球(负面激励)动起来 , AI需要在动态环境中寻找食物:
- 【物理】初二发力学习,初三语文成绩才能逆袭,别让你的小聪明耽误了语文
- 娱乐有料说一起来看看吧!,别让你的“房”“车”梦因”它“而破灭
- 『高铁』连云港至南京高铁11月建成!全程只要两个多小时
- 手机大魔王用权限管理来保护你的隐私安全,安卓手机安装APP后先别打开
- zol中关村在线最轻全画幅专微佳能RP记录你的精美影像
- 星鹿债务沐小沐债务重组,也许是你的上岸希望……,信用卡逾期太久还不清
- :高考成绩过线不多,只能走民办院校?你的选择还有更多
- 【地铁】今天早上杭州赶地铁的朋友,你的健康码打得开吗?
- 手机大魔王安卓手机安装APP后先别打开,用权限管理来保护你的隐私安全
- 你的剧世界有我马云给她0.2%的股份,20年过去她怎样了?,因为美貌做阿里前台