精英联盟总队|英国皇家物理学会“点赞”论文一作女博士,上海交大量子围棋问世( 二 )


计算机在记录棋子变化时 , 会记录棋子在棋盘上所占据的两个位置、以及玩家对这两个位置的选择 。
当棋子出现在两个位置的连接处 , 就会进入塌缩测量阶段 , 这时计算机会从存储的时间序列中 , 取出纠缠光子对的测量结果 。
值得注意的是 , 取出方式可以按顺序取出 , 也可以按玩家的要求随机取出 , 每个结果在使用后都会被销毁 , 以避免重复使用 。
量子围棋和普通围棋的两大区别
谈及量子围棋和普通围棋的区别 , 乔璐枫举例称 , 以一个19*19大小棋盘的量子围棋游戏为例 , 玩家不仅能获知游戏存在的状态数量 , 还能知道最多可达到的信息集平均大小 , 信息集平均大小是在非完美信息游戏中的一个衡量指标 , 它可以反映玩家隐藏信息的多少 。
概括来说 , 量子围棋和普通围棋主要有两大区别:第一 , 相比普通围棋 , 量子围棋可通过量子态塌缩 , 将不确定因素加进来 。 传统围棋棋局结果 , 完全由玩家水平决定 , 量子围棋则加入运气成分 , 其结果要看棋子具体塌缩到哪个位置 。
第二 , 当使用某些量子态 , 来模拟量子棋子时 , 玩家会比其他人获取更多信息 , 这时量子围棋中的棋子 , 就有点像打牌时手上拿着的暗牌 。
产生上述两种不同的原因是 , 该团队把常见的棋子变成量子棋子 , 并加入量子力学特有的叠加态、以及测量后塌缩的特性 。
有望扩展量子光子学的应用范围
对于本次研究的意义 , 乔璐枫给出三点总结 。
第一 , 当游戏可以被量子化 , 量子围棋游戏就能成为传统机器学习算法和量子机器学习算法的测试平台 。
第二 , 本次研究结果建立了利用固有量子特征和资源 , 来发明具有量子势能的新游戏范例 。
第三 , 量子围棋将为量子麻将等其他游戏的研发铺平道路 。
对于量子围棋的应用 , 乔璐枫说传统机器人的开发周期 , 之所以比网络机器人慢 , 是因为现实环境比人工环境复杂得多 。 而游戏是对现实世界的简化 , 简化则是解决难题的常用途径 。
由于棋盘游戏都有明确、且简单的规则 , 玩家在下棋时可以快速得到反馈 , 这非常有利于AI神经网络算法的学习和进化 。
具体来说 , 开发者通过编写游戏程序 , 可获得有关AI的启发 , 这些启发又可用于降低游戏程序的训练成本 , 比如将AI应用到高度模拟现实世界的游戏 , 如《我的世界》(Minecraft)、《第二人生》(SecondLife)等 。
此外 , 量子围棋也非常适合强化学习 。 此前强化学习为评估机器人的任务完成能力 , 需要反复运行程序 。 但不足之处在于 , 如果在周围有建筑物的环境中训练机器人 , 机器人会有撞倒物品、或跌落损坏的风险 。
而在使用量子围棋时 , 机器人能在运行环境中进行计算机模拟 , 这可避免让未经训练的机器人、在现实世界中跑来跑去的风险 , 同时也省去对机器人内部高精度零件的维护 。
量子围棋距离大众并不遥远
近日 , 清华大学AI研究院院长张钹表示:“深度学习触及天花板 , 在语音识别、图像识别、围棋三个领域外 , 短期很难再获得发展 。 ”
而乔璐枫所研究的量子围棋 , 正好在张钹所述的三大领域之内 。 事实上 , 量子围棋在AI产品中的应用 , 离我们并不遥远 。
【精英联盟总队|英国皇家物理学会“点赞”论文一作女博士,上海交大量子围棋问世】她举例称 , AlphaGo正是把卷积神经网络运用在围棋游戏上的经典案例 , 这种做法可以省去海量样本标注工作 , 且有助于深度学习的普及 。
以前 , 人们都喜欢用AI来解决棋盘游戏中的难题 , 而围棋是最难的传统棋盘游戏 , 因此备受关注 。 在AlphaGo面世之前 , 人们普遍认为 , AI在短时间内无法战胜人类围棋冠军 。
但事实上 , 围棋分为很多段位 , 有业余段和专业段 , 业余段又有1到8段 , 职业段有一到九段 。 基于此 , 研究者们利用不同方法 , 开发过各种围棋AI程序 。