-1

AI强势碾压的棋牌游戏:人工智能时代真的来了!

原标题:AI强势碾压的棋牌游戏:人工智能时代真的来了!

2017年 AI在各种棋牌游戏中横扫人类。先是在围棋比赛中,阿尔法狗3:0完胜世界排名第一的柯洁,随后在扑克比赛中,人工智能系统Libratus 战胜了四位德州扑克顶级选手;最近,马斯克的OpenAI机器人又在Dota 2中击败世界顶级选手Dendi。按照这种发展趋势,人工智能超越人类指日可待啊。

那么,AI是如何在游戏中超越人类的大脑的呢?花色互娱以Libratus 战胜了四位德州扑克顶级选手为例来为大家详细分析。

曾经有人认为想扑克牌这种不完美的信息游戏很难用机器学习来破解,因为德州扑克游戏与围棋不一样,它是不完美信息下的博弈,即对弈双方都不知道对方手里的牌。但卡内基梅隆计算机科学教授和学生诺姆布朗却打破了这种观念,他们研发的 Libratus程序软件在德州扑克 “双人游戏”比赛中单独击败了每个玩家,并在120,000手牌的末尾积累了超过180万美元的筹码,一举在为期20天的比赛中获得冠军。

Libratus是一个玩无限德州扑克的人工智能程序,Libratus的策略并非基于专业玩家的经验,所以它的玩牌方式可能有明显的不同。基于在匹兹堡超级计算机中心大约1500万核心小时的计算,它使用算法分析德州扑克规则,从而建立自己的策略,而且它能够在比赛中,通过预测所有未来步骤的胜率来思考自己的下一步。

与围棋强调计算和形式判断能力不同,德州扑克更讲究多人博弈过程,如何避免人性贪婪等弱点,并将科学的概率统计与灵活的实战策略很好地配合起来。在围棋、象棋等游戏中,机器和人类在决策前可以获得全部信息,而在德州扑克中,彼此无法得知对方的底牌是什么,也不知道发牌员发出的下一张牌是什么,在“不完整信息”下,人工智能需要根据经验或概率统计知识,猜测对手底牌和下一张牌的可能性,然后再制定自己的应对策略。

研发人员桑德霍尔姆和布朗说,Libratus平均每场14.7次大盲注是这次扑克比赛获胜的决定性因素。它的技术不使用专家领域知识或人类数据,也不专门针对扑克领域。因此,Libratus适用于大量不完美的信息游戏。

那么研究人员是怎么做呢?他们采用了三管齐下的方法。首先,开发了一种简化典型扑克游戏中10 121个决策点的算法。该算法产生了一个游戏玩法的抽象蓝图,详细描述了前几轮下注的情况,但对于后一轮游戏更为松散。研发人员认为,高冲高冲和高冲高冲几乎没有区别。把这些牌视为相同的牌可以降低游戏的复杂性,从而使计算更容易。

然后,在游戏的高潮部分,研发人员根据游戏状态对蓝图进行微调,并计算出了实时进行的策略。如果对手采取的策略是不能预料的,那么这个策略就会被重新设计,以实现这个意外的举动。这个过程的这一部分被称为嵌套子游戏解决。

最后,研究人员分析了多少Libratus的对手下注,以检测其策略中的潜在差距,用这些信息填补软件决策树中新分支的空白。Libratus下注非常的随机化,它前期主要是靠强化学习,自己跟自己玩大量的游戏的方式,来提高系统的试错能力的。

可以说,依托着人工智能的发展,Libratus系统所搭载德州扑克堪称是对传统玩法的一种颠覆。此次德州扑克次大赛表明,在信息不完善的情况下,最好的人工智能已经超越了战略思维中最好的人的素质,人工智已经开始超越人脑了。

[编辑:叶子猪小秘书]
本文由叶子猪游戏新闻中心首发,仅代表发表厂商及作者观点,不代表叶子猪本身观点!

游戏推荐

相关阅读

随便看看