人类再失一城!德州扑克职业选手遭AI碾压,“局势几乎不可逆转”

人类再失一城!德州扑克职业选手遭AI碾压,“局势几乎不可逆转”

2017-01-23 16:19雷锋网 合作伙伴
因为事先发给每位玩家2张底牌,所以对方的底牌信息是非公开的,AI要处理一种“非完整信息博弈”。而AlphaGo玩围棋,双方的信息完整、对称,不存在隐藏的信息。在德州扑克上AI取得的进步,具有重要意义。

在德州扑克人机大战中,四位职业牌手与 CMU 开发的人工智能系统 Libratus 进行了激烈对抗。

Libratus是卡耐基梅隆大学的托马斯·桑德霍尔姆和诺姆·布朗(Noam Brown)开发的。他们以前开发的机器人 Claudico 在 2015 年的德州扑克比赛中没能击败职业牌手。

此前雷锋网曾报道过,“一对一无限注德州扑克”就是两个人玩的赌博游戏,因为事先会给每位玩家分发 2 张底牌,所以对方“底牌信息”你是不知道的,对于计算机来说,就是在处理一种“非完整信息博弈”。我们知道 AlphaGo 玩围棋,对弈双方的信息是完整的、对称的,并没有隐藏的信息。所以在德州扑克上AI取得了进步,是具有重要意义的。

比赛期间,前三轮比赛失利后,四位职业牌手在第四天和第六天的比赛中获得胜利。Libratus 原本领先193000 美元,在第六轮比赛后 Libratus 仅领先 51000美 元。

在人类选手反击迅猛之时,牌手之一詹森·莱斯便在一封电子邮件中写道:

我们花了一段时间学习,以理解正在发生的事情。

然而,随后 Libratus 的表现让所有非常人吃惊:再次获得关键性胜利。第 10 天结束时,Libratus 已经领先 677000 美元,而且局势也似乎不可逆转。


跟 AlphaGo 相似,Libratus 也可通过增强学习进行自我博弈和学习。

Libratus 的开发者之一托马斯·桑德霍尔姆也说道:

我们不能详细谈论 Libratus 的技术,直到比赛结束为止。但是,我可以告诉大家,Libratus 的算法一直在超级计算机上运行,所以超级计算机每天都在输出改进的策略。

今年 1 月底,Libratus 可能会在下一场比赛中再次击败人类。到目前为止,机器人还没有在无限制德州扑克团体赛中击败过人类,但这一天也许不会太远了。

人工智能扑克机器人的研发具有重大意义。首先,它是一种教导人工智能系统处理不完整信息的方式。诺姆·布朗指出“在现实世界中,所有的相关信息通常不像棋盘上的棋子那样明显。有些重要的信息会丢失或隐藏,人工智能需要能够处理这样的信息。”

*本文作者亚峰,由新芽NewSeed合作伙伴雷锋网授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。