【EV 扑克(http://www.evp89.com)报道】
一项“国际卓越论文”奖在美国人工智能协会(AAAI)举办的人工智能国际顶会上颁给了德州扑克。
AAAI 的英文全称是“Association for the Advance of Artificial Intelligence”,该协会是人工智能领域的主要学术组织之一,具有一定的学术权威性。
获得这个奖的相关项目是一个轻量型德州扑克 AI 程序:Alpha Holdem。
该程序由中国科学院自动化所兴军亮团队研发出品。
这个程序在和高水平德扑玩家对抗时所表现出的决策速度及其他能力都已达到人类专业玩家水平。
有人或许会想,不过是一个德扑 AI,能有什么了不起?
其实在兴军亮团队之前就已经有不少类似的项目出现。
研究者认为德州扑克游戏规则又非常简单且边界确定,特别适合作为一个虚拟实验环境对博弈的相关基础理论方法和核心技术算法进行深入探究。
近年来,国际研究者在德州扑克这一大规模不完美信息博弈问题的优化求解中也取得了长足进步。
比如,之前加拿大阿尔伯特大学和美国卡内基梅隆大学的研究者就设计出 AI 程序 DeepStack 和 Libratus,并先后在两人无限注德州扑克中均战胜了人类专业选手,随后卡内基梅隆大学设计的 Pluribus 又在六人无限注德州扑克中战胜了人类专业选手。
在这个领域比较主流的德州扑克 AI 核心思想,是利用一种“反事实遗憾最小化(CFR)”算法,逼近纳什均衡策略——即任意一位参与者,在其他所有参与者策略确定的情况下,他所做的策略都是“最优解”。
可这种方法一直有一个比较明显的缺陷:它太过依赖人类专家去进行博弈树抽象。这就意味着,无论是在进行 AI 训练还是最后对局,它都需要大量的计算和存储资源。而这,也成为限制德州扑克 AI 进一步发展的阻碍。
兴军亮团队之所以能获得卓越论文奖,就是因为他们为 AlphaHoldem 采用了一种新的、基于端到端的深度强化学习算法。
这种新算法将一种改进后的深度强化学习算法与一种新型的自博弈学习算法相结合,可以在不借助任何领域知识的情况下,直接从牌面信息端到端地学习候选动作,然后做出决策。
数据显示,AlphaHoldem 每次决策的速度甚至都不到 3 毫秒,比之前同类 AI 决策速度快了 1000 倍。并且,AlphaHoldem 与 4 位高水平德州扑克选手对抗 1 万局的结果也证明,它已经达到了人类专业玩家水平。
为了教会 AI 打德州扑克,兴军亮带着团队前后用了十多台服务器,集中算力,让 AI 不断跟自己打牌,20 天的时间,就打了 1 亿局左右。
随后,他们又进一步提升了游戏学习的性能。这次,他们仅用 1 台服务器,训练不到 3 天,就能达到预期水平。
而在这个过程中,参与训练的 AI 能学会一些类似于人类专业选手才会掌握的计谋。而这,正是不完美信息博弈最有趣的地方。
目前,兴军亮和团队打造的德州扑克在线人机对抗平台 OpenHoldem 已经对外开放。
据兴军亮说,这个系统可能是国内唯一能公开打德州扑克的地方。
该平台具有如下特点:
● 高性能在线对抗环境:支持 2-6 人无限注德州扑克对抗;支持人人、机机、人机等多种对抗模式;支持多终端并发访问;支持 AI 分布式并行测试;
● 丰富的基准 AI:平台内置知识驱动推理型、数据驱动学习型、离线学习型、在线适应型等多种不同种类的高水平两人/多人德扑 AI;
● AI 研发技术共享:平台提供面向 AI 研发的工具包,包括 AI 训练环境、AI 编程接口、AI 开发文档以及博弈复盘服务;提供多种编程语言的 SDK 和示例代码;平台可接收团队/个人的自研 AI,并将高水平 AI 纳入为新的基准。
当然,兴军亮的目标绝不仅仅是带着 AI 攻略下一款款游戏。
像不完美信息博弈,这种机制,在经济政策的制定、法律法规的优化、外交策略的选择等领域,都有很广泛的应用。这些,是国际同行正在努力攻克的,也是国内相关研究比较薄弱的。
去训练出一个更聪明、更有用、可以和人类融为一体的人工智能,是兴军亮不懈追求的方向。
2 月 18 日-2 月 26 GG 大师赛
同时也预告在 APL 落幕之后,2 月 18 日-2 月 26 日就是GG 大师赛的舞台。
即日起,你可以由每天数场的免费赛赢得资格,0 报名成为竞技扑克大师;或者最低 1 刀起的卫星赛踏上大师之路。
欢庆元宵佳节来临,只要报名即获邀参与免费特典赛事,有机会斩获 WSOP 金戒指春巡赛邀请函!详细内容请见海报或官网。
龙华富贵 贺新年APL百 W 新春红包礼来袭
紧接着 APL 最高潮#25:青龙主赛事就要“龙”重登场了,带来史上最高的惊人保底奖励!
望向现在 Day2 晋级选手名单也是众星云集呀,国人Tony、茅人及、丁彪,以及 WSOP 主赛事冠军Damian Salas等等。
现在每日都有多场 Day1 可以挑战,所有蓄势待发的挑战者,你们准备好登上 APL 盛宴的最高殿堂了吗?
激动人心的赛事福利来袭:
【活动 1. 报 2+1】
[APL#17:龙年贺岁神秘赏金赛]每日多场 Day1 可以挑战,还有“报 2+1”特别活动,简直比卫星赛还超值!
0 报名加入“#25 青龙主赛事”,争夺系列赛最高保底奖励 2,000w!数量有限,先到先得。
【活动 2. 300W 红包雨来袭】
接着马上要过年了,象征喜庆与祝福的红包怎能缺席呢?
2 月 9 日除夕夜当天到 2 月 25 日,APL 赛事+常规桌将龙重登场“百 w 新春红包礼”,在你为荣誉奋斗的同时献上额外惊喜,助力所有国人龙运当头、龙华富贵~
【活动 3. 喜新恋旧】
本周开始新朋友+老朋友都将有各种领到手软的福利大放送,要如何获得!?登入游戏中查看有没有收到惊喜啦。
【春风十里,不如 APL 百 W 红包】
新年大家最期待收到的红包怎么能错过?
2 月 9 日-2 月 20 日,所有常规桌+APL 赛事都将掉落新春红包礼,将丰厚奖励洒向每一位参与比赛的选手,让你龙心大悦感受无限的幸运。
无论你是职业选手或娱乐玩家,都将在这场 APL 盛宴中找到属于自己的精彩瞬间。
让我们共同迎接吉祥龙年的到来,在竞技扑克世界里创造属于自己的传奇!
超低报名 超高回报!!!神秘百 W 赏金赛ing
以大神丹牛为目标,练功之余还有机会斩获高额奖励,最好的战场绝非“百 W 赏金猎人大奖赛”莫属了!赛事时间 1 月 14 日-2 月 5 日,带来超惊人的豪华总保底1 亿刀!
不仅每日猎人战力榜上选手,天天都可以瓜分 25K 刀奖励外;系列赛号称最高质量、最强性价比只要5.25 刀报名的“神秘赏金百 W 赛”,现在正如火如荼展开中,1 月 23 日将迎来 Day2。
现在“神秘赏金百 W 赛”每天都有多场 Day1 开放报名,也可以从最低 0.5 刀的卫星赛开始一步步稳扎稳打,成为下一个斩获百 W 奖励的 Moneymaker!
拿下冠军就加送 2024 任一国内线下赛套票,包含5 天酒店住宿+机票+主赛门票,助力国人乘风破浪,于现场赛事也能登顶巅峰!
逐梦参赛!百度 “丹牛也疯狂逆转胜” 了解更多活跃新朋友限量送
双旦嘉年华福利免费赛史上最大变革 ”免费体验场”来了!
现在开始可以随时随地可以享受真实的游戏体验!我们提供丰富多样的玩法,包括德州扑克、奥马哈、短牌等等,让您尽情挑战自我,提高技巧。不仅如此,可以从游戏中获得体验币,所有玩家每日可以领取 20,000,新加入朋友还可额外获得 20,000,助您迅速上手。
加入我们的免费扑克游戏,和全球的牌手们一起切磋技艺,感受扑克游戏的乐趣吧!EV 扑克作为 GGPoker 在国内新开设的旗舰品牌,每月不断推出福利反馈活动,现在只要成为 EV 新用户,达成免费赛任务就可以获得——“EV 专属大宝箱”启动码 1 组加入 EV 扑克战队:http://evpk8.com/96088再送 4 张免费门票!
想跟美女 Sashimi 一起玩,想知道最新资讯与赛程,敬请锁定 EV 扑克官网(http://www.evp66.com)。看牌手痒玩 EV 扑克,每日多场免费赛奖励高达 20w,现在注册EV 扑克(evp66.com)额外加赠8 张幸运赛门票最高奖励 1500 倍!