匹茲堡賭場的人機大戰終于塵埃落定。
人工智能贏了,卻沒有帶來爆炸般的熱議。雖然一開始營造的氛圍甚是強大,但似乎大家從始至終都更相信AI程序的贏面更大。雖然有人期待人類反殺逆襲,但最終也沒能實現。觀眾對這樣的結果已經習以為常。而僅僅10個月前,阿爾法狗和李世石的對弈結果則要轟動地多。阿爾法狗壓倒性的勝利也開啟了全面熱議AI的時代。
在這場比賽開局之初,36氪就報道過這場人機大戰,并預測結果:雖然在某些回合中,人類選手會占得上風,但是在12萬手的交鋒中,機器大概率會成為贏家。
正如我們所料,當地時間 1 月 30 日,在賓夕法尼亞州匹茲堡的 Rivers 賭場,卡耐基梅隆大學(CMU)開發的AI程序Libratus 擊敗人類頂級職業玩家。
這次比賽時長為20天,Libratus和4名頂級人類玩家Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou,玩12萬手,勝者將獲得20萬美元的獎金。
這場比賽的一大看點在于,德州撲克是信息不對稱的博弈。與圍棋、國際象棋不同,每個選手只能看到自己的手牌。因此,在比賽的策略上,Libratus采用納什均衡的辦法。納什均衡追求的是最安全而不是最極致的利益。在這一策略當中,只要其他玩家的策略保持不變,單一玩家就無法通過變換策略獲益。
不完整信息博弈被看作是難以攻克的計算機難題。早在2015年時,CMU的AI程序Claudico就在無限下注的比賽中跟4位德撲頂尖高手交過手,共計進行了8萬手。不過,在這一次比賽當中,AI程序被狂虐,排在倒數第二名。
這一次CMU的Libratus完美復仇,可以看作人工智能在不完美信息博弈方面的一個里程碑。
Libratus不僅可以執行既定的策略,也可以通過不斷學習來靈活應變。Libratus的開發者之一Tuomas Sandholm曾透露,“Libratus的算法一直在超級計算機上運行,所以超級計算機每天都在輸出改進的策略?!?/p>
在前三輪比賽失利后,四位職業牌手在第四天和第六天的比賽中獲得大勝。Libratus原本領先193,000美元,第六輪比賽后,Libratus已經僅僅領先51,000美元。但是,Libratus隨后再次獲得壓倒性勝利。到第10天結束時,Libratus已經領先677,000美元。這就是機器學習結果的結果。半程結束后,局勢幾乎已經難以扭轉了。最終比賽結果的懸殊,也讓人感到無力回天的絕望。

雖然,沒有人確切知道機器下一步會做到什么,但是肯定人工智能會在一個又一個的領域里擊敗人類。人工智能的每一次進步也都會引起一些擔憂。在阿爾法狗戰勝李世石的時候,就有人擔心AI會不會控制人類,人類的末日來臨了嗎?對于人類和AI的關系,聯想CTO芮勇的看法則要豁達得多:
其實人和機器擅長的地方很不一樣。機器強的地方在于它的記憶非常強大,它的運算能力非常強大,和人的左半腦非常相似。但是人還有很強的右半腦,右半腦抽象力、想象力、創造力都非常強大。蘋果砸到牛頓頭上的時候,右半腦就開始想它為什么會掉下來呢?是不是有什么引力?但是蘋果砸到機器上,一點反應都沒有。所以人類和機器的關系并不是人和機器去PK,而是人和機器加在一起,成為更強大的人類。