德撲人機大戰收官，人工智能毫無懸念地獲勝

36氪 2017-02-01 08:48 搶發第一評

匹茲堡賭場的人機大戰終于塵埃落定。

人工智能贏了，卻沒有帶來爆炸般的熱議。雖然一開始營造的氛圍甚是強大，但似乎大家從始至終都更相信AI程序的贏面更大。雖然有人期待人類反殺逆襲，但最終也沒能實現。觀眾對這樣的結果已經習以為常。而僅僅10個月前，阿爾法狗和李世石的對弈結果則要轟動地多。阿爾法狗壓倒性的勝利也開啟了全面熱議AI的時代。

在這場比賽開局之初，36氪就報道過這場人機大戰，并預測結果：雖然在某些回合中，人類選手會占得上風，但是在12萬手的交鋒中，機器大概率會成為贏家。

正如我們所料，當地時間 1 月 30 日，在賓夕法尼亞州匹茲堡的 Rivers 賭場，卡耐基梅隆大學（CMU）開發的AI程序Libratus 擊敗人類頂級職業玩家。

這次比賽時長為20天，Libratus和4名頂級人類玩家Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou，玩12萬手，勝者將獲得20萬美元的獎金。

這場比賽的一大看點在于，德州撲克是信息不對稱的博弈。與圍棋、國際象棋不同，每個選手只能看到自己的手牌。因此，在比賽的策略上，Libratus采用納什均衡的辦法。納什均衡追求的是最安全而不是最極致的利益。在這一策略當中，只要其他玩家的策略保持不變，單一玩家就無法通過變換策略獲益。

不完整信息博弈被看作是難以攻克的計算機難題。早在2015年時，CMU的AI程序Claudico就在無限下注的比賽中跟4位德撲頂尖高手交過手，共計進行了8萬手。不過，在這一次比賽當中，AI程序被狂虐，排在倒數第二名。

這一次CMU的Libratus完美復仇，可以看作人工智能在不完美信息博弈方面的一個里程碑。

Libratus不僅可以執行既定的策略，也可以通過不斷學習來靈活應變。Libratus的開發者之一Tuomas Sandholm曾透露，“Libratus的算法一直在超級計算機上運行，所以超級計算機每天都在輸出改進的策略?！?/p>

在前三輪比賽失利后，四位職業牌手在第四天和第六天的比賽中獲得大勝。Libratus原本領先193,000美元，第六輪比賽后，Libratus已經僅僅領先51,000美元。但是，Libratus隨后再次獲得壓倒性勝利。到第10天結束時，Libratus已經領先677,000美元。這就是機器學習結果的結果。半程結束后，局勢幾乎已經難以扭轉了。最終比賽結果的懸殊，也讓人感到無力回天的絕望。

雖然，沒有人確切知道機器下一步會做到什么，但是肯定人工智能會在一個又一個的領域里擊敗人類。人工智能的每一次進步也都會引起一些擔憂。在阿爾法狗戰勝李世石的時候，就有人擔心AI會不會控制人類，人類的末日來臨了嗎？對于人類和AI的關系，聯想CTO芮勇的看法則要豁達得多：

其實人和機器擅長的地方很不一樣。機器強的地方在于它的記憶非常強大，它的運算能力非常強大，和人的左半腦非常相似。但是人還有很強的右半腦，右半腦抽象力、想象力、創造力都非常強大。蘋果砸到牛頓頭上的時候，右半腦就開始想它為什么會掉下來呢？是不是有什么引力？但是蘋果砸到機器上，一點反應都沒有。所以人類和機器的關系并不是人和機器去PK，而是人和機器加在一起，成為更強大的人類。

原創文章，作者：梁風，如若轉載，請注明出處：http://36kr.com/p/5062865.html

聲明：該文章版權歸原作者所有，轉載目的在于傳遞更多信息，并不代表本網贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題，請在30日內與本網聯系。

您閱讀這篇文章花了0秒

轉發這篇文章只需要1秒鐘哦