頭圖來自視覺中國,未經授權,請勿轉載使用。
文/ 曾歡 ?羅硯
圍棋從未像現在這樣得到來自棋界內外、橫跨體育界科技界的全球矚目。人機大戰才比了第一場,但好多人似乎覺得已成定局。因為李世石開局第一盤就輸了,人類輸給了機器。
記得當年輸給深藍,我們喊過人類還有圍棋,這次李世石如果失敗,是不是就意味著人類在象征大腦發育水平的棋類運動里,從此再無與機器人抗衡的優勢了呢?
先別慌,面對首戰的失利,有位擁有洪荒之力的天才少年站出來說,李世石會輸,我不會輸!#人類的尊嚴由我來捍衛#這個微博名叫@柯潔大棋渣 的19歲少年哪來的自信?因為他就是多次力挫李世石,目前世界排名第一的圍棋九段柯潔啊。
一、李世石是怎么輸的?
讓我們先復盤下,李世石是如何失掉這至關重要的首局。
開局:李世石看似亂來的“邪惡招法”
AlphaGo的長處在于學習前人經驗和計算,正如李世石判斷的一樣,布局是相對的短板,這也是李世石選擇執黑先行的原因。
下到第7手,李世石九段把起黑子放在了一個棋盤右下側出乎所有人意料的位置,既不守,又不攻。中國圍棋九段選手柯潔把這一招定義為“從沒有見過的邪惡招法”,而古力九段也表示這一招從未在職業選手中出現過。你AlphaGo不是經驗豐富、閱棋無數嗎?下個你沒見過的,看你學誰去。
然而這里,AlphaGo似乎并沒有接茬,而是繼續穩扎穩打,專攻右上角。
而AlphaGo怎么想的呢?
AlphaGo是用兩個大腦去決策的,第一個大腦叫落子選擇器Move Picker,即“監督學習的策略網絡(Policy Network)” ,它會預測每一個合法下一步的最佳概率,給出候選走子。這里的最佳目標不是數學意義上的贏棋,而是怎么下出符合人類高手選擇的落子,簡單說就是下得像個人樣。
第二大腦是局面評估器Position Evaluator,即價值網絡(Value Network),學習大量棋譜后,它自我強化學習,通過“左右互搏”來學習判斷局勢,讓從AlphaGo候選中做出決策。
事后,我們能看出這里兩者預期的誤差,李世石試圖以經驗去擾亂機器,而AlphaGo的智能之處在于它不是簡單的數據庫調取方案,而是智能模仿人類行為,反而讓李世石的“邪惡招法”顯得多余。
中盤:李世石穩占優勢
到第27子后,剛剛進入中盤,到了這個階段,李世石還是占有一些優勢,但李世石陷入了思考。
有趣的是白棋的第84手,居然下出了從未見過的下法,韓國金成龍九段表示:“成為職業棋手27年來,第一次看到白斷這手棋!”李世石看到這步棋,搖了搖頭。
那么問題來了,既然 AlphaGo 是跟別人學的棋譜,那么這招是和誰學的?連Google作者表示連他也不知道。作者設置了機制,但并不知道這個機制具體如何運作學習。#AI對人類目前來說,還是一只尚不了解的怪獸#
收官:AlphaGo的恐怖逆襲
最后官子階段AlphaGo開始展現恐怖之處。
“明明之前是我的優勢,但在最后的官子階段,卻被他一步一步蠶食,最后輸的卻是我。”AlphaGo的上一個對手樊麾二段就感受過,“AlphaGo用同樣的方式蹂躪了我五盤,只要犯哪怕一個錯誤,就會被窮追猛打,最后萬劫不復。”
可惜的是李世石也犯了錯,還是兩個。掙扎了一個小時,局勢仍然不可逆轉。
下午3點33分,李世石投子認輸,AlphaGo獲勝。
留下李世石一個人坐在棋局前復盤。開賽前,李不止一次的對媒體表示,“除非出現不可理喻的低級失誤,我絕不會輸,尤其是第一局。”但兩三個小時后,李世石只得重新再試圖去認識他的對手,雖然了解或許也是徒勞。
二、這局棋,如何評說?
接下來李世石勝算多大?
“雖然受到很大沖擊,但還是很享受這盤棋,并且很期待后面的比賽。這盤我沒下好,所以想后面的棋我勝算還是會很大吧,勝算會是五成吧。”
“這盤棋電腦不是靠運氣,而是憑借實力完勝的,這不由讓我們對李世石的信心有所動搖。他們自己發揮的水平高低相差很大,如果說是柯潔去下,可能整體會好一點,但也難說一定能贏。畢竟電腦具備很多人所不具備的優勢,最主要的還是心態。”
AlphaGo表現如何?
而對人工智能,前微軟亞洲研究院副院長張崢則評價:
AlphaGo勝利的概率是100%,只不過不見得是這次。“毛病”還是機器學習的老毛病。表現在:無法總結規律,或者說無法吐出一套規整自洽的規律;泛化能力差,無法在復盤中舉一反三,即便告訴它哪步走錯了,恐怕它也不知道為啥,只是一氣兒死磕到撞了南墻才完事。
Facebook人工智能組研究員,Facebook人工智能圍棋程序Darkforest負責人田淵棟評論AlphaGo:
第一點,如果你覺得AlphaGo的落子水平會波動,其實它可能判斷勝率已經很高,有時候隨便下;
第二點,蒙特卡洛樹搜索是遇強則強的,如果對手太弱的話也不會下出太強的手;
第三點,AlphaGo下棋每一步最后都是算整體分數的,并非單純局部,反倒是有時候局部弱,對殺會有問題;
第四點,接下去的研究是進入程序的黑箱里去。人工智能研究者們雖然設計學習算法,但其實不知道電腦是怎么決策的,要打開黑箱了解內部機理,還有很長的路要走。
谷歌,讓我愛你還是怕你?
國內科技界大有迷信算法的擁躉,搜狗CEO王小川正是其中代表,不過在他看來,谷歌這次是個“心計婊”:
“谷歌找樊麾的時候,他找了一個職業棋手至少是一個洲的冠軍,但其實段位相對比較低,這樣他能夠在里面得到一個取勝,但是說出去是很大的影響力。另外還有一個設定,谷歌和樊麾簽了保密協議,最后等到《Nature》封面文章一發表,立刻起到了引爆的作用。所以谷歌在做這件事情的時候,不僅在做技術研究的問題,還深刻考慮了背后選什么人,怎樣實現媒體影響力。
以我對AlphaGo的判斷,他們并不會對李世石做特別的判斷,樣本量不夠。”
虎嗅編輯翻同學卻在這人機大戰中,感到深刻的危機:
“科技公司最邪惡之處在于,把全部用戶信息拿去讓機器學習,而且還不告訴用戶。#人類的叛徒#”
三、AlphaGo:(希望)下一場對手是柯潔
AlphaGo為何選擇李世石作為首個挑戰的職業九段棋手?據新華社對AlphaGo創始人戴密斯·哈薩比斯的采訪,這是因為李世石在頂尖水平已有十年甚至更久,“也許更年輕的選手也能有這個水平,但現在還不確定,因為他們還需要有十年頂尖水平去證明自己。”事實上,對于許多高段位的職業棋手來說,李世石是他們實力的試金石,有種說法是,不管拿過幾個冠軍,只要沒贏過李世石,就不能妄談“第一人”,對于AlphaGo來說,也是如此。
哈薩比斯同時表示,由于對電腦來說,中國的規則更為簡便易行,AlphaGo的對弈選擇了中國的規則,因此他們也期待在這次挑戰李世石之后,AlphaGo能與中國的職業棋手過招,他點到了一個名字——柯潔。
柯潔在前文也多次提到,但是在AlphaGo對戰李世石之前,不關注圍棋的人們或許還根本沒聽說過這個名字,然而在李世石宣布認輸之后,柯潔以這樣一條微博出現在公眾視野:

這個微博ID名為:@柯潔大棋渣 的用戶,認證信息顯示他正是圍棋九段、第二屆百靈杯世界冠軍——柯潔。
四、柯潔是誰?
柯潔是誰?他哪來的自信?——5天前(3月5日)柯潔剛剛在第17屆農心杯上戰勝擂主李世石,幫助中國隊奪得農心杯三連冠;一個月前(2月11日),在2016央視賀歲杯圍棋賽決賽中,柯潔以7勝2負戰勝李世石;2個月前(1月5日),在第二屆夢百合杯世界圍棋公開賽五番棋決賽中,柯潔也曾以3比2戰勝李世石。

圖為李世石與柯潔最近一次比賽對弈,本圖來自視覺中國,請勿轉載
值得一提的是這場一月初進行的世界圍棋公開賽五番棋決賽,首局柯潔執白輸給了李世石,第二局比賽由于幾招不慎,柯潔落入極度被動地位,當時在央視研究室觀賽的棋圣聶衛平生氣地預言其“敗局已定”,并中途離席,但柯潔在最后30分鐘上演神奇逆轉,翻盤勝出。
這就是柯潔,他有著極其強大的計算能力,棋風犀利,猶善后發制人。若如上文所說,李世石是最高段位棋手證明自己實力的試金石,那么以上戰績足以說明柯潔的冠軍成色。而這個屢次戰勝李世石的中國棋手柯潔,還不到19歲。
有人將剛剛過去的2015年稱為圍棋界的柯潔之年,他一度世界大賽14連勝,刷新了孔杰塵封6年的紀錄。柯潔全年等級分對局58勝16負,勝率78.38%。去年11月,柯潔以2687分登頂國內等級分排行榜,一舉超越時越,成為目前國內第一人。而從等級分排名第35位到超越另一位90后棋手時越登頂,柯潔只用了兩年時間。
在自己的微博里,他同樣自信地這樣自我介紹道:

據公開資料,柯潔,1997年生人,父親柯國凡是個棋迷,業余4段,還曾開辦過圍棋館,母親周柳萍曾拿過市運會女子成人組前6,在這種背景下成長的柯潔5歲就開始學習圍棋,最早師從周宗強5段,隨后師從麗水圍棋好手鄭一兵。
2004年10月,7歲的柯潔第一次參加比賽就獲得了16周歲以下組冠軍。2005年,柯潔破格進入聶衛平道場開始深造。
2007年,在全國少年兒童圍棋錦標賽上,10歲的柯潔拿到了他的第1個全國冠軍。2008年柯潔幸運地獲得最后一個定段名額,沖段成功,邁過職業門檻。隨后柯潔正式簽約云南圍棋隊,成為一名職業棋手。在全國升段賽上,在二段組比賽11勝1負,在第三輪比賽中就提前晉升三段。
圍棋界的“網紅”,一邊對弈一邊網聊
在性格方面,柯潔一反大多數棋手給人沉穩、內斂的印象,而是和大多數95后一樣,個性張揚,直言直語,他愛上網,喜歡使用社交網絡(他的微博資料還認真填寫著:異性戀、求交往)、喜歡追電子產品(從微博觀察,他還是個“果粉”),網絡還為他提供了另一種日常訓練的方式——“下網棋”,他在知名圍棋對弈網站的昵稱叫“潛伏”,頭像是電視劇《潛伏》里孫紅雷的劇照。柯潔曾在采訪中說:“‘潛伏’的寓意是默默努力,有一天脫穎而出。”
據成都商報報道,從2011年到2013年,柯潔在網上與國內外高手下了4000多盤棋,贏了3100多盤。據對弈網站統計,2012年是他網上下棋創紀錄的一年,達到1600多盤。他還有每逢大賽前會上網下一盤的習慣,以快棋“砍殺”高手為樂,第二屆夢百合杯世界圍棋公開賽決賽第四局輸了后,他立馬上網用直接讀秒的快棋戰勝了韓國的元晟溱九段。
同時,柯潔還喜歡一邊在網上與高手快棋對弈一邊網聊,有時是給網友講棋,有時是自嘲自己的失誤,抒發情緒。
評價李世石:傳奇是時候落幕了
在一月舉行的世界圍棋公開賽五番棋決賽前,柯潔曾表示:“李世石之前說他有五成希望取勝,我想如果一共是一百成的話,他有五成。另外我想說,傳奇是時候落幕了。”
對于自己,柯潔曾多次在采訪中表示:“我要做這個時代的領軍人物,NO.1。”
對于這些言論,有人評價柯潔年少輕狂,也有人認為這正體現出柯潔已經具備優秀棋手最該具備的自信心,要知道,年少時的李世石也是如此。而柯潔目前取得的成績也足以為他的豪言撐腰。
AlphaGo約戰?“我的勝算大概六成”
AlphaGo將柯潔作為了下個挑戰對象,那柯潔怎么想?
在AlphaGo對戰李世石之前,柯潔在1月份接受果殼網專訪時表示:
我當然非常想和它下了!當然不是為了錢或者什么的,而是想看看自己到底有什么實力。因為它和樊麾下的這五盤棋,其實是樊麾下得太糟糕了我覺得,完全是……有點看不下去,沒法看的(笑)。甚至大家對這個棋譜都有很多質疑,懷疑他是不是有意放水,搞不清楚。他可能也是好久不下棋了,實力表現非常糟糕。
但不只是我想下,我們棋院可以說所有人都想和機器一戰,都想挑戰一下這個“阿法狗”。我覺得只要是懂點圍棋的都會想和這個計算機高手下一盤吧!都非常期待看看它到底有多大的實力,有多大的能量。
我覺得我去下的話也非常有信心能戰勝這個阿法狗。這是就現在來說啊,以后不知道。
在人機大戰第一回合結束后,柯潔坦言“阿爾法圍棋”的實力遠超自己想象,現在“誰輸誰贏不敢說,說實話都有點想支持‘機器’了。” 對于未來可能被約戰,他表示:“如果被約戰,我肯定會接受,’百看不如一試’嘛,”柯潔說,“我想電腦終究有一天會擊敗我們所有職業棋手,但目前我肯定會盡力拿下,我相信自己還是會贏的。” 他估計自己的勝算有6成。
柯潔也有自己的顧慮:“通過AlphaGo和李世石剛剛的比賽可以看出AlphaGo一定是弱于我的,但我不想通過比賽讓AlphaGo拷貝我的比賽思路。”
前微軟亞洲研究院副院長張崢曾解釋過:“其實“偷招”這個倒不用擔心,五局的樣本對機器沒用,它不靠這個,靠的是工程上高效率、策略上粗枝大葉但大方向正確。”
外界評價如何評價?
韓國棋院博士裴泰一認為,現今世界棋壇當之無愧的第一人必是未來的柯潔。
李世石:“這種自信滿滿的表現,不就是小朋友的魅力所在嗎?先不說韓國圍棋界,也不談國籍,作為前輩棋手一定要阻止柯潔這么小的年紀成為第一人。怎么說也得20幾歲才合適吧?柯潔。。。現在太小了吧?”
日本圍棋史上最年輕的九段棋手井山裕太:柯潔是世界上頂級的棋手。
上海圍棋隊主教練劉世振:“從人的風格、以及棋的風格上來看,柯潔都非常像年輕時的古力。而且柯潔的計算力要比古力更快更準。”
五、今天的比賽,想看柯潔的上哪?
雖然嘴上狂傲,但是相信今天的比賽給每一個職業圍棋選手的沖擊都是很大的。今天凌晨一點,柯潔還在微博發自拍,感嘆:“輾轉反側,夢醒黑白”。#還是一個多愁善感的文藝少年啊#

知道你和我一樣,都被這個97年點天才小鮮肉的狂拽酷炫所迷倒了,那今天(3月10日)的人機大戰第二場比賽,能在哪看到柯潔呢?他被邀請到樂視直播間去了,別怪我沒提醒你哦#請打賞廣告費#!
