Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

2016-01-29 18:06:00 來源:雷鋒網 作者:佚名 人氣: 次閱讀 191 條評論

Facebook與Google之間,關于圍棋人工智能的沒有硝煙的戰(zhàn)爭。到底誰家的人工智能更強一點?...

【編者按】本文來自知社學術圈士奇。

美國時間1月27日,Facebook與Google兩家之間玩了一場沒有硝煙的戰(zhàn)爭。在相隔不到幾個小時的時間里,雙方先后公布了自家人工智能技術(AI)在圍棋軟件上的進展與水平。如此緊張的撕咬,恐怕并非巧合。我們來看看到底誰家的人工智能更強一些......

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

| Facebook

臉書的聲音

周三早上,Facebook創(chuàng)始人扎克伯格在自己的臉書上敲了這么一段:“……科學家們已經花了20年教電腦兄下圍棋,現在我們馬上要實現啦 (We’re getting close)。在過去半年里,我們所創(chuàng)造的AI只用0.1秒就走一步,效果與以前那些幾年才設計出來的系統(tǒng)一樣好……”

背后的故事

Facebook去年11月就在International Conference on Learning Representations (ICLR) 上發(fā)表了論文《Better Computer Go Player with Neural Network and Long-term Prediction》作者為Yuandong Tian和Yan Zhu兩名華人。論文介紹了代號為黑暗森林的圍棋人工智能系統(tǒng)。幾乎在扎克伯格發(fā)布消息的同一時間,Facebook人工智能研發(fā)中心發(fā)表了該論文的更新版,中心負責人Yann LeCun也在Facebook上作了相關介紹。

該項目獨立帶頭人Yuandong Tian表示:“圍棋中極多的分支因子使得傳統(tǒng)的搜索技術難有建樹,即使在尖端硬件平臺上運行也非常乏力。如果換了黑白方,圍棋的評估體系也會有很大變化。”

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

(Facebook圍棋程序已達業(yè)余五段水平)

這一次,他們在新版本系統(tǒng)黑暗森林2上面加入了蒙特卡洛樹搜索,與之前的卷積神經網絡相結合后,性能有了進一步提升。對戰(zhàn)人類棋手時,黑暗森林2可以達到業(yè)余三段水平;通過7.5萬次運行后,則可以在KGS服務器上穩(wěn)定保持在業(yè)余五段水平。

| Google

谷歌的聲音

同一天,Google在官方博客中表示:“……我們很驕傲地公告天下,我們的科學家已經搞定了圍棋,并攻克了人工智能領域的一項重大挑戰(zhàn) (achieved one of the grand challenges of AI)……”

兩邊的開場白都從介紹中國古代這項頭腦競技開始,Google甚至還提到了孔子和四藝。不過就后面的用詞來看,Google的技術似乎更勝一籌。

背后的故事

Google的圍棋論文可謂來得早不如來得巧。

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

同樣在1月27日,DeepMind團隊發(fā)表的《Mastering the game of Go with deep neural networks and tree search》作為Nature封面論文上線。

DeepMind是一個位于倫敦的人工智能團隊,2014年其公司被Google以4億英鎊的價格收購。團隊創(chuàng)始人Demis Hassabis在周三發(fā)表的官方博客中表示,他們開發(fā)的圍棋程序AlphaGo融合了高級樹狀查找和深度神經網絡。通過對神經網絡進行的3000萬步訓練 (所有棋譜均來自人類專業(yè)棋手的比賽),AlphaGo預測出人類對手下一步走法的正確率已經達到了57%,之前的紀錄是44%。

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

(AlphaGo 5-0 擊敗樊麾)

談到圍棋戰(zhàn)績,Google明顯應該更驕傲一些。AlphaGo在2015年10月5日以五連勝的成績擊敗了歐洲圍棋冠軍樊麾。這次對決完全符合比賽規(guī)則,沒有任何讓棋設定。今年三月,AlphaGo將對陣世界頂尖棋手——韓國“飛禽島少年”李世乭。讓我們拭目以待。

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

(韓國棋手李世乭)

|專家怎么看?

樊麾,2013-2015年三度歐洲圍棋冠軍

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

在中國,圍棋不僅是一項比賽,它還是生活的一面鏡子。我們說,假如你的棋下得有問題,那很可能是你心性的問題——棋如其人。

輸棋確實很難過。和AlphaGo對戰(zhàn)之前,我覺得我能贏。在第一局失利后,我改變了戰(zhàn)術,增強了進攻,但還是輸了。問題是人類有時會犯致命的錯誤,因為我們是人。有時我們會疲憊,有時我們求勝心切,我們總有這樣那樣的壓力。電腦程序不會這樣,它非常強,也非常穩(wěn)定,簡直就像一堵墻一樣。對我來說這是很大的差別。我知道AlphaGo是個電腦,但如果沒人告訴的話,我可能會覺得它是個有點陌生卻又非常強大的對手,是個真人。

當然,輸掉比賽讓我不太開心,不過作為職業(yè)選手,我們輸過很多比賽。所以,失敗了就從中學習,也許會有所收獲??傊畯拈L遠來講這是一件好事。

Toby Manning,英國圍棋協(xié)會司庫,樊麾人機對戰(zhàn)的裁判

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

圍棋玩家都知道,人工智能尚未解決圍棋這個問題。所以我想人們會希望見到電腦達到人類專業(yè)水平,但我覺得這可能還要10年的時間。在這次比賽中,我本來是看好樊麾的。

很神奇的是,在比賽過程中你很難分辨誰是人類,誰是電腦。在很多圍棋軟件的比賽中,你可以看到很多合理的棋路,然后電腦還是會瞬間崩盤。但這次不一樣,你真的很難分辨誰是誰。

AlphaGo與人類不同的一大特點是掌控時間的方式,樊麾下棋所用的時間比電腦要長。AlphaGo的路數看起來并不像人類那樣具有侵略性。它會平靜地布局,而非發(fā)起進攻或試圖吃掉一片棋子。

我認為圍棋界的主要反應會是,就像IBM的深藍獲得國際象棋大師地位后一樣,人們希望自己能夠掌控軟件,并在自己的比賽中彌補自己的不足。

Hajin Lee,國際圍棋聯(lián)合會秘書長

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

當我知道那個電腦要挑戰(zhàn)職業(yè)頂尖棋手李世乭的時候,真的很吃驚。我當時覺得這個挑戰(zhàn)者絕對對頂級選手有多強完全沒概念。但實際上,可能我才是那個不知道這個電腦有多強的人。現在我對這個比賽非常興奮。

誰會贏呢?我不知道。李世乭自己也覺得可能那電腦跟他一樣強??赡苁俏衣牭搅颂郃lphaGo的消息,我現在驚訝于它的強大。同時我也非常了解李世乭的水平,所以我認為他們雙方五五開吧。

我覺得圍棋是個很有內涵的競技,我不覺得如果電腦AI擊敗了人類會對圍棋造成什么傷害。我想人們會接受自己被電腦技術超越這件事。

Jonathan Schaeffer,阿爾伯塔大學計算機科學家,Chinook設計師

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

我想這還不是圍棋版的深藍時刻。真正的成就是這個程序能作為選手在頂級比賽中較量的時候。深藍從1989年開始就常常戰(zhàn)勝各路大師,最后登頂則是八年之后的事情。但就目前情況來看,我認為AlphaGo和頂級人類選手之間的差距被大大縮短了??赡苤恍枰龠M行一點努力和改善,再提高一點計算能力,不出一兩年,它就能打敗人類。

就今年3月份的比賽來說,不是打擊AlphaGo團隊,我還是看好人類。我們可以把AlphaGo看成是少年天才。它突然學了一手好棋,進步神速,但畢竟還是經驗有限。從國際象棋和西洋跳棋來看,經驗還是很重要的。

Demis Hassabis,DeepMind創(chuàng)始人

Google 和 Facebook: 究竟是誰搞定了圍棋人工智能?| 深度

AlphaGo正在突飛猛進,甚至會超越最棒的人類選手。能夠看它在圍棋規(guī)則內去創(chuàng)造新的東西,感覺很神奇。我們對自己創(chuàng)造的這個系統(tǒng)有種很密切的感情,特別是它被創(chuàng)造的方式——它會學習,我們也會教它,它的風格就像人一樣。和其他編出來的程序不同,你不知道它到底都會什么,因為它能夠自己學習。

| 結語

用Facebook人工智能研究中心Yuandong Tian的話說,兩家公司確實存在著某種“友好”的競爭。是呀,這樣兩家公司之間的較量一定是件好事。腦海里不禁想起了去年Google Chrome團隊送給Microsoft Edge團隊的那個大蛋糕,不知道這一次是誰送給誰呢?

參考文獻

1.Nature doi:10.1038/nature.2016.19255

2.http://120.52.73.78/arxiv.org/pdf/1511.06410.pdf

3.Googleblog、Facebook、Wired

【作者介紹】知社學術圈,由清華教授發(fā)起的海歸學者發(fā)起的公益學術交流平臺,旨在分享學術信息,整合學術資源,加強學術交流,促進學術進步。

作者文章推薦閱讀:

1、機器自學72小時堪比國際大師,深度學習到底有多厲害?

2、谷歌AlphaGo的勝利:不是計算機打敗了人類,而是人類打敗了人類