谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

2016-01-29 08:01:00 來源:雷鋒網(wǎng) 作者:佚名 人氣: 次閱讀 148 條評(píng)論

人工智能AlphaGo實(shí)現(xiàn)了里程碑式的一步。...

【編者按】作者北大軟件與微電子研究院研究生畢業(yè),圍棋業(yè)余5段,現(xiàn)參與在線圍棋教育開發(fā)項(xiàng)目。

谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

“珍珠港遭到空襲!這不是演習(xí)!這不是演習(xí)!這不是演習(xí)!”

——2016年1月28日凌晨

從昨晚開始,一條聲稱某AI在19路棋盤上分先戰(zhàn)勝樊麾二段,并且論文已登上Nature的消息刷爆了朋友圈。一開始,就像以往的那些“大新聞”一樣,大家都認(rèn)為是標(biāo)題黨,甚至某業(yè)余7段還查驗(yàn)到其論文尚未被Nature審核通過。

然而隨著時(shí)間的推移,越來越多的近距離詳細(xì)消息傳來,開始有人相信消息的真實(shí)性。圍棋圈內(nèi)的各種微信群、朋友圈都在不斷地爭(zhēng)論,相信的人越來越多,不信的人也堅(jiān)持己見。

終于,在接近凌晨?jī)牲c(diǎn),又一條最新報(bào)道來了,這次還附帶著棋譜:《面對(duì)谷歌圍棋AI,人類最后的智力驕傲即將崩塌……》(雖是真消息,但稍有標(biāo)題黨之嫌)至此,看到棋譜的所有人幾乎都相信了:人工智能AlphaGo,實(shí)現(xiàn)了里程碑式的一步。

| 首先,在客觀上要肯定AlphaGo實(shí)現(xiàn)的水平進(jìn)步

從昨晚開始,一條聲稱某AI在19路棋盤上分先戰(zhàn)勝范麾二段,并且論文已登上Nature的消息刷爆了朋友圈。一開始,就像以往的那些“大新聞”一樣,大家都認(rèn)為是標(biāo)題黨,甚至某業(yè)余7段還查驗(yàn)到其論文尚未被Nature審核通過。

然而隨著時(shí)間的推移,越來越多的近距離詳細(xì)消息傳來,開始有人相信消息的真實(shí)性。

圍棋圈內(nèi)的各種微信群、朋友圈都在不斷的爭(zhēng)論,相信的人越來越多,不信的人也堅(jiān)持己見。

終于,在接近凌晨?jī)牲c(diǎn),又一條最新報(bào)道來了,這次還附帶著棋譜:以往最強(qiáng)的圍棋AI,大致是CrazyStone、Zen和銀星圍棋這幾個(gè)。

而AlphaGo在讓以上幾個(gè)程序(無銀星圍棋)4子的情況下,取得了80%左右的勝率。我們據(jù)此基本可以判斷,人工智能將自己的水平上限一下子提高了5個(gè)子。

樊麾二段,雖然以歐洲冠軍聞名于世,但其實(shí)圈內(nèi)誰都知道他是一名中國(guó)旅歐教學(xué)的職業(yè)棋手。

雖然遠(yuǎn)離東亞職業(yè)一線,但樊老師的水平仍然是不容置疑的,他依然有著職業(yè)的水平(雖然是較弱的職業(yè)),一般的業(yè)6仍然是比他不上的。

AlphaGo在正式比賽中對(duì)樊老師5:0(棋譜已可見),據(jù)說加上非正式比賽的總分為8:2(已確認(rèn)),再加上棋譜里AlphaGo顯示出的驚人的表現(xiàn),我們可以認(rèn)為,人工智能在圍棋上的水平已經(jīng)邁入了職業(yè)的大門。

最新:據(jù)多位頂尖棋手對(duì)棋譜的鑒定,認(rèn)為AlphaGo的水平應(yīng)該在業(yè)余強(qiáng)6段到弱職業(yè)之間,離人類頂尖大概還有一先到兩先的差距

說的更明白點(diǎn),之前的AI在蒙特卡洛算法的幫助下雖然取得了革命性的進(jìn)步,戰(zhàn)勝了絕大多數(shù)的人類,但人類中能戰(zhàn)勝那些AI的人數(shù)可能仍然在近百萬的級(jí)別。

而自今日(其實(shí)已經(jīng)是三個(gè)月前了)的AlphaGo起,能在圍棋盤上戰(zhàn)勝AI的人類人數(shù)可能已經(jīng)不到千人了。

按照Facebook人工智能研究院的田淵棟老師的說法,這個(gè)消息在相關(guān)研究圈內(nèi)應(yīng)該早就不是新聞了。

甚至回想一下昨天扎克伯格在facebook上突然發(fā)聲支持自己的研究團(tuán)隊(duì),也因?yàn)槭侵懒薵oogle團(tuán)隊(duì)的成果即將在一日內(nèi)公示,所以想要搶占一個(gè)在輿論的位置。

(田老師參與的facebook的研究團(tuán)隊(duì),是google現(xiàn)在最大的競(jìng)爭(zhēng)對(duì)手,田老師他們使用的方法應(yīng)該不太一樣,雖然他們暫時(shí)落后,但我同樣也很期待他們的下一步進(jìn)展)

總之,從事實(shí)看來,這不是演習(xí)已經(jīng)是顯而易見的事實(shí)。

接下來談點(diǎn)個(gè)人對(duì)人工智能的粗淺理解。

| 蒙特卡洛算法之后,我看到了新的天地

近些年來,盡管在蒙特卡洛算法的幫助下,AI實(shí)現(xiàn)了革命性的進(jìn)步,達(dá)到了能戰(zhàn)勝大部分人類的水平(中等業(yè)余5段),但隨著摩爾定律的走向終點(diǎn),計(jì)算機(jī)硬件的發(fā)展速度在舊有的道路上暫時(shí)無法按以前的速度爆炸發(fā)展下去,大家都認(rèn)為僅憑蒙特卡洛算法是無法幫助AI戰(zhàn)勝人類的。

依據(jù)個(gè)人的理解,我曾將圍棋的思維過程分解為四步的演進(jìn):常識(shí)→棋感→計(jì)算→判斷

大約一年前,我曾和李喆七段就此問題進(jìn)行過簡(jiǎn)單討論,當(dāng)時(shí)我認(rèn)為蒙特卡洛算法的成功主要在于為人工智能建立了“棋感”,而以往的人工智能只能在“常識(shí)”和“計(jì)算”具有天然優(yōu)勢(shì)。

在蒙特卡洛算法之前,雖然計(jì)算機(jī)憑借強(qiáng)大的計(jì)算力可以積累大量“常識(shí)”,但由于“棋感”的缺失,人工智能無法對(duì)計(jì)算方向進(jìn)行有效的篩選,最終就不免淪于蠻力搜索。

而蠻力搜索雖然可以在一定程度上實(shí)現(xiàn)高水平的“計(jì)算”,甚至很多其他棋類都在這一環(huán)節(jié)上被人工智能打敗,而由于圍棋的過度復(fù)雜和摩爾定律結(jié)束對(duì)計(jì)算機(jī)發(fā)展前景的限制,走到這一步仍然無法讓人工智能戰(zhàn)勝人類。

谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

(注:上圖為計(jì)算機(jī)眼中的國(guó)際象棋落子思路,而下圖為計(jì)算機(jī)眼中的圍棋落子思路,來自谷歌deepmind官網(wǎng)AlphaGo | Google DeepMind)

谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

而蒙特卡洛算法出現(xiàn)后,憑借大量?jī)?chǔ)備的棋局,通過勝負(fù)概率來判斷下一步著點(diǎn)以作為計(jì)算方向,極大的提高的計(jì)算的效率,所以AI的水平才實(shí)現(xiàn)了革命性的進(jìn)步。

而這次的AlphaGo,使用了深度神經(jīng)網(wǎng)絡(luò)與蒙特卡洛樹狀搜索相結(jié)合的方法。

依據(jù)已經(jīng)能看到的Nature上的論文(可見雷鋒網(wǎng)文章:《Google人工智能擊敗歐洲圍棋冠軍, AlphaGo 究竟是怎么做到的?》),研究者們?cè)贏lphaGo中加入了兩個(gè)深度神經(jīng)網(wǎng)絡(luò),以value networks來評(píng)估大量的選點(diǎn),而以policy networks來選擇落子,并且開發(fā)了一種新式算法來結(jié)合蒙特卡洛算法和以上兩個(gè)神經(jīng)網(wǎng)絡(luò)。

谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

(注:上圖為AlphaGo使用的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖,來自原論文)

在這種結(jié)合下,研究者們結(jié)合參考人類職業(yè)對(duì)局的監(jiān)督式學(xué)習(xí),和AI大量積累自對(duì)弈實(shí)現(xiàn)的深度學(xué)習(xí),來訓(xùn)練和提高AI的圍棋實(shí)力。

在蒙特卡洛算法之后,我看到了新的天地。這種結(jié)合以及新式的思路,讓人感到前景無限。

最后談一談,我認(rèn)為我們應(yīng)該保有的態(tài)度。

| 如何面對(duì)人工智能?

這里,我首先想引用李喆七段在今天早上說的話:

我們已來到兩個(gè)時(shí)代的連接處,無論你是否愿意,這都是一個(gè)需要接受的事實(shí)。工具無善惡,善惡在人心。未來的路通往何方,將由我們自己決定?!?/strong>

從凌晨到早上,朋友圈里的評(píng)論區(qū)一直爭(zhēng)論不休,甚至某世界冠軍一直在說“不信”,畢竟大家在沒有看到板上的釘子之前,從情感上都是不愿意相信的。直到另外兩位一線棋手告訴他,已經(jīng)可以看到棋譜了......

面對(duì)這個(gè)事件,接下來將會(huì)有很多的爆炸性新聞報(bào)道,以及各種各樣姿勢(shì)的討論。

我們要知道:

一.人工智能的確實(shí)現(xiàn)了很大的進(jìn)步。

這次的進(jìn)步可能是革命性的,這次新聞宣稱的AI取得的成績(jī)并不是“標(biāo)題黨”。

二.人工智能還沒有戰(zhàn)勝人類(什么所謂“人類最后的驕傲陷落”都屬于“標(biāo)題黨”)。

但朝著這個(gè)方向邁出了一大步,而且是在很多人在蒙特卡洛之后不看好AI下一步發(fā)展的情況下,來了一個(gè)突然襲擊(谷歌從開始研究到出成果再到發(fā)布,一直憋一個(gè)大新聞憋這么久也真是能忍)。

三.人工智能戰(zhàn)勝人類的時(shí)點(diǎn),可能比很多人想象的要來得更早了。

不是之前設(shè)想的生物計(jì)算機(jī)或者量子計(jì)算機(jī)出現(xiàn)后,甚至都不是新材料取代硅晶片之后,在這個(gè)時(shí)代就有可能出現(xiàn)了。也許是五十年后,也許是二十年后,甚至可能是十年后。

從小學(xué)時(shí)開始,我就癡迷于許峰雄教授對(duì)于計(jì)算機(jī)國(guó)際象棋項(xiàng)目的研究和成就,一直追蹤到97年“深藍(lán)”戰(zhàn)勝卡斯帕羅夫。(就是在那之后不久,我才從國(guó)際象棋轉(zhuǎn)投了圍棋......)

谷歌AlphaGo的勝利:不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類

(注:上圖為第一個(gè)打敗人類的計(jì)算機(jī)國(guó)際象棋程序“深藍(lán)”之父——許峰雄)

從中學(xué)時(shí)代到大學(xué)時(shí)代,我一直追尋著許教授的動(dòng)態(tài)和他撰寫的各種文章、書籍,他寫的《“深藍(lán)”揭秘》被我翻的都爛了,我甚至在中學(xué)時(shí)代一直想以此作為未來的求學(xué)從研的方向。

許教授離開IBM、前往亞研院并聲稱準(zhǔn)備致力于作為最終問題的計(jì)算機(jī)圍棋難題之后,我仍然一年年心心念念的期待著許教授的后續(xù)動(dòng)作。

然而十多年過去,等來的卻是無數(shù)的后來者。

這也挺好,人類就是不缺后來者。

看許教授對(duì)當(dāng)年研究過程的講述,最大的感受就是:

其實(shí)并不是計(jì)算機(jī)打敗了人類,而是人類打敗了人類。

大量的計(jì)算機(jī)專家,配合大量的國(guó)際象棋職業(yè)棋手,在算法上不斷革新,再搭乘上摩爾定律的東風(fēng),不斷的失敗再重來、輸了再修正,最終才解決了計(jì)算機(jī)國(guó)際象棋難題。

卡斯帕羅夫,是敗給了數(shù)以百計(jì)的人類專家的智慧的合力。

圍棋也會(huì)是一樣,計(jì)算機(jī)——今天說人工智能更合適,戰(zhàn)勝人類的那一天遲早會(huì)來,大部分人都從來不否認(rèn)這一點(diǎn)。

爭(zhēng)論,始終在于這一天的早晚。

而棋手和圍棋從業(yè)者們,出于可以理解的感情,總是希望并認(rèn)為這一天不會(huì)來得那么快,但他們絕對(duì)不會(huì)拒絕甚至仇視這種進(jìn)步。

其實(shí)我看到的很多人,都一直期待并贊許著人工智能的進(jìn)步,甚至很多職業(yè)高手還親身參與和幫助著計(jì)算機(jī)圍棋項(xiàng)目的研究。我們努力打造著一個(gè)“大玩具”,一個(gè)能戰(zhàn)勝自己的“大玩具”。

所以最終的成功,是我們?nèi)祟愖约旱某晒?,而不?yīng)該對(duì)計(jì)算機(jī)感到恐懼。

同時(shí),這“大玩具”也不只是好玩而已,人工智能對(duì)于現(xiàn)代乃至未來科技的發(fā)展有著極大的意義,這意義甚至?xí)霎?dāng)年原子彈研究的后續(xù)紅利。

所以不要害怕,不要煩惱,讓我們期待著人工智能在圍棋上戰(zhàn)勝人類的那一天的到來吧。

我之前一直認(rèn)為在我有生之年是看不到這一天的,然而現(xiàn)在看來,我錯(cuò)了。

我一點(diǎn)也不失望,反而感到很興奮,很激動(dòng),并且期待著以google和facebook為首的前沿研究團(tuán)隊(duì)們的進(jìn)一步的表現(xiàn)。最后的最后,恭喜谷歌,恭喜圍棋,恭喜人類。

另外,文本先發(fā)于知乎(我的知乎ID:高飛龍),希望也能與雷鋒網(wǎng)的讀者們一起分享,歡迎留言探討。

推薦閱讀:

1、Google人工智能擊敗歐洲圍棋冠軍, AlphaGo 究竟是怎么做到的?

2、Google人工智能攻破了圍棋,然后呢?