探秘Facebook的人工智能大腦:Big Sur硬件系統(tǒng)

2016-07-15 18:27:40 來源:百度百家作者:佚名 人氣: 次閱讀 420 條評論

在俄勒岡州Prineville的山上一棟350,000平方英尺(32516.064平方米)的大樓里,嵌在一臺(tái)不起眼的服務(wù)器機(jī)架狹縫里面的是Fac...

  在俄勒岡州 Prineville 的山上一棟 350,000 平方英尺(32516.064 平方米)的大樓里,嵌在一臺(tái)不起眼的服務(wù)器機(jī)架狹縫里面的是 Facebook 最有價(jià)值的人工智能工具,它叫 Big Sur ,是一種訓(xùn)練軟件不斷提升性能的硬件系統(tǒng)。它使用從全世界篩選而來的海量數(shù)據(jù),并利用這棟大廈內(nèi)部的超級計(jì)算能力將以前需要幾個(gè)月才能做完的事加速到只需要幾個(gè)小時(shí)就能完成。有了 Big Sur ,F(xiàn)acebook 能夠訓(xùn)練啟動(dòng)桌面游戲播放程序和幫助軟件「解讀」圖片并向人們解釋圖片內(nèi)容的人工智能程序。

  Big Sur 系統(tǒng)可以在第二代 Facebook 的 Prineville 數(shù)據(jù)中心找到,第一代建成僅在六年前。 Prineville 是俄勒岡州中部的小城市,居民僅在 9,000以上。這座城以 Facebook 這家社交網(wǎng)絡(luò)公司的第一家美國服務(wù)器農(nóng)場為標(biāo)志,這些服務(wù)器被建造出來用于承納 Facebook 節(jié)節(jié)升高的用戶量和網(wǎng)站劇增的計(jì)算需求。現(xiàn)在,此園區(qū)包圍了 100 萬平方英尺土地,在 735 Connect 街上有將近六棟整體灰色大廈,從 126 大道向各個(gè)方向延伸。

  其運(yùn)作方式看上去更像政府辦公大樓,而不是像數(shù)據(jù)中心,而且它的安保措施覆蓋了所有進(jìn)出口。對于科技產(chǎn)業(yè)之外的人來說,他們很容易將 Big Sur 視為等同于機(jī)密文件,存放在深處的建筑群里的封鎖的多層次的物理空間之中。

  

  在 Facebook Prineville 第二代的兩個(gè)數(shù)據(jù)操作中心內(nèi)部;第三代數(shù)據(jù)中心正在構(gòu)建中。

  真正的驚喜:第三代數(shù)據(jù)中心都確實(shí)不會(huì)被嚴(yán)格保密。事實(shí)上, Facebook 去年宣布, Big Sur 在取代 Prineville 數(shù)據(jù)中心和全美國其它幾個(gè)地方的系統(tǒng)之前會(huì)成為一個(gè)開源項(xiàng)目。這家公司已經(jīng)將 Big Sur 的設(shè)計(jì)提交給了開源計(jì)算項(xiàng)目 (Open Compute Project) 。由 Facebook2010 年開創(chuàng)的數(shù)據(jù)中心社區(qū),其設(shè)計(jì)宗旨是讓硬件更高效節(jié)能,并分享公司及其競爭對手從全美國日益增長的服務(wù)器群組中學(xué)到了什么。

  通過使用 8 個(gè)現(xiàn)成的——盡管很昂貴的—— Nvidia 圖形處理器 (Nvidia GPUs ) 和生產(chǎn)商 Quanta 的設(shè)計(jì)參考書,你甚至可以自己動(dòng)手建立初級版本的Big Sur ,就像 Facebook 做的那樣。但是,如果不像 Facebook 在 Prineville 將成千上萬的基于 GPUs 的系統(tǒng)綁定在一起,你就不可能獲得符合設(shè)計(jì)初衷的能夠進(jìn)行人工智能訓(xùn)練的能力。建立真實(shí)可靠的 Big Sur 設(shè)施需要只有像谷歌或微軟這種大公司才愿意投資的某些資源。(這兩家公司都參與開源計(jì)算項(xiàng)目,而且只要他們愿意,他們就能創(chuàng)建 Big Sur 的類似版本。)

  「我們的職責(zé)不是保守秘密,」Kevin Lee 是 Facebook 技術(shù)項(xiàng)目經(jīng)理,監(jiān)管 Big Sur 和位于 Prineville 的其它服務(wù)器設(shè)計(jì),他說,「我們的目標(biāo)是理解世界,是驅(qū)動(dòng)人工智能的發(fā)展。」當(dāng)然,谷歌有它自己的訓(xùn)練人工智能的開源軟件,即 Tensor Flow ,所以 Facebook 出于與谷歌競爭的理由,也會(huì)繼續(xù)分享它的秘密。

  Lee 說,人工智能是 Facebook 未來的三大核心支柱之一。其CEO Mark Zuckerberg 四月份在 F8 開發(fā)者大會(huì)勾勒了 Facebook 十年的戰(zhàn)略規(guī)劃圖,解釋了社交網(wǎng)站 Facebook.com 如何成為這樣的公司的第一步,而它的許多移動(dòng)應(yīng)用程序是第二步。接下來十年,Zuckerberg 想讓 Facebook 引領(lǐng)網(wǎng)絡(luò)互連、無人機(jī)、增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)和人工智能行業(yè)。

  人工智能正在幫助 Facebook 軟件看見和理解世界,解讀人類語言,獨(dú)自進(jìn)行推理,并安排自己的行為過程。其中一些已經(jīng)能實(shí)際操作了。例如, Facebook 的新款多語言編輯器(multilingual composer) 讓你以某種語言編排文本,然后自動(dòng)翻譯成其它語言。另一個(gè)新鮮的例子是使用 Facebook 的人工智能去分析圖片并向盲人和視覺受損的用戶描述圖片內(nèi)容。每次你上傳圖片,訓(xùn)練 Big Sur 的圖片識(shí)別算法都會(huì)識(shí)別人臉并建議圖片中哪些人需要標(biāo)記。

  這些特征中,每個(gè)特征的中心都是機(jī)器學(xué)習(xí),一項(xiàng)幾乎和人工智能本身一樣歷史悠久的人工智能訓(xùn)練技術(shù)。多虧了海量數(shù)據(jù)集的開放以及最近計(jì)算能力的飛躍,機(jī)器學(xué)習(xí)已經(jīng)漸漸成為一種改善這類軟件日益有效的方法。和許多競爭者一樣,F(xiàn)acebook 使用機(jī)器學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)是受人類大腦啟發(fā)可以繪制模式并且把概率結(jié)果從復(fù)雜數(shù)據(jù)集中摘出的算法。

  Nvidia 公司加速計(jì)算部的副總裁 Ian Buck 與 Facebook 人工智能與數(shù)據(jù)中心團(tuán)隊(duì)有著密切合作,他說,「第一次培訓(xùn)一個(gè)獨(dú)立的神經(jīng)網(wǎng)絡(luò)花費(fèi)了我們整整三個(gè)月。」而在使用新型 Nvidia GPUs 優(yōu)化培訓(xùn)硬件后,培訓(xùn)時(shí)間被縮短到了一個(gè)月。他還說有了配備最新 Nvidia 硬件的 Big Sur,現(xiàn)在不到一天就可以培訓(xùn)一個(gè)神經(jīng)網(wǎng)絡(luò)執(zhí)行以往需要人來完成的任務(wù)。

  

  Nvidia 公司的 Ian Buck 站在一架由 Big Sur培訓(xùn)的神經(jīng)網(wǎng)絡(luò)旁,它正在基于 12,000 多幅畫作來創(chuàng)造藝術(shù)

  Buck 在低層級的 FacebookPrineville 數(shù)據(jù)中心深處實(shí)時(shí)展示這個(gè)場景。一個(gè)由 Big Sur 培訓(xùn)過的 Facebook 人工智能消耗數(shù)不勝數(shù)的看似是法國印象派畫家的畫作,并且開始自己作畫。他不使用虛擬畫架和筆刷,而是基于這些消耗的畫作設(shè)想出畫該是什么樣子,然后創(chuàng)造出圖形文件。Buck 說團(tuán)隊(duì)給它提供了 12,000 幅左右的畫作,30 分鐘內(nèi)它便開始輸出原創(chuàng)作品了。他補(bǔ)充說,還有一些培訓(xùn)它的更精細(xì)的方法——告訴人工智能更多地關(guān)注一幅比方說沒什么云彩的畫上,同時(shí)不太去關(guān)注那些畫著陰沉天空的作品。

  這還只是一個(gè)測試版本,Google Deep Dream 的神經(jīng)網(wǎng)絡(luò)同樣使用計(jì)算機(jī)視覺來建造超現(xiàn)實(shí)圖像。但是 Facebook 的概念驗(yàn)證暗示出它計(jì)劃讓人工智能遠(yuǎn)遠(yuǎn)超出圖片標(biāo)記和翻譯的范疇——Facebook 公司剛剛開始探索這些可能。

  Facebook 的作畫人工智能暗示出它計(jì)劃超越圖片標(biāo)記。

  現(xiàn)階段,F(xiàn)acebook 希望憑借越來越強(qiáng)大的部件來改進(jìn) Big Sur。Lee 表示該系統(tǒng)為模塊化,從而支持更新的 GPUs 以及不同的服務(wù)器與機(jī)架設(shè)計(jì)。以它現(xiàn)在的狀態(tài),F(xiàn)acebook 的數(shù)據(jù)科學(xué)家們和人工智能研究者們能夠登陸位于 Prineville 的服務(wù)器并且使用 Big Sur 培訓(xùn)尚未被投入使用的離線算法。

  

  Facebook 的 Kevin Lee 在 FacebookPrineville 展示一個(gè) Big Sur 系統(tǒng)

  該公司也從未回避讓第三方研究者接觸這些機(jī)會(huì)的問題。公司和個(gè)人可以通過開源計(jì)算項(xiàng)目加入該團(tuán)體,使用開源硬件和軟件并為其做出貢獻(xiàn)。

  Lee 說, 「保密硬件不是我們要做的事。」一隊(duì)參觀記者聚集在一個(gè)他從服務(wù)器機(jī)架里挪出的 Big Sur 系統(tǒng)前,證明了 Lee所說非虛。當(dāng) Lee 取出部件并解釋它們的功能時(shí),記者們一直在瘋狂地拍照。對 Big Sur 內(nèi)部運(yùn)作的強(qiáng)烈興趣在 Lee 看來似乎有些蠢——有一份 95 頁的 PDF 在線文件可以準(zhǔn)確地告訴你 Big Sur 的模樣,工作原理以及你該如何構(gòu)建它。

您可能感興趣的文章

相關(guān)文章