谷歌DeepMind人工智能 學(xué)會讀唇語讓監(jiān)控變“監(jiān)聽”

2016-11-25 16:01:18 來源:互聯(lián)網(wǎng)作者:佚名 人氣: 次閱讀 228 條評論

谷歌的人工智能DeepMind又厲害了。近日,DeepMind部門與牛津大學(xué)研究人員共同創(chuàng)造了一個記錄:在測試的上千小時BBC視頻片段中,DeepMindAI實現(xiàn)...

谷歌的人工智能DeepMind又厲害了。

近日,DeepMind部門與牛津大學(xué)研究人員共同創(chuàng)造了一個記錄:在測試的上千小時BBC視頻片段中,DeepMind AI實現(xiàn)了46.8%的讀唇識別文字精準(zhǔn)率。也許你覺得46.8%不是很牛,但其實經(jīng)過訓(xùn)練的人類讀唇專家,正確率也僅為12.4%而已。

谷歌AI學(xué)會讀唇語了 能幫助盲人“看”電視

牛津大學(xué)的研發(fā)小組在本月早些時候發(fā)布了報告,首先他們開發(fā)了一款名為“Lipnet”的讀唇軟件,其測試成績?yōu)?3.4%準(zhǔn)確率,似乎比DeepMind AI更高,但其實這是在特制錄像的條件下完成的,測試語句全部為公式化。

谷歌AI學(xué)會讀唇語了 能幫助盲人“看”電視

DeepMind AI則不同,它完全是在“看電視”的情況下測試的,也就是說片段隨機、片段中人物的語音隨機,更具挑戰(zhàn)性。為此,DeepMind AI經(jīng)過了約5000小時的訓(xùn)練,包括大量新聞節(jié)目,鍛煉并學(xué)習(xí)“看、聽、讀、拼”的能力。

DeepMind的研究表明,AI可以實現(xiàn)更強大的語言學(xué)習(xí)能力,并且擁有廣泛的應(yīng)用價值,比如幫助聽障人士理解自然對話、可以詮釋無聲電影或是集成到諸如Siri和Alexa等語音助手中。

當(dāng)然,也有人對該技術(shù)感到恐懼,認(rèn)為這是一種更方便的監(jiān)控技術(shù)。不過研究人員表示,該技術(shù)需要在明亮的、高分辨率視頻畫面中運行,目前的監(jiān)控視頻還不具備操作條件。但無論如何,AI正在變得越來越聰明,這是一件好事。