人工智能解讀唇語 不止能解碼語音和語言翻譯
使用人工智能來解碼語音和語言已有先例,而現(xiàn)在人們又能夠根據(jù)人工智能來解讀唇語。...
據(jù)外媒報道,一種新型的語音合成器可以跳過語音記錄,而直接將說話者嘴部動作轉換為語句。研究人員表示,該設備將能幫助聲帶麻痹患者發(fā)聲,向腦機接口又邁進一步。描述該裝置的研究發(fā)表在《PLOS計算生物學》期刊上。
這項研究的作者來自法國國家科學研究中心。文章中提到,“這種語音合成器將人體主要語音發(fā)音器(舌,顎,口和嘴唇)的運動轉換成智能語音。”說話者的發(fā)言,以及嘴部各個部位的位置會被同時記錄,然后通過人工智能網(wǎng)絡算法進行分析。
此處使用的人工智能算法是基于人類大腦建模的深層神經(jīng)網(wǎng)絡(DNN)。算法設計針對偏復雜的模式識別。該深層神經(jīng)網(wǎng)絡DNN通過測量舌頭、下顎、軟腭和嘴唇的協(xié)調(diào)動作(又稱為“發(fā)音語音信號”)來識別嘴正在發(fā)音的某個詞語。
作者解釋道,DNN計算模型對這些測量的數(shù)據(jù)進行訓練,將“發(fā)音語音信號”轉換成“聲學語音信號”,“這項研究中,我們讓用于訓練DNN模型的用戶,以及陌生新用戶都來測試語音合成器的實時控制性能,從而評估它在是否能很好地成為腦機接口的一部分。
”語音腦機接口將能通過解碼皮層的語言相關活動,實時控制語音合成器,從而幫助有嚴重發(fā)聲障礙的人恢復交流。為幫助連聲道都無法震動的患者“說話”,科學家將必須掌握如何解碼大腦信號,并將其翻譯成語音。
谷歌不久前推出了多語言之間機器翻譯系統(tǒng)。該系統(tǒng)被成為“Zero-Shot翻譯系統(tǒng)”,并具有自我學習能力。它能將未學習過的兩種語言翻譯成一種已經(jīng)學習過的語言 --換言之,通過人工智能訓練學習了如何實現(xiàn)X語言對Y語言的翻譯后,系統(tǒng)就能立即自動掌握從X到Z語言的翻譯。
Google Brain的博文把這項翻譯技術稱為神經(jīng)機器翻譯系統(tǒng)(Google Neural Machine Translation ,簡稱GNMT)。
AR/VR/人工智能曇花一現(xiàn)?誰來讓電視更聰明
從百廢待興到繁花似錦,電視都經(jīng)歷過。放眼當下的互聯(lián)網(wǎng)電視,也呈現(xiàn)出一片百家爭鳴的熱鬧景象,但是深剖來看,電視創(chuàng)新的腳步似乎因為從性價比模...
日本研發(fā)人工智能治療癌癥 AI應用醫(yī)療前景廣闊
近日,日本國立癌癥研究中心宣布,將與產(chǎn)業(yè)技術綜合研究所等機構共同開發(fā)運用人工智能(AI)的系統(tǒng),向每一位癌癥患者提供最合適的治療。...
谷歌大腦負責人談人工智能:科幻變現(xiàn)實
11月26日消息,據(jù)財富》網(wǎng)站報道,GoogleBrain團隊的聯(lián)合創(chuàng)始人杰夫?迪恩在接受財富》雜志的采訪時談到,研究者在推動人工智能時面臨著的挑戰(zhàn)是如何把監(jiān)督學習和非監(jiān)督學習結合起來,他還解釋了強化學習這一AI技...
谷歌DeepMind人工智能 學會讀唇語讓監(jiān)控變“監(jiān)聽”
谷歌的人工智能DeepMind又厲害了。近日,DeepMind部門與牛津大學研究人員共同創(chuàng)造了一個記錄:在測試的上千小時BBC視頻片段中,DeepMindAI實現(xiàn)...
人工智能AI將成為網(wǎng)絡安全防御神器
AI將成為網(wǎng)絡安全防御神器鳳凰科技訊北京時間11月24日消息,據(jù)外媒報道,隨著互聯(lián)網(wǎng)的普及,人們的財產(chǎn)也在迅速數(shù)字化(私人照片、客戶敏感數(shù)據(jù)、知識產(chǎn)權等),這時如何保護它們就成了企業(yè)和個人的重要一課。雖然每年都...
IBM人工智能新突破 根據(jù)語音推斷年齡
近日,IBM在人工智能領域取得了兩個新突破。長遠來看,這些成就似乎微不足道,但IBM的JasonPelecanos稱這些突破對于越來越智能的機器來說是必不可少的。...