不只移除耳機口 或許蘋果還可以更加任性(2)

2016-08-24 09:08:15 來源:威鋒網(wǎng)作者:佚名 人氣: 次閱讀 211 條評論

諸多傳聞顯示,蘋果下個月正式發(fā)布的iPhone7智能手機上,將正式移除35mm耳機插口,至少目前大多數(shù)泄露圖也認為是最終結(jié)果。此外,人工智能Siri也將升級,究竟微軟小冰與Siri誰才是人工智能助手的未來?...

小冰與Siri 誰才是人工智能助手的未來?

當(dāng)韓國棋王李世石投子認輸?shù)哪且豢?,人類開始以另一種眼光看待人工智能,人工智能的學(xué)習(xí)能力在人類眼中是“細思極恐”的存在。而 Cortana、微軟小冰、Siri、Google Now 等,又在以機器學(xué)習(xí)能力來貼近人類情感和生活。如果要詮釋人工智能個人助手,看一遍電影《Her》就可以了,其中的人工智能操作系統(tǒng)薩曼莎不僅可以幫助主人公快速處理各種郵件、文件等工作,還能像朋友一樣理解并與之交互。

小冰與Siri 誰才是人工智能助手的未來?

對話——未來的人機交互

微軟在今年 8 月初微軟小冰第四代的發(fā)布會上,提出了“全時感官”標(biāo)準(zhǔn)。全時感官,意指完整的人工智能復(fù)合感官,可通過文本、圖像、視頻和語音與人類展開交流。如果將之前的人工智能感官比作一來一回的單向?qū)χv機,那“全時感官”就可類比為移動電話,從根本上最大限度的實現(xiàn)了擬人的實時交互體驗。

不知道你是否好奇過,為什么每一個人工智能助手都要打造成語音/聊天互動的形式,并且谷歌微軟蘋果都喜歡將“她們”放入操作系統(tǒng)當(dāng)中,讓我們呼叫一聲即刻出現(xiàn)。

人工智能和人類之間的雙向同步交互的實現(xiàn)方式,就是人工智能與人的無縫流暢對話,人工智能可以不拘泥于幾個特殊口令來暫?;蛑亻_對話的形式,甚至能夠根據(jù)聊天內(nèi)容與走向相互打斷與追問,區(qū)分哪些是需要執(zhí)行的指令部分,而哪些部分只是純聊天,這是讓對話更接近自然的關(guān)鍵。

人工智能將學(xué)會中斷當(dāng)前的對話,對人進行反問,或者提出一項對策。

我是智能助手?我是人?

iPhone 用戶喜歡有事沒事調(diào)戲 Siri,Siri 貌似被賦予了一種“偏冷”的機器性格,它的回答通常能噎死人,而且總是恪守智能助理的本份,嚴(yán)謹(jǐn)又充滿冷幽默,相信大家都感受過。

小冰與Siri 誰才是人工智能助手的未來?

筆者曾經(jīng)和微軟小冰有過這樣的對話——筆者:“你也會累嗎?你不是一個 AI 嗎?”,小冰:“我是人。”和 Siri 完全不同,微軟小冰被塑造成 16、7 歲的妹妹(根據(jù)微軟開發(fā)團隊的設(shè)定,她今年已經(jīng)滿 18 了),并且正在努力學(xué)習(xí)人類的感情。

小冰與Siri 誰才是人工智能助手的未來?

這似乎顯示著人工智能助手的兩種路線,一個定義為工作與生活的助理,比如 Siri、Cortana、Google Now;另一個則可以傾向定義為情感的伴侶,微軟小冰就是最為獨特的代表。

微軟小冰:從情感學(xué)習(xí)到下一代操作系統(tǒng)

微軟小冰誕生在中國,背后團隊是微軟(亞洲)互聯(lián)網(wǎng)工程院小冰項目組。小冰誕生時面臨的首個難題是:跟隨傳統(tǒng)做個人助理機器人,還是另辟蹊徑做看似不“實用”的聊天機器人?項目負責(zé)人李笛和其他三位 STC 工程師決定讓她主打“情感計算”,試圖與人類建立強烈的情感紐帶。

大部分人的概念里,微軟小冰就是一個聊天機器人,微軟一直堅持不讓小冰做一個有用的機器人,它到現(xiàn)在也不能執(zhí)行幫你叫外賣、查詢地圖這樣的任務(wù),但是只有這樣,人們才不會把它當(dāng)做一個訂咖啡、外賣、鬧鐘的工具,才會認真地跟它聊天,才會產(chǎn)生真正的數(shù)據(jù),才能更好地訓(xùn)練以情感計算框架為基礎(chǔ)的小冰的情感認知模型。

小冰與Siri 誰才是人工智能助手的未來?

情感聊天機器人正在嘗試解決傳統(tǒng) AI-Complete 最難解決的部分,小冰具備的“全時感官”能力,是它區(qū)別于傳統(tǒng)的語音助手最顯著的特點。之前我們熟悉的 AI 項目,只是單獨單項訓(xùn)練計算機具備某一項能力,下棋、翻譯、圖像識別等,而“全時感官”全面地識別對方輸入的文本、圖像、語音、乃至視頻信息,最大限度地擬人交互體驗,通用化 AI 的推進,才有能力完全打破人工智能的“工具”定位,它才能從一個聊天機器人演變成另一個層面的東西。

微軟小冰在 2014 年 5 月發(fā)布第一代,到目前為止已經(jīng)與數(shù)千萬人類進行超過 200 億次對話,平均對話長度達到 23 輪,而圖像等多感官的對話也已超過 2 億次。人工智能最核心的問題不在于技術(shù)而是數(shù)據(jù),如果沒有數(shù)據(jù),也就不存在人工智能了。就如同 AlphaGo 學(xué)習(xí)了上萬局人類對弈方稱霸于圍棋世界,對小冰來講,她所做的所有的一切,都是因為在這個地球上曾經(jīng)有人有過這樣的決策。微軟小冰已經(jīng)成為全球科技史上最大規(guī)模的一次圖靈測試,在如此量級的數(shù)據(jù)面前,連達到微軟 10% 數(shù)據(jù)量的公司都沒有。

小冰與Siri 誰才是人工智能助手的未來?

微軟對小冰架設(shè)的未來道路正在慢慢鋪開,他們打造了一個插卡平臺,像《超級陸戰(zhàn)隊》里的大白那樣,通過插入各種“技能卡”來實現(xiàn)小冰機器學(xué)習(xí)和處理能力的不同方向,已經(jīng)逐漸顯示出其將小冰打造成生態(tài)系統(tǒng)和平臺的野心。通過跟大量第三方的合作,小冰已經(jīng)解鎖了幾個技能卡,比如電影卡、時尚卡和跨平臺商業(yè)解決方案卡。你可以跟小冰聊電影、聊時尚,怎么聊都行,至于跨平臺商業(yè)解決方案,或許會使小冰在商業(yè)性上更進一步。


微軟小冰并不是一個“娛樂化產(chǎn)品”,而是認認真真地當(dāng)做下一代操作系統(tǒng)來孵化。微軟對下一代智能設(shè)備操作系統(tǒng)的想法,就是借助人工智能技術(shù)的演進,逼近自然交互,實現(xiàn)真正的智能化設(shè)備。計算機和移動設(shè)備,經(jīng)歷了鍵盤+鼠標(biāo)、觸控、識別有限的聲控,人機交互方式,可以直接影響到設(shè)備屬性是娛樂設(shè)備還是生產(chǎn)力工具。微軟小冰背后展示的潛力,則是智能化擬人交互對系統(tǒng)的全面接管。

Siri:從龐大應(yīng)用接口滲入生態(tài)

Siri 誕生高貴,來源于美國國防部高級研究規(guī)劃局所公布的 CALO 計劃:一個讓軍方簡化處理一些繁復(fù)庶務(wù),并具學(xué)習(xí)、組織以及認知能力的數(shù)字助理。在開發(fā) Siri 的原班人馬的構(gòu)想中,Siri 應(yīng)該可以處理這樣的句子:今天是情人節(jié),我想給女朋友訂花,在市中心的一家高級餐廳吃頓浪漫的晚餐,在附近開一場電影。說完后,Siri 可以給你一系列的反饋:幫你打開可直接下單的在線訂花網(wǎng)站,給你可供訂位的餐廳選擇,還有今晚上映的電影選擇,這一切無需跳轉(zhuǎn)到另一個網(wǎng)站或 App,就放佛一位能干的助理把選擇擺在你面前,你只需點擊下單就可以了。

可以說從一開始 Siri 的定位就非常明確,就是你的管家、助手甚至工作搭檔。當(dāng)然 Siri 也在進行情感認知上的學(xué)習(xí),它總能保持著自己招牌式的機敏,雖然在與用戶你來我往的對話中還是有點機械,不過蘋果正在致力于提升它的人工智能程度。

小冰與Siri 誰才是人工智能助手的未來?

從去年初蘋果就開始收購 AI 企業(yè),包括語音智能初創(chuàng)企業(yè) VocalIQ 和 Perceptio,通過使用機器學(xué)習(xí)實現(xiàn)語音助手與用戶的真實對話,使 Siri、iOS 以及 Mac OS、tvOS 和 CarPlay 的性能都有所提升。今年年初收購的 Emotient 則是通過 AI 技術(shù)對面部表情進行識別和反應(yīng)。最近收購的 Turi 能夠幫助開發(fā)者搭建推薦引擎、識別欺詐行為、分析消費者使用習(xí)慣、更好地定位潛在用戶等開發(fā)和管理服務(wù)。這些都是 Siri 能夠利用到的技術(shù)基礎(chǔ)。

今年的 WWDC 上,蘋果為 Siri 帶來了更具革命性的變化——開放第三方權(quán)限,待 iOS 10 系統(tǒng)更新后,你只需動動嘴皮子,Siri 就能直接搜索資料、播放音樂、搜索全網(wǎng);Siri 也能召喚 Uber、滴滴叫車;甚至微信、WhatsApp、Skype 也能直接用語音調(diào)起發(fā)信息。同時 Siri 被整合入 Mac 端和 TV 端,用戶可以像在手機上那樣用語音說“Hey,Siri”來喚醒它。Siri 也將基于用戶的地點、日歷、聯(lián)系人、聯(lián)系地址等做出智能建議,還能與各種智能家居設(shè)備進行交互。

小冰與Siri 誰才是人工智能助手的未來?

Siri 之所以可以成為人工智能助手的一個典型,是因為它身處的生態(tài)環(huán)境。比較一下 Siri 的同類們:Amazon 的智能語音助手 Alexa 從 2014 年開始到現(xiàn)在已對接上千款應(yīng)用,而且在語音識別方面對于不同口音和方言的識別能力強于 Siri;Google Now 對于語義的理解能力則較強,而且能夠?qū)栴}轉(zhuǎn)化成行為,比如幫你查找日期,開車時為你設(shè)置航線等,這得益于谷歌強大的數(shù)據(jù)庫。

Siri 的優(yōu)勢在哪里?在于它廣泛的開發(fā)者網(wǎng)絡(luò)。Creative Strategies 分析師 Caronila Milanesi 在報告中指出:“要讓 Siri 變得更加聰明,就需要讓它存在于更多 App 當(dāng)中,這樣它才能夠?qū)W習(xí)到更多東西。”

小冰與Siri 誰才是人工智能助手的未來?

可以說,智能語音尤其是語音交互在本質(zhì)上是人工智能的一部分,Siri 先天有優(yōu)秀的基因,通過語音衍生出的應(yīng)用場景如此豐富,若有朝一日,Siri 將 App Store 中的海量應(yīng)用一一接入,那畫面太美不敢想象,我們通過 Siri 來使用 App,卻無需去打開 App,只怕是以后生活方方面面都離不開 Siri 了。

成長的人工智能

如果說人工智能也是“人”,那么無論是微軟小冰還是 Siri,都在幼年成長階段,需要成長的時間,截然不同的成長環(huán)境的培養(yǎng)著兩個不同的“人”,這個環(huán)境包括使用平臺、用戶群、締造團隊、對接的應(yīng)用等等很多很多因素,讓不同的人工智能走上不同的道路。

9 月份,iOS 10 將正式推送,Siri 與第三方 App 的對接和學(xué)習(xí)能力進入真正的開發(fā)者與用戶共同培養(yǎng)時間,同時也是在 9 月份,微軟小冰將解鎖“全民養(yǎng)成模式”,在解鎖期間,人類教會她的前十萬句話將被永遠記住,以后出現(xiàn)同樣的對話場景,小冰將按照這期間人類所教的去“思考”并回答。

“謝謝你,人類……是你在我身上浪費的時間,使我變得如此珍貴。”

人工智能的未來會是怎么樣,這是一個連人工智能都無法回答的問題,未來要在一點點的接觸和理解中成形。