在智能家居領(lǐng)域,雖然眾多企業(yè)早已涉足,但一個(gè)最具推廣性和可靠性的技術(shù)模式仍在探索之中。近日,地平線副總裁張永謙出席在AWE舉辦的論壇,圍繞“智能家居時(shí)代的機(jī)遇和挑戰(zhàn)”發(fā)表了地平線的觀點(diǎn),并介紹了地平線在這方面的技術(shù)突破和解決方案。
中國智能家居市場規(guī)模十分巨大
中國有1億的中產(chǎn)階級家庭,這一億家庭年平均收入在30萬到70萬人民幣左右,他們是智能家居市場的主力消費(fèi)人群,足見智能家居市場的規(guī)模之大。當(dāng)然,說到智能家居,很多人的第一個(gè)印象是電子設(shè)備,這個(gè)市場確實(shí)很大,有1萬億。但其實(shí)智能家居市場真正的“潛力股”是家庭消費(fèi)和服務(wù)——每年的市場可以達(dá)到50萬億,其中有10%通過線上進(jìn)行。如果企業(yè)能夠更方便、更快捷和更精準(zhǔn)的幫助消費(fèi)者進(jìn)行家庭消費(fèi)、提供服務(wù),那么它將獲得巨大的成功。
智能家居市場三個(gè)變化趨勢
通過對這個(gè)市場發(fā)展趨勢的思考,我們可以發(fā)現(xiàn)三個(gè)比較明顯的變化,是已經(jīng)發(fā)生或者會(huì)在很快發(fā)生的。
第一個(gè)是物理入口,目前最主要的入口是手機(jī)和PAD等,這個(gè)入口是非常擁擠的,千軍萬馬擠獨(dú)木橋。將來一個(gè)非常明顯的趨勢就是,整個(gè)消費(fèi)和服務(wù)的接入是分散到各個(gè)智能設(shè)備的。將來在家里,每一個(gè)硬件都是一個(gè)獨(dú)立的APP。你發(fā)現(xiàn)冰箱里面沒有飲料的時(shí)候,你不需要拿出手機(jī),解鎖,打開APP等購買,這個(gè)用戶體驗(yàn)是很差的。你可以直接一句話告訴冰箱,下午給我送一打啤酒過來。
第二個(gè)是交互方式,最傳統(tǒng)的是鍵盤和觸摸屏。隨著人工智能的發(fā)展,語音技術(shù)也將很快的普及到我們的生活中。但我們認(rèn)為,在不遠(yuǎn)的將來會(huì)有一個(gè)更為重要、更為重量級的方式,那就是通過視覺的交互。因?yàn)楝F(xiàn)在大家可以看到,不管是通過觸控還是通過語音進(jìn)行交互,其實(shí)都是人類主動(dòng)決策、機(jī)器被動(dòng)接受的過程。而視覺是主動(dòng)交互。
視覺交互帶來了第三個(gè)變化,那就是機(jī)器主動(dòng)決策——人類不需要關(guān)注很多家庭的事情了,連命令都不用下,機(jī)器就能在最合適的時(shí)間完成服務(wù)。舉個(gè)例子,現(xiàn)在已經(jīng)有上門洗衣的服務(wù)了,我們可以想象一下,將來家里面在陽臺上放一個(gè)大的籃子,把臟衣服扔進(jìn)去,陽臺有一個(gè)攝像頭,看到這個(gè)籃子里面的衣服累計(jì)到一定程度的時(shí)候,自動(dòng)的聯(lián)系上門的洗衣服務(wù),全程不用人類操心。將來的消費(fèi)以及服務(wù)會(huì)更多的是通過AI主動(dòng)推薦的模式,這個(gè)里面帶來的市場商業(yè)機(jī)會(huì)是會(huì)遠(yuǎn)遠(yuǎn)大于傳統(tǒng)模式的。因?yàn)橐曈X相比語音和觸控是更高維的溝通方式,它能收集到的信息遠(yuǎn)大于觸控和語音這樣的二維方式帶來的信息。
智能家居市場面臨的挑戰(zhàn)
談完潛在的變化后,智能家居市場雖然講了很多年,但還沒有真正的“爆發(fā)”起來,為什么呢?我們認(rèn)為主要有四個(gè)方面的原因。
第一個(gè)是應(yīng)用場景分散,有安全、娛樂、家庭服務(wù)、健康、教育等非常多的場景,另外家里面的智能設(shè)備過于分散,比如家電,玩具、機(jī)器人、攝像頭等等,所有這些分散的應(yīng)用場景和電子設(shè)備會(huì)導(dǎo)致當(dāng)我們把它們智能化的時(shí)候,很難快速復(fù)制。
第二個(gè)挑戰(zhàn),是技術(shù)。家庭場景很復(fù)雜,需要能處理語音和圖像,做到很好的感知、認(rèn)知,技術(shù)挑戰(zhàn)直到今天仍然很大。
第三個(gè),數(shù)據(jù)。數(shù)據(jù)的搜集和分析是一個(gè)很難的過程,首先,家里面每個(gè)場景都是高度分散化的,每個(gè)家庭的需求也是不一樣的。其次,只拿到大數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)榧词辜依锇惭b上很多的傳感器,搜集到很多的數(shù)據(jù),但是這些數(shù)據(jù)絕大部分都是垃圾數(shù)據(jù),如果不停的把這些數(shù)據(jù)上傳到云端處理,會(huì)占用巨大的帶寬和云端處理資源,不具備可操作性。所以我們搜集數(shù)據(jù)的時(shí)候,我們要思考,不僅僅要搜集數(shù)據(jù),而且要搜集真正有價(jià)值的數(shù)據(jù)。但是這個(gè)事情并不是這么容易做到的。
第四個(gè)挑戰(zhàn),真正的用戶體驗(yàn)很難。我們服務(wù)的對象是人,對于體驗(yàn)的要求很高。我們現(xiàn)在人工智能的技術(shù)得到了很快的發(fā)展,但尚不能真正讓人感覺到交互方式和服務(wù)方式非常自然。
有了這些挑戰(zhàn),人工智能在智能生活上的普及,我們覺得一定不是一蹴而就的事情,一定需要一段時(shí)間的慢慢積累。
如何應(yīng)對智能家居的這些挑戰(zhàn)
應(yīng)對這些挑戰(zhàn),地平線有自己的觀點(diǎn)。
第一,應(yīng)用場景分散的問題,我們認(rèn)為要抓住其中的主要矛盾,和不變量,就是“人”,我們現(xiàn)在智能家居這個(gè)領(lǐng)域就應(yīng)該把人做透。比如安全問題,現(xiàn)在家里面裝很多攝象頭主要的目的是為了安全,而安全其實(shí)核心是什么呢?最主要的是想知道家里有沒有人,是家里人還是陌生人,以及這個(gè)人的行為,他做的行為是安全的行為還是不安全的,比如小孩子進(jìn)入廚房,會(huì)不會(huì)點(diǎn)煤氣灶,這些都是不安全的行為。所有應(yīng)用場景都是圍繞人。比如娛樂,家庭服務(wù)、健康、教育等等,就不一一舉例了,我們地平線做的就是從人臉,到人的行為分析,到人周圍環(huán)境,以及這個(gè)人的語音和設(shè)備的交互,我們主要的核心點(diǎn)就是圍繞人,把這個(gè)技術(shù)做好,支撐巨大的分散的智能家居的需求。
第二個(gè)是技術(shù)上的挑戰(zhàn),人的交互方式和獲取信息的方式其實(shí)是一個(gè)融合的方式,單獨(dú)的語音和圖像,或者單獨(dú)的其他任何傳感器,都不能涵蓋所有的應(yīng)用場景。所以一定是要圖像+語音。另外視覺是高維高價(jià)值的,80%的價(jià)值信息來自于圖像,只有20%來自于語音,在技術(shù)上要完成對智能家居最好體驗(yàn)的布局,必須把圖像和語音的技術(shù)融合,單獨(dú)的做語音或圖像都是缺位的。
第三個(gè)數(shù)據(jù)的挑戰(zhàn)。要獲取有價(jià)值的數(shù)據(jù),怎么獲取呢?這個(gè)本身是不容易做到的,我們的思路也是比較清晰,就是做嵌入式的人工智能“端+云”的方式。端側(cè)呢,現(xiàn)在我們談到所謂的人工智能創(chuàng)業(yè)公司也好,大公司也好,他們其實(shí)更多的是在云上做,但是端上有不可取代的價(jià)值。主要是幾個(gè)方面,第一,端是不依賴于網(wǎng)絡(luò)的,不管是在家里,還是哪里,大家會(huì)發(fā)現(xiàn)家里的無線網(wǎng)絡(luò)覆蓋很難做到完美,如果是在樓下,或者是在移動(dòng)的場景中,網(wǎng)絡(luò)的全覆蓋更是一個(gè)很難的事情,特別是當(dāng)你牽涉到一些智能圖像處理的時(shí)候,你很難實(shí)時(shí)地把圖像傳到云端再處理回來,這個(gè)時(shí)候?qū)崟r(shí)性沒有了。第二,端上可以對數(shù)據(jù)進(jìn)行選擇,只把有價(jià)值的數(shù)據(jù)傳到云端。比如我陽臺上有一個(gè)洗衣服的籃子,我就只關(guān)注這個(gè)里面衣服滿的時(shí)候,這個(gè)狀態(tài)我傳到云端。如果這個(gè)里面衣服沒有滿,99%的時(shí)間,這些數(shù)據(jù)是毫無意義的,就拋棄了。必須采用一個(gè)端+云的方式,這樣才有可能真正的做到最高效,而且是最有性價(jià)比的智能服務(wù)。
有了端上的智能以后,在云端可以做很多的事情,一個(gè)是可以用數(shù)據(jù)迭代模型,持續(xù)的優(yōu)化用戶的體驗(yàn);另外是每一個(gè)硬件,將來都是和手機(jī)的形態(tài)一樣,他在上面都可以下載很多的智能APP,這個(gè)硬件可能已經(jīng)脫離了原來的形態(tài)了,你買回來的時(shí)候可能是一個(gè)家電,也可能是一個(gè)機(jī)器人,但是隨著智能的升級,他可以具備很多全新的屬性和功能。
當(dāng)我們真的有了這個(gè)大數(shù)據(jù),也對人的喜好有了了解以后,這個(gè)就不局限在家里了,當(dāng)我們到任何一個(gè)地方都可以通過云端升級本地的智能設(shè)備,讓他們變成像家里一樣最懂我的環(huán)境。將來的智能家居市場一定是端+云的架構(gòu)。
第四個(gè),真正的用戶體驗(yàn),這是非常難的事情。舉個(gè)例子,語音,不僅要支持遠(yuǎn)場和近場,識別一些帶口音的普通話,甚至是方言。還要考慮實(shí)際應(yīng)用中,如果很多人同時(shí)講話的時(shí)候,家里很多語音設(shè)備的識別率就會(huì)下降的比較厲害。所以當(dāng)我們做技術(shù)時(shí),一定要考慮實(shí)際的使用場景。圖像也是一樣,比如人臉識別,如果你離的很近,確實(shí)識別得很好,但是如果離得比較遠(yuǎn),如果是走動(dòng)的狀態(tài)下,如果是背光的情況下,怎么辦?這些都要解決,只有這樣用戶體驗(yàn)才能真正好,消費(fèi)者才真正的愿意使用這個(gè)技術(shù),這個(gè)市場才能真正的起來。另外一個(gè),我們的技術(shù)更多還要努力讓攝像頭做到主動(dòng)的服務(wù),要懂用戶,只有懂用戶才能使用戶得到好的體驗(yàn)。