2月20-21日,2019全球第二屆自動(dòng)駕駛論壇在武漢舉辦,本次論壇以“智能駕駛 改變未來”為主題??拼笥嶏w智能汽車事業(yè)部副總經(jīng)理、車載系統(tǒng)產(chǎn)品線總經(jīng)理錢勇發(fā)表了主題演講,演講內(nèi)容如下:
各位來賓,各位朋友,大家下午好。非常高興今天有機(jī)會(huì)在這里跟大家一起探討,一起學(xué)習(xí),剛剛坐在下面聽了前面幾位分享嘉賓的分享內(nèi)容,感慨很深,我想我們都是在為汽車智能化這個(gè)方向,在各個(gè)領(lǐng)域里面工作。然后也非常感謝蓋世汽車能提供這樣的一個(gè)平臺(tái),讓我們這些人能夠聚在一起,相互的交流,相互的學(xué)習(xí)。我今天給大家?guī)淼膮R報(bào)的主題是人工智能助力汽車的智能化發(fā)展。
這幾年來看,其實(shí)人工智能已經(jīng)成為一個(gè)非常熱門的話題。人工智能技術(shù)的確能夠提升人類工作的效率,也成為各個(gè)國(guó)家在科技發(fā)展領(lǐng)域必爭(zhēng)的一塊市場(chǎng),人工智能的技術(shù),這幾年取得了突飛猛進(jìn)的進(jìn)步,然后在各個(gè)領(lǐng)域已經(jīng)深入的應(yīng)用了,大家平時(shí)能夠看到像在語音助理這一塊,能夠提高人類獲取信息的效率。在這個(gè)教育領(lǐng)域,人工智能的應(yīng)用能夠使學(xué)生享受個(gè)性化的服務(wù),使老師的教學(xué)更加的高效。然后比如在醫(yī)療領(lǐng)域,大家現(xiàn)在看的會(huì)比較多的像人工智能,能輔助醫(yī)療診斷。人工智能這些技術(shù)在各個(gè)行業(yè)的應(yīng)用,其實(shí)離不開咱們?nèi)斯ぶ悄芗夹g(shù)的發(fā)展??拼笥嶏w作為人工智能技術(shù)的研究和產(chǎn)業(yè)應(yīng)用的企業(yè),我們一直投入巨大的精力在人工智能技術(shù)的研究和應(yīng)用這一塊,2018年我們?cè)谡麄€(gè)人工智能技術(shù)的核心應(yīng)用這塊取得了巨大的一些進(jìn)步,我們拿到了12個(gè)世界第一,這里面除了我們的語音識(shí)別,語音合成這樣的技術(shù)以外,在機(jī)器閱讀理解,在語義理解以及在醫(yī)學(xué)影像診斷這一塊也取得了非常突獲得進(jìn)步。
科大訊飛作為國(guó)家四大人工智能開放平臺(tái),目前我們的語音的日活使用次數(shù)達(dá)到了47億次,我們的平臺(tái)支持了將近90萬的開發(fā)團(tuán)隊(duì),在人工智能的技術(shù)上進(jìn)行的應(yīng)用產(chǎn)品的開發(fā),大概開發(fā)了將近55款產(chǎn)品的應(yīng)用。這些產(chǎn)品將在未來的一段時(shí)間里面走進(jìn)我們生活的各個(gè)方方面面。我們看一下我們?cè)谄嚪较虻娜斯ぶ悄茉谄嚪矫娴膽?yīng)用??拼笥嶏w在汽車領(lǐng)域已經(jīng)默默耕耘了大概有16年左右。從2012年開始,我們提出了基于云加端的架構(gòu),以及自然語言理解的技術(shù),使汽車上的語音交互更加的自然。然后在2014年我們推出了行業(yè)首款賣空陣列的降噪技術(shù),大家都知道在車上有非常大的噪音,語音識(shí)別在車?yán)镱^噪音的技術(shù)上如何去噪,然后去提升語音識(shí)別的效果,這是2014年我們重點(diǎn)的突破。在2017年我們基于aiui的技術(shù)又推出了全雙工的人工交互技術(shù),讓人機(jī)的交互更加的方便,更加的自然。
所以基于當(dāng)前我們?cè)谄嚨闹悄苷Z音的應(yīng)用這一塊已經(jīng)形成了完整的技術(shù)閉環(huán),從前端的語音降噪到語音識(shí)別,到自然語言理解,再到語音合成,整個(gè)閉環(huán)的應(yīng)用能為汽車的語音的應(yīng)用起到了非常大的基礎(chǔ)的推進(jìn)的作用。整個(gè)的語音也得到了行業(yè)伙伴的認(rèn)可與及大家的支持,目前我們的整個(gè)的語音在前裝上已經(jīng)達(dá)到了1500萬的出貨。這次非常感謝大家的支持。以上簡(jiǎn)單的把我們?cè)瓉淼恼麄€(gè)的語音交互,在這個(gè)行業(yè)里面的應(yīng)用和前景情況跟大家匯報(bào)了一下,其實(shí)現(xiàn)在大家今天上午大家也都在談,其實(shí)汽車現(xiàn)在處于一個(gè)非常重要的智能化升級(jí)的時(shí)代,在智能化升級(jí)的時(shí)代里面,多項(xiàng)技術(shù)會(huì)融合應(yīng)用來推進(jìn)整個(gè)汽車的智能化升級(jí)。所以在這個(gè)階段里面,其實(shí)我們大家更應(yīng)該探討的是如何融合這些技術(shù)來提升汽車的智能化發(fā)展的進(jìn)程。人工智能在汽車方面的應(yīng)用,其實(shí)從我們的角度理解大概可以分為兩個(gè)方面,第一個(gè)方面,汽車對(duì)于環(huán)境的理解,也是今天很多嘉賓分享的關(guān)于自動(dòng)駕駛這一塊的內(nèi)容,其實(shí)我還有一塊是汽車對(duì)于人的理解。汽車對(duì)于人的其實(shí)在自動(dòng)駕駛來臨之前,所有的功能的開拓,或者是說自動(dòng)駕駛的設(shè)計(jì),都是為了人的體驗(yàn)服務(wù)的。
人機(jī)交互和自動(dòng)駕駛其實(shí)是一種耦合平行的發(fā)展的過程的,在不同的自動(dòng)駕駛的階段,對(duì)于人機(jī)交互這個(gè)方向的需求也是不一樣的。基于當(dāng)前的自動(dòng)駕駛的發(fā)展階段,其實(shí)我們更多看到的像座艙的體驗(yàn)和出行的體驗(yàn),這個(gè)階段人機(jī)交互領(lǐng)域的必然的研究的方向。從整個(gè)架構(gòu)的角度來看,整個(gè)汽車的智能化大概可以分為幾個(gè)域,第一個(gè)就是網(wǎng)關(guān)域,也就是我們傳統(tǒng)的總線級(jí)別的,第二個(gè)是人機(jī)交互域,第三個(gè)是駕駛域,三個(gè)在各自的領(lǐng)域各自的方向都在進(jìn)行深度的自主發(fā)展。其實(shí)這三個(gè)本身也要形成這種協(xié)同式的發(fā)展,來提高真正的智能化的進(jìn)程。
今天我主要想跟大家分享一下人機(jī)交互域的問題,人機(jī)交互在前一個(gè)階段家行業(yè)里面通力合作情況下,已經(jīng)取得了比較好的進(jìn)步,但是仍然會(huì)存在一些問題,我們大概總結(jié)一下,分為幾個(gè)方面,第一個(gè)方面就是人機(jī)交互的方式,現(xiàn)在人機(jī)交互的方式雖然已經(jīng)引入了語音,但是仍然會(huì)存在這種機(jī)械感比較強(qiáng)的感覺。第二,這種交互的方式比較單一,語音就是語音,圖像交互就是視覺交互。第三個(gè)就是車內(nèi)多人交互會(huì)相互干擾。第二個(gè)板塊,其實(shí)我們看到內(nèi)容服務(wù)這一塊,內(nèi)容服務(wù)的生態(tài)的割裂以及app化對(duì)用戶的體驗(yàn)非常大,影響非常大。然后還有一點(diǎn)就是汽車場(chǎng)景單獨(dú)的服務(wù)的創(chuàng)新其實(shí)是非常難的。一般的團(tuán)隊(duì)或者小的團(tuán)隊(duì)是很難在這個(gè)方向做創(chuàng)新發(fā)展的。第三個(gè)就是整車,雖然智能化的部件越來越多,但是整體上來看的話,整車的智能化部件還是相對(duì)較少,這些部件之間的接口不標(biāo)準(zhǔn),部件之間的融合智能化的融合,其實(shí)難度非常的大。所以基于這樣的現(xiàn)狀,我們一直在考慮下一代的人機(jī)交互域的解決方案是什么樣子的,我們提出咱們的系統(tǒng)整體解決方案,解決方案重點(diǎn)我們解決三個(gè)問題,第一個(gè)是智能交互,交互升級(jí),讓我們要塑造一個(gè)有溫度,有情感的人工智能的助理。第二個(gè)就是服務(wù)的升級(jí),去app化實(shí)現(xiàn)讓服務(wù)找人。第三個(gè)就是整車融合,讓整車上的智能的設(shè)備能融合一體,提升整車的智能化的交互體驗(yàn)效果。
首先我們看第一個(gè)部分,就是智能交互的發(fā)展,汽車上的人機(jī)交互方式,從最早的按鍵式的交互到后面的觸摸屏式的交互,再到現(xiàn)在的語音交互,在語音交互里面又分為三個(gè)階段。第一個(gè)階段我們可以看到像命令詞的交互,第二個(gè)是現(xiàn)在我們?cè)谕频淖匀徽Z言是的交互。到第三個(gè)階段,多輪交互將會(huì)成為主流,在智能交互里面,我們重點(diǎn)會(huì)推三大升級(jí),這三大特性分別是什么?第一是多模態(tài)交互,第二是多乘客交互,第三是情感化交互,多模態(tài)交互,大家可以理解,最早的是按鍵式交互到觸屏式交互,以觸屏為主的交互,以及我們以推動(dòng)了語音為主的交互,其實(shí)在上個(gè)階段融合花費(fèi)了很長(zhǎng)的時(shí)間,再往后面會(huì)融入視覺交互和聲紋交互,這些感知層面的融合,其實(shí)在認(rèn)知層面需要一個(gè)運(yùn)算大腦的融合,最后在我們的呈現(xiàn)層面,在不同的平臺(tái)執(zhí)行機(jī)構(gòu)上進(jìn)行展現(xiàn)。
第二個(gè)是多乘客交互。隨著智能駕艙以及智能移動(dòng)出行的普及和發(fā)展,多乘客交互在車上會(huì)越來越實(shí)現(xiàn),多乘客在車上能夠獲取自己個(gè)性化的服務(wù),是未來我們看到的一重要市場(chǎng)的趨勢(shì)方向。大家有看到過未來的車上面已經(jīng)能夠?qū)崿F(xiàn)不同的駕駛位,通過語音交互能夠獲取不同的服務(wù),坐在主駕駛的發(fā)出指令,幫我打開天窗,打開的一定就是主駕駛位的天窗。所以這里面依賴于我們首發(fā)的一款技術(shù),多音區(qū)方案是基于科大訊飛最早的麥克風(fēng)陣列技術(shù),對(duì)車上的一位置進(jìn)行區(qū)分,然后結(jié)合聲紋技術(shù),讓每個(gè)客戶每個(gè)乘客能夠享受到它個(gè)性化的服務(wù)。
第三情感化交互?,F(xiàn)在很多人托我通過語音交互跟我們的汽車交互。還是有冷冰冰的這種汽車的感覺,所以我們會(huì)融合vr技術(shù),為每一個(gè)汽車打造每一個(gè)汽車用戶,打造一個(gè)專屬自己的虛擬人工助理。第二個(gè)板塊就是智能服務(wù),智能服務(wù)這一塊,其實(shí)我們面臨的要去解決的就是去app化以及實(shí)現(xiàn)服務(wù)找人,最早的現(xiàn)在我們的交互方式都是讓人去找服務(wù),其實(shí)在這個(gè)階段要讓服務(wù)找人和人找服務(wù),這兩種模式都能夠融匯在一起。
簡(jiǎn)單看一下去app化的體驗(yàn),核心在于云端的融合,在于賬戶的打通,在于數(shù)據(jù)的融合。有一個(gè)很簡(jiǎn)單的場(chǎng)景,比如說我們?cè)缟先ヅ懿?,我在聽一首音樂或者聽一個(gè)書,當(dāng)我在上車的時(shí)候,我的場(chǎng)景應(yīng)該自動(dòng)能夠從移動(dòng)端轉(zhuǎn)移到我的車端,要實(shí)現(xiàn)這樣的體驗(yàn),就必須打破原來app的限制,能夠讓云端的數(shù)據(jù)和賬戶能夠融會(huì)貫通。目前我們的積極努力,我們跟高德地圖,qq音樂,喜馬拉雅,美團(tuán),這些大的ip已經(jīng)能夠?qū)崿F(xiàn)賬戶的通,然后讓大家實(shí)現(xiàn)場(chǎng)景的轉(zhuǎn)移,然后實(shí)現(xiàn)服務(wù)找人。服務(wù)找人其實(shí)是一個(gè)非常苦非常累的活,他的核心的原理是在于基于用戶的數(shù)據(jù)支數(shù)據(jù)的分析的基礎(chǔ)上,把用戶的在汽車領(lǐng)域的使用場(chǎng)景進(jìn)行細(xì)分。細(xì)分到你在每一個(gè)細(xì)分場(chǎng)景下,你可能出去線的這樣的訴求,然后讓服務(wù)主動(dòng)通過主動(dòng)交互的方式,讓服務(wù)觸達(dá)的我們的用戶,這個(gè)是需要慢慢去細(xì)分場(chǎng)景的,然后最核心的一個(gè)是我們叫智能場(chǎng)景的模型。
從理念上講,我們拒絕生態(tài)割裂。所以我們一直在探索生態(tài)融合的這種方式,我們非常努力的和互聯(lián)網(wǎng)的生態(tài)內(nèi)容和服務(wù)商進(jìn)行合作。目前我們已經(jīng)與這里面所有的生態(tài)合作伙伴進(jìn)行了融合的貫通,我們的理念是為用戶提供最好的服務(wù),非生態(tài)的?;诂F(xiàn)在我們的合作模式,我們已經(jīng)形成了大概七大類30小項(xiàng)的專業(yè)技能,只有這種技能的研發(fā),才能夠讓我們?cè)谲嚿鲜褂眠@些服務(wù)更加的方便,更加的便利,因?yàn)槠噲?chǎng)景不是簡(jiǎn)單的把手機(jī)上的app搬過去就可以了,這還解決不了一個(gè)問題,只靠幾個(gè)有限的人去做這樣的事,發(fā)展會(huì)非常的慢,所以把現(xiàn)在前面做的這些工作的經(jīng)驗(yàn),做成了一個(gè)開放這樣的平臺(tái),讓更多的我們的開發(fā)者能夠能夠以更簡(jiǎn)單更方便的模式參與到技能的開發(fā)里面來,而且能夠提供一套快速上線平臺(tái),能夠讓這些技能和服務(wù)能上線,讓我們的主機(jī)廠也能夠積極的參與到自己的產(chǎn)品的改進(jìn)系統(tǒng)里面來。
在期間的智能融合這一塊,現(xiàn)在大家可能看到的最多的。比如說我們叫控制車窗,控制空調(diào),控制座椅。隨著汽車上的智能部件的越來越多,我們會(huì)面臨更多的像我們看到的智能的行車記錄儀,還有數(shù)資的儀表以及氛圍燈,只有這些設(shè)備的貫通融合,才能夠把整個(gè)汽車的智能的場(chǎng)景真正的提供我們的用戶。隨著剛剛咱們說的智能駕駛的發(fā)展,以及智慧交通的發(fā)展,我們會(huì)開放一系列的接口與咱們外圍實(shí)現(xiàn)跨越的融合,自動(dòng)駕駛和人機(jī)交互域的融合。現(xiàn)在目前我們能支持的像360的環(huán)視,人臉識(shí)別和疲勞檢測(cè)這些的系統(tǒng)之間的對(duì)接的工作。
以上我們介紹了基于下一代的人機(jī)交互域的解決方案,它的主要的核心特點(diǎn)就是我們剛說的三個(gè)交互的智能,服務(wù)的智能和整車的融合。這樣的一套系統(tǒng),其實(shí)它是需要與行業(yè)里面的各類的合作伙伴進(jìn)行深度合作的,只有把這些服務(wù),互聯(lián)網(wǎng)的服務(wù)和整車的部件的智能融合在一起,才能夠真正的打造汽車的智能化的一個(gè)體的。在整個(gè)汽車智能化時(shí)代的發(fā)展里面,其實(shí)我們面臨的巨大的挑戰(zhàn),也給我們提出了更高的要求。在這樣的一個(gè)時(shí)代里面,我們只有相互的配銷戶的跨界的融合,相互的合作才能夠更快地推動(dòng)汽車智能化的發(fā)展,能夠?yàn)槲覀兊挠脩舻拿恳淮纬鲂懈犹峁└咝У倪@種體驗(yàn)的服務(wù)。
敬請(qǐng)關(guān)注蓋世汽車“2019全球第二屆自動(dòng)駕駛論壇”直播專題
pc:
移動(dòng):
提示:本文為現(xiàn)場(chǎng)速記,未經(jīng)專家審核,請(qǐng)勿轉(zhuǎn)載!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
