機(jī)電之家
欄目導(dǎo)航
- 產(chǎn)品
- 工廠
- 價(jià)格
- 采招
- 資訊
- 人才
- 樣本
- 產(chǎn)地
- 市場(chǎng)
- 周邊
- 二手
- 加盟
- 培訓(xùn)
- 會(huì)展
- 求購(gòu)
- 技術(shù)
- 案例
- 工品
- 人脈
- 工服
工業(yè)APP
VIP會(huì)員服務(wù)
城市分站

華北區(qū)

北京天津石家莊太原哈爾濱包頭邢臺(tái)邯鄲廊坊市唐山保定秦皇島

華中區(qū)

鄭州武漢長(zhǎng)沙重慶開封新鄉(xiāng)株洲洛陽隨州許昌湘潭黃石

華東區(qū)

上海南京杭州合肥福州南昌濟(jì)南青島寧波溫州蘇州鹽城

華南區(qū)

廣州深圳海口佛山東莞南寧珠海中山

西部區(qū)

陜西甘肅四川重慶云南貴州新疆青海寧夏西藏

東北區(qū)

遼寧吉林黑龍江

更多城市>>
視頻

科大訊飛錢勇：車載語音交互技術(shù)助力智能汽車強(qiáng)勢(shì)發(fā)展

2019-02-20 22:13:53　來源: 　訪問：3006 次

2月20-21日，2019全球第二屆自動(dòng)駕駛論壇在武漢舉辦，本次論壇以“智能駕駛改變未來”為主題?？拼笥嶏w智能汽車事業(yè)部副總經(jīng)理、車載系統(tǒng)產(chǎn)品線總經(jīng)理錢勇發(fā)表了主題演講，演講內(nèi)容如下：

各位來賓，各位朋友，大家下午好。非常高興今天有機(jī)會(huì)在這里跟大家一起探討，一起學(xué)習(xí)，剛剛坐在下面聽了前面幾位分享嘉賓的分享內(nèi)容，感慨很深，我想我們都是在為汽車智能化這個(gè)方向，在各個(gè)領(lǐng)域里面工作。然后也非常感謝蓋世汽車能提供這樣的一個(gè)平臺(tái)，讓我們這些人能夠聚在一起，相互的交流，相互的學(xué)習(xí)。我今天給大家?guī)淼膮R報(bào)的主題是人工智能助力汽車的智能化發(fā)展。

這幾年來看，其實(shí)人工智能已經(jīng)成為一個(gè)非常熱門的話題。人工智能技術(shù)的確能夠提升人類工作的效率，也成為各個(gè)國(guó)家在科技發(fā)展領(lǐng)域必爭(zhēng)的一塊市場(chǎng)，人工智能的技術(shù)，這幾年取得了突飛猛進(jìn)的進(jìn)步，然后在各個(gè)領(lǐng)域已經(jīng)深入的應(yīng)用了，大家平時(shí)能夠看到像在語音助理這一塊，能夠提高人類獲取信息的效率。在這個(gè)教育領(lǐng)域，人工智能的應(yīng)用能夠使學(xué)生享受個(gè)性化的服務(wù)，使老師的教學(xué)更加的高效。然后比如在醫(yī)療領(lǐng)域，大家現(xiàn)在看的會(huì)比較多的像人工智能，能輔助醫(yī)療診斷。人工智能這些技術(shù)在各個(gè)行業(yè)的應(yīng)用，其實(shí)離不開咱們?nèi)斯ぶ悄芗夹g(shù)的發(fā)展?？拼笥嶏w作為人工智能技術(shù)的研究和產(chǎn)業(yè)應(yīng)用的企業(yè)，我們一直投入巨大的精力在人工智能技術(shù)的研究和應(yīng)用這一塊，2018年我們?cè)谡麄€(gè)人工智能技術(shù)的核心應(yīng)用這塊取得了巨大的一些進(jìn)步，我們拿到了12個(gè)世界第一，這里面除了我們的語音識(shí)別，語音合成這樣的技術(shù)以外，在機(jī)器閱讀理解，在語義理解以及在醫(yī)學(xué)影像診斷這一塊也取得了非常突獲得進(jìn)步。

科大訊飛作為國(guó)家四大人工智能開放平臺(tái)，目前我們的語音的日活使用次數(shù)達(dá)到了47億次，我們的平臺(tái)支持了將近90萬的開發(fā)團(tuán)隊(duì)，在人工智能的技術(shù)上進(jìn)行的應(yīng)用產(chǎn)品的開發(fā)，大概開發(fā)了將近55款產(chǎn)品的應(yīng)用。這些產(chǎn)品將在未來的一段時(shí)間里面走進(jìn)我們生活的各個(gè)方方面面。我們看一下我們?cè)谄嚪较虻娜斯ぶ悄茉谄嚪矫娴膽?yīng)用?？拼笥嶏w在汽車領(lǐng)域已經(jīng)默默耕耘了大概有16年左右。從2012年開始，我們提出了基于云加端的架構(gòu)，以及自然語言理解的技術(shù)，使汽車上的語音交互更加的自然。然后在2014年我們推出了行業(yè)首款賣空陣列的降噪技術(shù)，大家都知道在車上有非常大的噪音，語音識(shí)別在車?yán)镱^噪音的技術(shù)上如何去噪，然后去提升語音識(shí)別的效果，這是2014年我們重點(diǎn)的突破。在2017年我們基于aiui的技術(shù)又推出了全雙工的人工交互技術(shù)，讓人機(jī)的交互更加的方便，更加的自然。

所以基于當(dāng)前我們?cè)谄嚨闹悄苷Z音的應(yīng)用這一塊已經(jīng)形成了完整的技術(shù)閉環(huán)，從前端的語音降噪到語音識(shí)別，到自然語言理解，再到語音合成，整個(gè)閉環(huán)的應(yīng)用能為汽車的語音的應(yīng)用起到了非常大的基礎(chǔ)的推進(jìn)的作用。整個(gè)的語音也得到了行業(yè)伙伴的認(rèn)可與及大家的支持，目前我們的整個(gè)的語音在前裝上已經(jīng)達(dá)到了1500萬的出貨。這次非常感謝大家的支持。以上簡(jiǎn)單的把我們?cè)瓉淼恼麄€(gè)的語音交互，在這個(gè)行業(yè)里面的應(yīng)用和前景情況跟大家匯報(bào)了一下，其實(shí)現(xiàn)在大家今天上午大家也都在談，其實(shí)汽車現(xiàn)在處于一個(gè)非常重要的智能化升級(jí)的時(shí)代，在智能化升級(jí)的時(shí)代里面，多項(xiàng)技術(shù)會(huì)融合應(yīng)用來推進(jìn)整個(gè)汽車的智能化升級(jí)。所以在這個(gè)階段里面，其實(shí)我們大家更應(yīng)該探討的是如何融合這些技術(shù)來提升汽車的智能化發(fā)展的進(jìn)程。人工智能在汽車方面的應(yīng)用，其實(shí)從我們的角度理解大概可以分為兩個(gè)方面，第一個(gè)方面，汽車對(duì)于環(huán)境的理解，也是今天很多嘉賓分享的關(guān)于自動(dòng)駕駛這一塊的內(nèi)容，其實(shí)我還有一塊是汽車對(duì)于人的理解。汽車對(duì)于人的其實(shí)在自動(dòng)駕駛來臨之前，所有的功能的開拓，或者是說自動(dòng)駕駛的設(shè)計(jì)，都是為了人的體驗(yàn)服務(wù)的。

人機(jī)交互和自動(dòng)駕駛其實(shí)是一種耦合平行的發(fā)展的過程的，在不同的自動(dòng)駕駛的階段，對(duì)于人機(jī)交互這個(gè)方向的需求也是不一樣的。基于當(dāng)前的自動(dòng)駕駛的發(fā)展階段，其實(shí)我們更多看到的像座艙的體驗(yàn)和出行的體驗(yàn)，這個(gè)階段人機(jī)交互領(lǐng)域的必然的研究的方向。從整個(gè)架構(gòu)的角度來看，整個(gè)汽車的智能化大概可以分為幾個(gè)域，第一個(gè)就是網(wǎng)關(guān)域，也就是我們傳統(tǒng)的總線級(jí)別的，第二個(gè)是人機(jī)交互域，第三個(gè)是駕駛域，三個(gè)在各自的領(lǐng)域各自的方向都在進(jìn)行深度的自主發(fā)展。其實(shí)這三個(gè)本身也要形成這種協(xié)同式的發(fā)展，來提高真正的智能化的進(jìn)程。

今天我主要想跟大家分享一下人機(jī)交互域的問題，人機(jī)交互在前一個(gè)階段家行業(yè)里面通力合作情況下，已經(jīng)取得了比較好的進(jìn)步，但是仍然會(huì)存在一些問題，我們大概總結(jié)一下，分為幾個(gè)方面，第一個(gè)方面就是人機(jī)交互的方式，現(xiàn)在人機(jī)交互的方式雖然已經(jīng)引入了語音，但是仍然會(huì)存在這種機(jī)械感比較強(qiáng)的感覺。第二，這種交互的方式比較單一，語音就是語音，圖像交互就是視覺交互。第三個(gè)就是車內(nèi)多人交互會(huì)相互干擾。第二個(gè)板塊，其實(shí)我們看到內(nèi)容服務(wù)這一塊，內(nèi)容服務(wù)的生態(tài)的割裂以及app化對(duì)用戶的體驗(yàn)非常大，影響非常大。然后還有一點(diǎn)就是汽車場(chǎng)景單獨(dú)的服務(wù)的創(chuàng)新其實(shí)是非常難的。一般的團(tuán)隊(duì)或者小的團(tuán)隊(duì)是很難在這個(gè)方向做創(chuàng)新發(fā)展的。第三個(gè)就是整車，雖然智能化的部件越來越多，但是整體上來看的話，整車的智能化部件還是相對(duì)較少，這些部件之間的接口不標(biāo)準(zhǔn)，部件之間的融合智能化的融合，其實(shí)難度非常的大。所以基于這樣的現(xiàn)狀，我們一直在考慮下一代的人機(jī)交互域的解決方案是什么樣子的，我們提出咱們的系統(tǒng)整體解決方案，解決方案重點(diǎn)我們解決三個(gè)問題，第一個(gè)是智能交互，交互升級(jí)，讓我們要塑造一個(gè)有溫度，有情感的人工智能的助理。第二個(gè)就是服務(wù)的升級(jí)，去app化實(shí)現(xiàn)讓服務(wù)找人。第三個(gè)就是整車融合，讓整車上的智能的設(shè)備能融合一體，提升整車的智能化的交互體驗(yàn)效果。

首先我們看第一個(gè)部分，就是智能交互的發(fā)展，汽車上的人機(jī)交互方式，從最早的按鍵式的交互到后面的觸摸屏式的交互，再到現(xiàn)在的語音交互，在語音交互里面又分為三個(gè)階段。第一個(gè)階段我們可以看到像命令詞的交互，第二個(gè)是現(xiàn)在我們?cè)谕频淖匀徽Z言是的交互。到第三個(gè)階段，多輪交互將會(huì)成為主流，在智能交互里面，我們重點(diǎn)會(huì)推三大升級(jí)，這三大特性分別是什么？第一是多模態(tài)交互，第二是多乘客交互，第三是情感化交互，多模態(tài)交互，大家可以理解，最早的是按鍵式交互到觸屏式交互，以觸屏為主的交互，以及我們以推動(dòng)了語音為主的交互，其實(shí)在上個(gè)階段融合花費(fèi)了很長(zhǎng)的時(shí)間，再往后面會(huì)融入視覺交互和聲紋交互，這些感知層面的融合，其實(shí)在認(rèn)知層面需要一個(gè)運(yùn)算大腦的融合，最后在我們的呈現(xiàn)層面，在不同的平臺(tái)執(zhí)行機(jī)構(gòu)上進(jìn)行展現(xiàn)。

第二個(gè)是多乘客交互。隨著智能駕艙以及智能移動(dòng)出行的普及和發(fā)展，多乘客交互在車上會(huì)越來越實(shí)現(xiàn)，多乘客在車上能夠獲取自己個(gè)性化的服務(wù)，是未來我們看到的一重要市場(chǎng)的趨勢(shì)方向。大家有看到過未來的車上面已經(jīng)能夠?qū)崿F(xiàn)不同的駕駛位，通過語音交互能夠獲取不同的服務(wù)，坐在主駕駛的發(fā)出指令，幫我打開天窗，打開的一定就是主駕駛位的天窗。所以這里面依賴于我們首發(fā)的一款技術(shù)，多音區(qū)方案是基于科大訊飛最早的麥克風(fēng)陣列技術(shù)，對(duì)車上的一位置進(jìn)行區(qū)分，然后結(jié)合聲紋技術(shù)，讓每個(gè)客戶每個(gè)乘客能夠享受到它個(gè)性化的服務(wù)。

第三情感化交互?，F(xiàn)在很多人托我通過語音交互跟我們的汽車交互。還是有冷冰冰的這種汽車的感覺，所以我們會(huì)融合vr技術(shù)，為每一個(gè)汽車打造每一個(gè)汽車用戶，打造一個(gè)專屬自己的虛擬人工助理。第二個(gè)板塊就是智能服務(wù)，智能服務(wù)這一塊，其實(shí)我們面臨的要去解決的就是去app化以及實(shí)現(xiàn)服務(wù)找人，最早的現(xiàn)在我們的交互方式都是讓人去找服務(wù)，其實(shí)在這個(gè)階段要讓服務(wù)找人和人找服務(wù)，這兩種模式都能夠融匯在一起。

簡(jiǎn)單看一下去app化的體驗(yàn)，核心在于云端的融合，在于賬戶的打通，在于數(shù)據(jù)的融合。有一個(gè)很簡(jiǎn)單的場(chǎng)景，比如說我們?cè)缟先ヅ懿?，我在聽一首音樂或者聽一個(gè)書，當(dāng)我在上車的時(shí)候，我的場(chǎng)景應(yīng)該自動(dòng)能夠從移動(dòng)端轉(zhuǎn)移到我的車端，要實(shí)現(xiàn)這樣的體驗(yàn)，就必須打破原來app的限制，能夠讓云端的數(shù)據(jù)和賬戶能夠融會(huì)貫通。目前我們的積極努力，我們跟高德地圖，qq音樂，喜馬拉雅，美團(tuán)，這些大的ip已經(jīng)能夠?qū)崿F(xiàn)賬戶的通，然后讓大家實(shí)現(xiàn)場(chǎng)景的轉(zhuǎn)移，然后實(shí)現(xiàn)服務(wù)找人。服務(wù)找人其實(shí)是一個(gè)非常苦非常累的活，他的核心的原理是在于基于用戶的數(shù)據(jù)支數(shù)據(jù)的分析的基礎(chǔ)上，把用戶的在汽車領(lǐng)域的使用場(chǎng)景進(jìn)行細(xì)分。細(xì)分到你在每一個(gè)細(xì)分場(chǎng)景下，你可能出去線的這樣的訴求，然后讓服務(wù)主動(dòng)通過主動(dòng)交互的方式，讓服務(wù)觸達(dá)的我們的用戶，這個(gè)是需要慢慢去細(xì)分場(chǎng)景的，然后最核心的一個(gè)是我們叫智能場(chǎng)景的模型。

從理念上講，我們拒絕生態(tài)割裂。所以我們一直在探索生態(tài)融合的這種方式，我們非常努力的和互聯(lián)網(wǎng)的生態(tài)內(nèi)容和服務(wù)商進(jìn)行合作。目前我們已經(jīng)與這里面所有的生態(tài)合作伙伴進(jìn)行了融合的貫通，我們的理念是為用戶提供最好的服務(wù)，非生態(tài)的?；诂F(xiàn)在我們的合作模式，我們已經(jīng)形成了大概七大類30小項(xiàng)的專業(yè)技能，只有這種技能的研發(fā)，才能夠讓我們?cè)谲嚿鲜褂眠@些服務(wù)更加的方便，更加的便利，因?yàn)槠噲?chǎng)景不是簡(jiǎn)單的把手機(jī)上的app搬過去就可以了，這還解決不了一個(gè)問題，只靠幾個(gè)有限的人去做這樣的事，發(fā)展會(huì)非常的慢，所以把現(xiàn)在前面做的這些工作的經(jīng)驗(yàn)，做成了一個(gè)開放這樣的平臺(tái)，讓更多的我們的開發(fā)者能夠能夠以更簡(jiǎn)單更方便的模式參與到技能的開發(fā)里面來，而且能夠提供一套快速上線平臺(tái)，能夠讓這些技能和服務(wù)能上線，讓我們的主機(jī)廠也能夠積極的參與到自己的產(chǎn)品的改進(jìn)系統(tǒng)里面來。

在期間的智能融合這一塊，現(xiàn)在大家可能看到的最多的。比如說我們叫控制車窗，控制空調(diào)，控制座椅。隨著汽車上的智能部件的越來越多，我們會(huì)面臨更多的像我們看到的智能的行車記錄儀，還有數(shù)資的儀表以及氛圍燈，只有這些設(shè)備的貫通融合，才能夠把整個(gè)汽車的智能的場(chǎng)景真正的提供我們的用戶。隨著剛剛咱們說的智能駕駛的發(fā)展，以及智慧交通的發(fā)展，我們會(huì)開放一系列的接口與咱們外圍實(shí)現(xiàn)跨越的融合，自動(dòng)駕駛和人機(jī)交互域的融合。現(xiàn)在目前我們能支持的像360的環(huán)視，人臉識(shí)別和疲勞檢測(cè)這些的系統(tǒng)之間的對(duì)接的工作。

以上我們介紹了基于下一代的人機(jī)交互域的解決方案，它的主要的核心特點(diǎn)就是我們剛說的三個(gè)交互的智能，服務(wù)的智能和整車的融合。這樣的一套系統(tǒng)，其實(shí)它是需要與行業(yè)里面的各類的合作伙伴進(jìn)行深度合作的，只有把這些服務(wù)，互聯(lián)網(wǎng)的服務(wù)和整車的部件的智能融合在一起，才能夠真正的打造汽車的智能化的一個(gè)體的。在整個(gè)汽車智能化時(shí)代的發(fā)展里面，其實(shí)我們面臨的巨大的挑戰(zhàn)，也給我們提出了更高的要求。在這樣的一個(gè)時(shí)代里面，我們只有相互的配銷戶的跨界的融合，相互的合作才能夠更快地推動(dòng)汽車智能化的發(fā)展，能夠?yàn)槲覀兊挠脩舻拿恳淮纬鲂懈犹峁└咝У倪@種體驗(yàn)的服務(wù)。

敬請(qǐng)關(guān)注蓋世汽車“2019全球第二屆自動(dòng)駕駛論壇”直播專題

pc：

移動(dòng)：

提示：本文為現(xiàn)場(chǎng)速記，未經(jīng)專家審核，請(qǐng)勿轉(zhuǎn)載！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.

/企業(yè)主營(yíng)產(chǎn)品/

/閱讀下一篇/