機(jī)電之家 > 機(jī)電號 > 正文 申請入駐

銷量連續(xù)全國第一 小度智能音箱仍在研究人工智能vs人工智障

原標(biāo)題:銷量連續(xù)全國第一 小度智能音箱仍在研究人工智能vs人工智障 來源:techweb.com.cn

【techweb】8月15日,根據(jù)strategy analytics智能音箱和屏幕(sss)研究服務(wù)今天發(fā)布的最新研究報告顯示,2019年q2智能音箱的全球銷量持續(xù)飆升,達(dá)到3030萬臺,同比翻倍。其中百度小度智能音箱出貨量470萬臺居全球第三,超過阿里巴巴和小米,排名國內(nèi)第一,與2018年相比,小度智能音箱銷量增長高達(dá)38倍。

strategy analytics數(shù)據(jù)

這已經(jīng)不是第一份報告顯示小度智能音箱的飛速增長。2019年第一季度,包括canalys、idc,stra tegy analytics在內(nèi)的多家調(diào)研機(jī)構(gòu)的數(shù)據(jù)均顯示,小度智能音箱市場份額已升至國內(nèi)第一,全球第三。

百度入局智能音箱領(lǐng)域時間并不長,從2018年3月正式發(fā)布有屏音箱小度在家,迄今為止不到2年時間。小度智能音箱何以在競爭激烈的國內(nèi)市場迅速崛起?

百度首席架構(gòu)師、slg首席技術(shù)官朱凱華和我們聊了聊小度智能音箱背后的技術(shù)故事。

智能音箱區(qū)別于傳統(tǒng)音箱的突出特征就是可以和人進(jìn)行語音交互互動。在朱凱華看來,百度智能音箱的優(yōu)勢在于很好的實(shí)現(xiàn)了對話式交互的用戶體驗(yàn)。

朱凱華介紹,擁有良好的對話式交互,需要解決“聽清、聽懂和滿足”三個問題。聽清,要求音箱在嘈雜環(huán)境內(nèi)(不論是外部嘈雜,還是音箱本身大聲放音時)能準(zhǔn)確的被倍喚醒、并把用戶的聲音轉(zhuǎn)為文字。

而能聽懂,則是對音箱智能性的更高要求。聽懂,意味著要能準(zhǔn)確的把文字理解為用戶意圖,人工智能和人工智障,一字之差,說出的是用戶體驗(yàn)的天壤之別。

朱凱華表示:“智能和智障的區(qū)別,很大部分是要做好‘知之為知之,不知為不知’。在理解的時候快速給答案,不理解時給出合理澄清,不裝懂不插科打諢?!钦稀艽蟛糠质遣欢拐f引起用戶抵觸。”

朱凱華現(xiàn)場使用小度演示了真正的智能音箱在遇到這方面難題的解決方案:當(dāng)他對小度說“我想聽….”的時候,小度的回答是,“你想聽什么呢?”當(dāng)他再次說出“我想聽劉德華的歌”時,小度響應(yīng)并播放了劉德華的歌曲。

朱凱華介紹,這只是小度“聽懂”方面的一個小例子,但這樣的能力卻已經(jīng)要高于市面上的絕大部分產(chǎn)品。小度的聽懂在于,當(dāng)它獲得模糊需求(不清晰指令)的時候,它會嘗試分析和校對自己的指定,以便更準(zhǔn)確地滿足用戶的需求。

除了上述聽清、聽懂需要的人工智能技術(shù)保障外,對話式交互第三個要素“滿足”,則需要有豐富的信息、內(nèi)容和服務(wù)來滿足用戶。簡言之,也就是音箱聽清聽懂了用戶的需求,還需要能滿足用戶需求的能力,這需要設(shè)備有完備的知識和技能服務(wù)。

“現(xiàn)在流行的垃圾分類話題,比如濕紙巾是什么垃圾,小度也能給出答案?!敝靹P華介紹,因?yàn)樾《缺晨堪俣仁畠|級的知識圖譜、百億級的搜索請求和萬億級的網(wǎng)頁內(nèi)容,同時構(gòu)建了33000+平臺開發(fā)者、2400+優(yōu)秀技能的生態(tài),是知識和技能最完備的平臺。

不過,現(xiàn)在的小度已經(jīng)不滿足于現(xiàn)有的語音交互的智能程度。

在今年7月的百度ai開發(fā)者大會上,百度公司董事長兼ceo李彥宏啟動了小度在家“極客模式”開始了與智能音箱的連續(xù)對話聊天,并介紹了一個極具技術(shù)流的的名詞“全雙工免喚醒”功能。

搭載“全雙工免喚醒”功能的小度智能音箱,可以和用戶進(jìn)行連續(xù)聊天,不需要每次都呼喚“小度小度“喚醒。這種人機(jī)交互模式無疑更加“自然”,離真正意義上的“智能”更進(jìn)一步。

體驗(yàn)進(jìn)步一小步,背后是科技人員努力的一大步。要真正做好“全雙工免喚醒”絕非易事。

試想,在人聲嘈雜的環(huán)境里,機(jī)器如何準(zhǔn)備識別你的這句話是針對它說的,還是對其他人員說的?這對“智能”性程度提出了更高要求。此前市面上有其他品牌展示過相關(guān)技術(shù)的演示,但工業(yè)化量產(chǎn),目前只有小度率先推出。

對此,朱凱華表示,能夠首先推出全雙工免喚醒,有3個必要條件:具備軟件和硬件結(jié)合的能力;語音識別和語義理解結(jié)合、端到端的識別和理解整合的深度優(yōu)化能力;和對所有技術(shù)能夠進(jìn)行深度整合的能力。

目前小度“全雙工免喚醒”功能已在小度有屏音箱產(chǎn)品和有燈帶的音箱產(chǎn)品上上線,主要應(yīng)用于音樂和有聲內(nèi)容場景。朱凱華透露,該功能很快將拓展至更多場景使用。

對于語音交互技術(shù)和智能家居的未來發(fā)展,朱凱華認(rèn)為,從人之間的交流方式來看,輸出信息帶寬最大的是語音,輸入是視覺。未來的交互方式一定是視覺和語音相結(jié)合方式。智能家居時代要求設(shè)備間有良好的感知與協(xié)同能力,多模態(tài)交互將是必然趨勢。不過,科技不停地向前發(fā)展,在技術(shù)落地的過程中一定會有各種不同的產(chǎn)品形態(tài),但最核心的是技術(shù)能力有沒有更好地在階段時間內(nèi)滿足用戶的需求。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“機(jī)電號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.

/企業(yè)主營產(chǎn)品/
/閱讀下一篇/

漫談|人工智能將給農(nóng)業(yè)創(chuàng)造哪些“不可能”

相關(guān)推薦
熱點(diǎn)推薦
160086文章數(shù) 1142關(guān)注度
往期回顧 全部

設(shè)備相關(guān)熱點(diǎn)

設(shè)備相關(guān)推薦

頭條要聞

設(shè)備要聞

設(shè)備資訊

往期設(shè)備要聞