日前,微軟語音識別技術27年老將、微軟首位華人技術院士黃學東擔任微軟全球人工智能首席技術官,全面負責微軟azure云人工智能的工作,包括語音、機器翻譯、計算機視覺、自然語言和人工智能認知服務。
根據(jù)最新任命,黃學東(技術fellow,現(xiàn)為ai認知服務首席技術官)將領導新統(tǒng)一的ai認知服務工程和研究團隊。黃學東最近領導了認知組織的語音和語言團隊,是ai領域全球頂尖專家之一。認知組織中的語音和語言以及計算機視覺團隊將移至ai平臺并向黃學東匯報,而ai平臺組織中現(xiàn)有的form recognizer,personalizer和其他認知服務工程團隊也將向黃學東匯報。
首先我們要祝賀黃學東博士,我們期待微軟ai在黃學東博士的帶領下再創(chuàng)佳績!接下來先為大家介紹一下黃學東博士。
微軟語音技術創(chuàng)始人,微軟首位華人技術院士
微軟素有ai領域“黃埔軍?!钡拿雷u,而微軟全球技術院士代表著技術人員的最高榮譽,到現(xiàn)在,全球也僅有20多人獲得這項殊榮,其中就包括黃學東,微軟首位華人技術院士、微軟首席語音科學家。

黃學東
1978年,15歲的黃學東進入湖南大學師資班(后來的電子工程系),成為當時校園里年齡最小的學生之一。他先后獲得湖南大學學士學位、清華大學碩士學位和英國愛丁堡大學博士學位。
1993年,他作為高級研究員加入了微軟研究所并負責組建microsoft's 語音識別技術研究團隊。2000年到2004年,他作為microsoft's語音識別技術研究團隊的總經理,負責微軟語音技術和產品的研究、開發(fā)和市場拓展。
作為微軟的首席語音科學家,黃學東率領團隊實現(xiàn)了 ai 超越人類水平的歷史性里程碑:
2016年10月18日,由黃學東帶領的微軟語音團隊在產業(yè)標準 switchboard 語音識別基準測試中,實現(xiàn)了對話語音識別詞錯率(word error rate, 簡稱wer)低至5.9%的突破,首次達成與專業(yè)速記員持平而優(yōu)于絕大多數(shù)人的表現(xiàn)?!斑@是人工智能領域突破性進展之一,意味著有史以來第一次有計算機能像人類一樣,識別對話中的每一個單詞?!秉S學東說。
2017年,在對話語音轉寫任務中,微軟語音識別系統(tǒng)的詞錯率降到 5.1%,準確率超過專業(yè)速記員?!翱赡鼙砻嫔线@個進展不大,但是在‘最后一英里’上,每 0.1 個百分點的進步都很艱難,必須保證系統(tǒng)沒有任何bug。何況從相對錯誤率降幅角度, 5.9 到 5.1 是一個超過 10% 的相對進步?!?/p>

2018 年,在漢英新聞機器翻譯任務中,微軟機器翻譯系統(tǒng)達到了可與人工翻譯媲美的水平。
2019 年,在斯坦福對話式問答任務中,微軟機器閱讀理解系統(tǒng)刷新記錄,成為目前排行榜上唯一一個模型分數(shù)超過人類分數(shù)的團隊。
對話微軟黃學東:語音和語言技術是真正鑲在ai皇冠上的明珠
“只有掌握了核心的語音和語言技術,人工智能才有希望,否則其它都是在‘忽悠’?!秉S學東認為,在人工智能發(fā)展的過程中,語音和語言是皇冠上的明珠。
去年,黃學東做客微軟播客節(jié)目,聊了聊他和團隊在語音和語言技術取得的幾個里程碑式的突破。
黃學東解釋了掌握語音識別、翻譯和對話將如何讓機器從 “感知 ai” 進化到 “認知 ai”,更接近真正的人類智能。此外,黃學東也談到他如何走上語音研究之路,以及他在清華大學和在微軟的人生歷程。
主持人:您是微軟語音和語言組的 technical fellow,負責領導微軟的語音工作。我們將在稍后深入討論這些,但首先,作為公司的首席語音科學家,請概括地告訴我們你的工作內容是什么,以及為什么要做這些。你早上起來的動力是什么?
黃學東:我們所做的就是確保我們擁有最好的語音和語言技術,可以用于各種各樣的場景。我們有一整個團隊在做這件事情,因為對話不僅是人們最自然的交流方式,而且這是 ai 最大的挑戰(zhàn)。我們嘗試真正地推動這個領域的突破,在我們的云服務 azure services 上提供出色的服務,并確保我們能夠讓微軟內部和微軟之外的客戶滿意。如果你想厘清整個事情,主要有三個方面。
首先,我們有能力去真正提高語音識別的準確性,去驅動語音合成的自然性,以及確保機器翻譯的準確性,例如從英語翻譯成漢語或法語或德語。因此,這背后有很多科學,要確保準確性,自然度,延遲時間,這些技術都是世界級的。這是一方面。
第二方面是,我們不僅提供技術,我們還通過 azure 提供服務。從 office 到 windows, cortana,它們都依賴于相同的云服務。我們也有邊緣設備,比如我們的語音設備 sdk。我們想要確保在邊緣和云端的語音技術都是以現(xiàn)代的方式提供的,即云平臺和嵌入式平臺。這是第二方面:平臺是現(xiàn)代化的。
第三個方面,是向客戶表達我們的愛。因為我們在世界各地都有廣泛的客戶,我們想讓消費者滿意,并確保使用我們的語音翻譯的客戶體驗是一流的。
這就是我實際上在做的三件關鍵事情:提升 ai 能力,使我們在云端和邊緣設備的平臺實現(xiàn)現(xiàn)代化,以及愛我們的客戶。
在人類進化的長河中語音和語言起了決定性的作用,在ai的進化中也會如此
在2018年新智元產業(yè)·躍遷技術峰會上,黃學東分享了微軟在語音、自然語言和機器翻譯研究中不斷“開掛”的歷程和技術細節(jié)。黃學東說,人類進化的長河中語音和語言起了決定性的作用,在人工智能的進化當中語音和語言會起到同樣的作用。

黃學東
黃學東談到:達爾文的進化論已經說明,最新的科學驗證也再次證明,我們人和大猩猩dna的相似度接近99%,就那1%的區(qū)別造就了我們是這個地球的主宰。為什么呢?因為我們更聰明嗎?還是漫長的進化過程當中有什么其他因素?計算機視覺非常重要,但動物的視力其實比人還厲害,晚上的夜貓子看得比人更厲害,但我們仍然是這個地球的主宰,最重要的原因之一是我們的語音和語言。
2020,新智元繼續(xù)與您一起探索??于你的ai新天地!ai技術干貨,b站風格直播,就在新智元we站小程序!ai??你,新智元祝您2020新春快樂!????

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“機電號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.
