機(jī)電之家 > 機(jī)電號(hào) > 正文 申請(qǐng)入駐

人工智能數(shù)據(jù)標(biāo)注這些年:從幕后到前臺(tái)丨曼孚科技

人工智能數(shù)據(jù)標(biāo)注這些年:從幕后到前臺(tái)丨曼孚科技

2020年03月20日 17:50作者:黃頁(yè)編輯:

分享

“你了解人工智能行業(yè)嗎?”

10個(gè)人中可能有9個(gè)人會(huì)給出肯定的回答。

“你了解數(shù)據(jù)標(biāo)注行業(yè)嗎?”

10個(gè)人中可能有9個(gè)人會(huì)茫然地?fù)u頭。

與處在聚光燈中心的人工智能科技公司不同,數(shù)據(jù)標(biāo)注行業(yè)長(zhǎng)期處于聚光燈之外的灰色地帶,很長(zhǎng)一段時(shí)間內(nèi)都是被邊緣化乃至低視的一個(gè)存在。

不過,隨著時(shí)代發(fā)展帶來需求的改變,數(shù)據(jù)標(biāo)注行業(yè)也在發(fā)生著日新月異的變化,開始從幕后走向前臺(tái)。

一.幕后:粗放與混亂交織

數(shù)據(jù)標(biāo)注行業(yè)里流傳著這樣的一段話:“有多少智能,就有多少人工”。

這句話在某種程度上道出了人工智能的本質(zhì)。

事實(shí)上,現(xiàn)階段讓ai提升認(rèn)知世界能力的最有效途徑仍然是監(jiān)督學(xué)習(xí),而目前ai算法能學(xué)習(xí)的數(shù)據(jù),幾乎全部都是通過人力逐一進(jìn)行標(biāo)注而得來的。

一張經(jīng)過數(shù)據(jù)標(biāo)注后的圖片(來源:曼孚科技)

需求即意味著市場(chǎng),據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè),未來幾年,國(guó)內(nèi)數(shù)據(jù)服務(wù)市場(chǎng)將達(dá)上百億。

如此龐大的市場(chǎng)規(guī)模,讓很多人都想趁機(jī)分一杯羹,于是大大小小的標(biāo)注團(tuán)隊(duì)如雨后春筍一樣大量出現(xiàn)。

然而,問題也隨之而來。

與人工智能高科技含量不同,數(shù)據(jù)標(biāo)注仍屬于勞動(dòng)密集型產(chǎn)業(yè),且模式通常以外包形式為主。

標(biāo)注員每天從事標(biāo)框、拉點(diǎn)等重復(fù)枯燥的工作,勞動(dòng)力水平參差不齊導(dǎo)致產(chǎn)出的標(biāo)注數(shù)據(jù)質(zhì)量偏低,無法滿足ai企業(yè)的需求,影響ai產(chǎn)品商業(yè)化落地進(jìn)程。

與此同時(shí),低端產(chǎn)能過低的技術(shù)含量,也使數(shù)據(jù)標(biāo)注行業(yè)幾乎沒有任何壁壘限制,很多標(biāo)注團(tuán)隊(duì)隨意拉進(jìn)來幾個(gè)人經(jīng)過簡(jiǎn)單培訓(xùn)就可以接業(yè)務(wù)了。

這樣的后果就是行業(yè)混亂且競(jìng)爭(zhēng)加劇,絕大部分標(biāo)注團(tuán)隊(duì)只能存活于產(chǎn)業(yè)鏈最底層,壓價(jià)情況嚴(yán)重,甚至接不到業(yè)務(wù)導(dǎo)致生存艱難。

二.前臺(tái):ai對(duì)于高質(zhì)量數(shù)據(jù)的依賴

人工智能行業(yè)內(nèi)有一個(gè)很重要的共識(shí):

數(shù)據(jù)集質(zhì)量的高低直接決定最終模型效果的好壞。

換句話說,數(shù)據(jù)對(duì)于模型性能的貢獻(xiàn)是最大的,數(shù)據(jù)越多越豐富、代表性越強(qiáng)、模型效果越好,算法的健壯性和魯棒性就越強(qiáng)。

隨著ai企業(yè)商業(yè)化落地進(jìn)程的加快,越來越多的企業(yè)開始意識(shí)到標(biāo)注數(shù)據(jù)的重要性。

以自動(dòng)駕駛為例,目前很多企業(yè)都已經(jīng)生產(chǎn)出自己的無人駕駛汽車樣車,并頻頻出現(xiàn)在公共視野內(nèi)。

然而,雖然這些樣車在實(shí)驗(yàn)室內(nèi)表現(xiàn)良好,但距離真正的商用仍然有很遙遠(yuǎn)的距離,一個(gè)很重要的原因就是真實(shí)路況場(chǎng)景與實(shí)驗(yàn)室場(chǎng)景差距過大。

自動(dòng)駕駛標(biāo)注場(chǎng)景(來源:曼孚科技)

在實(shí)驗(yàn)室內(nèi),只需要少量的道路數(shù)據(jù)即可滿足實(shí)驗(yàn)的需要,但是到了真實(shí)的道路上,無人駕駛汽車將會(huì)遇到很多無法預(yù)知的情況,在沒有足夠數(shù)據(jù)支撐的前提下,車載電腦無法做出自己的判斷,導(dǎo)致潛在的風(fēng)險(xiǎn)劇增。

因此,以自動(dòng)駕駛企業(yè)為代表的眾多ai企業(yè)對(duì)數(shù)據(jù)標(biāo)注行業(yè)提出了更高的要求,數(shù)據(jù)標(biāo)注行業(yè)已然開始處于聚光燈的焦點(diǎn),從幕后走向了前臺(tái)。

三.未來:智能化、精細(xì)化、場(chǎng)景化

ai數(shù)據(jù)是人工智能的重中之重。眾所周知,人工智能的三駕馬車是算法、算力與數(shù)據(jù),其中數(shù)據(jù)是人工智能行業(yè)的發(fā)展基石。

隨著人工智能行業(yè)商業(yè)化落地進(jìn)程的加快,ai數(shù)據(jù)服務(wù)領(lǐng)域泥沙下沉,清泉上涌,行業(yè)變革已初露端倪。未來,智能化、精細(xì)化、場(chǎng)景化將是數(shù)據(jù)標(biāo)注行業(yè)的主要發(fā)展方向。

智能化,即意味著標(biāo)注工具ai化。以曼孚科技自研的語(yǔ)音標(biāo)注工具為例,ai預(yù)標(biāo)注技術(shù)可以自動(dòng)識(shí)別轉(zhuǎn)寫語(yǔ)音數(shù)據(jù),標(biāo)注員只需要在工具預(yù)標(biāo)注的結(jié)果上略作修改即可,這在提升標(biāo)注效率的同時(shí)也減輕了對(duì)于人力的依賴。

精細(xì)化,即意味對(duì)標(biāo)注數(shù)據(jù)集質(zhì)量與細(xì)節(jié)提出了新的要求。以往數(shù)據(jù)集的準(zhǔn)確率可能達(dá)到90%以上即可滿足要求,但隨著ai商業(yè)化落地進(jìn)程的加快,ai企業(yè)對(duì)于標(biāo)注數(shù)據(jù)的質(zhì)量要求達(dá)到了95%,甚至99%以上,同時(shí)更加注重細(xì)節(jié),比如曼孚科技在進(jìn)行自動(dòng)駕駛領(lǐng)域數(shù)據(jù)標(biāo)注業(yè)務(wù)時(shí),項(xiàng)目方會(huì)對(duì)諸如情緒捕捉、疲勞駕駛等等提出更加細(xì)節(jié)化的標(biāo)注需求。

精細(xì)化標(biāo)注能力(來源:曼孚科技)

場(chǎng)景化,即意味數(shù)據(jù)標(biāo)注行業(yè)要滿足多樣化應(yīng)用場(chǎng)景標(biāo)注需求。以計(jì)算機(jī)視覺領(lǐng)域?yàn)槔?,目前?shù)據(jù)標(biāo)注可以應(yīng)用在自動(dòng)駕駛、無人機(jī)、ai教育、工業(yè)機(jī)器人、新零售、安全防護(hù)等場(chǎng)景中。每一個(gè)應(yīng)用場(chǎng)景都有自己的數(shù)據(jù)類型與具體標(biāo)注要求,因此極為考驗(yàn)數(shù)據(jù)標(biāo)注企業(yè)的場(chǎng)景化標(biāo)注能力。

可以預(yù)見的是,未來幾年數(shù)據(jù)標(biāo)注行業(yè)將迎來一場(chǎng)大變革,理念更先進(jìn)、技術(shù)更硬核、服務(wù)更專業(yè)的ai數(shù)據(jù)服務(wù)企業(yè)將會(huì)把數(shù)據(jù)標(biāo)注行業(yè)帶入全新的精細(xì)化運(yùn)營(yíng)時(shí)代。

而未來,相信隨著5g技術(shù)的逐步應(yīng)用,數(shù)據(jù)與5g的結(jié)合將碰撞出更多創(chuàng)新火花,共同托起ai發(fā)展的基石。

轉(zhuǎn)載請(qǐng)注明出處。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“機(jī)電號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of JDZJ Hao, which is a social media platform and only provides information storage services.

/企業(yè)主營(yíng)產(chǎn)品/
/閱讀下一篇/

你見過人工智能會(huì)自己寫代碼嗎

相關(guān)推薦
熱點(diǎn)推薦
159989文章數(shù) 2168關(guān)注度
往期回顧 全部

設(shè)備相關(guān)熱點(diǎn)

設(shè)備相關(guān)推薦

頭條要聞

設(shè)備要聞

設(shè)備資訊

往期設(shè)備要聞