|
摘 要:本文首先介紹了連續(xù)可變斜率增量調(diào)制(cvsd)的工作原理和性能,并與當(dāng)前應(yīng)用較為廣泛的其它語音編碼方 法進(jìn)行分析比較,接著重點介紹了美國國家半導(dǎo)體公司的cvsd語音編碼芯片-cmx639,并給出無線耳麥的整 體設(shè)計方案。
關(guān)鍵詞:語音編碼、cvsd、cmx639 cvsd工作原理
在無線通信的幾十年的發(fā)展過程中,語音通信始終占據(jù)著重要地位。雖然數(shù)據(jù)業(yè)務(wù)得到了飛速的發(fā)展,但應(yīng)該看到的是,大多數(shù)用戶仍以進(jìn)行語音通信為主,而且無線語音通信的應(yīng)用領(lǐng)域也在不斷擴(kuò)大,在安全保衛(wèi)、旅游休閑、教育等領(lǐng)域得到了越來越廣泛的應(yīng)用。
研究在保證一定語音質(zhì)量的前提下,盡可能的降低語音編碼率可以實現(xiàn)對無線通信資源的充分利用,是語音編碼研究的重要領(lǐng)域之一。目前應(yīng)用較為廣泛的語音編碼方法主要有:pcm和adpcm、增量調(diào)制、線性預(yù)測編碼、子帶編碼等。
其中線性增量調(diào)制的工作原理如圖1所示: 圖中的s(t)是編碼器的輸入話音信號, (t)是s(t)經(jīng)量化、編碼和本地譯碼器后得到的再生話音信號, 為量化階距(簡稱量階),p(t)是編碼輸出碼型。其編碼規(guī)則如下:
若s(t)> (tn-tn),即e(tn)>0 ,則編碼器輸出 "1"碼; 若s(t)< (tn-tn),即e(tn)<0,則編碼器輸出 "0"碼. 上兩式中,tn是第n次取樣時刻,n=1,2,3,……;tn是取樣周期;而s(tn)- (tn-ts)=e(tn),e(tn)稱為比較器誤差信號。 譯碼器的譯碼規(guī)則是:當(dāng)輸入"1"碼時,則譯碼輸出增加一個量階 ;當(dāng)輸入"0"碼時,則譯碼器輸出減小一個量階 。
圖1 線性別增量調(diào)制度原理圖(略) 圖2 線性增量調(diào)制編碼示意圖(略) 圖3 cmx639管腳功能圖(略)
線性增量調(diào)制量階的大小直接關(guān)系到語音編碼的質(zhì)量。如果量階設(shè)置過小,當(dāng)語音信號斜率較大時,會發(fā)生過載,使得信號嚴(yán)重失真;而量階如果過大,則會增大顆粒噪聲。因為語音的動態(tài)范圍通常較大,所以線性增量調(diào)制的性能差強(qiáng)人意,要保證正常通話質(zhì)量,語音編碼速率通常不小于50kbps。
而連續(xù)可變斜率增量調(diào)制(cvsd)在線性增量調(diào)制的基礎(chǔ)上,能自適應(yīng)地調(diào)整量階。當(dāng)編碼輸出連續(xù)出現(xiàn)"0"或"1"時,表明語音信號斜率較大,則適當(dāng)增大量化的量階;反之,則適當(dāng)降低語音量化的量階。因此能在較大的動態(tài)范圍內(nèi),始終使信號的量化信噪比接近于其最大值,有效地提高了語音編碼的質(zhì)量。
經(jīng)測試,語音編碼速率在20kbps左右的cvsd基本可以滿足日常通話的要求,其語音質(zhì)量略低于64kbps的pcm和32kbps的adpcm,而好于16kbpsadpcm。誠然,目前采用線性預(yù)測編碼、子帶編碼等方式已經(jīng)可以在編碼速率低于10kbps,甚至在1 kbps左右的條件下,實現(xiàn)較高的語音編碼質(zhì)量(mos評價高于3分)。但應(yīng)該指出的是,這些技術(shù)實現(xiàn)難度較大,系統(tǒng)復(fù)雜,成本較高,不太適合一些低成本的應(yīng)用場合,如無線耳麥、短距離對講機(jī)等。而cvsd以其較低的應(yīng)用難度、極低低的成本、較低編碼速率和較好的語音編碼質(zhì)量,特別適合于這些應(yīng)用場合。更值得一提的是,cvsd作為增量調(diào)制的一種,是一種串入-串出的結(jié)構(gòu),用一個比特代表一個取樣點,不存在幀結(jié)構(gòu)。由于cvsd具有的這一特點,使得當(dāng)進(jìn)行無線通信時,無需進(jìn)行復(fù)雜的組幀和拆幀工作,在發(fā)端可以直接將編碼數(shù)據(jù)進(jìn)行傳送;而在收端,不需要進(jìn)行復(fù)雜的定時和比特同步工作,也不需要對數(shù)據(jù)進(jìn)行處理,可以直接將解調(diào)出的波形進(jìn)行語音解碼,大大降低了系統(tǒng)的實現(xiàn)難度。
cmx639芯片介紹
cmx639是美國國家半導(dǎo)體公司推出的斜率連續(xù)可變增量(cvsd)全雙工音頻調(diào)制芯片。
cmx639完全集成了語音編碼和解碼功能,實現(xiàn)了單芯片語音處理的能力,外圍設(shè)備簡單,而且用戶可以通過其管腳方便地對其編解碼算法進(jìn)行設(shè)置,并且具有強(qiáng)大的可選擇編碼算法,低功耗、低價位、小體積和開發(fā)難度低等多種優(yōu)點,因此特別適合在對成本非常敏感的消費類語音系統(tǒng)中應(yīng)用。
vdd:3.0v~5.0v供電電壓。 encoder input(7): 模擬語音信號的輸入管腳。 encoder output(4):語音編碼后的輸出管腳,將輸入的模擬信號編碼成為串行數(shù)據(jù)。 decoder input(11):用于解碼的串行數(shù)據(jù)的輸入管腳 decoder output(9):解碼后的模擬語音信號輸出管腳。 data enable(5):數(shù)據(jù)使能端,當(dāng)data enable管腳處于高電平狀態(tài)時,encoder output才輸出編碼信號;否則,encoder output管腳處于高阻狀態(tài)。
agrithm(13):算法選擇管腳,由外部輸入來決定壓縮編碼地算法是采用3 bit或4 bit算法。
(10):功率節(jié)省管腳。當(dāng)不需要進(jìn)行語音編解碼時,將powersave管腳置低電平,芯片處于低功耗的待機(jī)狀態(tài)。
clock mode1(15),clock mode2(14),encoder data clock(3)和decoder data clock(12):其管腳功能見下表。
由上表可知,cmx639采樣速率完全取決于振蕩器的頻率和所設(shè)置的時鐘模式。用戶可以依據(jù)實際情況,自主選擇采樣速率,在語音質(zhì)量和編碼數(shù)據(jù)碼率之間進(jìn)行權(quán)衡,而且在振蕩器的頻率固定的情況下,還可以利用外部端口改變采樣速率,因此賦予用戶開發(fā)極大的自主權(quán)。
典型應(yīng)用
無線耳麥徹底擺脫了電線的束縛,在指揮調(diào)度、安全保衛(wèi)、多媒體教學(xué)、休閑娛樂等諸多領(lǐng)域有著廣闊的市場前景。無線耳麥綜合了語音處理技術(shù)和無線通信技術(shù)等技術(shù),要求體積小,功耗低,有較高的語音質(zhì)量和較低的成本。經(jīng)過比較論證,采用cvsd語音編碼芯片-cmx639,并結(jié)合短距離射頻芯片trf6900和其它相關(guān)器件,可以基本達(dá)到無線耳麥各方面的性能要求。系統(tǒng)框圖如圖4所示。
從話筒來的語音信號幅度通常不大,為了減小量化噪聲對信號質(zhì)量的影響,加入了前置放大器(an7310),將信號幅度提高到適合cm639編碼的水平。
cmx639在進(jìn)行解碼時,不可避免地混入了一些高頻噪聲,音頻濾波器(max7400)可以有效地濾除語音信號中混有的高頻噪聲,使得語音信號柔和。
圖4 無線耳麥結(jié)構(gòu)方框圖(略)
由于cmx639輸出的語音功率較低,不宜直接輸出到耳機(jī),加入功率放大器(lm386)可以提高音量,還可以用戶對音量大小進(jìn)行調(diào)節(jié)。 trf6900是ti公司最新推出的短距離無線射頻芯片,采用fsk調(diào)制,其主要性能如下: 1) 有效數(shù)據(jù)傳輸距離100米; 2) 工作電壓2.2 v-3.6 v; 3) 待機(jī)電流5 a,工作電流50ma; 4) 數(shù)據(jù)傳輸最高速率50kbps。
trf6900可以基本滿足無線耳麥對傳輸距離和數(shù)據(jù)速率的要求,而且工作電壓和功耗較低,可以利用電池進(jìn)行供電。
cmx639對語音信號的每次取樣,只用1個比特表示,輸出的是串行比特流,可以直接送入射頻芯trf6900進(jìn)行傳輸,在接收端,則直接將串行比特流送入cmx639進(jìn)行解碼。整個過程不需要軟件進(jìn)行處理,微處理器只負(fù)責(zé)對cmx639和trf6900進(jìn)行初始化設(shè)置和監(jiān)控,因此大大降低了微處理的負(fù)擔(dān),因此可以采用廉價的微處理器。ti公司的msp430f1121功耗低,價格便宜,體積小,并可以進(jìn)行在線編程,非常適合在無線耳麥中使用。
無線耳麥經(jīng)過硬件開發(fā)和軟件編程后,進(jìn)行調(diào)試,在傳輸距離為50米的條件下,cmx639采用24 kbps的取樣速率,語音質(zhì)量可以滿足正常的語言交流。
|