媚药人妻潮喷中文字幕在线,国产精品无码久久久久ys

高速可設(shè)定式DSP技術(shù)

【字體：

】

(圖一)　高速可設(shè)定式DSP的簡易架構(gòu)

(圖二)　可設(shè)定式DSP的開發(fā)流程

　

消費性產(chǎn)品與通訊產(chǎn)品都要能支援高運算量和資料轉(zhuǎn)換的功能。這些產(chǎn)品對體積大小和耗電量的要求很嚴格，而數(shù)位訊號處理器（DSP），就是這些產(chǎn)品最核心的部份。為了支援這些產(chǎn)品的需求和應用，DSP應該是可程式化的、可設(shè)定的和可擴充的。因此高速可設(shè)定式DSP因此應運而生，它非常適合應用在需要高效能、低功率且可以彈性設(shè)計的消費性產(chǎn)品和通訊產(chǎn)品上。

消費性產(chǎn)品與通訊產(chǎn)品，基本上都要能支援高運算量和資料轉(zhuǎn)換（transformation）的功能。例如：視訊影像的編碼與解碼、聲音的壓縮與解壓縮，或者影像資料的處理及壓縮、語音的播放以及通訊頻道的編解碼等應用。
這些產(chǎn)品對體積大小和耗電量的要求很嚴格，而且要求能針對特定的規(guī)格提供最佳的支援。而所謂特定的規(guī)格就是指產(chǎn)品的應用功能。例如：手提式視訊裝置需要低功率和低成本，但影像品質(zhì)并不高；不過，視訊廣播市場所需要的視訊產(chǎn)品，則必須是高畫質(zhì)的，且其運算處理效能一定要高。

此外，目前許多產(chǎn)品都必須同時支援多種應用項目，或必須支援具有多種格式（format）的單一應用。譬如：只支援MPEG2的視訊產(chǎn)品，將必須同時支持MPEG4、H26L、MSWM和其它視訊標準；而WLAN通訊裝置除了要支援802.11的不同版本標準以外，有時還得支援其它的無線電標準。

而數(shù)位訊號處理器（digital signal processing；DSP），就是這些產(chǎn)品最核心的部份，負責處理那些需要大量運算的資料。為了有效地支援這些產(chǎn)品的需求和應用，DSP應該是可程式化的（programmable）、可設(shè)定的（configurable/reconfigurable）和可擴充的（scalable）。高速的可設(shè)定式DSP因此應運而生，它非常適合應用在需要高效能、低功率且可以彈性設(shè)計的消費性產(chǎn)品和通訊產(chǎn)品上。

高速可設(shè)定式DSP的設(shè)計目的，簡單說，就是要在單一的系統(tǒng)級單晶片（SoC）架構(gòu)下，支援許多種應用和需求，而且使用者可以利用高階語言來開發(fā)。為了能盡早完成產(chǎn)品的開發(fā)工作，使產(chǎn)品能提早上市，這種新技術(shù)將是無法抵擋的趨勢。

必須了解的定義

有幾個定義必須先了解。首先，所謂「可程式化」，是指它可以處理指令，而不是指執(zhí)行固定的函式（function）。對DSP而言，指令可以來自于高階語言（C、Java、C++）的編譯器（compiler），也可以經(jīng)由手寫程式（組合語言）產(chǎn)生。這有別于傳統(tǒng)的DSP功能，因為可設(shè)定式DSP具有類似中央處理器（CPU）的功能。其實，正如DSP的原名──「數(shù)位訊號處理器」，它本來就應該是一種處理器；只不過，傳統(tǒng)的DSP并沒有將CPU核心納入架構(gòu)中，因此，「DSP只能執(zhí)行固定的函式」就變成了一種刻板印象。

所謂可設(shè)定式，是指可以使用一種或數(shù)種方法，將可設(shè)定式DSP修改成客戶想要的應用功能。不過，這些修改必須在它變成硅晶之前，就得完成。

而可擴充性，是指它可以增加或縮減功能，來支援不同種類的應用需求。在大多數(shù)的情況下，是專指增加功能而言，這可以使它擁有數(shù)顆傳統(tǒng)DSP的功能。

基本特性

可設(shè)定式DSP最明顯的特性，就是能動態(tài)地執(zhí)行最佳化作業(yè)。它以下列三種方式來強化運算效能。

擴充或縮小

藉由增加或減少DSP處理器里的可用資源，同一種應用就可以具有不同等級的運算效能�？蓴U充性可以藉由增加單一DSP的資源，或者使用數(shù)個DSP核心來達成。不過，為了能完善地利用這些新增的資源，以提高運算效能，還需要一個功能強大的編譯器來配合才行。如果沒有這種編譯器的協(xié)助，則可設(shè)定式DSP只會使應用產(chǎn)品的開發(fā)時程增長而已。

位置與混合

藉由改變資源的組成結(jié)構(gòu)（在不增加額外的資源之情況下），可設(shè)定式DSP可以依照不同的應用需求，提供不同等級的效能。例如，暫存器的位置（必須防止它的資料爆滿溢出）會直接影響到程式運算迴圈的效能。同樣地，功能強大的編譯器在這里也扮演著舉足輕重的角色。

自訂指令（custom instruction）

每一種應用都具有一些特殊的運算作業(yè)（數(shù)學的、工程的或其它），但并不是全部都適合DSP去執(zhí)行。因此，實際上，單一的DSP不可能包含所有的指令或運算函式。而且，DSP廠商也無法事先就完全知道，所有客戶需要的全部運算函式和指令。所以，為了提供彈性設(shè)計的方便性，可設(shè)定式DSP允許使用者可以將自己設(shè)計的指令置入此DSP中，以滿足客戶的需求。

除了提高運算效能以外，可設(shè)定式DSP還必須支援功率和體積（成本）的最佳化。因為效能、功率、體積三者是技術(shù)產(chǎn)品成敗的關(guān)鍵，所以可設(shè)定式DSP必須在指定的效能等級中，以程式求出最合適的耗電功率和體積大小。

可設(shè)定式DSP可以用比較少的時脈週期和邏輯電路，得到與傳統(tǒng)DSP同等級的效能，這是靠自訂指令來完成的。在可程式化方面，此種DSP具有下列兩個重要的功能。

指令的執(zhí)行

和一般的處理器一樣，可設(shè)定式DSP讀取和執(zhí)行指令串流或目標碼（object code），以實現(xiàn)特定的應用功能。這些功能包含支援多重標準或多重格式，甚至包括未知的新功能，或數(shù)目更多的格式。藉由撰寫和執(zhí)行新的指令，它就可以支援許多種不同的應用功能，這是傳統(tǒng)DSP望塵莫及的。

高階語言

使用高階語言（C與Java）來設(shè)計處理器的程式，具有右列的幾個優(yōu)點：程式設(shè)計者的生產(chǎn)力會提高（因為容易撰寫和驗證）、設(shè)計彈性高（因為容易變更）及維護性高（因為容易除錯和修改）。這些優(yōu)點是低階語言（組合語言）所沒有的。如果不使用高階語言來開發(fā)，則徒具可程式化功能的DSP就沒有價值了。不過，高階語言所帶來的便利性，其實是源自于高效率的編譯器與優(yōu)化程式（optimizer）。

基本單元

平行執(zhí)行單元（parallel execution unit）是可以視需要做增減調(diào)整的；也可以結(jié)合數(shù)個可設(shè)定式DSP核心，形成陣列的架構(gòu)一起工作。高速的可設(shè)定式DSP是「極長指令字組（Very Long Instruction Word；VLIW）」的可程式化處理器。VLIW DSP的運算速度是很驚人的，例如：TI于2004年2月推出的TMS320C64x DSP核心的時脈速率最高可達1GHz。

需要經(jīng)過數(shù)位訊號處理的應用，其頻寬需求是非常高的。例如：簡單的16與32位元的資料轉(zhuǎn)換，就需要進行數(shù)百次的乘加運算，再結(jié)合大量的資料流處理，因此，需要一個非常有效率的運算平臺才行。

另一種可以使運算速度加快的方法，就是盡可能同時執(zhí)行許多個運算作業(yè)。VLIW處理器的功能正可以達到這個目的。因為每一個指令字組（instruction word）包含了許多個時槽（time slot），因此編譯器可以在每一個週期內(nèi)，指定許多個動作，而且在每一個時槽里，執(zhí)行個別的動作。其結(jié)果是，VLIW處理器就可以在一個週期內(nèi)，完成數(shù)個運算作業(yè)。VLIW處理器特別適合應用于數(shù)位訊號處理工作，因為DSP的工作都是規(guī)律而重復的，幾乎不需要控制碼。

高速可設(shè)定式DSP具有數(shù)個類似「算數(shù)邏輯單元（ALU）」的結(jié)構(gòu)，稱作「計算單元（Computational Unit；CU）」，它們前后串接，并藉由「指令時槽（instruction slot）」控制每一個CU。當兩個CU共用一個指令時槽時，就發(fā)生了「重疊」現(xiàn)象，此時不能進行「同時作業(yè)」。不過，高速可設(shè)定式DSP允許CU混合不同的指令，并利用指令時槽，決定每一個週期內(nèi)的指令型態(tài)與數(shù)量。

在VLIW架構(gòu)中，指令字組包含了許多個時槽，每一個時槽各控制一個運算作業(yè)。因此，藉由改變時槽或CU的數(shù)量，就可以增加或減少每週期所執(zhí)行的運算數(shù)量。當增加CU后，會使可用的混合資源改變，好讓編譯器能對平行作業(yè)（parallel operation）做出最好的排序（schedule）。「可設(shè)定式」之名就來自于此。

典型的CU包含：算數(shù)運算單元、乘加單元（MAC）、位移單元、計數(shù)器和其它指令處理指元。資料路徑（data path）大小一般是16或32位元，或兩者兼具；採固點或浮點運算。大部份的CU還支援「單指令多資料（Single Instruction Multiple Data；SIMD）」運算功能，可以處理位元組（byte）或半字組（half word）的資料，例如將平面空間的圓轉(zhuǎn)換成3D空間的圓（由多個三角形構(gòu)成）。

同樣的，記憶介面單元（Memory Interface Unit；MIU）也被指令時槽組織起來，并透過指令時槽決定讀取的時機。MIU支援資料存取和位址（address）生成。高速可設(shè)定式DSP支援16或32位元的位址空間（address space）。因為MIU和CU一樣，都受指令時槽的控制，因此可以藉由改變時槽的數(shù)目，來變更可用的MIU數(shù)量。

和傳統(tǒng)處理器不同的是，可設(shè)定式DSP的暫存器（register）分散于各地，它不使用集中式的單一「暫存檔案（register file）」來管理。這會使得運算結(jié)果的位置，比較靠近產(chǎn)生此結(jié)果的地方和應用此結(jié)果的地方。同時，這也讓編譯器能更靈活地將資料配置到儲存的位置。這觀念類似RAM的隨機存取動作。

「資料通訊區(qū)塊（data communication block）」可以讓資料在不同的儲存位址之間移動，以及輸入到CU里。它包含了數(shù)個具有多工（MUX）功能的匯流排，并且受編譯器的控制。(圖一)是高速可設(shè)定式DSP的簡易架構(gòu)。

　

編譯器

就大多數(shù)的應用而言，除了要追求快速的運算能力以外，要如何才能有效地儲存暫時性的資料，也是一個令人頭痛的難題�？稍O(shè)定式DSP可以在不同位置新增、移除，甚至重組資料和位址暫存器，這可以讓編譯器充份地利用暫時性的儲存資源（譬如RAM、暫存器）。

因為高速可設(shè)定式DSP是屬于VLIW架構(gòu)，它允許加入自訂的CU。這種CU稱作「設(shè)計者定義的計算單元（Designer Defined Computational Unit；DDCU）」，包括自訂的指令，并可以加到編譯器的可用字匯里去，成為程式語言的一部份。

不過，彈性、平行運算與可設(shè)定性，是以高成本構(gòu)筑而成的。這除了硬體的成本以外，另一個成本就是編譯器的成本。編譯器負責將高階程式碼轉(zhuǎn)譯成指令，并傳送給可設(shè)定式DSP執(zhí)行，這個復雜的過程就是成本所在。

這種編譯器必須是VLIW最佳化編譯器，可以將連續(xù)的C程式碼轉(zhuǎn)換成VLIW指令；并盡可能在每一個週期內(nèi)，執(zhí)行最多的運算作業(yè)。它能察覺可設(shè)定式DSP的設(shè)定變更（新增或刪除），甚至能將使用者自訂的DDCU，轉(zhuǎn)譯成相對應的指令。

此編譯器能針對指定的應用類別和DSP核心之不同，將C程式碼映射（map）成相對應的目標碼。這個映射作用是全域的（global），且包括許多最佳化和轉(zhuǎn)換作業(yè)，其目的就是要使原始程式碼能和DSP更加適配。

因為DSP在每一個工作週期內(nèi)，能執(zhí)行的工作量是已知的，所以編譯器的任務就是要在每一個週期內(nèi)，盡可能將最多的有用工作量賦予DSP。不過有時候，部份應用程式并無法妥善地被映射到DSP上，這時編譯器會產(chǎn)生訊息，指出那些尚待改善的地方。這些訊息包含：

●消耗過多運算週期的程式碼：有一部份的程式碼會消耗掉很多的運算週期（動態(tài)地），因此必須多加注意；
●利用率偏低的程式碼：有一部份的程式碼會使編譯器無法妥善利用DSP；
●沒有善加利用資源：有些DSP資源未被充份利用；有些則是多余的；有些資源可以利用其它方式進行重整，以獲得平行運算的最大效益，或節(jié)省更多的空間和時間；
●缺乏資源：如果能增加資源（如暫存器、指令等），就可以提高應用程式的效能。

利用上述的編譯結(jié)果和描述，使用者可以針對程式碼和組態(tài)進行修改。程式的修改可能包括：簡單迴路的重寫、改變資料型態(tài)、或改變語法，這些可能使編譯器的作業(yè)更加簡單和明確。此外，使用者也可以改變可設(shè)定式DSP的組態(tài)，藉由增加或移除資源，或以許多種不同的方式重組資源，或可以添加能提高應用程式執(zhí)行效率的自訂指令。

產(chǎn)品開發(fā)流程

使用可設(shè)定式DSP來開發(fā)產(chǎn)品時，如果不採用一套完整的開發(fā)流程來遵循的話，則可設(shè)定的、可擴充的目標可能就很難達到。此流程見(圖二)。

在圖二中，進行數(shù)位訊號處理的應用程式可以說是主角。它以C或Java等高階語言寫成，并在主機上經(jīng)過驗證與測試。除了要完成功能性驗證以外，效能、成本、體積、耗電量也都要做取捨和折衷，以達到最完善的境界。

應用和最終產(chǎn)品的不同，也就是開發(fā)流程的起點，也可能會對開發(fā)的目標產(chǎn)生影響。例如：手提式裝置需要低功率，但是它的應用程式需要500～1000 MIPS的處理速率，在這種情況下，就要以平行處理能力較差、具單一DSP核心的處理器為開發(fā)目標。但若是廣播視訊應用程式要實現(xiàn)高解析度的畫面，那就要以高階、具兩個DSP核心的處理器為開發(fā)目標。
　

結(jié)語

「軟硬體同時開發(fā)」是加速SoC設(shè)計的重要方法，同樣也是應用高速可設(shè)定式DSP開發(fā)新產(chǎn)品時，必須採用的方法。OEM/ODM廠商在時間和成本的壓力下，最后勢必會採用這種新技術(shù)。不過，若大多數(shù)廠商都使用同一款DSP處理器來開發(fā)產(chǎn)品，很可能無法形成產(chǎn)品的市場區(qū)隔，再次陷入削價競爭的窘境。（原載于零組件雜志第158期）

上一篇：通用DSP的RISC核心開發(fā)單處理器VoIP

下一篇： DSP微控制器技術(shù)介紹