專利名稱:減小的并行和流水線化的高階mimo lmmse接收器架構(gòu)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明主要地涉及用于使用多個發(fā)射天線和/或多個接收天線的擴頻通信系統(tǒng)的接收器和有關(guān)方法,并且特別地涉及使用比如基于線性最小均方誤差(LMMSE)的均衡器這樣的均衡器的接收器。
背景技術(shù):
在發(fā)射器側(cè)和接收器側(cè)都使用多個天線的MIMO(多輸入多輸出)技術(shù)近來已經(jīng)作為現(xiàn)代通信中最重要的技術(shù)突破之一而出現(xiàn)。原先的MIMO稱為D-BLAST(見G.J.Foschini,″Layered space-timearchitecture for wireless communication in a fadingenvironment when using multielement antennas″,Bell Labs Tech.J.,pp.41-59,1996),以及一種通過復雜度與性能之間的合理權(quán)衡來進行無效和消除的更現(xiàn)實的策略稱為V-BLAST(見G.D.Golden,J.G.Foschini,R.A.Valenzuela和P.W.Wolniansky,″DETECTIONALGORITHM AND INITIAL LABORATORY RESULTS USING V-BLASTSPACE-TIME COMMUNICATION ARCHITECTURE″,Electron.Lett,Vol35,pp.14-15,Jan.1999)。
原先的MIMO空間多路復用是針對窄帶和平坦衰落信道而提出的。在多徑衰落信道中,擴頻碼的正交性將被破壞并且引入了多址干擾(MAI)以及符號間干擾。利用很短的擴頻增益,常規(guī)瑞克接收器不能提供可接受的性能?;贚MMSE(線性最小均方誤差)的碼片均衡器有希望恢復擴頻碼的正交性以便抑制ISI和MAI。然而,LMMSE均衡器涉及到一般復雜度為0((NF)3)的大型相關(guān)矩陣的求逆,其中N是Rx天線的數(shù)目而F是信道長度。這對于硬件實施而言非常昂貴。
早先用任一如下框架來解決碼片均衡器問題
(i)自適應隨機梯度算法如LMS;(ii)共軛梯度算法;以及(iii)基于FFT的MIMO碼片均衡器。
選項(i)的算法受制于穩(wěn)定性問題,因為收斂依賴于良好步長大小的選擇(見M.J.Heikkila,K.Ruotsalainen和J.Lilleberg,″SPACE-TIME EQUALIZATION USING CONJUGATE-GRADIENT ALGORITHMIN WCDMA DOWNLINK″,IEEE Proceeding in PIMRC,pp.673-677,2002)。選項(ii)的算法根據(jù)Levinson和Shur表現(xiàn)出O((NF)2)階的復雜度。對于選項(iii),基于FFT的均衡器將(NF×NF)矩陣求逆減少到大小為(N×N)的LF個子矩陣求逆(見J.Zhang,T.Bhatt,G.Mandyam,″EFFICENT L1NEAR EQUALIZATION FOR H1GHDATA RATE DOWNLINK CDMA SIGNALING″,Proceeding of IEEEAsilomar Conference on Signals,systems and Computers,2003)。
Zhang,Bhatt,Mandyam提出的上述基于FFT的快速算法使用了相關(guān)矩陣的帶狀托普利茨結(jié)構(gòu)。雖然此基于FFT的算法避免了對維度為NF×NF的原相關(guān)矩陣的求逆,但是發(fā)明人認為一些矩陣求逆對于MIMO接收器在所難免。對于具有高維度的MIMO接收器,MIMO接收器的復雜度隨著天線的數(shù)目顯著地增加。感興趣的主要運算是針對過采樣因子為2的1×4、2×4和4×4MIMO配置或者1×2、2×2接收器的在頻域中的多個4×4矩陣求逆這一架構(gòu)。這是因為這些有望最有可能在不遠的將來加以部署。接收器必須嵌入到便攜設(shè)備中這一事實使得低復雜度移動接收器的設(shè)計對于低成本產(chǎn)品的普遍商業(yè)部署而言至關(guān)重要。出于實踐考慮,有必要確定哪一矩陣求逆架構(gòu)的范圍最適合于VLSI實施。
本領(lǐng)域中所需的是一種用于在保持于便攜無線設(shè)備、移動臺如移動電話、具有雙向通信的PDA、個人因特網(wǎng)接入設(shè)備和其它此類裝置所施加的約束內(nèi)的同時減少MIMO系統(tǒng)中接收器復雜度的接收器架構(gòu)和相應的方法。
發(fā)明內(nèi)容
本發(fā)明是一種用于恢復多徑信道信號中擴頻碼正交性的方法和LMMSE接收器。通過對大小為N×N的數(shù)個子矩陣求逆來避免現(xiàn)有技術(shù)的整個NF×NF矩陣的求逆,其中N是接收天線的數(shù)目而F是信道長度參數(shù)。以厄密優(yōu)化和樹修剪來減少常規(guī)FFT設(shè)計模塊的數(shù)目和復雜度,并且進一步簡化子矩陣的求逆。
本發(fā)明在一個方面為包括從一連串子矩陣E的求逆中生成濾波器系數(shù)w集的裝置的均衡器。子矩陣各自的大小不大于2×2,并且各自代表用于通過多徑信道接收的擴頻信號的近似相關(guān)矩陣Crr的元素。
在另一方面中,本發(fā)明是一種具有基于線性最小均方誤差LMMSE的碼片級均衡器的擴頻接收器。該均衡器包括有限沖激響應FIR濾波器,該濾波器耦合到協(xié)方差估計器和抽頭求解器的輸出,該協(xié)方差估計器和抽頭求解器可操作用以將塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素與經(jīng)傅立葉變換的信道矩陣H進行組合。該塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。
在另一方面中,本發(fā)明是一種具有協(xié)方差估計器和抽頭求解器裝置的均衡器。這些裝置具有耦合到有限沖激響應濾波器裝置的輸出,并且用于對塊循環(huán)矩陣Crr的子矩陣元素執(zhí)行快速傅立葉變換FFT和求逆而對信道矩陣H執(zhí)行傅立葉變換。同上,塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。協(xié)方差估計器和抽頭求解器裝置還用于將經(jīng)傅立葉變換和求逆的子矩陣與經(jīng)傅立葉變換的信道矩陣進行組合。這些裝置對不大于2×2的矩陣求逆。
在另一方面中,本發(fā)明是一種用以從多徑信道接收信號的方法。該方法包括以至少兩個接收天線來接收所述信號;以及通過將經(jīng)傅立葉變換的信道矩陣與塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合來均衡所接收的信號,該塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。
本發(fā)明的其它方面包括使計算處理流線化(streamline)、使用于各種濾波器系數(shù)的計算并行化以及使各種參數(shù)在時間上流水線化以減少數(shù)據(jù)路徑長度和消除重復計算。
參照與附圖相結(jié)合的如下描述,本發(fā)明的實施例的這些及其它特征、方面和優(yōu)點將變得明顯。然而將理解到附圖僅僅是為了對本發(fā)明進行說明的目的而設(shè)計的,不應理解為對本發(fā)明進行限制的限定。
下文更具體地參照除有規(guī)定之外未按比例繪制的以下附圖來描述本發(fā)明。
圖1是MIMO多碼CDMA下行鏈路的系統(tǒng)模型。
圖2是LMMSE碼片均衡器的框圖。
圖3是基于FFT的MIMO均衡器抽頭求解器的VLSI架構(gòu)的框圖。
圖4是合并式2×2矩陣求逆和信道乘法的經(jīng)厄密優(yōu)化的數(shù)據(jù)路徑。
圖5(a)是分割式4×4矩陣求逆的數(shù)據(jù)依賴路徑。
圖5(b)是經(jīng)厄密優(yōu)化的4×4矩陣求逆的數(shù)據(jù)依賴。
圖6是使用通用設(shè)計模塊T、M和HINV的VLSI設(shè)計架構(gòu)。
圖7是M(A,B)處理單元的并行VLSIRTL架構(gòu)布局。
圖8是T(A11,A21,A22)設(shè)計塊的RTL架構(gòu)布局。
具體實施例方式
這里使用如下縮寫詞LMMSE線性最小均方誤差;CDMA碼分多址;SIMO單輸入多輸出;MIMO多輸入多輸出;FPGA現(xiàn)場可編程門陣列;VLSI超大規(guī)模集成電路;
ASIC專用集成電路;RTL寄存器傳送層;DSP數(shù)字信號處理;FFT快速傅立葉變換如這里所用,除非另有具體指明,術(shù)語CDMA通指擴頻通信系統(tǒng)(例如CDMA 2000)。運算符[]T和[]*指示了轉(zhuǎn)置,而運算符[]H指示了本領(lǐng)域中已知的厄密運算。概括言之,本發(fā)明是一種復雜度減少的基于FFT的線性均衡器并且還包括一種用于所提出的MIMO接收器的完整并行VLSI架構(gòu)。為了進一步減少復雜度,公開了利用相關(guān)系數(shù)和FFT算法結(jié)構(gòu)的厄密優(yōu)化。然后在子矩陣的求逆中應用厄密特征。減少狀態(tài)的FFT模塊避免對稱系數(shù)和零系數(shù)的重復計算,由此減少常規(guī)FFT設(shè)計模塊的數(shù)目和復雜度。
特別感興趣的是在基于FFT的碼片均衡器抽頭求解器中的分割式4×4子矩陣和通用RTL方案。4×4子矩陣被分割成4個2×2子矩陣以便更好地適應于移動設(shè)備。然后通過探求分割式4×4求逆中的共性來顯著地簡化4×4矩陣求逆。根據(jù)特殊設(shè)計塊導出通用架構(gòu)以消除復數(shù)運算中的冗余度。經(jīng)調(diào)節(jié)的模型有助于高效并行VLSI模塊如“復數(shù)-厄密-乘法”、“厄密求逆”和“對角變換”的設(shè)計。這促成在復雜度上節(jié)省3x的高效架構(gòu)以及更為并行和流水線化的RTL方案,這在FPGA原型平臺中得到驗證。此方法的可能應用包括符合1X EV-DV或者MIMO-HSDPA標準的下行鏈路CDMA移動設(shè)備。
在圖1中描述了使用空間多路復用的MIMO多碼CDMA下行鏈路系統(tǒng)10。在系統(tǒng)10中應用數(shù)目為M的發(fā)射(Tx)天線12和數(shù)目為N的接收(Rx)天線14,其中通常M≤N。在多碼CDMA系統(tǒng)中,多個擴頻碼被分配給單個用戶以實現(xiàn)高的數(shù)據(jù)速率。首先,在解多路復用器塊16中將高數(shù)據(jù)速率符號解多路復用成K*M個較低速率的子流,其中K是系統(tǒng)中用于數(shù)據(jù)傳輸?shù)臄U頻碼的數(shù)目。子流被分解成M組,其中組中的各子流在關(guān)聯(lián)擴頻器18中以擴頻增益為G的擴頻碼來擴頻。子流組然后在求和節(jié)點20被組合并且在擾頻器22以長擾碼來進行擾頻而且經(jīng)由信道26通過第m個Tx天線12被發(fā)射到接收器24。在第m個發(fā)射天線處的碼片級信號給定如下dm(i)=Σk-1Ksmk(j)·cmk[i]+smP(j)·cmP[i],---[1]]]>其中j是符號索引,i是碼片索引,而k是復合擴頻碼的索引。smk[j]是第m個子流處第k個碼的第j個符號。在下文中著重于第j個符號索引而省略該索引以求簡明。cmk[i]=ck[i]cm(s)[i]]]>是用于第m個子流處第k個碼的復合擴頻碼序列,其中ck[i]是用戶特定的(user specific)哈達馬擴頻碼,而cm(s)[i]是天線特定的(antenna specific)擾頻長碼。smP[j]標示了第m個天線處的導頻符號。cmP[i]=cP[i]cm(s)[i]]]>是用于第m個天線處導頻符號的復合擴頻碼。在第n個Rx天線處接收的碼片級信號給定如下rn(i)=Σm=1MTΣr=0Lm,nhm,n(l)dm(i-τ1)+z(i),---(2)]]>其中信道通過如下信道矩陣來表征,該信道矩陣具有從第m個Tx天線與第n個Rx天線之間的信道系數(shù)中獲得的元素hm,n(t)=Σl=0Lm,nhm,n(l)δ(t-τm,n,l).---[3]]]>與符號采樣相對照,‘碼片’級信號是指擴頻碼所擴頻的碼片采樣。在擴頻系統(tǒng)中,碼片均衡器充當前端(其中采樣通過擴頻碼來擴頻)或者應對多徑信道效應。在典型接收器中,解擴器在碼片均衡器之后,用以在解擴之后檢測單獨符號。通過在向量r‾(i)=[r1(i),...rn(i),...rN(i)]T]]>中封裝來自所有接收天線的接收碼片并且收集LF=2F+1個連續(xù)碼片(通常,中心位于所有N個Rx天線的第i個碼片處),將信號矩陣形成為r‾A(i)=[r‾(i+F)T,...r‾(i)T,...r‾(i-F)T]T]]>(其中在字母標志符如X上方的字符 用來代表矩陣)。在向量形式下,接收信號可以給定如下r‾‾A‾(i)=Σm=1MH‾md‾m(i)---[4]]]>其中 是根據(jù)信道系數(shù)構(gòu)造的塊托普利茨矩陣。多個接收天線的信道向量定義為h‾(l)=[hm,l(l),...hm,n(l),...hm,N(l)]T.]]>用于第m個發(fā)射天線的發(fā)射碼片向量給定為d‾M(l)=[dm,l(i+F),...dm,n(i),...dm,N(i-F-L)]T.]]>多個Tx天線的使用顯著地增加頻譜效率??蓪崿F(xiàn)的數(shù)據(jù)速率隨著Tx天線的數(shù)目幾乎線性地增加。對于滿負荷系統(tǒng)(M+K=G),可實現(xiàn)的比特率取決于Tx天線配置、調(diào)制方案和碼片速率。表I給出了對于擴頻因子(SF)為G=16和碼片速率為3.84MHz的不同數(shù)目的發(fā)射天線而言可實現(xiàn)的聚集未編碼數(shù)據(jù)速率。
表I可實現(xiàn)的未編碼數(shù)據(jù)速率(Mbps)碼片級均衡已經(jīng)是單用戶CDMA下行鏈路中最有前途的接收器之一。如圖2中所示,接收器24中的碼片級均衡器28以抽頭求解器30進行操作并且輸出碼片級均衡信號到解擾器/解擴器32(表示為一個功能塊,但是在實踐中可以分解成兩個或者更多),該解擾器/解擴器又輸出到解交織器/解碼器(在非限制性說明中也表示為一個功能塊)。碼片級均衡器28按照線性FIR濾波器系數(shù)集估計發(fā)射碼片采樣如下d‾^m(i)=w-^mHr‾‾A[i]---[5]]]>當前研究包括兩種主要的均衡方式,即非自適應線性均衡器和自適應線性均衡器。非自適應線性均衡器通常假設(shè)觀察窗中信道26的平穩(wěn)性并且以比如LMMSE或者迫零這樣的標準來設(shè)計均衡器28。眾所周知,LMMSE求解給定如下w‾^mops=argminE[||d←m(i)-w‾^mHr‾‾A[i]||2],---[6]]]>=σd2(i)R‾w(i)-1E[r‾‾A[i]d‾‾mH(i)]]]>其中相關(guān)矩陣在遍歷性的假設(shè)下按照時間平均給定如下R‾rr=E[r‾‾A[i]r‾‾mH(i)]=1NΣi=0N-1r‾‾A(i)r‾‾A(i)---[7]]]>而使用導頻符號將信道系數(shù)估計為h‾^m=E[r‾‾A[i]d‾‾mH(i)].]]>在HSDPA標準中,總發(fā)射功率的約10%專用于公用導頻信道(CPICH)。這將提供準確的信道估計。
使用信道的平穩(wěn)性以及卷積性質(zhì),容易表明相關(guān)矩陣是帶狀塊托普利茨矩陣 其中 是具有相關(guān)系數(shù)的N×N塊矩陣。表明了在添加兩個如下拐角矩陣之后可以通過塊循環(huán)矩陣來對相關(guān)矩陣 進行近似 使用對角化定理的擴展,塊循環(huán)矩陣可以分解如下C‾rr(D‾H⊗I‾)(Σi=0LF-1W‾t⊗E‾[i])(D‾H⊗I‾),---[8]]]>其中W‾=diag(1,WLF-1,...,WLF-(LF-1))]]>和WLF=ej(2π/LF)]]>是用于DFT計算的相位因子系數(shù)。運算符_標示了克羅內(nèi)克爾積,而 是DFT矩陣。對于MIMO系統(tǒng),可以表明MIMO均衡器抽頭可以以如下等式來計算w‾^mops=(D‾H⊗I‾)·F‾-1·(D‾⊗I‾).---[9]]]>F‾=diag(F‾0,F‾1,...,F‾LF)]]>是塊對角矩陣,該矩陣具有從循環(huán)矩陣第一列的逐元素FFT獲得的元素。對于M×NMIMO系統(tǒng),這將(NLFxNLF)矩陣的求逆減少到大小為N×N的子塊矩陣的求逆。
系統(tǒng)級流水線為了實現(xiàn)實時實施,可以應用DSP處理器或者VLSI架構(gòu)。移動設(shè)備的有限硬件資源和電源通常使硬件設(shè)計更具挑戰(zhàn)性,尤其對于MIMO系統(tǒng)更是如此。然而,簡單的實施在計算上具有多個冗余度。需要多個優(yōu)化以更適合于實時實施。在架構(gòu)、系統(tǒng)分割與流水線之間的交互著重于如下目標1)減少的計算復雜度;2)最少的硬件資源;3)用于關(guān)鍵計算部分的并行和流水線架構(gòu)。
為了探求高效架構(gòu),詳述任務如下·計算獨立相關(guān)元素 并且通過添加拐角元素來形成循環(huán) 的第一塊列為C‾rr(1)=[E‾
,...,E‾[L],0,...,0,E‾H[L],...,E‾H[1]]T.]]>各元素是N×N子塊矩陣。
·獲得 元素向量F‾n1,n2=FFT{E‾n1,n2(c)}]]>的逐元素FFT,其中E‾n1,n2(c)[i]=C‾rr(1)[(n1-i-1)*N+n2-1],]]>i=
,n1,n2∈[1,N]。
·對于m=[1,M],計算信道估計的逐維度FFT如下Φ‾m=(D‾⊗I‾)h‾^m=FFT(
]>n∈[1,N]·計算N×N子矩陣 的逆,其中F‾[i]-1=diag(F‾
-1,...,F‾[LF-1]-1).]]>·計算信道估計系數(shù)的FFT輸出與子矩陣的逆的矩陣乘法Ψ‾m=P‾-1Φ‾m.]]>·計算矩陣乘法結(jié)果的逐維度IFFTw‾^mopt=(D‾H⊗I‾)Ψ‾m.]]>利用時序和數(shù)據(jù)依賴分析,在圖3的框圖中示出了用于接收器24的MIMO均衡器28的頂級設(shè)計塊,該圖還示出了虛線塊內(nèi)的抽頭求解器30。系統(tǒng)級流水線是為求更佳模塊性而設(shè)計的。相關(guān)估計塊36在一個數(shù)據(jù)路徑40a上從用于各碼片的接收天線14獲取多個輸入采樣以計算 第一列的相關(guān)系數(shù)。通過在 矩陣估計塊38中添加拐角以形成矩陣 使之循環(huán)。完整系數(shù)被寫到DPRAM 42(存儲介質(zhì)),而N×N逐元素FFT模塊44計算[F‾
,...,F‾[LF]]=FFT{[E‾
,...,E‾[L],o,...o,E‾[L]H,...,E[1]H]}]]>另一并行數(shù)據(jù)路徑40b用于信道估計以及如 中那樣的對信道系數(shù)向量的M×N逐維度FFT。來自并行數(shù)據(jù)路徑40b的導頻符號用來在信道估計塊44估計信道。這些在信道矩陣塊46中組成對整個信道進行估計的矩陣,在另一FFT模塊48獲得該矩陣的FFT。子矩陣求逆和乘法塊52從DPRAM 42獲取信道和相關(guān)的FFT系數(shù)并且如 中那樣進行計算。
最后,M×N逐維度IFFT模塊54為均衡器抽頭 生成結(jié)果并且將它們發(fā)射到M×N MIMO FIR塊56以供濾波。為了反映正確時序,在前端的相關(guān)模塊36和信道估計模塊46將在吞吐模式下針對流傳輸輸入采樣進行工作。虛線塊中的FFT/IFFT模塊(44,50,54)構(gòu)造抽頭求解器30的后處理。它們適合于使用雙點RAM塊而在塊模式下工作來傳送數(shù)據(jù)。MIMO FIR濾波56也將在吞吐模式下針對緩存的流傳輸輸入數(shù)據(jù)進行工作。
厄密優(yōu)化和減少狀態(tài)的FFT根據(jù)相關(guān)矩陣的循環(huán)特征,可以用如下引理來減少FFT計算的復雜度。定義相關(guān)矩陣的逐元素FFT為{E‾[1]⇒FFT[F‾i,j[1:LF]]N=N.]]>對于SIMO和MIMO情況,循環(huán)相關(guān)系數(shù)向量的逐元素FFT結(jié)果通過使用FFT計算的特征來允許厄密結(jié)構(gòu)。厄密特征按照如下引理來給出。
引理1F‾i,j=conj(F‾i,j).]]>因此 的計算對于j<i是冗余的。
引理2由于 的虛部等于0,所以 的計算可以減少到全DFT的僅L/LF。與 有關(guān)的計算也減少到實數(shù)運算,節(jié)省了50%的復雜度。由于FFT算法應用了旋轉(zhuǎn)系數(shù)的特征,所以引理2中厄密特征的應用并不簡單。利用基于標準時間抽選(DIT)FFT算法的修剪運算可以導出針對減少狀態(tài)的FFT(RS-FFT)的面向硬件的優(yōu)化。不同類型的蝴蝶單元基于輸出系數(shù)的特征而有差別,而在蝴蝶樹中修剪不必要的計算分支。注意到在標準蝴蝶單元中,各運算涉及到具有四次實數(shù)乘法和兩次實數(shù)加法的完全復數(shù)乘法。修剪增加了減少狀態(tài)FFT架構(gòu)的效率。雖然當FFT的數(shù)目增加到很大數(shù)目時使節(jié)省有減少,但是對于均衡器應用,F(xiàn)FT的長度保持于64點FFT的范圍。RS-FFT節(jié)省了實數(shù)乘法的大致50%。本發(fā)明的某些方面利用厄密特征并且著重于塊抽頭求解器中逐元素FFT模塊之后矩陣求逆和乘法模塊的優(yōu)化。
厄密矩陣求逆架構(gòu)雖然基于FFT的抽頭求解器避免了維度為NF×NF的原相關(guān)矩陣的直接矩陣求逆,但是對角矩陣 的求逆在所難免。對于具有高接收維度的MIMO接收器, 中的矩陣求逆和乘法并非微不足道。由于 矩陣的對角特征,所以它可以如F‾-1=diag(F‾0-1,F‾1-1,...,F‾LF-1-1)]]>中那樣劃分成大小為N×N的LF個子矩陣的逆。使用高斯消除的傳統(tǒng)N×N矩陣求逆具有O(N3)復數(shù)運算的復雜度。根據(jù)第IV部分的厄密引理,不言而喻 的元素也是厄密對稱的。關(guān)于厄密本征值分解有引理如下如果A‾∈C‾RDT]]>使得A‾=A‾H,]]>則存在酉矩陣U‾∈C‾RDT,]]>使得U‾HA‾U‾=Λ‾,]]>其中 是 的本征值的對角矩陣。Cholesky分解可以用來幫助這些矩陣的求逆。然而,此方法要求由于它們的復雜度而在硬件中優(yōu)選為加以避免的算數(shù)平方根運算。如下具體描述單獨地考慮兩種特殊情況,即兩個Rx天線和四個Rx天線,因為這些是最有可能被廣泛采用的。將這些教導適應于不同數(shù)目的Rx天線在邏輯上是相符的。示出了基于塊分割的探求、適合于VLSI(超大規(guī)模)實施的復雜度減少方案和高效架構(gòu)。提取分割式塊矩陣求逆的共性以設(shè)計用于可再次使用的模塊性的通用RTL模塊。通過再次使用2×2塊分割來設(shè)計4×4接收器。
雙天線MIMO/ST接收器根據(jù)等式[9],簡單的分割在于針對 的矩陣求逆、然后是 和信道系數(shù)逐維度FFT的矩陣乘法。在這一分割中,先計算 中整個子塊矩陣的求逆,然后是矩陣乘法。然而,此分割涉及到兩個單獨的循回結(jié)構(gòu)。由于兩個步驟具有同一循回結(jié)構(gòu),所以更希望合并這兩個步驟并且減少開銷。2×2子矩陣的求逆給定如下F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1---[10]]]>=1f0,0(k)*f1,1(k)-f0,1(k)*f1,0(k)f1,1(k)-f0,1(k)-f1,0(k)f0,0(k).]]>令Γ‾=(D‾⊗I‾)h‾=[Γ‾0Γ‾1...Γ‾LF-1],]]>其中Γ‾k=[γ1(k)γ2(k)]]]>是逐維度FFT系數(shù)的第k個元素的組合,然后矩陣求逆和乘法的合并運算給定如下G‾=F‾-1·(D‾⊗I‾)h‾]]>=diag(F‾0-1,F‾1-1,,...,FLF-1-1)Γ‾---[11]]]>=[F‾0-1Γ‾0T,F‾1-1Γ‾1T,...,F‾LF-1-1Γ‾LF-1T]T]]>因此單個合并循回可以用來計算 的最終結(jié)果而不是使用單獨的循回。然而,利用 的厄密特征,可以減少矩陣求逆和乘法模塊中實數(shù)運算的次數(shù)。這是在實數(shù)、半復數(shù)和復數(shù)乘法/加法的區(qū)別之下來自引理1和引理2中特征的直接結(jié)果。它也得到如下所示用于矩陣G第k個元素的簡化等式W‾(k)=1f0,0(k)·f1,1(k)-|f0,1(k)|2f1,1(k)oγ1(k)-f0,1(k)*γ2(k)f0,0(k)oγ2(k)-f0,1(k)a*γ1(k)---[12]]]>其中“a·b”意味著“實數(shù)×實數(shù)"乘法;“aob”意味著“實數(shù)×復數(shù)”乘法,而“a*b”意味著“復數(shù)×復數(shù)”乘法。復數(shù)除法為實數(shù)除法所取代。據(jù)此導出如圖4中所示具有厄密優(yōu)化的簡化數(shù)據(jù)路徑。在這一圖中,f0,0(k)和f1,1(k)是實數(shù)。單個乘號意味著實數(shù)乘法。帶圓圈的乘號意味著“實數(shù)×復數(shù)”乘法,而帶矩形的乘號是“復數(shù)×復數(shù)”乘法。
根據(jù)圖4不言而喻數(shù)據(jù)路徑與現(xiàn)有技術(shù)的完全DMI相比顯著地簡化。這有助于定點實施中的縮放并且由此增加算法的穩(wěn)定性。復雜度比較如下?;谒袕蛿?shù)的原矩陣求逆和乘法具有10次復數(shù)乘法+2次實數(shù)乘法。這對于一次循回就是42次實數(shù)乘法。對于FFT長度為32的塊,將有42*32=1344次實數(shù)乘法。在簡化的數(shù)據(jù)路徑中有2次復數(shù)乘法+5次半復數(shù)乘法+1次實數(shù)乘法。這在各循回中等于19次實數(shù)乘法或者在一個塊中等于608次實數(shù)乘法。注意也減少了對于來自逐元素FFT的接口的存儲。節(jié)省了用于Im(f0,0),Im(f1,1),Re(f0,0)和Re(f1,1)的四個分布DPRAM。
具有4個Rx天線的接收器這包括1×4、2×4、4×4 SIMO和MIMO場合。注意到過采樣的接收器分集也具有同一數(shù)學格式。因此這也可以是過采樣因子為2的2個接收天線的情況。感興趣的主要運算是4×4矩陣(其在N=2且過采樣因子為2時出現(xiàn))的求逆,所以有必要確定哪一可能矩陣架構(gòu)的范圍最適合于此應用。除最小化所用電路面積之外,該設(shè)計需要在短的時間預算內(nèi)工作。用于此部分的高效計算架構(gòu)節(jié)省了面積和時間資源。從一開始將 中的4×4子矩陣分割成2×2塊子矩陣如下
F‾[i]4x4=f11[i]f12[i]f13[i]f14[i]f21[i]f22[i]f23[i]f24[i]f31[i]f32[i]f33[i]f34[i]f41[i]f42[i]f43[i]f44[i]=B‾11[i]B‾12[i]B‾21[i]B‾22[i]i---[13]]]>4×4矩陣的求逆可以通過四個2×2子矩陣的順序求逆來進行。為求簡明,將4×4元素矩陣求逆分割為F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i].]]>可以表明子塊按照如下等式來給定C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i].C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1---[14]]]>不考慮數(shù)據(jù)依賴,簡單的計算將具有大小都為2×2的八次復數(shù)矩陣乘法、兩次復數(shù)矩陣求逆和兩次復數(shù)矩陣減法。但是這并不是很有效。考察數(shù)據(jù)依賴表現(xiàn)了數(shù)據(jù)路徑中的一些重復運算。對于不考慮 矩陣的厄密結(jié)構(gòu)這一普通情況,可以表明順序計算具有圖5a所給定的數(shù)據(jù)流的依賴路徑。原始復雜度給定如下六次矩陣乘法、兩次求逆和兩次減法。根據(jù)數(shù)據(jù)路徑流可以標識關(guān)鍵路徑。
現(xiàn)在 矩陣的厄密結(jié)構(gòu)用來導出更為并行和優(yōu)化的計算架構(gòu)。由于厄密矩陣的逆是厄密共軛,即F‾-1=[F‾-1]H,]]>可以表明B‾11-1[i]=[B‾11-1]HB‾12-1[i]=[B‾21-1]HB‾22-1[i]=[B‾22-1]H⇒C‾11-1[i]=[C‾11-1]HC‾12-1[i]=[C‾21-1]H.C‾22-1[i]=[C‾22-1]H]]>這通過去除具有厄密關(guān)系的重復計算塊來得到數(shù)據(jù)路徑。在圖5(b)中示出了減少的數(shù)據(jù)路徑,其中HINV意味著2×2厄密矩陣的求逆,而[]H是2×2矩陣的厄密運算。此數(shù)據(jù)路徑可以稱為分割式4×4矩陣求逆的簡單厄密優(yōu)化架構(gòu)。
然而,此簡單的處理沒有得到最高效的計算架構(gòu)。數(shù)據(jù)路徑仍然是以很長的依賴路徑來構(gòu)造的。為了完全提取共性并且調(diào)節(jié)VLSI中的設(shè)計塊,為不同類型的復數(shù)計算來定義對2×2矩陣的如下特殊運算符。這些特殊運算符將映射到VLSI處理單元(PU)以處理厄密矩陣的特殊特征。通過提取數(shù)據(jù)路徑之中的共性來實現(xiàn)高級模塊性。
·定義1“pPow(ab)=Re(a).Re(b)+Im(a).Im(b)”定義為兩個復數(shù)的偽冪函數(shù),而“Re(a,b)=Re(a).Re(b)-Im(a).Im(b)”定義為復數(shù)乘法的實部。
·定義2對于一般2×2矩陣 和厄霧2×2矩陣B‾=B‾H,]]>定義運算符CHM(復數(shù)-厄密-乘法)為M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>注意到除 之外所有數(shù)都是復數(shù)。
·定義3對于2×2厄密矩陣B‾=b11b21*b21b22=B‾H,]]>定義厄密求逆(HInv)運算符為HInv(B‾)=1(b11b22-|b21|2b22-b21*-b21b11.]]>此設(shè)計可以通過簡單的實數(shù)乘法和除法而不是復數(shù)乘法和除法來實現(xiàn)。
·定義4將劃分為四個子塊的4×4厄密 給定為A‾=A‾11A‾21*A‾21A‾22=A‾H,]]> 的DT(對角變換)定義如下T(A‾)=T(A‾11,A‾21,A‾22)]]>=A‾22-A‾21A‾13A‾21H---[15]]]>=A‾22-M(A‾21,A‾11)A‾21H]]>利用這些定義,將4×4厄密矩陣F‾=F‾H]]>的求逆調(diào)節(jié)成對2×2矩陣的簡化運算。在一些操縱之后,分割的子塊計算等式可以使用所定義的運算符來映射到如下過程。
(1):B‾inv=Hinv(B‾11)=B‾invH;]]>(2):D‾=M(B‾21,B‾inv);]]>(3):C‾22=Hinv(T(B‾inv,B‾21,B‾22);]]>(4):C‾12=-M(D‾H,C‾22);becauseC‾12=C‾21H=-(C‾22D‾)H=-D‾HC‾22]]>(5):C‾11[i]=Binv+D‾HC‾22D‾=T(-C‾22,D‾H,B‾inv)]]>這得到了使用圖6中通用處理單元的硬件映射,該圖表現(xiàn)了總體計算復雜度是2HInv次運算、2次DT和1個額外的CHM塊。由于符號反相符和厄密格式化符[]H完全沒有硬件資源,所以計算復雜度取決于三個通用塊。計算的數(shù)據(jù)路徑表明不同設(shè)計模塊之間的時序關(guān)系。此調(diào)節(jié)塊圖有助于設(shè)計高效并行VLSI模塊,下文給出其細節(jié)。
并行架構(gòu)模塊現(xiàn)在導出用于普通 和 運算的高效設(shè)計模塊。為了提取共性和減少冗余度,需要探求通用運算中涉及到的基本計算的時序關(guān)系。由于在 變換中嵌入了運算 ,所以需要以去除重復計算和再次使用高效計算架構(gòu)的方式來設(shè)計接口。計算的分組和對臨時寄存器的巧妙使用將消除冗余度并且賦予到設(shè)計模塊的簡單和通用的接口。對于單個 模塊,令D‾=d11d12d21d22=M(A‾,B‾)=a11ob11+a11*b12a11*b21*+a12ob22a21ob11+a22*b21a21*b11*+a22ob22.]]>為了提取 和 運算中的共性,具有用于厄密矩陣的如下引理。引理如果B‾=B‾H]]>是2×2厄密矩陣,則 也是厄密矩陣。關(guān)聯(lián)計算通過6次CM(復數(shù)乘法)、4次CRM(復數(shù)-實數(shù)乘法)、4次pPow(ab)和2次Re(a,b)來給出,其中6次CM是{a12*b21,a11*b21*,a22*b21,a21*b21*,d21*a11*,d22*a12*},4次“CRM”運算是{tmp1=(a11оb11),tmp3=(a12оb22,tmp5=(a21оb11),tmp7=(a22оb22)},而4次“pPow(ab)”運算是pPow(tmp1,a11*),pPow(tmp3,a12*),pPow(tmp5,a21*),pPow(tmp7,a22*)。兩次Re(a,b)運算是Re(tmp2,a11*),Re(tmp6,a21*)。
證明對G‾=A‾B‾A‾H]]>的計算進行擴展和分組如下。
G‾=g11g12g21g22=A‾B‾A‾H=M(A‾,B‾)A‾H=a11ob11+a11*b12a11*b21*+a12ob22a21ob11+a22*b21a21*b21*+a22o&ogr;b22a11*a21*a12*a22*]]>這產(chǎn)生如下元素g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*]]>在等式中,a*b意味著“復數(shù)×復數(shù)”乘法,而“aob”意味著“復數(shù)×實數(shù)”乘法。定義臨時寄存器tmp1=(a11оb11),tmp2=(a12оb21),tmp3=(a12оb22),tmp5=(a21оb11),tmp6=a22*b21,tmp7=(a22оb22)。將這些臨時值相加以生成d11,d12,d21,d22。然而,取代了使這些臨時值與輸入進行普通復數(shù)乘法以產(chǎn)生最終結(jié)果,可以利用這些變量的關(guān)系和使用特殊函數(shù)部分。例如,容易驗證(a11ob11)*a11*=pPow(tmpL,a11),因為b11是a11的范數(shù)的標量。通過改變計算的次序和組合共同計算,可以最終表明 是具有如下給定的元素的厄密矩陣g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*)]]>因此可以如圖7所示設(shè)計簡化的 RTL模塊,以 的實部和虛部以及如{b11(r),b21(r/i),b22(r)}中那樣僅厄密矩陣 的必要元素作為輸入。輸出端口包括{tmp1,tmp2,tmp3,tmp5,tmp6,tmp7}。無需輸出tmp4和tmp8。另外,雖然所有這些數(shù)具有復數(shù)值,但是與輸入值的乘積無需是復數(shù)乘法。也只需計算d21,d22以獲得 元素。從 運算中消除{tmp4,tmp8,d21,d22}中的冗余計算。從簡化的 模塊加以構(gòu)建,4×4厄密矩陣的 變換的數(shù)據(jù)路徑RTL模塊按照圖8來給定,其中定義了簡化的函數(shù)部分{pPow(a,b)Re(a,b)}。 的輸出端口包括獨立元素{t11,t21,t22}。
性能和設(shè)計根據(jù)簡化的通用設(shè)計模塊,如圖6中那樣設(shè)計頂級RTL方案。與圖4和圖5中的設(shè)計相比較,這些架構(gòu)表現(xiàn)了更佳的并行和減少的冗余度。由于在模塊設(shè)計中提取 和 的共性,所以可以如下所示通過消除單獨 模塊進一步優(yōu)化頂級中的RTL。因此,從第二個 模塊中一起生成 和 的結(jié)果。此設(shè)計不僅將冗余度消除到最佳程度而且有助于多個子載波的流水線化。好得多地平衡數(shù)據(jù)路徑以實現(xiàn)高速VLSI架構(gòu)。
可以通過改變 模塊中復數(shù)乘法的數(shù)值計算次序來進一步減少實數(shù)乘法的次數(shù)。傳統(tǒng)上,復數(shù)乘法按照″c=cr+jci=(ar+jai)*(br+jbi)=(arbr-aibi)+j(arbi+aibr)″來給定。這具有四次獨立實數(shù)乘法和兩次實數(shù)加法。通過重排計算次序,可以提取共性并且減少實數(shù)乘法的次數(shù)如下(1)p1=arbr;p2=aibi;s1=ar+ai;s2=br+bi;(2)cr=p1-p2;d=(p1+p2);s=s1s2;(3)ci=s-d.
這在三個步驟中需要三次RM(實數(shù)乘法)和兩次RA(實數(shù)加法)??紤]到RA比RM廉價得多,該成本是值得的。
通過利用矩陣元素的厄密特征來減少冗余計算從而簡化RM和RA的次數(shù)。在表II中列舉了不同基本計算的量度作為參考。不言而喻,2×2厄密矩陣的求逆需要七次RM和兩次RA,而普通2×2矩陣的直接求逆需要二十六次RM。復數(shù)2×2矩陣乘法需要三十二次RM。如果使用4×4矩陣求逆的傳統(tǒng)計算架構(gòu),需要8*8*4+2*6.5*4=308次RM和8*8*4+2*1.5*2+2*4*2=150次RA而無需利用數(shù)據(jù)依賴優(yōu)化(DO)。即使利用簡單的數(shù)據(jù)依賴優(yōu)化,復雜度仍然是244次RM和102次RA。然而,單個
變換就4×4厄密矩陣而言需要共計6*3+4*2+4*2+2*2=38次RM??偠灾瑢崝?shù)乘法的次數(shù)是2x(38+7)=90次RM以計算具有厄密結(jié)構(gòu)的
這僅是用以計算逆的傳統(tǒng)架構(gòu)的實數(shù)乘法的不到三分之一。注意到在更佳模塊性和流水線化時也顯著地縮短了關(guān)鍵數(shù)據(jù)路徑。在表III中示出了就實數(shù)乘法而言的復雜度減少。
表II用于基本運算的RM和RA的次數(shù)
表III針對4×4矩陣求逆的復雜度減少基于上述算法優(yōu)化,發(fā)明人已經(jīng)展現(xiàn)了RTL設(shè)計在NallatechFPGA平臺上的VLSI架構(gòu)和原型。碼片速率與3.84MHz的WCDMA碼片速率一致,而發(fā)明人為Xilinx Virtex-II V6000 FPGA應用了38.4MHz的時鐘速率。相關(guān)窗口被設(shè)置為對于所有4個接收天線都是10個碼片。FFT大小是32點。在下文中給出主要設(shè)計塊的規(guī)范吞吐模式相關(guān)計算、多個FFT/IFFT模塊和4×4子矩陣的LF求逆。利用基于Precision-C(現(xiàn)在是Catapult-C)的設(shè)計方法來研究VLSI架構(gòu)設(shè)計的多個面積/時間權(quán)衡。例如,對于16-FFT/IFFT模塊,從一個極端上說,可以利用以蝴蝶樹模式布局的并行蝴蝶單元和復數(shù)乘法器來設(shè)計完全并行和流水線架構(gòu)。由于在經(jīng)濟上希望減少物理面積,所以這一點并不實際。將合并的多輸入多輸出FFT模塊設(shè)計為利用控制邏輯和相位系數(shù)加載中的共性??偠灾脙H四個乘法器來為此模塊實現(xiàn)面積/時間高效設(shè)計。對于4×4厄密矩陣的LF求逆,延遲對于6個乘法器而言是38埃秒。這得益于前述架構(gòu)優(yōu)化。
表IV主要FPGA設(shè)計模塊的面積/時間規(guī)范本發(fā)明的當前實施是在FPGA平臺中原型化的,而最佳模式被認為是實施為ASIC架構(gòu)并且集成于通信碼片中的PHY處理引擎中。當前RTL可以以ASIC技術(shù)為目標。速度關(guān)鍵元素包括用于MIMO相關(guān)、信道估計、FIR濾波和均衡器抽頭求解器的可縮放架構(gòu)。一種可選方式是將它實施于高端DSP處理器中。然而,DSP可能不能為具有流傳輸輸入數(shù)據(jù)的時間關(guān)鍵塊的實時處理而提供足夠的并行和流水線化。
該優(yōu)化減少了FFT的次數(shù)以及上述子矩陣求逆和乘法中實數(shù)運算的次數(shù)。這有助于算法在減少硬件資源的VLSI架構(gòu)中的實時實施。它也對定點實施賦予了更佳的穩(wěn)定性。感興趣的主要運算是頻域中多個4×4矩陣的求逆。這得到高效的架構(gòu),其3倍地節(jié)省了復雜度并具有更為并行和流水線化的RTL方案,這在FPGA原型平臺中得到驗證。本發(fā)明被認為對于在發(fā)射器和接收器都有多個天線的高端CDMA設(shè)備最為有利。對于簡化分集階數(shù)多達4的接收器設(shè)計(即過采樣因子為2的4個接收天線或者2個接收天線)尤其有用,不過這些原則可以延及具有不同數(shù)目天線的其它接收器。
本領(lǐng)域技術(shù)人員應當認識到本發(fā)明的一個方面涉及一種數(shù)據(jù)存儲介質(zhì),該數(shù)據(jù)存儲介質(zhì)存儲用以指引數(shù)據(jù)處理器對利用至少兩個天線從多徑信道接收的信號進行均衡的程序指令。程序指令可操作用以使數(shù)據(jù)處理器執(zhí)行如下操作,該操作通過對經(jīng)傅立葉變換的信道矩陣與塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合來均衡所接收的信號,其中塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。數(shù)據(jù)存儲介質(zhì)可以包括碼分多址多個輸入CDMA接收器的一部分。
盡管已經(jīng)圖示和描述了當前被認為是請求保護的本發(fā)明的優(yōu)選和可選實施例的內(nèi)容,但是將認識到許多變化和改型可能由本領(lǐng)域技術(shù)人員想到。本意在于在所附權(quán)利要求中覆蓋落入于請求保護的本發(fā)明的精神和范圍內(nèi)的所有那些變化和改型。
權(quán)利要求書(按照條約第19條的修改)1.一種擴頻MIMO接收器,其使用并行計算架構(gòu)和近似的相關(guān)矩陣Crr的2×2子矩陣的元素的厄密優(yōu)化,測量至少2×2子矩陣元素,避免直接計算所述近似相關(guān)矩陣的逆傅立葉變換。
2.如權(quán)利要求1所述的接收器,其中所述子矩陣各自是具有從所述近似相關(guān)矩陣的列的逐元素快速傅立葉變換中獲得的元素的塊對角矩陣。
3.如權(quán)利要求2所述的接收器,其通過對所述子矩陣求逆并且將所述經(jīng)求逆的子矩陣F-1與信道估計系數(shù)h的快速傅立葉變換進行組合來生成濾波器系數(shù)集。
4.如權(quán)利要求3所述的接收器,其中所述組合包括矩陣乘法F-1H(D)m,以及進一步其中所述裝置對所述乘法的結(jié)果執(zhí)行快速逆傅立葉變換以求解其元素w包括所述濾波器系數(shù)集的濾波器矩陣W。
5.如權(quán)利要求1所述的接收器,其中所述相關(guān)矩陣代表以每碼片至少兩次進行過采樣的多于兩個的偶數(shù)個接收天線或者兩個接收天線。
6.如權(quán)利要求5所述的接收器,其中所述近似相關(guān)矩陣Crr的非零元素被分割成互斥2×2子矩陣B,而各所述分割的子矩陣被求逆。
7.如權(quán)利要求6所述的接收器,其中厄密優(yōu)化包括對各所述分割的子矩陣執(zhí)行快速傅立葉變換,所述子矩陣被轉(zhuǎn)換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經(jīng)傅立葉變換的信道矩陣相乘產(chǎn)生F-1H(D)m,并對F-1H(D)m執(zhí)行快速逆傅立葉變換。
8.如權(quán)利要求7所述的接收器,其中對于各2×2子矩陣B,獨立地確定和存儲僅三個元素,而根據(jù)所述存儲的三個元素中的至少一個元素來確定第四元素。
9.如權(quán)利要求8所述的接收器,通過對所述三個存儲的元素的三次單獨的計算運算來生成濾波器系數(shù)集,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數(shù)-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>10.如權(quán)利要求9所述的接收器,其設(shè)置于接收器內(nèi),其中用于各第k個擴頻碼的所述濾波器系數(shù)集如下g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*.]]>11.如權(quán)利要求10所述的接收器,其中在確定各第k個擴頻碼濾波器系數(shù)時存儲和再次使用至少一些計算組合。
12.如權(quán)利要求11所述的接收器,其中用于各第k個擴頻碼的所述濾波器系數(shù)集如下g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數(shù)厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數(shù)a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
13.一種用以從多徑信道接收信號的方法,包括以至少兩個接收天線來接收所述信號;確定至少大小為4×4的塊循環(huán)矩陣Crr,所述塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似;并行地,利用塊循環(huán)矩陣的2×2子矩陣元素的厄密優(yōu)化來解決逆傅立葉變換而不直接計算該逆傅立葉變換;以及通過將經(jīng)傅立葉變換的信道矩陣與所述塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號。
14.如權(quán)利要求13所述的方法,其中對各所述2×2子矩陣元素執(zhí)行傅立葉變換,所述子矩陣被轉(zhuǎn)換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經(jīng)傅立葉變換的信道矩陣相乘產(chǎn)生F-1H(D)m,并對F-1H(D)m執(zhí)行快速逆傅立葉變換。
15.如權(quán)利要求14所述的方法,其中通過三個單獨的計算運算的布局來執(zhí)行所述組合,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數(shù)-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>16.如權(quán)利要求13所述的方法,還包括根據(jù)所述組合來生成濾波器系數(shù)集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數(shù)包括g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*.]]>17.如權(quán)利要求13所述的方法,還包括根據(jù)所述組合來生成濾波器系數(shù)集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數(shù)包括g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>
其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是所確定的并存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數(shù)厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數(shù)a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
權(quán)利要求
1.一種均衡器,包括如下裝置,所述裝置從對一連串子矩陣E的求逆中生成濾波器系數(shù)w集,所述子矩陣各自的大小不大于2×2并且代表用于通過多徑信道接收的擴頻信號的近似相關(guān)矩陣Crr的元素。
2.如權(quán)利要求1所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE均衡器。
3.如權(quán)利要求1所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE碼片級均衡器。
4.如權(quán)利要求1所述的均衡器,其中所述子矩陣各自是具有從所述近似相關(guān)矩陣的列的逐元素快速傅立葉變換中獲得的元素的塊對角矩陣。
5.如權(quán)利要求4所述的均衡器,其中所述均衡器通過將所述經(jīng)求逆的子矩陣F-1與信道估計系數(shù)h的快速傅立葉變換進行組合來生成所述濾波器系數(shù)集。
6.如權(quán)利要求5所述的均衡器,其中所述組合包括矩陣乘法F-1H(D)m,以及進一步其中所述裝置對所述乘法的結(jié)果執(zhí)行快速逆傅立葉變換以求解其元素w包括所述濾波器系數(shù)集的濾波器矩陣W。
7.如權(quán)利要求8所述的均衡器,其中對于各第k個濾波器系數(shù),所述經(jīng)快速傅立葉變換的列元素被求逆F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1]]>并且與所述經(jīng)傅立葉變換的信道矩陣H中所述信道系數(shù)h的所述第k個元素的組合Γ‾k=[γ1(k)γ2(k)]]]>進行矩陣相乘。
8.如權(quán)利要求1所述的均衡器,其中所述均衡器形成接收器中的如下部分,所述部分具有以每碼片至少兩次進行過采樣的多于兩個的偶數(shù)個接收天線或者兩個接收天線。
9.如權(quán)利要求8所述的均衡器,其中所述近似相關(guān)矩陣Crr的非零元素被分割成互斥2×2子矩陣B,而各所述分割的子矩陣被求逆。
10.如權(quán)利要求9所述的均衡器,其中對各所述分割的子矩陣執(zhí)行快速傅立葉變換,所述子矩陣被轉(zhuǎn)換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經(jīng)傅立葉變換的信道矩陣相乘產(chǎn)生F-1H(D)m,并對F-1H(D)m執(zhí)行快速逆傅立葉變換。
11.如權(quán)利要求10所述的均衡器,其中對于各2×2子矩陣B,獨立地確定和存儲僅三個元素,而根據(jù)所述存儲的三個元素中的至少一個元素來確定第四元素。
12.如權(quán)利要求11所述的均衡器,通過對所述三個存儲的元素的三次單獨的計算運算來生成所述濾波器系數(shù)集,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數(shù)-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>
13.如權(quán)利要求12所述的均衡器,其設(shè)置于接收器內(nèi),其中用于各第k個擴頻碼的所述濾波器系數(shù)集如下g11=(a11·b11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12·b22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21·b21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22·b22)*a22*.]]>
14.如權(quán)利要求13所述的均衡器,其中在確定各第k個擴頻碼濾波器系數(shù)時存儲和再次使用至少一些計算組合。
15.如權(quán)利要求14所述的均衡器,其中用于各第k個擴頻碼的所述濾波器系數(shù)集如下g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數(shù)厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數(shù)a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
16.一種擴頻接收器,包括基于線性最小均方誤差LMMSE的碼片級均衡器,所述均衡器包括有限沖激響應FIR濾波器,所述濾波器耦合到協(xié)方差估計器和抽頭求解器的輸出,所述協(xié)方差估計器和抽頭求解器可操作用以將塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素與經(jīng)傅立葉變換的信道矩陣H進行組合,所述塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。
17.如權(quán)利要求16所述的擴頻接收器,其中所述子矩陣元素的維度大于2×2并且被分割成較小矩陣、被求逆和組合形成所述經(jīng)傅立葉變換和求逆的子矩陣元素。
18.如權(quán)利要求16所述的擴頻接收器,其中經(jīng)傅立葉變換和求逆的塊循環(huán)矩陣Crr的所述子矩陣元素與所述經(jīng)傅立葉變換的信道矩陣H進行矩陣相乘,并對結(jié)果進行逆傅立葉變換。
19.如權(quán)利要求16所述的擴頻接收器,其中所述均衡器使用電路來實施。
20.如權(quán)利要求16所述的擴頻接收器,其中所述均衡器使用軟件來實施。
21.如權(quán)利要求16所述的擴頻接收器,其中所述均衡器使用電路和軟件的組合來實施。
22.如權(quán)利要求16所述的擴頻接收器,其中所述接收器包括多輸入CDMA接收器。
23.如權(quán)利要求16所述的擴頻接收器,其中所述接收器包括多輸入多輸出MIMO CDMA接收器。
24.一種均衡器,包括協(xié)方差估計器和抽頭求解器裝置,所述協(xié)方差估計器和抽頭求解器裝置具有耦合到有限沖激響應濾波器裝置的輸出,所述協(xié)方差估計器和抽頭求解器裝置對塊循環(huán)矩陣Crr的子矩陣元素執(zhí)行快速傅立葉變換FFT和求逆而對信道矩陣H執(zhí)行傅立葉變換,所述塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似,以及所述協(xié)方差估計器和抽頭求解器裝置將所述經(jīng)傅立葉變換和求逆的子矩陣與所述經(jīng)傅立葉變換的信道矩陣進行組合,所述裝置對不大于2×2的矩陣求逆。
25.如權(quán)利要求24所述的均衡器,其中所述均衡器形成碼分多址CDMA下行鏈路接收器的一部分。
26.如權(quán)利要求24所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE均衡器。
27.如權(quán)利要求24所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE碼片級均衡器。
28.如權(quán)利要求24所述的均衡器,其中所述均衡器形成具有多輸入多輸出MIMO架構(gòu)的碼分多址CDMA接收器的一部分。
29.一種用以從多徑信道接收信號的方法,包括以至少兩個接收天線來接收所述信號;以及通過將經(jīng)傅立葉變換的信道矩陣與塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號,所述塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。
30.如權(quán)利要求29所述的方法,其中所述將經(jīng)傅立葉變換的信道矩陣與塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合通過具有耦合到有限沖激響應濾波器的輸出的抽頭求解器來實施。
31.如權(quán)利要求29所述的方法,其中均衡使用線性最小均方誤差LMMSE技術(shù)。
32.如權(quán)利要求29所述的方法,其中均衡使用線性最小均方誤差LMMSE碼片級技術(shù)。
33.如權(quán)利要求29所述的方法,其中接收和均衡在碼分多址多輸入CDMA接收器內(nèi)發(fā)生。
34.如權(quán)利要求29所述的方法,其中所述組合包括矩陣乘法F-1H(D)m,所述方法還包括對所述乘法的結(jié)果執(zhí)行快速逆傅立葉變換以求解其元素w包括FIR濾波器系數(shù)集的濾波器矩陣W。
35.如權(quán)利要求34所述的方法,其中對于各第k個濾波器系數(shù),所述經(jīng)傅立葉變換的子矩陣元素被求逆F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1]]>并且與所述經(jīng)傅立葉變換的信道矩陣H中所述信道系數(shù)h的所述第k個元素的組合Γ‾k=[γ1(k)γ2(k)]]]>進行矩陣相乘。
36.如權(quán)利要求29所述的方法,其中被求逆以求解濾波器系數(shù)集的所有矩陣的維度為2×2。
37.如權(quán)利要求29所述的方法,其中所述經(jīng)求逆的子矩陣元素的維度大于2×2,所述方法還包括將所述子矩陣元素分割成互斥塊子矩陣并且對各互斥塊子矩陣求逆。
38.如權(quán)利要求37所述的方法,其中對各所述分割的子矩陣執(zhí)行傅立葉變換,所述子矩陣被轉(zhuǎn)換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經(jīng)傅立葉變換的信道矩陣相乘產(chǎn)生F-1H(D)m,并對F-1H(D)m執(zhí)行快速逆傅立葉變換。
39.如權(quán)利要求29所述的方法,其中通過三個單獨的計算運算的布局來執(zhí)行所述組合,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數(shù)-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>
40.如權(quán)利要求29所述的方法,還包括根據(jù)所述組合來生成濾波器系數(shù)集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數(shù)包括g11=(a11·b11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12·b22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21·b21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22·b22)*a22*.]]>
41.如權(quán)利要求29所述的方法,還包括根據(jù)所述組合來生成濾波器系數(shù)集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數(shù)包括g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是所確定的并存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數(shù)厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數(shù)a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
42.一種數(shù)據(jù)存儲介質(zhì),存儲用以指引數(shù)據(jù)處理器對利用至少兩個天線從多徑信道接收的信號進行均衡的程序指令,包括如下操作,該操作通過將經(jīng)傅立葉變換的信道矩陣與塊循環(huán)矩陣Crr的經(jīng)傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號,其中塊循環(huán)矩陣Crr是相關(guān)矩陣Rrr的近似。
43.如權(quán)利要求42所述的數(shù)據(jù)存儲介質(zhì),其中所述將所述經(jīng)傅立葉變換的信道矩陣與所述塊循環(huán)矩陣Crr的所述經(jīng)傅立葉變換和求逆的子矩陣元素進行組合的操作包括操作具有耦合到有限沖激響應濾波器的輸出的抽頭求解器。
44.如權(quán)利要求42所述的數(shù)據(jù)存儲介質(zhì),其中所述均衡操作使用線性最小均方誤差LMMSE技術(shù)。
45.如權(quán)利要求42所述的數(shù)據(jù)存儲介質(zhì),其中所述均衡操作使用線性最小均方誤差LMMSE碼片級技術(shù)。
46.如權(quán)利要求42所述的數(shù)據(jù)存儲介質(zhì),其中所述數(shù)據(jù)存儲介質(zhì)包括碼分多址多輸入CDMA接收器的一部分。
全文摘要
公開了一種為通過N個接收天線接收的擴頻信號恢復下行鏈路信道中擴頻碼正交性的LMMSE接收器?;贔FT的碼片均衡器抽頭求解器將現(xiàn)有技術(shù)的直接矩陣求逆減少到大小為N×N的一些子矩陣的求逆,N為接收天線的維度,并且最高效地將矩陣逆減少到不大于2×2。還按照厄密優(yōu)化通過常規(guī)快速傅立葉變換方式將復雜度進一步減少到子矩陣求逆和樹修剪。對于雙重過采樣的N=4或者N=2的接收器,所得4×4矩陣被分割成2×2塊子矩陣、被求逆并且重建成4×4矩陣。找到共同計算并且消除重復計算以提高效率。從特殊設(shè)計塊導出通用設(shè)計架構(gòu)以消除復數(shù)運算中的冗余度。最優(yōu)地,該架構(gòu)是并行和流水線化的。
文檔編號H04B1/707GK101091366SQ200580045166
公開日2007年12月19日 申請日期2005年11月4日 優(yōu)先權(quán)日2004年11月24日
發(fā)明者郭遠斌, 張建中, D·麥凱恩, J·R·卡瓦拉羅 申請人:諾基亞公司