快速點(diǎn)陣向量量化的制作方法

文檔序號(hào)：2837466閱讀：604來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：：快速點(diǎn)陣向量量化的制作方法
技術(shù)領(lǐng)域：
：本發(fā)明涉及對(duì)音頻信號(hào)編碼和解碼，更具體地講，涉及使用快速點(diǎn)陣向量量化來(lái)編碼和解碼具有高達(dá)大約22kHz音頻帶寬的音頻信號(hào)。
背景技術(shù)：
：在建立聲音信號(hào)或從聲音信號(hào)重放聲音的許多系統(tǒng)中使用音頻信號(hào)處理。隨著數(shù)字信號(hào)處理器(DSP)的發(fā)展，許多信號(hào)處理功能是通過(guò)數(shù)字化進(jìn)行的。為此，從聲波建立音頻信號(hào)，轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù)，為希望的效果進(jìn)行處理，轉(zhuǎn)換回模擬信號(hào)，并作為聲波再現(xiàn)。模擬音頻信號(hào)一般是通過(guò)話筒從聲波(聲音)產(chǎn)生的。以特定頻率對(duì)模擬音頻信號(hào)的振幅取樣，并將振幅轉(zhuǎn)換成代表振幅的數(shù)字。典型的取樣頻率是大約8kHz(即，每秒取樣8000次)，16kHz至196kHz，或這些頻率之間的某個(gè)頻率。根據(jù)數(shù)字化聲音的質(zhì)量，可以用8比特至128比特之間的某個(gè)比特?cái)?shù)字化聲音的每個(gè)取樣。為了保持高質(zhì)量的聲音，可能要使用許多比特。例如，在最高端，為了以196kHz取樣率和每個(gè)取樣128比特表現(xiàn)一秒鐘的聲音，可以占用128比特xl92kHz-24兆比特-3MB。為了表現(xiàn)3分鐘(180秒)的歌曲，要用540MB。在低端，在典型的電話會(huì)議中，以8kHz對(duì)聲音進(jìn)行取樣，且以每個(gè)取樣8比特進(jìn)行數(shù)字化，仍然要使用8kHzx8比特二64千比特/秒-8kB/秒。為了使數(shù)字化聲音數(shù)據(jù)更容易使用、存儲(chǔ)和傳送，一般要對(duì)它們進(jìn)行編碼，以減小它們的大小而不降低它們的質(zhì)量。當(dāng)要再現(xiàn)它們的時(shí)侯，對(duì)它們進(jìn)行解碼以恢復(fù)原始的數(shù)字化數(shù)據(jù)。已經(jīng)提出了各種不同的方式對(duì)音頻信號(hào)進(jìn)行編碼和解碼，以減小它們的數(shù)字格式的大小。對(duì)信號(hào)進(jìn)行編碼和解碼信號(hào)的處理器或處理模塊通常被稱為編解碼器。一些是無(wú)損的，即，解碼信號(hào)與原始信號(hào)嚴(yán)格地相同。一些是有損的，即，解碼信號(hào)與原始信號(hào)有輕微的差別。有損編解碼器通?？梢匀〉帽葻o(wú)損編解碼器更大的壓縮率。有損編解碼器利用某些人類聽覺(jué)的特征，拋棄某些人類不易察覺(jué)的聲音。對(duì)于大多數(shù)人，只有在大約20Hz至大約20kHz之間的音頻范圍內(nèi)的聲音才是可察覺(jué)的。在這個(gè)頻率范圍之外的聲音大多數(shù)人是不能聽到的。因此，當(dāng)為人類聽眾再現(xiàn)聲音時(shí)，產(chǎn)生這個(gè)范圍之外的聲音并不能改善聽到的聲音質(zhì)量。在用于人類聽眾的大多數(shù)音頻系統(tǒng)中，不再現(xiàn)這個(gè)范圍之外的聲音。在典型的公共電話系統(tǒng)中，在兩個(gè)電話機(jī)之間僅通信大約300Hz至大約3000Hz之內(nèi)的頻率。這減少了數(shù)據(jù)傳輸。一種用于編碼/解碼音樂(lè)的流行方法是MP3編解碼器中使用的方法。典型的音樂(lè)CD可以存儲(chǔ)大約40分鐘的音樂(lè)。當(dāng)用MP3編碼器以相當(dāng)?shù)穆曇糍|(zhì)量為相同的音樂(lè)編碼時(shí)，這種CD可以存儲(chǔ)10-16倍以上的音樂(lè)。結(jié)合在這里作為參考的、標(biāo)題為"64kbit/s內(nèi)7kHz音頻編碼"的ITU-T(國(guó)際電信同盟電信標(biāo)準(zhǔn)化部)建議G.722(1988)描述了一種64kbit/s內(nèi)7kHz音頻編碼的方法。ISDN線路具有以64kbit/s傳輸數(shù)據(jù)的能力。這種方法實(shí)際上將通過(guò)使用ISDN線路的電話網(wǎng)絡(luò)的音頻的帶寬從3kHz提高到7kHz。改善了聽到的音頻質(zhì)量。盡管這種方法使得能夠通過(guò)現(xiàn)有的電話網(wǎng)獲得高質(zhì)量的音頻，但是，它一般需要來(lái)自電話公司的ISDN服務(wù)，這種服務(wù)比一般的窄帶電話服務(wù)更貴。一種建議在電信中使用的更新的方法是，結(jié)合在這里作為參考的，標(biāo)題為"用于低幀損系統(tǒng)中免提操作的24和32kbit/s編碼(Codingat24and32kbit/sforhands—freeoperationinsystemwithlowframeloss)"的ITU-T建議G.722.1(1999)。這個(gè)建議說(shuō)明了一種數(shù)字寬帶編碼器算法，這種算法提供了50Hz至70kHz的音頻帶寬，操作在大大低于G.722的24kbit/s或32kbit/s的比特率。以這種數(shù)據(jù)率，具有使用慣用模擬電話線路的慣用調(diào)制解調(diào)器的電話可以發(fā)送寬帶音頻信號(hào)。因此，只要兩端的電話機(jī)能夠執(zhí)行G.722.1中所述的編碼/解碼，大多數(shù)現(xiàn)有電話網(wǎng)都可以支持寬帶對(duì)話。
發(fā)明內(nèi)容希望能有全頻聲音通過(guò)電話，從而使得就聲音質(zhì)量而言，電話對(duì)話幾乎與面對(duì)面對(duì)話一樣。希望有一種能夠改善聲音質(zhì)量，或減小數(shù)據(jù)負(fù)擔(dān)，或既能改善聲音質(zhì)量又能減小數(shù)據(jù)負(fù)擔(dān)的方法。本發(fā)明披露了提高了音頻編解碼器的效率，即，提高了聲音質(zhì)量和減小了傳輸信道或存儲(chǔ)介質(zhì)中的數(shù)據(jù)負(fù)擔(dān)的系統(tǒng)、方法、和裝置。本發(fā)明的一個(gè)實(shí)施例對(duì)輸入音頻信號(hào)使用了至少兩個(gè)MLT(調(diào)制重迭變換(ModulatedLappedTransform))。一個(gè)低頻MLT使用大約20ms的幀，和—個(gè)高頻MLT使用四個(gè)各為大約5ms的幀。低頻MLT可以與G722.1中說(shuō)明的MLT相同，而高頻MLT在高頻下提供了更高的分辨率。與單變換相比，雙變換產(chǎn)生了更好的高頻的瞬變?cè)佻F(xiàn)?？梢詫LT系數(shù)分組成子幀，然后組成不同長(zhǎng)度的組。子幀的每個(gè)振幅包絡(luò)可以由數(shù)標(biāo)量量化器來(lái)量化，MLT系數(shù)可以用多維點(diǎn)陣向量來(lái)量化。根據(jù)本發(fā)明的各個(gè)實(shí)施例的快速點(diǎn)陣向量量化器提供了高于標(biāo)量量化器的量化效率和精度，而且沒(méi)有點(diǎn)陣向量量化通常所具有的問(wèn)題。本發(fā)明的各個(gè)實(shí)施例進(jìn)一步通過(guò)使用一個(gè)用于高速量化和一個(gè)用于低速量化的兩個(gè)不同的量化方案，改善了量化和編碼。本發(fā)明的各個(gè)實(shí)施例通過(guò)動(dòng)態(tài)地確定是否使用霍夫曼編碼技術(shù)為振幅包絡(luò)和系數(shù)索引編碼而進(jìn)一步改進(jìn)了量化編碼。對(duì)于四個(gè)組中的每一組，只有在能夠減少編碼組內(nèi)的所有系數(shù)索引所需的總比特?cái)?shù)的時(shí)侯，才使用霍夫曼編碼技術(shù)。否則，不使用霍夫曼編碼技術(shù)以減少不必要的計(jì)算成本。根據(jù)本發(fā)明的各個(gè)實(shí)施例，提供了一種在對(duì)音頻信號(hào)編碼中使用的量化方法。該方法可以包括使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化變換系數(shù)，和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化變換系數(shù)。為了以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù)，該方法可以包括從截?cái)嗟狞c(diǎn)陣構(gòu)造碼本，其中點(diǎn)陣包括所有碼向量的多維點(diǎn)陣，所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo)；和量化位于截?cái)帱c(diǎn)陣之外的外部源向量。為了以每個(gè)系數(shù)l比特的速率量化變換系數(shù)，該方法可以包括從點(diǎn)陣構(gòu)造碼本，和量化每個(gè)碼向量，該點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣。根據(jù)本發(fā)明的各個(gè)實(shí)施例，提供了一種對(duì)音頻信號(hào)進(jìn)行編碼的方法。該方法可以包括將音頻信號(hào)的取樣組從時(shí)域變換到頻域，以形成變換系數(shù)的幀。該方法還可以包括將變換系數(shù)的每一幀分成多個(gè)組，其中每組包含多個(gè)子幀，和其中每個(gè)子幀包含特定數(shù)量的變換系數(shù)。該方法還可以包括根據(jù)子幀的rms來(lái)確定每個(gè)子幀的范數(shù)。該方法還可以包括量化每個(gè)子幀的rms。該方法還可以包括通過(guò)用子幀的量化rms除子幀內(nèi)的每個(gè)系數(shù)來(lái)歸一化每個(gè)子幀的系數(shù)。該方法還可以包括使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化系數(shù)。該方法還可以包括使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)l比特的速率量化系數(shù)。還提供一種上面記錄有程序的計(jì)算機(jī)可讀介質(zhì)，機(jī)器可以執(zhí)行該程序來(lái)執(zhí)行在此描述的任何方法。根據(jù)本發(fā)明的各個(gè)實(shí)施例，提供一種對(duì)音頻信號(hào)編碼的22kHz編碼器。該編碼器可以包括變換模塊，用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域，以形成變換系數(shù)的幀。該編碼器還可以包括第一點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù)。該編碼器還可以包括第二點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)l比特的速率量化變換系數(shù)。該方法還可以包括編碼器模塊，用于針對(duì)有所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。根據(jù)本發(fā)明的各個(gè)實(shí)施例，提供了一種終端(endpoint)。該終端包括可以包括音頻輸入/輸出接口，可通信地耦合到音頻輸入/輸出的話筒，可通信地耦合到音頻輸入/輸出接口的揚(yáng)聲器,和可通信地耦合到音頻輸入/輸出接口的22kHz音頻編碼器。該終端還可以包括可通信地耦合到音頻輸入/輸出接口的總線，可通信地耦合到總線的視頻輸入/輸出接口，可通信地耦合到視頻輸入/輸出接口的攝像機(jī)，和可通信地耦合到視頻輸入/輸出接口的顯示裝置。通過(guò)結(jié)合附圖閱讀以下對(duì)優(yōu)選實(shí)施例的詳細(xì)說(shuō)明，可以更好地理解本發(fā)明，其中圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例雙變換方案；圖2A示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例系數(shù)分組方案；圖2B示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的示例系數(shù)分組方案；圖3A示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例編碼比特流；圖3B示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的標(biāo)記比特的示例結(jié)構(gòu)；圖3C示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的變換系數(shù)的示例結(jié)構(gòu)；圖3D示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的變換系數(shù)的示例結(jié)構(gòu)；圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的編碼處理過(guò)程的示例處理流程圖；圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的解碼處理過(guò)程的示例處理流程圖；圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的編碼器的示例方框圖；圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的解碼器的示例方框圖；圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的會(huì)議系統(tǒng)的示例方框圖。具體實(shí)施方式本發(fā)明的各個(gè)實(shí)施例利用革新的編碼器和解碼器擴(kuò)大和改善了音頻信號(hào)處理的性能。廣義地講，編碼處理包括變換處理、量化處理、和編碼處理。本發(fā)明的各個(gè)實(shí)施例在三個(gè)處理中全部做出了改進(jìn)。在大多數(shù)現(xiàn)有技術(shù)的音頻信號(hào)處理中，音頻信號(hào)幀具有固定的長(zhǎng)度。幀長(zhǎng)度越短，延遲越短。對(duì)于高頻，較短的幀長(zhǎng)度也提供了較好的時(shí)間分辨率和更好的性能。但是，短幀提供了較差的頻率分辨率。與此相反，幀長(zhǎng)度越長(zhǎng)，延遲越長(zhǎng)。但是，在低頻，較長(zhǎng)的幀提供較好的頻率分辨率和更好的性能，以分辨音調(diào)諧波。在一種折衷方案中，幀長(zhǎng)度一般在20ms的范圍內(nèi)，這也是G722.1建議中采用的幀長(zhǎng)度。根據(jù)本發(fā)明的各個(gè)實(shí)施例，可以使用至少兩個(gè)不同的音頻取樣幀長(zhǎng)度。一個(gè)具有較長(zhǎng)的幀長(zhǎng)度，并且設(shè)計(jì)用于更好地表現(xiàn)低頻頻譜；另一個(gè)具有較短的幀長(zhǎng)度，用于高頻信號(hào)，和在高頻提供更好的分辨率。兩種信號(hào)幀的組合提高了聲音質(zhì)量。這可以將頻譜響應(yīng)擴(kuò)大到整個(gè)人類音頻頻譜，例如，大約20Hz至大約22kHz。根據(jù)本發(fā)明的一個(gè)實(shí)施例，比特分配可以是自適應(yīng)和動(dòng)態(tài)的，而不是使用極少種類內(nèi)的預(yù)定比特分配。在變換系數(shù)量化的過(guò)程中，可使用動(dòng)態(tài)比特分配。因此，能夠最好地使用可用比特。使用至少兩個(gè)變換，要量化和編碼的變換系數(shù)遠(yuǎn)比使用一個(gè)單一變換時(shí)的多。在本發(fā)明的一個(gè)實(shí)施例中，可以使用快速點(diǎn)陣向量量化法來(lái)代替簡(jiǎn)單的標(biāo)量量化法。向量量化一般比簡(jiǎn)單的標(biāo)量量化法的效率高。更具體地講，點(diǎn)陣向量量化(LVQ)比慣用的已知LBG(Linde，Buzo,andGray)向量量化的優(yōu)越之處在于，由于LVQ碼本的規(guī)則結(jié)構(gòu)，LVQ具有相對(duì)簡(jiǎn)單的量化處理過(guò)程，并且能夠節(jié)省所需的存儲(chǔ)器。但是，由于幾種限制，點(diǎn)陣向量量化尚未在實(shí)時(shí)語(yǔ)音和音頻-編碼中廣泛地應(yīng)用，這幾種限制包括在如何截?cái)嘟o定速率的點(diǎn)陣以建立與輸入源的概率密度函數(shù)(PDF)匹配的LVQ碼本，如何快速地將LVQ碼本的碼向量(點(diǎn)陣點(diǎn))翻譯成它們的索引，和如何量化位于截?cái)帱c(diǎn)陣外面的源向量("局外者(outlier)")方面存在的困難。根據(jù)本發(fā)明的快速LVQ(FLVQ)避免了上述限制。FLVQ包括高速量化器(HRQ)和低速量化器(LRQ)。在量化變換系數(shù)中，量化器不是定標(biāo)點(diǎn)陣碼本而是定標(biāo)系數(shù)，以便使用一種快速搜索算法，然后在解碼器再換算重構(gòu)的系數(shù)。通過(guò)將局外者放回到用作LVQ碼本的截?cái)帱c(diǎn)陣內(nèi)，這種定標(biāo)系數(shù)的方法也可以解決"局外者"問(wèn)題。諸如人類話音或音頻音樂(lè)之類的輸入源的PDF是從各種不同聲源的大的集合中產(chǎn)生的。一旦消除了LVQ的限制，在本發(fā)明的實(shí)施例中，F(xiàn)LVQ的使用提供了比現(xiàn)有技術(shù)標(biāo)量量化更高的量化效率。在本發(fā)明的另一個(gè)實(shí)施例中，通過(guò)動(dòng)態(tài)霍夫曼編碼可以進(jìn)一步提高量化和編碼效率。眾所周知，作為一種熵編碼方法的霍夫曼編碼法在源非均勻分布時(shí)最為有用。變換系數(shù)一般是非均勻分布的；因此，使用霍夫曼編碼法可以提高編碼效率。在本發(fā)明的這個(gè)實(shí)施例中，在霍夫曼編碼法減少比特需求時(shí)，可以將霍夫曼編碼法用于編碼振幅包絡(luò)和變換系數(shù)的量化索引。在確定是否使用霍夫曼編碼法時(shí)，將使用霍夫曼編碼法的比特的總數(shù)與可用于范數(shù)或變換系數(shù)的量化的比特?cái)?shù)比較。只有存在節(jié)省時(shí)，才可以使用霍夫曼編碼法。這種方式，使用了最佳編碼方法。雙變換在一個(gè)實(shí)施例中，使用了兩種大小的幀，一個(gè)被稱為長(zhǎng)幀，另一個(gè)被稱為短幀。為了簡(jiǎn)明起見(jiàn)，本發(fā)明稱之為雙變換，盡管應(yīng)當(dāng)理解在某些實(shí)施例幀可以使用一種幀大小，或者可以使用兩種以上的幀大小。參考圖1，對(duì)音頻信號(hào)102進(jìn)行取樣和數(shù)字化。在這個(gè)特定的例子中，以48kHz的頻率對(duì)音頻信號(hào)取樣。但是，也可以使用其他取樣頻率。在這個(gè)例子中，長(zhǎng)幀L104具有大約20ms的幀長(zhǎng)度。對(duì)于每個(gè)長(zhǎng)幀L104，具有多個(gè)短幀S1106，S2107,S3108,和S4109。在這個(gè)例子中，每個(gè)短幀106，107，108和109具有大約5ms的幀長(zhǎng)度；因此，每個(gè)長(zhǎng)幀104具有大約960個(gè)取樣(48kHzx0.02s=960)，而每個(gè)短幀(106，107，108，109)具有大約240個(gè)取樣(48kHzx0.005s=240)。盡管在本例中示出了四個(gè)短幀106，107，108和109，但是也可以有更少或更多數(shù)量的短幀；例如，短幀的數(shù)量可以是2，3，4，5，等等。將這些幀104，106，107，108和109從時(shí)域變換到頻域。例如，可以如同ITU-T建議G.722.1中所雄的那樣，可以利用MLT(調(diào)制重迭變換)對(duì)它們進(jìn)行變換。為了簡(jiǎn)明，本發(fā)明稱之為MLT變換，盡管也可以使用其他類型的變換，例如，F(xiàn)FT(快速傅里葉變換)和DCT(離散余弦變換)，等等。該變換產(chǎn)生圖2A中所示的MLT系數(shù)集212，222,224，226，和228。每個(gè)短幀MLT系數(shù)集222，224，226，和228具有大約240個(gè)系數(shù)，并且每個(gè)系數(shù)與相鄰的系數(shù)具有大約100Hz的間隔。對(duì)于長(zhǎng)幀212，大約有960個(gè)MLT系數(shù)，或每25Hz—個(gè)系數(shù)?？梢越M合這些系數(shù)以形成1920個(gè)MLT系數(shù)的單一集。這個(gè)系數(shù)集可以捕獲聲音的低頻特性和高頻特性。由于22kHz的編碼帶寬，可以忽略大約22kHz以上頻率的MLT變換系數(shù)。長(zhǎng)變換十分適合于捕獲較低的頻率。短變換很適于捕獲較高的頻率。因此，并不是所有系數(shù)都攜帶再現(xiàn)被變換的聲音信號(hào)的相同的值。在一個(gè)實(shí)施例中，可以忽略一些系數(shù)。每個(gè)短幀MLT系數(shù)集具有大約240個(gè)系數(shù)。每個(gè)系數(shù)與它的相鄰系數(shù)間隔大約100Hz。在一個(gè)實(shí)施例中，可以忽略低于大約6800Hz和高于大約22,000Hz的系數(shù)。因此，每個(gè)短幀可以保留152個(gè)系數(shù)，并且四個(gè)短幀的系數(shù)的總數(shù)是608個(gè)。對(duì)于長(zhǎng)幀，在一個(gè)實(shí)施例，由于長(zhǎng)幀被用來(lái)表現(xiàn)較低頻率的信號(hào)，所以可以保留低于大約7kHz頻率的系數(shù)，并且可以將高于大約7kHz頻率的、來(lái)自長(zhǎng)變換的系數(shù)舍棄。因此，較低的頻率可以有280個(gè)系數(shù)。因此，在一個(gè)實(shí)施例中，對(duì)于高達(dá)2SkHz左右的音頻辦譜，總系數(shù)可以是888(608+280)個(gè)。在量化和編碼之前，可以將系數(shù)分組成子幀(sub-frame)并組成組。在這個(gè)實(shí)施例中"子幀(sub-frame)"可以與G.722.1方法中的"區(qū)域(region)"相同。將一個(gè)子幀作為一個(gè)單元，計(jì)算振幅包絡(luò)，賦予可變比特分配，和進(jìn)行進(jìn)一步的量化和編碼。一個(gè)組包括許多具有一個(gè)頻譜范圍內(nèi)的相同長(zhǎng)度的子幀。一個(gè)組內(nèi)的子幀可以具有相同的特性，并且可以用相同的方式量化或編碼。但是，對(duì)于不同組中的子幀，量化和編碼的方法可能是不同的。與現(xiàn)有技術(shù)方法中的區(qū)域不同，子幀可以具有不同的大小，組也可以是不同大小的，從而，在可以減少量化和編碼的過(guò)程中，不同的子幀和組可以更接近地表示頻譜和比特需求。在當(dāng)前的實(shí)施例中，從OHz到22kHz的整個(gè)音頻頻譜可以劃分為四個(gè)組。第一組覆蓋從大約OHz到大約4kHz的頻率。第一組具有10個(gè)子幀，每個(gè)子幀具有16個(gè)MLT系數(shù)。第一組中的總系數(shù)是160個(gè)系數(shù)，所有這些系數(shù)都來(lái)自于長(zhǎng)幀變換。第二組包括從大約4kHz到大約7kHz的頻譜。第二組具有5個(gè)子幀，每個(gè)子幀具有24個(gè)系數(shù)，所以第二組具有總共120個(gè)系數(shù)。這些系數(shù)來(lái)自于長(zhǎng)幀變換。第三組覆蓋從大約7kHz(或在一些實(shí)施例中，大約6.8kHz)到大約14kHz的頻譜。在它們的邊界上，長(zhǎng)幀變換和短幀變換可以交迭，以使過(guò)渡更為平順。第三組具有9個(gè)子幀，每個(gè)子幀具有32個(gè)系數(shù)，所以第三組總共具有288個(gè)系數(shù)。這些系數(shù)來(lái)自于四個(gè)短幀變換。第四組覆蓋從大約14kHz到大約22kHz的頻譜。這個(gè)組具有10個(gè)子幀，每個(gè)子幀具有32個(gè)系數(shù)，所示總共有320個(gè)系數(shù)?？傊?，在本實(shí)施例中，有888個(gè)系數(shù)要量化和編碼。在邊界頻率附近的250Hz的頻率區(qū)域上，可以利用一個(gè)三角窗口在長(zhǎng)MLT和短MLT系數(shù)之間進(jìn)行重疊相加(OLA)。對(duì)于長(zhǎng)MLT，用下坡斜率乘從6775Hz開始的IO個(gè)系數(shù)。對(duì)于短MLT，用上坡斜率乘從6800Hz開始的2個(gè)系數(shù)。在根據(jù)上述方案將系數(shù)分組到子幀并組成組時(shí)，可以根據(jù)頻率按從低頻到高頻的順序排列這些系數(shù)。例如，可以將用于相同頻率的系數(shù)分組到一起來(lái)自L的系數(shù)后面跟隨著來(lái)自Sl、S2、S3、和S4的系數(shù)，然后又是來(lái)自L的更高頻率的系數(shù)，并重復(fù)上述排列。也允許和接受其他排列或順序。例如，可以將來(lái)自相同變換的系數(shù)分組到一起，即，首先排列所有來(lái)自L變換的系數(shù)，然后考來(lái)自S1變換，S2、S3、和S4變換的系數(shù)。已經(jīng)發(fā)現(xiàn)這里的排列或順序可能影響后面的量化或編碼。在一個(gè)實(shí)施例中，以下的排列似乎在后面要說(shuō)明的量化和編碼方案中一般能夠給出好的結(jié)果。來(lái)自長(zhǎng)幀變換的系數(shù)根據(jù)頻率從低到高地排列到第一和第二組。來(lái)自四個(gè)短變換的系數(shù)一般不根據(jù)它們的頻率排列，但是并不是嚴(yán)格地根據(jù)頻率順序排列。首先，選擇8個(gè)來(lái)自第一短幀變換的系數(shù)，并根據(jù)頻率順序排列。然后，選擇來(lái)自第二短幀變換的相同頻率的8個(gè)系數(shù)。同樣地，選擇來(lái)自第三短幀變換的相同頻率的系數(shù)。接下來(lái)，選擇來(lái)自第四短幀變換的系數(shù)。此后，我們返回到第一短幀變換Sl,選擇下8個(gè)系數(shù)，并且重復(fù)上述過(guò)程，直到選擇了來(lái)自短幀變換的全部系數(shù)。使用上述雙變換和分組，得到4個(gè)組和34個(gè)子幀，每個(gè)子幀具有16、24或32個(gè)系數(shù)。與僅能夠變換低頻或高頻，或不能得到精細(xì)的分辨率的現(xiàn)有技術(shù)方法的單一變換不同，本發(fā)明的各個(gè)實(shí)施例在音頻頻譜的低頻和高頻都能夠提供好的分辨率。計(jì)算負(fù)擔(dān)僅稍大于單一的短幀變換(例如，5ms幀長(zhǎng)度，48kHz取樣速率)，在22kHz將頻譜范圍擴(kuò)大到全音頻頻譜。這些系數(shù)代表全音頻頻譜?？梢杂酶鞣N量化和編碼方法對(duì)這些系數(shù)進(jìn)行量化和編碼，例如，使用G.722.1中所述的方法。如果使用G.722.1方法，首先對(duì)每個(gè)子幀的振幅包絡(luò)進(jìn)行計(jì)算、標(biāo)量量化、和霍夫曼編碼。振幅包絡(luò)也用于分配用于根據(jù)子幀分配的類別編碼每個(gè)子幀內(nèi)的系數(shù)索引的比特。然后，根據(jù)這些系數(shù)索引的類別量化它們。上述方案可用于語(yǔ)音和一般音樂(lè)。根據(jù)另一個(gè)實(shí)施例，打擊樂(lè)器類型的信號(hào)可能出現(xiàn)在音頻信號(hào)中。根據(jù)諸如高達(dá)大約10kHz的頻率區(qū)域上的長(zhǎng)MLT系數(shù)的平均梯度斜度，最大長(zhǎng)MLT系數(shù)的位置，和長(zhǎng)MLT系數(shù)的零交叉率(ZCR)之類的特性，可以檢測(cè)到打擊樂(lè)器類型信號(hào)。打擊樂(lè)器類型信號(hào)的例子包括，但不限于，響板和三角鐵等產(chǎn)生的聲音。如果檢測(cè)到這種打擊樂(lè)器類型信號(hào)，如圖2B中所示的那樣，可以將較長(zhǎng)的幀變換系數(shù)的邊界頻率調(diào)節(jié)到大約800Hz(不是7kHz)。這種調(diào)節(jié)有利地減小了前回聲現(xiàn)象。因此，在這個(gè)實(shí)施例中，長(zhǎng)幀變換系數(shù)232可以包括大約0Hz到大約800Hz范圍內(nèi)的頻率，而短幀變換系數(shù)242、244、246、和248可以包括大約600Hz到大約22kHz范圍中的頻率。頻率的疊加有助于提供平滑的過(guò)渡?？梢栽谶吔珙l率附近的250Hz的頻率區(qū)域上利用三角窗口在長(zhǎng)MLT和短MLT系數(shù)之間執(zhí)行OLA。對(duì)于長(zhǎng)MLT，用下坡斜率乘在575Hz開始的10個(gè)系數(shù)。對(duì)于短MLT，用上坡斜率乘在600Hz開始的2個(gè)系數(shù)。將以25Hz間隔為中心的較低的400個(gè)長(zhǎng)MLT系數(shù)劃分為20個(gè)組，每個(gè)組有20個(gè)系數(shù)。如下計(jì)算每個(gè)組中的頻譜能量-19^^,《々r服e，0&、19公式i其中x是長(zhǎng)MLT系數(shù)，i是組號(hào)，和THREQ是安靜(quiet)閾值，按照經(jīng)驗(yàn)，可以選擇安靜閾值為THREQ二7000。當(dāng)前幀與前一個(gè)幀之間的組能量比率的自然對(duì)數(shù)^如下計(jì)算02"19公式2其中n是幀數(shù)。上升沿的平均梯度斜度^m;^如下計(jì)算:19￡(maX(i￡,,。)*￡,.)^附;v=~~^-公式3>=0下降沿的平均梯度斜度i。^P(^如下計(jì)算^附A，=^——~"~公式4如果滿足以下條件(1)iam;>r朋i^Jl^,其中7T7i^iL4M尸是斜度的預(yù)定閾值，并等于1.5;(2)第一長(zhǎng)MLT系數(shù)，；c。，是長(zhǎng)MLT系數(shù)的最大值；和(3)零交叉率，ZC/，小于預(yù)定閾值，77W^ZO=0.1，那么檢測(cè)到打擊樂(lè)器類型信號(hào)。如果檢測(cè)到打擊樂(lè)器類型信號(hào)，那么當(dāng)前幀和后面兩個(gè)幀的邊界頻率被調(diào)節(jié)到大約800Hz。如果在下一個(gè)幀n+l或n+2中，條件^w&，>1是真，那么編碼器用調(diào)節(jié)的邊界頻率工作8個(gè)幀。否則，編碼器在幀n+3返回到7kHz的邊界頻率。在打擊樂(lè)器類型信號(hào)模式中，當(dāng)邊界頻率是大約800Hz時(shí)，將雙MLT系數(shù)劃分成具有不同長(zhǎng)度的38個(gè)子幀。有代表低于800Hz頻率的32個(gè)長(zhǎng)MLT系數(shù)，它們被分離成兩個(gè)16個(gè)系數(shù)的子幀。短MLT系數(shù)被劃分成各種不同的組第一組具有12個(gè)16系數(shù)子幀，并代表600Hz到5.4kHz的頻率；第二組具有12個(gè)24系數(shù)子幀，并代表5.4kHz到12.6kHz的頻率；第三組具有12個(gè)32系數(shù)子幀并代表12.6kHz到22.2kHz的頻率。每個(gè)子幀包括相同短MLT的系數(shù)。振幅包絡(luò)對(duì)子幀的振幅包絡(luò)進(jìn)行量化和分析，以確定是否要使用霍夫曼編碼?？梢詫⒐潭ū忍胤峙滟x予每個(gè)振幅包絡(luò)作為默認(rèn)值和基準(zhǔn)。如果使用霍夫曼編碼技術(shù)能夠比固定比特節(jié)省一些比特，則可以使用霍夫曼編碼技術(shù)。為振幅包絡(luò)設(shè)置霍夫曼標(biāo)記，使得解碼器能夠知道是否使用霍夫曼編碼。節(jié)省的比特?cái)?shù)被存儲(chǔ)在供剩余編碼使用的比特中。否則，不使用霍夫曼編碼，清除標(biāo)記，和使用默認(rèn)固定比特。例如，在一個(gè)實(shí)施例中，給每個(gè)包絡(luò)被分配5比特。用于包絡(luò)的總默認(rèn)比特是34x5=170比特。假設(shè)傳輸率是64kbit/s，那么每幀的比特?cái)?shù)是64kbit/sX20ms=1280比特。在本例中，保留六個(gè)標(biāo)記比特。因此，可用于編碼系數(shù)索引的比特是1280-6-170=1104比特。對(duì)于每個(gè)子幀，將振幅包絡(luò)，也稱為范數(shù)(norm)，定義為子幀中MLT系數(shù)的RMS(均方根)值，和如下計(jì)算-ATwOO=/-2W/"r,M)m/《7",w)公式5M(。^其中r是子幀的索引，M^是子幀的大小，可以是16、24或32，m/f(h"」是第r個(gè)子幀的第w個(gè)MLT系數(shù)。在當(dāng)前的例子中，當(dāng)B/^10時(shí)，M^是16，所有這些子幀都在第一組中，0-4kHz;當(dāng)110S15時(shí)，M(^是24，所有這些子幀都在第二組中，4kHz-7kHz;當(dāng)16^r^24時(shí)，Mf^是32，所有這些子幀都在第三組中，6.8kHz-14kHz;當(dāng)25^《34時(shí)，Mf^是32，所有這些子幀都在第四組中，14kHz-22kHz;m^W值用對(duì)數(shù)量化器計(jì)算和標(biāo)量量化。下面的表1示出了對(duì)數(shù)量化器的碼本。表1范數(shù)量化的40-級(jí)碼本<table>tableseeoriginaldocumentpage18</column></row><table>72,3.5172"272"372-L58182823"382-2.0921251927.52922'5392'"第一子幀的振幅包絡(luò)，rm^"，用5比特量化，并且將它的量化索引被直接發(fā)送到解碼器。因此，僅有前32個(gè)碼字被用于量化/vn^/入剩下的33個(gè)振幅包絡(luò)用全部40個(gè)碼字量化，并如下差分編碼得到的索引。差分索引=index(i+l)-index(i)公式6其中1=0，1，2，...。差分索引被約束到[-15,16]的范圍。首先調(diào)節(jié)負(fù)的差分索引，然后調(diào)節(jié)正的差分索引。最后，對(duì)調(diào)節(jié)的差分索引使用霍夫曼編碼。接下來(lái)，將用于霍夫曼編碼的總比特與用于直接編碼(即，不用霍夫曼編碼)的比特?cái)?shù)比較。如果總比特少于不用霍夫曼編碼的，那么可以將霍夫曼代碼在信道上發(fā)送。否則，量化索引的差分碼將被發(fā)送到解碼器。因此，用于編碼的比特總是最少的。如果使用霍夫曼代碼，那么設(shè)置霍夫曼標(biāo)記，并將節(jié)省的比特返回到可用比特。例如，如果霍夫曼編碼的總比特是160比特，那么節(jié)省170-160=10比特。可用比特成為10+1104=1114比特。自適應(yīng)比特分配方案可以將一種基于變換系數(shù)的組的能量的自適應(yīng)比特分配方案用于在子幀之間分配幀中的可用比特。在一個(gè)實(shí)施例中，可以使用一種改進(jìn)的比特分配方案。與G.722.1中使用這方案不同，系數(shù)索引的自適應(yīng)比特分配不是通過(guò)類別固定，而是通過(guò)在量化振幅包絡(luò)的同時(shí)的分配處理過(guò)程來(lái)固定?？梢允侨缦碌谋忍胤峙?。設(shè)/ema/;^w代表可用比特的總數(shù)，Af"J代表分配給第"子幀的比特?cái)?shù)。在上述例子中，在對(duì)振幅包絡(luò)使用霍夫曼編碼時(shí)，iemm>^r=1114:步驟0，將比特分配初始化到零，即，^"戶0，其中"=1,2,3,…N，其中N是子幀的總數(shù)。在上述例子中，N是34。步驟l，找到子幀中具有最大RMS的子幀的索引"。步驟2，將Af「"片匕特分配給第"子幀，即，rW7W+Jkf「"入(在這里，^Tf^是第"子幀中系數(shù)的數(shù)量)。步驟3，用2除n7wfhj，并且7ema/wcfer-Aema/"(ier-M"(^)。步驟4，如果/^ma!'打^^16，那么重復(fù)步驟1至3。否則停止。在這樣的比特分配之后，除了少數(shù)剩余比特之外的所有比特被分配到子幀。有一些子幀可能沒(méi)有任何比特分配給它們，因?yàn)檫@些子幀的RMS值太小，即，從頻譜的該部分沒(méi)有對(duì)音頻信號(hào)的可察覺(jué)的貢獻(xiàn)。頻譜的該部分可以忽略?？焖冱c(diǎn)陣向量量化盡管可以使用現(xiàn)有技術(shù)的量化和編碼方法來(lái)實(shí)現(xiàn)上述實(shí)施例以將處理過(guò)的音頻信號(hào)擴(kuò)大到全音頻頻譜，但是它們沒(méi)能將全部潛力帶給廣大聽眾。使用現(xiàn)有技術(shù)的方法，比特率需求可能很高，這使得更難發(fā)送處理過(guò)的全譜頻音頻信號(hào)?？梢允褂酶鶕?jù)本發(fā)明一個(gè)實(shí)施例的新的快速點(diǎn)陣向量量化(FLVQ)方案，這個(gè)方案提高了編碼效率和減少了比特需求。FLVQ可以用于任何音頻信號(hào)的量化和編碼。將MLT系數(shù)分別劃分到16、24、和32個(gè)系數(shù)的子幀中。計(jì)算每個(gè)子幀的RMS，或，范數(shù)，即，子幀中系數(shù)的均方根值，并用量化的范數(shù)對(duì)系數(shù)進(jìn)行歸一化。用快速LVQ以8-維向量量化每個(gè)子幀中的歸一化系數(shù)?？焖冱c(diǎn)陣向量量化器包括高速量化器(HRQ)和低速量化器(LRQ)。高速量化器被設(shè)計(jì)用來(lái)以高于1比特/系數(shù)的速度量化系數(shù)，低速量化器用于以1比特/系數(shù)的速度量化。點(diǎn)陣向量量化器最好是用于均勻分布源。點(diǎn)陣是點(diǎn)在N維歐幾里得空間中的規(guī)則排列。在這種情況下，源(即，MLT系數(shù))是非均勻的，因此，將熵編碼-霍夫曼編碼-應(yīng)用于高速量化的索引，以改善HRQ的性能。高速量化高速量化可以基于用于點(diǎn)陣D8的Voronoi碼，并且設(shè)計(jì)用來(lái)以2至6比特/系數(shù)的速度量化規(guī)格化MLT。這個(gè)子量化器的碼本可以從點(diǎn)陣D8的有限區(qū)域構(gòu)造，并且不存儲(chǔ)在存儲(chǔ)器中。碼向量可以通過(guò)簡(jiǎn)單的代數(shù)方法產(chǎn)生。點(diǎn)陣Ds定義如下<formula>formulaseeoriginaldocumentpage21</formula>公式7其中Zs是整數(shù)坐標(biāo)的所有點(diǎn)組成的點(diǎn)陣。可以看到，Ds是一個(gè)整數(shù)點(diǎn)陣，并且是由具有帶有偶數(shù)和的整數(shù)坐標(biāo)的點(diǎn)"0^2，>^4,>^^7，>0組成的。例如，向量尸(-l,-l，0，2，l，-3,2，4)具有4的偶數(shù)和，因此y是Ds的一個(gè)點(diǎn)陣點(diǎn)。Conway和Sloane開發(fā)了用于某些已知點(diǎn)陣的快速量化算法，這些算法可以用于Ds。但是，他們的算法假設(shè)了一個(gè)不能在實(shí)時(shí)音頻編碼中用作碼本的無(wú)限點(diǎn)陣。也就是說(shuō)，對(duì)于一個(gè)給定速度，他們的算法不能用于量化位于截?cái)帱c(diǎn)陣區(qū)域外面的輸入向量。在一個(gè)實(shí)施例中，分別以2、3、4、和5比特/系數(shù)的速度量化歸一化的MLT系數(shù)。在另一個(gè)實(shí)施例中，例如，在檢測(cè)到打擊樂(lè)器類型信號(hào)時(shí)，最大量化速度可以是6比特/系數(shù)。為了使給定速度下失真最小，可以截?cái)嗖⒍?biāo)點(diǎn)陣Ds。實(shí)際上，是定標(biāo)系數(shù)而不是點(diǎn)陣碼本，以便使用Conway等描述的快速搜索算法，并且，隨后在解碼器重新定標(biāo)重構(gòu)的系數(shù)。此外，可以開發(fā)一種量化"局外者"的快速方法。對(duì)于給定速度R比特/維(1</<7)，可以如下量化每個(gè)8維系數(shù)向量<formula>formulaseeoriginaldocumentpage21</formula>1)將一個(gè)小偏移量《=2-6應(yīng)用到向量x的每個(gè)分量，以避開截?cái)郪oronoi區(qū)域的邊界上的任何點(diǎn)陣點(diǎn)，即；c,=;c-a，其中a=(2"6，2"6,2_6,2-6，2"6,2-6,2_6,2-6)。2)用定標(biāo)因數(shù)a定標(biāo)向量^^-ar,。對(duì)于給定的速度R，按經(jīng)驗(yàn)選擇最佳定標(biāo)因數(shù)，并在下面的表2中示出。表2用于高速量化器的定標(biāo)因數(shù)<table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>3)尋找最靠近定標(biāo)向量A的i^的點(diǎn)陣點(diǎn)v。這可以利用Conway和Sloane中所述的搜索算法進(jìn)行。4)假設(shè)v是以給定速度R截?cái)嗟腣oronoi區(qū)域中的碼向量，并計(jì)算v的索引向量A-(mmit7,it8)，其中02夂S2"和Z-l，2，…8。索引A由公式8給出A=(vG-1)modulorr=2&公式8其中G是Z)s的生成器矩陣，并且定義如下<formula>formulaseeoriginaldocumentpage22</formula>公式9<formula>formulaseeoriginaldocumentpage23</formula>公式IO5)利用Conway等描述的算法，從索引向量A計(jì)算碼向量》然后與v比較。如果^和v嚴(yán)格相同，那么&是對(duì)&的最好碼向量的索引，并在這里停止。否則，輸入向量A是一個(gè)局外者，并可以通過(guò)以下步驟量化。6)用2除以向量X2:jc2=x2/2。7)尋找最靠近^的Z)s的點(diǎn)陣點(diǎn)w，然后計(jì)算"的索引向量》8)從索引向量7尋找碼向量》然后將^與w比較。如果j與"不同，那么重復(fù)步驟6)至8)。否則，計(jì)算w-;c/16。由于MLT系數(shù)的歸一化，執(zhí)行少量的重復(fù)就可以在截?cái)帱c(diǎn)陣中找到一個(gè)對(duì)局外者的碼向量。9)計(jì)算X2-^+W。10)找到最靠近A的Ds的點(diǎn)陣點(diǎn)M，然后計(jì)算"的索引向量》11)從索引向量J發(fā)現(xiàn)碼向量》然后將^與"比較。如果y和"嚴(yán)格相同，那么^=/并重復(fù)步驟9)至ll)。否則，A:是對(duì)A的最好碼向量，并停止。高速量化器的解碼過(guò)程可以如下進(jìn)行1)根據(jù)給定的速度i，從索引向量^尋找碼向量》2)用前面表2中給出的定標(biāo)因數(shù)"給碼向量;;重新定標(biāo)^=y/。3)將量化處理的步驟1)中使用的同樣的偏移a加到重新定標(biāo)的碼向量力少2-少i+a，然后停止。低速量化可以提供基于所謂的旋轉(zhuǎn)Gosset點(diǎn)陣/^s的低速量化器以1比特/系數(shù)的速度量化歸一化的MLT系數(shù)。點(diǎn)陣Ms是由落在圓心在原點(diǎn)上、半徑為2V^"的同心球面上的點(diǎn)組成的，其中f0，1，2,3，...。球面上的點(diǎn)的集構(gòu)成球面碼，并且可以用作量化碼本。在低速量化器中，碼本是由落在r=l的球面上的i^的全部240個(gè)點(diǎn)，和不屬于點(diǎn)陣/^s的16個(gè)附加點(diǎn)構(gòu)成的。附加點(diǎn)是通過(guò)排列兩個(gè)向量的分量(-2,0,0，0,0,0，0,0)和(2，0，0，0,0，0，0，0)得至U的，并用于量化靠近原點(diǎn)的輸入向量。為了開發(fā)快速索引算法，用一種特殊次序排列碼本的碼向量，并在下面的表3中示出。對(duì)于每個(gè)8維系數(shù)向量^0,，:C2,^,^;C5,^—,X8)，可以如下執(zhí)行量化1)將偏移^2"^應(yīng)用到向量c的每個(gè)分量；c,;c-"，其中<3=(2-6,2-6,2"6,2-6,2-6,2,2—6,2-6)。2)用定標(biāo)因數(shù)a定標(biāo)向量x,:^-a^。將最佳定標(biāo)因數(shù)經(jīng)驗(yàn)地選擇為a=1.25。3)通過(guò)用遞降順序給x2的分量重新排序獲得新的向量、。4)在表4中找到就均方根誤差(MSE)而言的^的最匹配的向量/。下面表4中給出的向量被稱為碼向量的引導(dǎo)部分(leader),并且碼本中的任何碼向量都可以通過(guò)它的引導(dǎo)部分的排列產(chǎn)生。5)通過(guò)以原始順序給/的分量重新排序，得到最好碼向量》6)在下面的表5中找到/的標(biāo)記向量，然后通過(guò)以原始順序給標(biāo)記向量的分量重新排列，得到向量"標(biāo)記向量定義如下如果引導(dǎo)部分是由-2，2和0組成的，那么用l指示-2和2，并且用0指示0;如果引導(dǎo)部分是由-l和l組成的，那么用l指示-l，并用0指示1。7)在下面的表6中尋找有關(guān)引導(dǎo)部分/索引偏移《。8)如果引導(dǎo)部分/是(2，0，0,0，0,0，0,-2)和碼向量y具有索引低于分量-2的索引的分量2，那么將偏移《調(diào)節(jié)為AT-尺+28。9)計(jì)算向量點(diǎn)積f=z//，其中；=(1,2,4,8,16,32,64,128)。10)在表7中從f找到有關(guān)碼向量y的索引增量_/。11)計(jì)算碼向量少的索引h&=i^/，然后停止。在低速量化器的解碼過(guò)程中可以采用以下步驟1)在表3中從接收的索引^找到碼向量》2)通過(guò)定標(biāo)因數(shù)a-1.5給碼向量少重新定標(biāo)"-y/"。3)將解碼過(guò)程的步驟1)使用的相同的偏移a加到重新定標(biāo)的碼向量然后停止。表3低速量化器(LRQ)的碼本<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table>表4LRQ的碼向量的引導(dǎo)部分<table>tableseeoriginaldocumentpage26</column></row><table>表5<table>tableseeoriginaldocumentpage26</column></row><table><table>tableseeoriginaldocumentpage27</column></row><table>表6用于索引LRQ的碼向量的有關(guān)引導(dǎo)部分的索E<table>tableseeoriginaldocumentpage27</column></row><table>表7有關(guān)LRQ的碼向量的索引增量<table>tableseeoriginaldocumentpage28</column></row><table>量化索引的霍夫曼編碼MLT系數(shù)不是均勻分布的。已經(jīng)觀察到8維系數(shù)向量具有在原點(diǎn)周圍的高度集中的概率。因此，點(diǎn)陣向量量化器的碼本對(duì)于非均勻源不是最佳的。為了改進(jìn)上述高速量化器的特性，可以使用霍夫曼編碼器對(duì)量化的索引編碼。由于低速(<2比特/取樣)編碼，大多數(shù)對(duì)應(yīng)于14-22kHz頻帶的"超額(extra)"子幀不被高速量化器量化。因此，霍夫曼編碼不用于超額子幀。對(duì)于給定速度R比特/維(1</<6)，通過(guò)高速量化器量化8維系數(shù)向量x，并且在(^、<2"，/=1,2,...8得到最佳碼向量的索引向量A:=(m、，H^,、)。然后，根據(jù)表8-11對(duì)A:的分量進(jìn)行霍夫曼編碼。通過(guò)使用霍夫曼編碼，用可變數(shù)量比特為量化索引進(jìn)行了編碼。對(duì)于給定速度A較多的頻率索引需要低于A的比特，和較少的頻率索引可能需要大于/的比特。因此，在霍夫曼編碼之后碼長(zhǎng)被改變，并且在一個(gè)幀中使用了三個(gè)標(biāo)記比特來(lái)指示是否將霍夫曼編碼應(yīng)用到頭三個(gè)子幀組中的每一個(gè)。標(biāo)記比特作為輔助信息發(fā)送到解碼器。對(duì)于一個(gè)子幀組，只有在使用霍夫曼編碼需要的比特?cái)?shù)不大于可用于這個(gè)組的比特的總數(shù)的時(shí)侯，才對(duì)量化索引進(jìn)行霍夫曼編碼。在這種情況下，將霍夫曼編碼標(biāo)記設(shè)置到l。但是，對(duì)于打擊樂(lè)器類型信號(hào)，不再對(duì)量化索引使用霍夫曼編碼。量化索引被直接發(fā)送到解碼器。在解碼器，檢査霍夫曼編碼標(biāo)記。如果設(shè)置了一個(gè)子幀組的霍夫曼編碼標(biāo)記，那么對(duì)這個(gè)組的編碼數(shù)據(jù)進(jìn)行霍夫曼解碼，以獲得量化索引。否則，將編碼數(shù)據(jù)直接用作量化索引。表8具有2比特/維的速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage29</column></row><table>具有3比特/維的速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table>表10具有4比特/維的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table>表11具有5比特/維速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table><table>tableseeoriginaldocumentpage31</column></row><table>通過(guò)編碼器產(chǎn)生的比特流圖3A示出了根據(jù)本發(fā)明實(shí)施例的編碼比特流的例子。在一個(gè)實(shí)施例中，一個(gè)幀中的比特總數(shù)是640，960和1280比特，分別對(duì)應(yīng)于32kbps，48kbps，和64kbps的比特率。在信道上發(fā)送的比特流可以包括3個(gè)部分標(biāo)記比特，范數(shù)代碼比特，和MLT系數(shù)的代碼比特。標(biāo)記比特可以首先發(fā)送，接下來(lái)是范數(shù)代碼比特，最后是用于MLT系數(shù)的代碼比特。標(biāo)記部分302包含多個(gè)用于各種不同目的的標(biāo)記比特。在本例中，標(biāo)記比特可以包括用于指示當(dāng)前幀的模式和發(fā)送到解碼器的模式標(biāo)記。例如，模式標(biāo)記可以用于指示打擊樂(lè)器類型信號(hào)模式。作為另一個(gè)例子，模式標(biāo)記可以用于指示語(yǔ)音和一般音樂(lè)。標(biāo)記也可以包括用于指示有多少以32kbps編碼的子幀并且作為輔助信息發(fā)送到解碼器的標(biāo)記。下一部分具有固定的長(zhǎng)度。在本例中，它具有四個(gè)比特。四個(gè)比特用于指示是否將霍夫曼編碼用于范數(shù)，組1系數(shù)索引，組2系數(shù)索引，和組3系數(shù)索引。組4一般不使用霍夫曼編碼，因?yàn)榻M4一般只有很少的比特，并且霍夫曼編碼一般不減少比特需求。比特流可以進(jìn)一步包括所有子幀的范數(shù)代碼比特304。如果沒(méi)有使用霍夫曼編碼，那么長(zhǎng)度是固定的。在這個(gè)例子中，固定長(zhǎng)度是170比特(34范數(shù)x5比特每范數(shù))。如果使用了霍夫曼編碼，那么長(zhǎng)度是由霍夫曼編碼確定的。比特流可以進(jìn)一步包括用于組1-4的編碼系數(shù)索引306。分配給每個(gè)組或每個(gè)系數(shù)的比特的數(shù)量是可以變化的。它們是根據(jù)每個(gè)子幀的范數(shù)通過(guò)比特分配確定的。組1-3的索引也可能依賴是否使用了霍夫曼編碼。組4的索引一般不使用霍夫曼編碼。但是，分配給組4的比特的數(shù)量仍然是可能改變的，因?yàn)槠渌糠值谋忍財(cái)?shù)可以改變。當(dāng)其他組由于霍夫曼編碼而使用較少的比特時(shí)，那些省下的比特可以用于組4。圖3B示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的標(biāo)記比特302的示例結(jié)構(gòu)。在本例中，標(biāo)記比特302可以包括指示當(dāng)前幀的模式并且發(fā)送到解碼器的標(biāo)記M308。在打擊樂(lè)器類型信號(hào)模式中，只有模式標(biāo)記308可以發(fā)送，其他標(biāo)記不需要發(fā)送。在語(yǔ)音和一般音樂(lè)模式中，所有的標(biāo)記都可以發(fā)送。標(biāo)記比特302可以進(jìn)一步包括用于指示有多少子幀要以低速(例如，32kbps)編碼的標(biāo)記L310。標(biāo)記比特302可以進(jìn)一步包括指示范數(shù)是否被霍夫曼編碼的標(biāo)記N312。標(biāo)記比特302可以進(jìn)一步包括指示每個(gè)MLT系數(shù)的組(在本例中，組1到組3)是否被霍夫曼編碼的標(biāo)記Gl到G3。圖3C示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用系數(shù)代碼比特306量化的(和可能霍夫曼編碼的)變換系數(shù)的組合集的示例結(jié)構(gòu)。在本例中，邊界頻率是大約7kHz。長(zhǎng)幀變換系數(shù)320代表高達(dá)大約7kHz的頻率。短幀變換系數(shù)322代表從大約6.8kHz到大約22kHz的頻率。長(zhǎng)幀變換和短幀變換可以在它們的邊界上重疊，以使過(guò)渡更平滑。圖3D示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的以系數(shù)代碼比特306量化的(可能霍夫曼編碼的)變換系數(shù)的組合集的另一個(gè)示例結(jié)構(gòu)。在本例中，邊界頻率是大約800Hz。長(zhǎng)幀變換系數(shù)324代表高達(dá)大約800Hz的頻率。短幀變換系數(shù)326代表從大約600Hz到大約22kHz的頻率。長(zhǎng)幀變換和短幀變換可以在它們的邊界重疊，以使過(guò)渡更為平滑。編碼器處理過(guò)程現(xiàn)在參考圖4，圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的整個(gè)編碼處理的示例處理流程圖。編碼處理過(guò)程在步驟400開始。在步驟410，可以對(duì)音頻信號(hào)使用兩個(gè)MLT變換，以便使音頻取樣及時(shí)地轉(zhuǎn)換成變換系數(shù)的幀。長(zhǎng)幀變換系數(shù)用于低頻的信號(hào)(例如，大約20Hz到大約7kHz)，而短幀變換系數(shù)用于高頻信號(hào)(例如，大約6.8kHz到大約22kHz)?？梢詫LT系數(shù)劃分成具有34個(gè)子幀的4個(gè)組。在步驟420，計(jì)算每個(gè)子幀的范數(shù)，并且用固定的比特?cái)?shù)量化。然后，每個(gè)子幀通過(guò)它的量化的范數(shù)規(guī)格化，并且得到規(guī)格化的變換系數(shù)?？梢詫?duì)所有量化范數(shù)嘗試霍夫曼編碼。如果使用的比特?cái)?shù)少于分配給范數(shù)量化的總比特?cái)?shù)，那么可使用霍夫曼編碼。設(shè)置霍夫曼標(biāo)記(標(biāo)記N)，并將超額比特存儲(chǔ)在比特剩余中。如果使用的比特?cái)?shù)不低于分配給范數(shù)量化的總比特?cái)?shù)，那么不使用霍夫曼編碼，并且清除霍夫曼標(biāo)記。比特剩余是總比特?cái)?shù)減去6個(gè)標(biāo)記比特和范數(shù)用去的比特。在步驟430，可以使用自適應(yīng)比特分配方案，以在子幀之間分配幀中可用的比特。首先，將每個(gè)子幀中所有比特設(shè)置到零(總共有34個(gè)子幀)，并且將比特剩余設(shè)置到總可用比特。接下來(lái)，找到子幀的最大范數(shù)，并且給子幀中每個(gè)系數(shù)分配1比特，總共是M比特；那么，假設(shè)它的范數(shù)=范數(shù)/2,比特剩余-比特剩余-M。對(duì)于具有16個(gè)系數(shù)的子幀，M=16，對(duì)于具有24或32個(gè)系數(shù)的子幀，M分別是24或32。如果比特剩余小于16，那么停止分配；否則重復(fù)最后步驟。當(dāng)進(jìn)行了比特分配時(shí)，比特剩余少于16。一些子幀的每個(gè)系數(shù)分配了幾個(gè)比特；其他的可能具有零比特。在決定步驟440中，如果每個(gè)系數(shù)的比特大于1，那么可以通過(guò)點(diǎn)陣i^進(jìn)行量化，步驟450中的高速量化；否則，在步驟460中通過(guò)利用點(diǎn)陣及&的低速量化進(jìn)行量化?，F(xiàn)在已經(jīng)知道分配給每個(gè)組的比特。在步驟470，可以對(duì)每個(gè)子幀的量化的系數(shù)有選擇地嘗試進(jìn)行霍夫曼編碼。將前三個(gè)組的每個(gè)組所需的比特總數(shù)相加。如果霍夫曼編碼的比特少于分配的比特，那么可以對(duì)該組使用霍夫曼編碼，并且設(shè)置該組的霍夫曼代碼標(biāo)記；并且將節(jié)省的比特分配到剩余比特。如果霍夫曼編碼比特不少于固定的分配比特，那么不使用霍夫曼編碼，并清除霍夫曼代碼標(biāo)記。根據(jù)上述的比特分配方案，將剩余比特分配到下一個(gè)組。分配所有比特，并且在步驟480結(jié)束該處理過(guò)程。形成比特流并且可以發(fā)送?？梢詫?duì)結(jié)合圖4說(shuō)明的示例編碼器處理進(jìn)行各種修改。根據(jù)本發(fā)明的一些實(shí)施例，雙變換可以是任選的。根據(jù)本發(fā)明的其他實(shí)施例，可以有少于兩個(gè)或多于兩個(gè)的變換。此外，并如上所述，可以使用任何類型的變換，例如MLT、FFT、DCT、等等。解碼器處理過(guò)程解碼器基本上以與編碼器相反的順序處理編碼比特流?？偙忍厥且阎牟⑶沂峭耆恢碌?。在解碼器，可以檢查數(shù)據(jù)完整性和解碼協(xié)議，以保證將適當(dāng)?shù)慕獯a器用于比特流。一旦解碼器驗(yàn)證用根據(jù)上述示例的編碼器對(duì)比特流進(jìn)行了編碼，那么它對(duì)比特流進(jìn)行解碼，如圖5中所示并說(shuō)明如下在接收到輸入到解碼器的編碼比特流時(shí)，處理流程在步驟500開始。在步驟510，檢查標(biāo)記比特。例如，確定前三個(gè)組的范數(shù)或系數(shù)索引是否受到霍夫曼編碼。如果設(shè)置了霍夫曼代碼標(biāo)記，那么在步驟520對(duì)范數(shù)的量化索引進(jìn)行霍夫曼解碼。在對(duì)所有范數(shù)進(jìn)行解碼之后，知道了范數(shù)使用的總比特。也知道了作為剩余比特的用于編碼系數(shù)索引的比特?cái)?shù)。如果沒(méi)有設(shè)置霍夫曼代碼標(biāo)記，則在步驟530使用固定速度。知道了范數(shù)使用的比特?cái)?shù)。知道了系數(shù)索引的比特總數(shù)。在步驟530中，通過(guò)去量化量化索引得到量化范數(shù)。從量化范數(shù)，可以執(zhí)行自適應(yīng)比特分配540，與圖4中方框430的操作相同，以確定哪個(gè)子幀具有多少比特。如果為一個(gè)組設(shè)置了霍夫曼標(biāo)記，那么接收的數(shù)據(jù)是霍夫曼代碼，并且必須對(duì)該組內(nèi)每個(gè)子幀進(jìn)行解碼。如果沒(méi)有設(shè)置霍夫曼標(biāo)記，那么接收的數(shù)據(jù)是系數(shù)的量化索引。在步驟560中，從量化范數(shù)和量化索引，可以重構(gòu)MLT系數(shù)。對(duì)于沒(méi)有分配任何比特的子幀，它們的MLT系數(shù)可以填充零，或用隨機(jī)數(shù)產(chǎn)生?？梢曰謴?fù)一個(gè)長(zhǎng)變換的低頻系數(shù)和四個(gè)短變換的高頻系數(shù)。長(zhǎng)變換中的高頻可以用零填充；同樣，四個(gè)短變換的低頻可以填充零。沿高頻和低頻的邊界，可以使用某種形式的平滑過(guò)渡。例如，一種最簡(jiǎn)單的平滑函數(shù)是邊界附近少數(shù)幾個(gè)系數(shù)上的漸變斜率。一旦重構(gòu)了長(zhǎng)變換和四個(gè)短變換的所有系數(shù)，它們可以被逆變換到數(shù)字音頻取樣。在步驟570，對(duì)長(zhǎng)李換和四個(gè)短變換執(zhí)行從頻域到時(shí)域的逆變換。例如，可以使用雙IMLT來(lái)重構(gòu)MLT系數(shù)?，F(xiàn)在有兩個(gè)數(shù)字音頻信號(hào)，每個(gè)覆蓋相同的20ms時(shí)幀。在步驟580，將兩個(gè)時(shí)域信號(hào)組合，以形成一個(gè)單一的音頻信號(hào)?？梢詫⑿盘?hào)轉(zhuǎn)換成模擬信號(hào)并作為聲音再現(xiàn)?？梢酝ㄟ^(guò)硬件、軟件、固件、或任何上述的組合執(zhí)行本發(fā)明的各個(gè)實(shí)施例的方法。例如，該方法可以通過(guò)編碼器或解碼器或其他處理器在諸如電話會(huì)議系統(tǒng)或視頻會(huì)議系統(tǒng)之類的音頻系統(tǒng)中執(zhí)行這些方法。此外，本發(fā)明的各個(gè)實(shí)施例的方法可以應(yīng)用到流動(dòng)音頻，例如，經(jīng)過(guò)互聯(lián)網(wǎng)。圖6示出了根據(jù)本發(fā)明的各個(gè)實(shí)施例的編碼器。圖7示出了根據(jù)本發(fā)明的各個(gè)實(shí)施例的解碼器。在一些實(shí)施例中，編碼器和解碼器可以是分離的，或在其他實(shí)施例中它們可以組合成一個(gè)編解碼器。在圖6的編碼器中，可以將數(shù)字取樣的輸入音頻信號(hào)饋送到至少兩個(gè)變換模塊610和620中，以使音頻取樣及時(shí)轉(zhuǎn)換成變換系數(shù)的幀。在其它實(shí)施例中，可以將輸入音頻信號(hào)饋送到單變換。為了便于敘述，將變換模塊610和620稱為MLT模塊，雖然可以使用其它類型的變換模塊。在一個(gè)實(shí)施例中，每20ms，可以將最近的1920個(gè)音頻取樣饋送到變換模塊610，和每5ms,將最近的480個(gè)音頻取樣饋送到變換模塊620。長(zhǎng)幀變換模塊610可以產(chǎn)生大約960個(gè)系數(shù)的集，而短幀變換模塊620可以產(chǎn)生各大約為240個(gè)系數(shù)的四個(gè)集。長(zhǎng)幀變換系數(shù)可以用于低頻信號(hào)，而短幀變換系數(shù)可以用于高頻信號(hào)。例如，在一個(gè)實(shí)施例中，長(zhǎng)幀變化系數(shù)代表大約20Hz至大約7kHz之間的頻率，而短幀變換系數(shù)代表大約6.8kHz至大約22kHz之間的頻率。在另一個(gè)實(shí)施例中，可以任選地提供模塊630，以指示打擊樂(lè)器類型信號(hào)的存在。如果檢測(cè)到打擊樂(lè)器類型信號(hào)，那么可以將指示打擊樂(lè)器類型模式的模式標(biāo)記發(fā)送到多路復(fù)用器695以傳輸。如果檢測(cè)到打擊樂(lè)器類型信號(hào)，那么可以將邊界頻率調(diào)節(jié)到大約800Hz。在這種情況下，雙變換系數(shù)是代表高達(dá)800Hz的頻率的長(zhǎng)變換系數(shù)和代表600Hz以上頻率的短變換系數(shù)的組合。在其他實(shí)施例中，邊界頻率可以是7kHz，或大約800Hz和大約7kHz之間的任何頻率。長(zhǎng)幀變換系數(shù)和短幀變換系數(shù)是通過(guò)組合器模塊640組合的。組合的系數(shù)被應(yīng)用到范數(shù)量化模塊650，范數(shù)量化模塊650計(jì)算和量化每個(gè)子幀的范數(shù)。將編碼模塊670應(yīng)用于范數(shù)的量化索引。編碼模塊可以任選地執(zhí)行霍夫曼編碼。得到的范數(shù)代碼比特被饋送到多路復(fù)用器695。也可以將霍夫曼代碼標(biāo)記饋送到多路復(fù)用器695，以指示范數(shù)是否被霍夫曼編碼。將來(lái)自范數(shù)量化模塊650的量化范數(shù)和來(lái)自組合器模塊640的組合MLT系數(shù)饋送到規(guī)格化MLT系數(shù)的規(guī)格化模塊660。也可以將量化范數(shù)饋入到在子幀之間的幀中分配可用比特的自適應(yīng)比特分配模塊675。隨著比特分配的完成，接下來(lái)，可以通過(guò)點(diǎn)陣向量量化模塊680—幀接一幀地量化歸一化的MLT系數(shù)。如果每個(gè)系數(shù)的比特大于1，那么可以通過(guò)高速量化器進(jìn)行量化，否則，可以通過(guò)低速量化器進(jìn)行量化。如果沒(méi)有檢測(cè)到打擊樂(lè)器類型信號(hào)，那么可以將最大量化速度設(shè)定到5比特每個(gè)系數(shù)?？梢詫⒒舴蚵幋a模塊685任選地應(yīng)用到MLT系數(shù)的量化索引。但是，對(duì)于打擊樂(lè)器類型信號(hào)，不將霍夫曼編碼模塊685應(yīng)用于MLT系數(shù)的量化索引。得到的霍夫曼代碼比特從霍夫曼編碼模塊685饋送到比較和數(shù)據(jù)選擇模塊690。比較和數(shù)據(jù)選擇模塊690比較從量化模塊680輸出的量化索引和從霍夫曼編碼模塊685輸出的霍夫曼代碼。對(duì)于前三個(gè)子幀組的每個(gè)組，如果霍夫曼編碼的比特少于分配比特，那么可以為該組選擇霍夫曼編碼的比特，并且設(shè)置該組的霍夫曼代碼標(biāo)記；和把節(jié)省的比特分配給剩余比特。如果霍夫曼編碼的比特不小于固定的分配比特，那么為該組選擇量化索引，并清除該組的霍夫曼代碼標(biāo)記。將選擇的MLT代碼比特與任何霍夫曼代碼標(biāo)記一起饋送到多路復(fù)用器695。形成比特流并且能夠被發(fā)送。圖7的解碼器可以操作以從編碼比特流重構(gòu)音頻信號(hào)。將編碼比特流提供到去多路復(fù)用器710，去多路復(fù)用器710將數(shù)據(jù)去多路復(fù)用為范數(shù)代碼比特、MLT代碼比特、和各種標(biāo)記，例如，模式標(biāo)記、用于以32kbit/s編碼的子幀數(shù)量的標(biāo)記、范數(shù)的霍夫曼代碼標(biāo)記、和每個(gè)MLT系數(shù)的組的霍夫曼代碼標(biāo)記、等等。盡管可以使用其他類型的變換模塊，為了便于參考，在本例中使用了標(biāo)示MLT代碼比特和MLT系數(shù)。范數(shù)代碼比特被饋送到解碼模塊720，解碼模塊720對(duì)子幀范數(shù)的量化索引進(jìn)行解碼。如果霍夫曼代碼標(biāo)記(標(biāo)記N)指出使用了霍夫曼編碼對(duì)范數(shù)進(jìn)行編碼，那么可以使用霍夫曼解碼。然后，去量化模塊725對(duì)子幀范數(shù)進(jìn)行去量化?？梢允褂米赃m應(yīng)比特分配模塊730在子幀之間分配幀中的可用比特。將MLT代碼比特從去多路復(fù)用器710饋送到解碼模塊735，解碼模塊735給MLT系數(shù)的量化索引解碼。如果任何霍夫曼代碼標(biāo)記指出使用了霍夫曼編碼對(duì)任何MLT系數(shù)組進(jìn)行了編碼，那么可以使用霍夫曼解碼。如果沒(méi)有霍夫曼代碼標(biāo)記指示使用了霍夫曼編碼法對(duì)任何MLT系數(shù)組編碼，那么量化索引通過(guò)到去量化模塊740。因此，將解碼的MLT代碼比特或MLT系數(shù)的量化索引饋入到去量化模塊740，去量化模塊740對(duì)MLT系數(shù)進(jìn)行去量化。重構(gòu)模塊745可以從量化的范數(shù)和量化索引重構(gòu)MLT系數(shù)。分離器模塊750將MLT系數(shù)分離成MLT系數(shù)的一個(gè)長(zhǎng)幀，和四個(gè)短幀MLT系數(shù)集。將長(zhǎng)幀逆變換模塊760應(yīng)用于長(zhǎng)幀MLT系數(shù)集，并且將短幀逆變換模塊770應(yīng)用于四個(gè)短幀MLT系數(shù)集。逆變換模塊760和770可以包括逆調(diào)制重迭變換(IMLT)模塊。將得到的時(shí)域信號(hào)相加，導(dǎo)致可以從數(shù)字轉(zhuǎn)換到模擬并且作為聲音再現(xiàn)的輸出音頻信號(hào)?？梢栽诟鱾€(gè)領(lǐng)域中找到本發(fā)明各個(gè)實(shí)施例的有效應(yīng)用，例如音頻會(huì)議，視頻會(huì)議，和流媒體，包括流音樂(lè)或語(yǔ)音?，F(xiàn)在參考圖8，圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例會(huì)議系統(tǒng)的方框圖。該系統(tǒng)包括可以操作以經(jīng)過(guò)網(wǎng)絡(luò)850與一個(gè)或更多遠(yuǎn)端終端840通信的本地終端810。通信可以包括音頻、視頻、和數(shù)據(jù)的交換。熟悉本領(lǐng)域的人員應(yīng)當(dāng)知道，視頻能力是可選的，并且終端810可以是沒(méi)有視頻能力的音頻會(huì)議裝置。例如，終端810可以包括喇叭擴(kuò)音器，或其他音頻會(huì)議裝置。同樣，每個(gè)遠(yuǎn)端終端840可以包括音頻會(huì)議裝置或視頻會(huì)議裝置。本地終端810包括音頻編解碼器812，和音頻I/0接口814。音頻編解碼器812可以包括諸如圖6的編碼器之類的編碼器。音頻編解碼器可以進(jìn)一步包括諸如圖7的解碼器之類的解碼器。音頻I/O接口814可以執(zhí)行模-數(shù)和數(shù)-模轉(zhuǎn)換，以及與處理從一個(gè)或更多話筒816接收的或發(fā)送到一個(gè)或更多揚(yáng)聲器818的音頻信息結(jié)合的其他信號(hào)處理任務(wù)。一個(gè)或更多話筒816可以包括帶有智能話筒混合和動(dòng)態(tài)降噪功能的選通話筒。在一些實(shí)施例中，一個(gè)或更多話筒816可以與終端810集成為一體，或它們可以是從終端810分離的，或是組合的。同樣，一個(gè)或更多揚(yáng)聲器818可以與終端810集成為一體，或與終端810分離，或組合。如果它們是與終端810分離的，那么話筒816和揚(yáng)聲器818可以經(jīng)過(guò)有線連接或無(wú)線連接發(fā)送和接收信息。本地終端810可以捕獲通過(guò)一個(gè)或更多話筒816產(chǎn)生的音頻信息(一般代表本地會(huì)議參與者的語(yǔ)音或聲音)。本地終端810數(shù)字化和處理捕獲的音頻信息。將音頻編碼和經(jīng)過(guò)網(wǎng)絡(luò)接口820發(fā)送到一個(gè)或更多遠(yuǎn)端終端840。終端810可以從遠(yuǎn)端會(huì)議終端840接收音頻信息(一般代表遠(yuǎn)端會(huì)議參與者的語(yǔ)音和聲音)。接收的音頻信息是通過(guò)網(wǎng)絡(luò)接口820接收的。將接收的音頻信息解碼、處理、轉(zhuǎn)換成模擬信號(hào)，并經(jīng)過(guò)一個(gè)或更多揚(yáng)聲器818作為音頻再現(xiàn)。在一些實(shí)施例中，終端可以任選地包括視頻能力。在這樣的實(shí)施例中，終端810可以包括視頻編解碼器822，視頻I/O接口824，一個(gè)或更多視頻攝像機(jī)826，和一個(gè)或更多顯示裝置828。一個(gè)或更多的攝像機(jī)826可以與終端810—體，或與終端810分離，或組合。同樣，一個(gè)或更多顯示裝置828可以與終端810—體，或與終端810分離，或組合。在具有視頻能力的實(shí)施例中，終端810可以捕獲一個(gè)或更多攝像機(jī)826產(chǎn)生的視頻信息(一般代表本地會(huì)議參與者的圖像)。終端810處理捕獲的視頻信息，并將處理的信息經(jīng)過(guò)網(wǎng)絡(luò)接口820發(fā)送到一個(gè)或更多遠(yuǎn)端終端840。視頻輸入/輸出接口轉(zhuǎn)換和處理從一個(gè)或更多攝像機(jī)826接收的視頻信息，并發(fā)送到一個(gè)或更多視頻監(jiān)視器828。視頻編解碼器824編碼和解碼視頻信息。終端810可以接收來(lái)自遠(yuǎn)端終端840的視頻信息(一般代表遠(yuǎn)端會(huì)議參與者的圖像)。終端810處理接收的視頻信息，并將處理的視頻信息導(dǎo)向一個(gè)或更多顯示裝置828。終端810也可以從其他周圍裝置接收輸入，或直接輸出到其他周圍裝置，例如，視頻磁帶播放機(jī)/錄像機(jī)，文件攝像機(jī)，或LCD投影機(jī)，等等。終端810的各個(gè)組件可以通過(guò)至少一條總線830相互連接，以便相互通信。終端810的組件也可以包括中央處理單元(CPU)832。CPU832解釋和執(zhí)行可以從存儲(chǔ)器834裝載的程序指令?？梢园ㄒ资訰AM、非易失性ROM、和/或諸如磁盤驅(qū)動(dòng)器或CD-ROM之類的存儲(chǔ)裝置的存儲(chǔ)器834存儲(chǔ)可執(zhí)行程序、數(shù)據(jù)文件、和其他信息。在終端810中可以具有附加的組件和部件。例如，終端810可以包括回波消除或降低以允許全雙工操作的模塊。一個(gè)或更多遠(yuǎn)端終端840可以包括與前面參考本地終端810說(shuō)明的類似的組件。網(wǎng)絡(luò)850可以包括PSTN(公共交換電話網(wǎng))，或基于IP的網(wǎng)絡(luò)。盡管圖示和說(shuō)明了本發(fā)明的示例實(shí)施例，應(yīng)當(dāng)知道可以進(jìn)行各種不同的改變而不脫離本發(fā)明的精神和范圍。已經(jīng)借助參考示例實(shí)施例說(shuō)明了本發(fā)明。熟悉本領(lǐng)域的人員應(yīng)當(dāng)知道，可以對(duì)這些示例實(shí)施例進(jìn)行各種修改，而不脫離本發(fā)明的精神和范圍。此外，盡管已經(jīng)在其特定環(huán)境下和特定應(yīng)用下的具體實(shí)現(xiàn)的情況下說(shuō)明了本發(fā)明，但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知道，本發(fā)明的用途不限于此，而是本發(fā)明可以有利地應(yīng)用到任何數(shù)量的環(huán)境和實(shí)現(xiàn)。因此上述說(shuō)明和附圖只是為了說(shuō)明的目的而沒(méi)有限制的意思。權(quán)利要求1.一種在對(duì)音頻信號(hào)編碼中使用的量化方法，所述方法包括從截?cái)帱c(diǎn)陣構(gòu)造碼本，其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣，所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo)；和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。2.根據(jù)權(quán)利要求1所述的方法，其中量化局外者源向量的操作包括(a)按一半來(lái)定標(biāo)每個(gè)局外者源向量，以形成定標(biāo)的局外者源向量;(b)確定與定標(biāo)的局外者向量最近的點(diǎn)陣點(diǎn)M;(c)計(jì)算M的索引向量y';(d)從索引向量_/確定碼向量"(e)將y與"進(jìn)行比較；(f)如果7與w不同，則重復(fù)步驟(a)至(e)的操作；(g)將定標(biāo)的局外者源向量的十六分之一加到定標(biāo)的局外者源向量，以形成新的定標(biāo)的局外者源向量；(h)重復(fù)步驟(b)至(e)的操作；(i)如果y與"相同，重復(fù)步驟(g)至(h)。3.根據(jù)權(quán)利要求1所述的方法，其中所述點(diǎn)陣包括8維的D8點(diǎn)陣。4.根據(jù)權(quán)利要求1所述的方法，進(jìn)一步包括-量化的可變比特長(zhǎng)度編碼索引。5.—種在對(duì)音頻信號(hào)編碼中使用的量化方法，所述方法包括-從點(diǎn)陣構(gòu)造碼本，所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣；和量化源向量。6.根據(jù)權(quán)利要求5所述的方法，其中量化操作包括-(a)偏移和定標(biāo)源向量；(b)按降序?qū)Χ?biāo)的源向量的分量進(jìn)行重排序；(c)根據(jù)均方差來(lái)確定重排序向量的引導(dǎo)向量/;(d)按定標(biāo)的源向量的分量的原始順序來(lái)排列引導(dǎo)向量/的分量的順序，以獲得碼向量"(e)確定引導(dǎo)向量/的標(biāo)記向量；(f)通過(guò)按原始順序排列標(biāo)記向量的分量的順序來(lái)獲得向量z;(g)確定與引導(dǎo)向量/有關(guān)的索引偏移《；(h)如果引導(dǎo)向量/是(2,0，0，0，0，0，0,-2)且碼向量少包括索引低于分量-2的索引的分量2，則將偏移尺調(diào)節(jié)為《=《+28;(i)計(jì)算向量點(diǎn)積/=z;/，其中p=(1,2,4,8,16,32,64,128);(j)確定與碼向量y有關(guān)的索引增量》(k)計(jì)算碼向量y的索引h其中^:=尺+乂。7.根據(jù)權(quán)利要求5所述的方法，其中所述點(diǎn)陣包括旋轉(zhuǎn)Gosset點(diǎn)陣瑪。8.—種在對(duì)音頻信號(hào)編碼中使用的量化方法，所述方法包括-使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化變換系數(shù)；和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化變換系數(shù)。9.根據(jù)權(quán)利要求8所述的方法，其中使用第一點(diǎn)陣向量量化器的操作包括從截?cái)帱c(diǎn)陣構(gòu)造碼本，其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣，所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo)；和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。10.根據(jù)權(quán)利要求8所述的方法，其中使用第二點(diǎn)陣向量量化器的操作包括從點(diǎn)陣構(gòu)造碼本，所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣；禾口量化源向量。11.根據(jù)權(quán)利要求8所述的方法，進(jìn)一步包括針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)的量化的可變比特長(zhǎng)度編碼索引。12.—種對(duì)音頻信號(hào)進(jìn)行編碼的方法，所述方法包括將音頻信號(hào)的取樣組從時(shí)域變換到頻域，以形成變換系數(shù)的幀；將變換系數(shù)的每一幀分成多個(gè)組，其中每組包含多個(gè)子幀，和其中每個(gè)子幀包含特定數(shù)量的變換系數(shù)；根據(jù)子幀的均方根來(lái)確定每個(gè)子幀的范數(shù)；量化每個(gè)子幀的均方根；通過(guò)用子幀的量化均方根除子幀內(nèi)的每個(gè)系數(shù)來(lái)歸一化每個(gè)子幀的系數(shù)；使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化系數(shù)；和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化系數(shù)。13.根據(jù)權(quán)利要求12所述的方法，其中使用第一點(diǎn)陣向量量化器的操作包括-從截?cái)帱c(diǎn)陣構(gòu)造碼本，其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣，所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo)；和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。14.根據(jù)權(quán)利要求12所述的方法，其中使用第二點(diǎn)陣向量量化器的操作包括-從點(diǎn)陣構(gòu)造碼本，所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣；和量化源向量。15.根據(jù)權(quán)利要求12所述的方法，進(jìn)一步包括針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)的量化的可變比特長(zhǎng)度編碼索引。16.根據(jù)權(quán)利要求12所述的方法，進(jìn)一步包括將變換系數(shù)的組合集分組成多個(gè)分組，其中每個(gè)分組包括子幀，和其中每個(gè)子幀包含特定數(shù)量的系數(shù)；計(jì)算子幀之一的均方根；通過(guò)用子幀的均方根劃分子幀內(nèi)每個(gè)系數(shù)來(lái)歸一化子幀的系數(shù)；為每個(gè)分組保持霍夫曼編碼標(biāo)記；為對(duì)每個(gè)分組編碼而保持固定的比特?cái)?shù)；為分組計(jì)算使用霍夫曼編碼所需的比特?cái)?shù)；如果使用霍夫曼編碼所需的比特?cái)?shù)少于針對(duì)該分組的固定比特?cái)?shù)，則設(shè)置霍夫曼標(biāo)記和使用霍夫曼編碼；和如果使用霍夫曼編碼所需的比特?cái)?shù)不少于針對(duì)該分組的固定比特?cái)?shù)，則清除霍夫曼標(biāo)記和使用固定的比特?cái)?shù)編碼。17.—種其上記錄有程序的計(jì)算機(jī)可讀介質(zhì)，由機(jī)器執(zhí)行所述程序以執(zhí)行權(quán)利要求l，5，8，或12中的任何一項(xiàng)所述的方法。18.—種對(duì)音頻信號(hào)編碼的22kHz編碼器，所述編碼器包括變換模塊，用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域，以形成變換系數(shù)的幀；第一點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù)；和第二點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)l比特的速率量化變換系數(shù)。19.根據(jù)權(quán)利要求8所述的編碼器，進(jìn)一步包括編碼器模塊，用于針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。20.—種終端，包括音頻輸入/輸出接口；可通信地耦合到所述音頻輸入/輸出接口的話筒；可通信地耦合到所述音頻輸入/輸出接口的揚(yáng)聲器；和可通信地耦合到所述音頻輸入/輸出接口的22kHz的音頻編碼器；其中所述22kHz的音頻編碼器包括變換模塊，用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域，以形成變換系數(shù)的幀；第一點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)大于1比特的速率量化系數(shù)；和第二點(diǎn)陣向量量化器模塊，用于以每個(gè)系數(shù)l比特的速率量化系數(shù)。21.根據(jù)權(quán)利要求20所述的終端，其中所述22kHz的音頻編碼器進(jìn)一步包括編碼器模塊，用于針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。22.根據(jù)權(quán)利要求20所述的終端，進(jìn)一步包括可通信地耦合到音頻輸入/輸出接口的總線；可通信地耦合到總線的視頻輸入/輸出接口；可通信地耦合到視頻輸入/輸出接口的攝像機(jī)；和可通信地耦合到視頻輸入/輸出接口的顯示裝置。全文摘要披露了對(duì)音頻進(jìn)行編碼和解碼的方法、裝置、和系統(tǒng)。音頻信號(hào)的數(shù)字取樣被從時(shí)域變換到頻域。用快速點(diǎn)陣向量量化器對(duì)得到的變換系數(shù)編碼。量化器具有高速量化器和低速量化器。高速量化器包括截?cái)帱c(diǎn)陣的方案。低速量化器具有基于表的搜索方法。低速量化器也可以包括基于表的索引方案。高速量化器進(jìn)一步包括用于變換系數(shù)的量化索引的霍夫曼編碼技術(shù)，以提高量化/編碼效率。文檔編號(hào)G10L19/00GK101165777SQ200710167128公開日2008年4月23日申請(qǐng)日期2007年10月18日優(yōu)先權(quán)日2006年10月18日發(fā)明者謝敏杰申請(qǐng)人:寶利通公司

完整全部詳細(xì)技術(shù)資料下載