国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      快速點(diǎn)陣向量量化的制作方法

      文檔序號(hào):2837466閱讀:604來(lái)源:國(guó)知局

      專利名稱::快速點(diǎn)陣向量量化的制作方法
      技術(shù)領(lǐng)域
      :本發(fā)明涉及對(duì)音頻信號(hào)編碼和解碼,更具體地講,涉及使用快速點(diǎn)陣向量量化來(lái)編碼和解碼具有高達(dá)大約22kHz音頻帶寬的音頻信號(hào)。
      背景技術(shù)
      :在建立聲音信號(hào)或從聲音信號(hào)重放聲音的許多系統(tǒng)中使用音頻信號(hào)處理。隨著數(shù)字信號(hào)處理器(DSP)的發(fā)展,許多信號(hào)處理功能是通過(guò)數(shù)字化進(jìn)行的。為此,從聲波建立音頻信號(hào),轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù),為希望的效果進(jìn)行處理,轉(zhuǎn)換回模擬信號(hào),并作為聲波再現(xiàn)。模擬音頻信號(hào)一般是通過(guò)話筒從聲波(聲音)產(chǎn)生的。以特定頻率對(duì)模擬音頻信號(hào)的振幅取樣,并將振幅轉(zhuǎn)換成代表振幅的數(shù)字。典型的取樣頻率是大約8kHz(即,每秒取樣8000次),16kHz至196kHz,或這些頻率之間的某個(gè)頻率。根據(jù)數(shù)字化聲音的質(zhì)量,可以用8比特至128比特之間的某個(gè)比特?cái)?shù)字化聲音的每個(gè)取樣。為了保持高質(zhì)量的聲音,可能要使用許多比特。例如,在最高端,為了以196kHz取樣率和每個(gè)取樣128比特表現(xiàn)一秒鐘的聲音,可以占用128比特xl92kHz-24兆比特-3MB。為了表現(xiàn)3分鐘(180秒)的歌曲,要用540MB。在低端,在典型的電話會(huì)議中,以8kHz對(duì)聲音進(jìn)行取樣,且以每個(gè)取樣8比特進(jìn)行數(shù)字化,仍然要使用8kHzx8比特二64千比特/秒-8kB/秒。為了使數(shù)字化聲音數(shù)據(jù)更容易使用、存儲(chǔ)和傳送,一般要對(duì)它們進(jìn)行編碼,以減小它們的大小而不降低它們的質(zhì)量。當(dāng)要再現(xiàn)它們的時(shí)侯,對(duì)它們進(jìn)行解碼以恢復(fù)原始的數(shù)字化數(shù)據(jù)。已經(jīng)提出了各種不同的方式對(duì)音頻信號(hào)進(jìn)行編碼和解碼,以減小它們的數(shù)字格式的大小。對(duì)信號(hào)進(jìn)行編碼和解碼信號(hào)的處理器或處理模塊通常被稱為編解碼器。一些是無(wú)損的,即,解碼信號(hào)與原始信號(hào)嚴(yán)格地相同。一些是有損的,即,解碼信號(hào)與原始信號(hào)有輕微的差別。有損編解碼器通??梢匀〉帽葻o(wú)損編解碼器更大的壓縮率。有損編解碼器利用某些人類聽覺(jué)的特征,拋棄某些人類不易察覺(jué)的聲音。對(duì)于大多數(shù)人,只有在大約20Hz至大約20kHz之間的音頻范圍內(nèi)的聲音才是可察覺(jué)的。在這個(gè)頻率范圍之外的聲音大多數(shù)人是不能聽到的。因此,當(dāng)為人類聽眾再現(xiàn)聲音時(shí),產(chǎn)生這個(gè)范圍之外的聲音并不能改善聽到的聲音質(zhì)量。在用于人類聽眾的大多數(shù)音頻系統(tǒng)中,不再現(xiàn)這個(gè)范圍之外的聲音。在典型的公共電話系統(tǒng)中,在兩個(gè)電話機(jī)之間僅通信大約300Hz至大約3000Hz之內(nèi)的頻率。這減少了數(shù)據(jù)傳輸。一種用于編碼/解碼音樂(lè)的流行方法是MP3編解碼器中使用的方法。典型的音樂(lè)CD可以存儲(chǔ)大約40分鐘的音樂(lè)。當(dāng)用MP3編碼器以相當(dāng)?shù)穆曇糍|(zhì)量為相同的音樂(lè)編碼時(shí),這種CD可以存儲(chǔ)10-16倍以上的音樂(lè)。結(jié)合在這里作為參考的、標(biāo)題為"64kbit/s內(nèi)7kHz音頻編碼"的ITU-T(國(guó)際電信同盟電信標(biāo)準(zhǔn)化部)建議G.722(1988)描述了一種64kbit/s內(nèi)7kHz音頻編碼的方法。ISDN線路具有以64kbit/s傳輸數(shù)據(jù)的能力。這種方法實(shí)際上將通過(guò)使用ISDN線路的電話網(wǎng)絡(luò)的音頻的帶寬從3kHz提高到7kHz。改善了聽到的音頻質(zhì)量。盡管這種方法使得能夠通過(guò)現(xiàn)有的電話網(wǎng)獲得高質(zhì)量的音頻,但是,它一般需要來(lái)自電話公司的ISDN服務(wù),這種服務(wù)比一般的窄帶電話服務(wù)更貴。一種建議在電信中使用的更新的方法是,結(jié)合在這里作為參考的,標(biāo)題為"用于低幀損系統(tǒng)中免提操作的24和32kbit/s編碼(Codingat24and32kbit/sforhands—freeoperationinsystemwithlowframeloss)"的ITU-T建議G.722.1(1999)。這個(gè)建議說(shuō)明了一種數(shù)字寬帶編碼器算法,這種算法提供了50Hz至70kHz的音頻帶寬,操作在大大低于G.722的24kbit/s或32kbit/s的比特率。以這種數(shù)據(jù)率,具有使用慣用模擬電話線路的慣用調(diào)制解調(diào)器的電話可以發(fā)送寬帶音頻信號(hào)。因此,只要兩端的電話機(jī)能夠執(zhí)行G.722.1中所述的編碼/解碼,大多數(shù)現(xiàn)有電話網(wǎng)都可以支持寬帶對(duì)話。
      發(fā)明內(nèi)容希望能有全頻聲音通過(guò)電話,從而使得就聲音質(zhì)量而言,電話對(duì)話幾乎與面對(duì)面對(duì)話一樣。希望有一種能夠改善聲音質(zhì)量,或減小數(shù)據(jù)負(fù)擔(dān),或既能改善聲音質(zhì)量又能減小數(shù)據(jù)負(fù)擔(dān)的方法。本發(fā)明披露了提高了音頻編解碼器的效率,即,提高了聲音質(zhì)量和減小了傳輸信道或存儲(chǔ)介質(zhì)中的數(shù)據(jù)負(fù)擔(dān)的系統(tǒng)、方法、和裝置。本發(fā)明的一個(gè)實(shí)施例對(duì)輸入音頻信號(hào)使用了至少兩個(gè)MLT(調(diào)制重迭變換(ModulatedLappedTransform))。一個(gè)低頻MLT使用大約20ms的幀,和—個(gè)高頻MLT使用四個(gè)各為大約5ms的幀。低頻MLT可以與G722.1中說(shuō)明的MLT相同,而高頻MLT在高頻下提供了更高的分辨率。與單變換相比,雙變換產(chǎn)生了更好的高頻的瞬變?cè)佻F(xiàn)??梢詫LT系數(shù)分組成子幀,然后組成不同長(zhǎng)度的組。子幀的每個(gè)振幅包絡(luò)可以由數(shù)標(biāo)量量化器來(lái)量化,MLT系數(shù)可以用多維點(diǎn)陣向量來(lái)量化。根據(jù)本發(fā)明的各個(gè)實(shí)施例的快速點(diǎn)陣向量量化器提供了高于標(biāo)量量化器的量化效率和精度,而且沒(méi)有點(diǎn)陣向量量化通常所具有的問(wèn)題。本發(fā)明的各個(gè)實(shí)施例進(jìn)一步通過(guò)使用一個(gè)用于高速量化和一個(gè)用于低速量化的兩個(gè)不同的量化方案,改善了量化和編碼。本發(fā)明的各個(gè)實(shí)施例通過(guò)動(dòng)態(tài)地確定是否使用霍夫曼編碼技術(shù)為振幅包絡(luò)和系數(shù)索引編碼而進(jìn)一步改進(jìn)了量化編碼。對(duì)于四個(gè)組中的每一組,只有在能夠減少編碼組內(nèi)的所有系數(shù)索引所需的總比特?cái)?shù)的時(shí)侯,才使用霍夫曼編碼技術(shù)。否則,不使用霍夫曼編碼技術(shù)以減少不必要的計(jì)算成本。根據(jù)本發(fā)明的各個(gè)實(shí)施例,提供了一種在對(duì)音頻信號(hào)編碼中使用的量化方法。該方法可以包括使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化變換系數(shù),和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化變換系數(shù)。為了以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù),該方法可以包括從截?cái)嗟狞c(diǎn)陣構(gòu)造碼本,其中點(diǎn)陣包括所有碼向量的多維點(diǎn)陣,所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo);和量化位于截?cái)帱c(diǎn)陣之外的外部源向量。為了以每個(gè)系數(shù)l比特的速率量化變換系數(shù),該方法可以包括從點(diǎn)陣構(gòu)造碼本,和量化每個(gè)碼向量,該點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣。根據(jù)本發(fā)明的各個(gè)實(shí)施例,提供了一種對(duì)音頻信號(hào)進(jìn)行編碼的方法。該方法可以包括將音頻信號(hào)的取樣組從時(shí)域變換到頻域,以形成變換系數(shù)的幀。該方法還可以包括將變換系數(shù)的每一幀分成多個(gè)組,其中每組包含多個(gè)子幀,和其中每個(gè)子幀包含特定數(shù)量的變換系數(shù)。該方法還可以包括根據(jù)子幀的rms來(lái)確定每個(gè)子幀的范數(shù)。該方法還可以包括量化每個(gè)子幀的rms。該方法還可以包括通過(guò)用子幀的量化rms除子幀內(nèi)的每個(gè)系數(shù)來(lái)歸一化每個(gè)子幀的系數(shù)。該方法還可以包括使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化系數(shù)。該方法還可以包括使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)l比特的速率量化系數(shù)。還提供一種上面記錄有程序的計(jì)算機(jī)可讀介質(zhì),機(jī)器可以執(zhí)行該程序來(lái)執(zhí)行在此描述的任何方法。根據(jù)本發(fā)明的各個(gè)實(shí)施例,提供一種對(duì)音頻信號(hào)編碼的22kHz編碼器。該編碼器可以包括變換模塊,用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域,以形成變換系數(shù)的幀。該編碼器還可以包括第一點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù)。該編碼器還可以包括第二點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)l比特的速率量化變換系數(shù)。該方法還可以包括編碼器模塊,用于針對(duì)有所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。根據(jù)本發(fā)明的各個(gè)實(shí)施例,提供了一種終端(endpoint)。該終端包括可以包括音頻輸入/輸出接口,可通信地耦合到音頻輸入/輸出的話筒,可通信地耦合到音頻輸入/輸出接口的揚(yáng)聲器,和可通信地耦合到音頻輸入/輸出接口的22kHz音頻編碼器。該終端還可以包括可通信地耦合到音頻輸入/輸出接口的總線,可通信地耦合到總線的視頻輸入/輸出接口,可通信地耦合到視頻輸入/輸出接口的攝像機(jī),和可通信地耦合到視頻輸入/輸出接口的顯示裝置。通過(guò)結(jié)合附圖閱讀以下對(duì)優(yōu)選實(shí)施例的詳細(xì)說(shuō)明,可以更好地理解本發(fā)明,其中圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例雙變換方案;圖2A示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例系數(shù)分組方案;圖2B示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的示例系數(shù)分組方案;圖3A示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例編碼比特流;圖3B示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的標(biāo)記比特的示例結(jié)構(gòu);圖3C示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的變換系數(shù)的示例結(jié)構(gòu);圖3D示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的變換系數(shù)的示例結(jié)構(gòu);圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的編碼處理過(guò)程的示例處理流程圖;圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的解碼處理過(guò)程的示例處理流程圖;圖6示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的編碼器的示例方框圖;圖7示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的解碼器的示例方框圖;圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的會(huì)議系統(tǒng)的示例方框圖。具體實(shí)施方式本發(fā)明的各個(gè)實(shí)施例利用革新的編碼器和解碼器擴(kuò)大和改善了音頻信號(hào)處理的性能。廣義地講,編碼處理包括變換處理、量化處理、和編碼處理。本發(fā)明的各個(gè)實(shí)施例在三個(gè)處理中全部做出了改進(jìn)。在大多數(shù)現(xiàn)有技術(shù)的音頻信號(hào)處理中,音頻信號(hào)幀具有固定的長(zhǎng)度。幀長(zhǎng)度越短,延遲越短。對(duì)于高頻,較短的幀長(zhǎng)度也提供了較好的時(shí)間分辨率和更好的性能。但是,短幀提供了較差的頻率分辨率。與此相反,幀長(zhǎng)度越長(zhǎng),延遲越長(zhǎng)。但是,在低頻,較長(zhǎng)的幀提供較好的頻率分辨率和更好的性能,以分辨音調(diào)諧波。在一種折衷方案中,幀長(zhǎng)度一般在20ms的范圍內(nèi),這也是G722.1建議中采用的幀長(zhǎng)度。根據(jù)本發(fā)明的各個(gè)實(shí)施例,可以使用至少兩個(gè)不同的音頻取樣幀長(zhǎng)度。一個(gè)具有較長(zhǎng)的幀長(zhǎng)度,并且設(shè)計(jì)用于更好地表現(xiàn)低頻頻譜;另一個(gè)具有較短的幀長(zhǎng)度,用于高頻信號(hào),和在高頻提供更好的分辨率。兩種信號(hào)幀的組合提高了聲音質(zhì)量。這可以將頻譜響應(yīng)擴(kuò)大到整個(gè)人類音頻頻譜,例如,大約20Hz至大約22kHz。根據(jù)本發(fā)明的一個(gè)實(shí)施例,比特分配可以是自適應(yīng)和動(dòng)態(tài)的,而不是使用極少種類內(nèi)的預(yù)定比特分配。在變換系數(shù)量化的過(guò)程中,可使用動(dòng)態(tài)比特分配。因此,能夠最好地使用可用比特。使用至少兩個(gè)變換,要量化和編碼的變換系數(shù)遠(yuǎn)比使用一個(gè)單一變換時(shí)的多。在本發(fā)明的一個(gè)實(shí)施例中,可以使用快速點(diǎn)陣向量量化法來(lái)代替簡(jiǎn)單的標(biāo)量量化法。向量量化一般比簡(jiǎn)單的標(biāo)量量化法的效率高。更具體地講,點(diǎn)陣向量量化(LVQ)比慣用的已知LBG(Linde,Buzo,andGray)向量量化的優(yōu)越之處在于,由于LVQ碼本的規(guī)則結(jié)構(gòu),LVQ具有相對(duì)簡(jiǎn)單的量化處理過(guò)程,并且能夠節(jié)省所需的存儲(chǔ)器。但是,由于幾種限制,點(diǎn)陣向量量化尚未在實(shí)時(shí)語(yǔ)音和音頻-編碼中廣泛地應(yīng)用,這幾種限制包括在如何截?cái)嘟o定速率的點(diǎn)陣以建立與輸入源的概率密度函數(shù)(PDF)匹配的LVQ碼本,如何快速地將LVQ碼本的碼向量(點(diǎn)陣點(diǎn))翻譯成它們的索引,和如何量化位于截?cái)帱c(diǎn)陣外面的源向量("局外者(outlier)")方面存在的困難。根據(jù)本發(fā)明的快速LVQ(FLVQ)避免了上述限制。FLVQ包括高速量化器(HRQ)和低速量化器(LRQ)。在量化變換系數(shù)中,量化器不是定標(biāo)點(diǎn)陣碼本而是定標(biāo)系數(shù),以便使用一種快速搜索算法,然后在解碼器再換算重構(gòu)的系數(shù)。通過(guò)將局外者放回到用作LVQ碼本的截?cái)帱c(diǎn)陣內(nèi),這種定標(biāo)系數(shù)的方法也可以解決"局外者"問(wèn)題。諸如人類話音或音頻音樂(lè)之類的輸入源的PDF是從各種不同聲源的大的集合中產(chǎn)生的。一旦消除了LVQ的限制,在本發(fā)明的實(shí)施例中,F(xiàn)LVQ的使用提供了比現(xiàn)有技術(shù)標(biāo)量量化更高的量化效率。在本發(fā)明的另一個(gè)實(shí)施例中,通過(guò)動(dòng)態(tài)霍夫曼編碼可以進(jìn)一步提高量化和編碼效率。眾所周知,作為一種熵編碼方法的霍夫曼編碼法在源非均勻分布時(shí)最為有用。變換系數(shù)一般是非均勻分布的;因此,使用霍夫曼編碼法可以提高編碼效率。在本發(fā)明的這個(gè)實(shí)施例中,在霍夫曼編碼法減少比特需求時(shí),可以將霍夫曼編碼法用于編碼振幅包絡(luò)和變換系數(shù)的量化索引。在確定是否使用霍夫曼編碼法時(shí),將使用霍夫曼編碼法的比特的總數(shù)與可用于范數(shù)或變換系數(shù)的量化的比特?cái)?shù)比較。只有存在節(jié)省時(shí),才可以使用霍夫曼編碼法。這種方式,使用了最佳編碼方法。雙變換在一個(gè)實(shí)施例中,使用了兩種大小的幀,一個(gè)被稱為長(zhǎng)幀,另一個(gè)被稱為短幀。為了簡(jiǎn)明起見(jiàn),本發(fā)明稱之為雙變換,盡管應(yīng)當(dāng)理解在某些實(shí)施例幀可以使用一種幀大小,或者可以使用兩種以上的幀大小。參考圖1,對(duì)音頻信號(hào)102進(jìn)行取樣和數(shù)字化。在這個(gè)特定的例子中,以48kHz的頻率對(duì)音頻信號(hào)取樣。但是,也可以使用其他取樣頻率。在這個(gè)例子中,長(zhǎng)幀L104具有大約20ms的幀長(zhǎng)度。對(duì)于每個(gè)長(zhǎng)幀L104,具有多個(gè)短幀S1106,S2107,S3108,和S4109。在這個(gè)例子中,每個(gè)短幀106,107,108和109具有大約5ms的幀長(zhǎng)度;因此,每個(gè)長(zhǎng)幀104具有大約960個(gè)取樣(48kHzx0.02s=960),而每個(gè)短幀(106,107,108,109)具有大約240個(gè)取樣(48kHzx0.005s=240)。盡管在本例中示出了四個(gè)短幀106,107,108和109,但是也可以有更少或更多數(shù)量的短幀;例如,短幀的數(shù)量可以是2,3,4,5,等等。將這些幀104,106,107,108和109從時(shí)域變換到頻域。例如,可以如同ITU-T建議G.722.1中所雄的那樣,可以利用MLT(調(diào)制重迭變換)對(duì)它們進(jìn)行變換。為了簡(jiǎn)明,本發(fā)明稱之為MLT變換,盡管也可以使用其他類型的變換,例如,F(xiàn)FT(快速傅里葉變換)和DCT(離散余弦變換),等等。該變換產(chǎn)生圖2A中所示的MLT系數(shù)集212,222,224,226,和228。每個(gè)短幀MLT系數(shù)集222,224,226,和228具有大約240個(gè)系數(shù),并且每個(gè)系數(shù)與相鄰的系數(shù)具有大約100Hz的間隔。對(duì)于長(zhǎng)幀212,大約有960個(gè)MLT系數(shù),或每25Hz—個(gè)系數(shù)??梢越M合這些系數(shù)以形成1920個(gè)MLT系數(shù)的單一集。這個(gè)系數(shù)集可以捕獲聲音的低頻特性和高頻特性。由于22kHz的編碼帶寬,可以忽略大約22kHz以上頻率的MLT變換系數(shù)。長(zhǎng)變換十分適合于捕獲較低的頻率。短變換很適于捕獲較高的頻率。因此,并不是所有系數(shù)都攜帶再現(xiàn)被變換的聲音信號(hào)的相同的值。在一個(gè)實(shí)施例中,可以忽略一些系數(shù)。每個(gè)短幀MLT系數(shù)集具有大約240個(gè)系數(shù)。每個(gè)系數(shù)與它的相鄰系數(shù)間隔大約100Hz。在一個(gè)實(shí)施例中,可以忽略低于大約6800Hz和高于大約22,000Hz的系數(shù)。因此,每個(gè)短幀可以保留152個(gè)系數(shù),并且四個(gè)短幀的系數(shù)的總數(shù)是608個(gè)。對(duì)于長(zhǎng)幀,在一個(gè)實(shí)施例,由于長(zhǎng)幀被用來(lái)表現(xiàn)較低頻率的信號(hào),所以可以保留低于大約7kHz頻率的系數(shù),并且可以將高于大約7kHz頻率的、來(lái)自長(zhǎng)變換的系數(shù)舍棄。因此,較低的頻率可以有280個(gè)系數(shù)。因此,在一個(gè)實(shí)施例中,對(duì)于高達(dá)2SkHz左右的音頻辦譜,總系數(shù)可以是888(608+280)個(gè)。在量化和編碼之前,可以將系數(shù)分組成子幀(sub-frame)并組成組。在這個(gè)實(shí)施例中"子幀(sub-frame)"可以與G.722.1方法中的"區(qū)域(region)"相同。將一個(gè)子幀作為一個(gè)單元,計(jì)算振幅包絡(luò),賦予可變比特分配,和進(jìn)行進(jìn)一步的量化和編碼。一個(gè)組包括許多具有一個(gè)頻譜范圍內(nèi)的相同長(zhǎng)度的子幀。一個(gè)組內(nèi)的子幀可以具有相同的特性,并且可以用相同的方式量化或編碼。但是,對(duì)于不同組中的子幀,量化和編碼的方法可能是不同的。與現(xiàn)有技術(shù)方法中的區(qū)域不同,子幀可以具有不同的大小,組也可以是不同大小的,從而,在可以減少量化和編碼的過(guò)程中,不同的子幀和組可以更接近地表示頻譜和比特需求。在當(dāng)前的實(shí)施例中,從OHz到22kHz的整個(gè)音頻頻譜可以劃分為四個(gè)組。第一組覆蓋從大約OHz到大約4kHz的頻率。第一組具有10個(gè)子幀,每個(gè)子幀具有16個(gè)MLT系數(shù)。第一組中的總系數(shù)是160個(gè)系數(shù),所有這些系數(shù)都來(lái)自于長(zhǎng)幀變換。第二組包括從大約4kHz到大約7kHz的頻譜。第二組具有5個(gè)子幀,每個(gè)子幀具有24個(gè)系數(shù),所以第二組具有總共120個(gè)系數(shù)。這些系數(shù)來(lái)自于長(zhǎng)幀變換。第三組覆蓋從大約7kHz(或在一些實(shí)施例中,大約6.8kHz)到大約14kHz的頻譜。在它們的邊界上,長(zhǎng)幀變換和短幀變換可以交迭,以使過(guò)渡更為平順。第三組具有9個(gè)子幀,每個(gè)子幀具有32個(gè)系數(shù),所以第三組總共具有288個(gè)系數(shù)。這些系數(shù)來(lái)自于四個(gè)短幀變換。第四組覆蓋從大約14kHz到大約22kHz的頻譜。這個(gè)組具有10個(gè)子幀,每個(gè)子幀具有32個(gè)系數(shù),所示總共有320個(gè)系數(shù)??傊?,在本實(shí)施例中,有888個(gè)系數(shù)要量化和編碼。在邊界頻率附近的250Hz的頻率區(qū)域上,可以利用一個(gè)三角窗口在長(zhǎng)MLT和短MLT系數(shù)之間進(jìn)行重疊相加(OLA)。對(duì)于長(zhǎng)MLT,用下坡斜率乘從6775Hz開始的IO個(gè)系數(shù)。對(duì)于短MLT,用上坡斜率乘從6800Hz開始的2個(gè)系數(shù)。在根據(jù)上述方案將系數(shù)分組到子幀并組成組時(shí),可以根據(jù)頻率按從低頻到高頻的順序排列這些系數(shù)。例如,可以將用于相同頻率的系數(shù)分組到一起來(lái)自L的系數(shù)后面跟隨著來(lái)自Sl、S2、S3、和S4的系數(shù),然后又是來(lái)自L的更高頻率的系數(shù),并重復(fù)上述排列。也允許和接受其他排列或順序。例如,可以將來(lái)自相同變換的系數(shù)分組到一起,即,首先排列所有來(lái)自L變換的系數(shù),然后考來(lái)自S1變換,S2、S3、和S4變換的系數(shù)。已經(jīng)發(fā)現(xiàn)這里的排列或順序可能影響后面的量化或編碼。在一個(gè)實(shí)施例中,以下的排列似乎在后面要說(shuō)明的量化和編碼方案中一般能夠給出好的結(jié)果。來(lái)自長(zhǎng)幀變換的系數(shù)根據(jù)頻率從低到高地排列到第一和第二組。來(lái)自四個(gè)短變換的系數(shù)一般不根據(jù)它們的頻率排列,但是并不是嚴(yán)格地根據(jù)頻率順序排列。首先,選擇8個(gè)來(lái)自第一短幀變換的系數(shù),并根據(jù)頻率順序排列。然后,選擇來(lái)自第二短幀變換的相同頻率的8個(gè)系數(shù)。同樣地,選擇來(lái)自第三短幀變換的相同頻率的系數(shù)。接下來(lái),選擇來(lái)自第四短幀變換的系數(shù)。此后,我們返回到第一短幀變換Sl,選擇下8個(gè)系數(shù),并且重復(fù)上述過(guò)程,直到選擇了來(lái)自短幀變換的全部系數(shù)。使用上述雙變換和分組,得到4個(gè)組和34個(gè)子幀,每個(gè)子幀具有16、24或32個(gè)系數(shù)。與僅能夠變換低頻或高頻,或不能得到精細(xì)的分辨率的現(xiàn)有技術(shù)方法的單一變換不同,本發(fā)明的各個(gè)實(shí)施例在音頻頻譜的低頻和高頻都能夠提供好的分辨率。計(jì)算負(fù)擔(dān)僅稍大于單一的短幀變換(例如,5ms幀長(zhǎng)度,48kHz取樣速率),在22kHz將頻譜范圍擴(kuò)大到全音頻頻譜。這些系數(shù)代表全音頻頻譜??梢杂酶鞣N量化和編碼方法對(duì)這些系數(shù)進(jìn)行量化和編碼,例如,使用G.722.1中所述的方法。如果使用G.722.1方法,首先對(duì)每個(gè)子幀的振幅包絡(luò)進(jìn)行計(jì)算、標(biāo)量量化、和霍夫曼編碼。振幅包絡(luò)也用于分配用于根據(jù)子幀分配的類別編碼每個(gè)子幀內(nèi)的系數(shù)索引的比特。然后,根據(jù)這些系數(shù)索引的類別量化它們。上述方案可用于語(yǔ)音和一般音樂(lè)。根據(jù)另一個(gè)實(shí)施例,打擊樂(lè)器類型的信號(hào)可能出現(xiàn)在音頻信號(hào)中。根據(jù)諸如高達(dá)大約10kHz的頻率區(qū)域上的長(zhǎng)MLT系數(shù)的平均梯度斜度,最大長(zhǎng)MLT系數(shù)的位置,和長(zhǎng)MLT系數(shù)的零交叉率(ZCR)之類的特性,可以檢測(cè)到打擊樂(lè)器類型信號(hào)。打擊樂(lè)器類型信號(hào)的例子包括,但不限于,響板和三角鐵等產(chǎn)生的聲音。如果檢測(cè)到這種打擊樂(lè)器類型信號(hào),如圖2B中所示的那樣,可以將較長(zhǎng)的幀變換系數(shù)的邊界頻率調(diào)節(jié)到大約800Hz(不是7kHz)。這種調(diào)節(jié)有利地減小了前回聲現(xiàn)象。因此,在這個(gè)實(shí)施例中,長(zhǎng)幀變換系數(shù)232可以包括大約0Hz到大約800Hz范圍內(nèi)的頻率,而短幀變換系數(shù)242、244、246、和248可以包括大約600Hz到大約22kHz范圍中的頻率。頻率的疊加有助于提供平滑的過(guò)渡??梢栽谶吔珙l率附近的250Hz的頻率區(qū)域上利用三角窗口在長(zhǎng)MLT和短MLT系數(shù)之間執(zhí)行OLA。對(duì)于長(zhǎng)MLT,用下坡斜率乘在575Hz開始的10個(gè)系數(shù)。對(duì)于短MLT,用上坡斜率乘在600Hz開始的2個(gè)系數(shù)。將以25Hz間隔為中心的較低的400個(gè)長(zhǎng)MLT系數(shù)劃分為20個(gè)組,每個(gè)組有20個(gè)系數(shù)。如下計(jì)算每個(gè)組中的頻譜能量-19^^,《々r服e,0&、19公式i其中x是長(zhǎng)MLT系數(shù),i是組號(hào),和THREQ是安靜(quiet)閾值,按照經(jīng)驗(yàn),可以選擇安靜閾值為THREQ二7000。當(dāng)前幀與前一個(gè)幀之間的組能量比率的自然對(duì)數(shù)^如下計(jì)算02"19公式2其中n是幀數(shù)。上升沿的平均梯度斜度^m;^如下計(jì)算:19£(maX(i£,,。)*£,.)^附;v=~~^-公式3>=0下降沿的平均梯度斜度i。^P(^如下計(jì)算^附A,=^——~"~公式4如果滿足以下條件(1)iam;>r朋i^Jl^,其中7T7i^iL4M尸是斜度的預(yù)定閾值,并等于1.5;(2)第一長(zhǎng)MLT系數(shù),;c。,是長(zhǎng)MLT系數(shù)的最大值;和(3)零交叉率,ZC/,小于預(yù)定閾值,77W^ZO=0.1,那么檢測(cè)到打擊樂(lè)器類型信號(hào)。如果檢測(cè)到打擊樂(lè)器類型信號(hào),那么當(dāng)前幀和后面兩個(gè)幀的邊界頻率被調(diào)節(jié)到大約800Hz。如果在下一個(gè)幀n+l或n+2中,條件^w&,>1是真,那么編碼器用調(diào)節(jié)的邊界頻率工作8個(gè)幀。否則,編碼器在幀n+3返回到7kHz的邊界頻率。在打擊樂(lè)器類型信號(hào)模式中,當(dāng)邊界頻率是大約800Hz時(shí),將雙MLT系數(shù)劃分成具有不同長(zhǎng)度的38個(gè)子幀。有代表低于800Hz頻率的32個(gè)長(zhǎng)MLT系數(shù),它們被分離成兩個(gè)16個(gè)系數(shù)的子幀。短MLT系數(shù)被劃分成各種不同的組第一組具有12個(gè)16系數(shù)子幀,并代表600Hz到5.4kHz的頻率;第二組具有12個(gè)24系數(shù)子幀,并代表5.4kHz到12.6kHz的頻率;第三組具有12個(gè)32系數(shù)子幀并代表12.6kHz到22.2kHz的頻率。每個(gè)子幀包括相同短MLT的系數(shù)。振幅包絡(luò)對(duì)子幀的振幅包絡(luò)進(jìn)行量化和分析,以確定是否要使用霍夫曼編碼??梢詫⒐潭ū忍胤峙滟x予每個(gè)振幅包絡(luò)作為默認(rèn)值和基準(zhǔn)。如果使用霍夫曼編碼技術(shù)能夠比固定比特節(jié)省一些比特,則可以使用霍夫曼編碼技術(shù)。為振幅包絡(luò)設(shè)置霍夫曼標(biāo)記,使得解碼器能夠知道是否使用霍夫曼編碼。節(jié)省的比特?cái)?shù)被存儲(chǔ)在供剩余編碼使用的比特中。否則,不使用霍夫曼編碼,清除標(biāo)記,和使用默認(rèn)固定比特。例如,在一個(gè)實(shí)施例中,給每個(gè)包絡(luò)被分配5比特。用于包絡(luò)的總默認(rèn)比特是34x5=170比特。假設(shè)傳輸率是64kbit/s,那么每幀的比特?cái)?shù)是64kbit/sX20ms=1280比特。在本例中,保留六個(gè)標(biāo)記比特。因此,可用于編碼系數(shù)索引的比特是1280-6-170=1104比特。對(duì)于每個(gè)子幀,將振幅包絡(luò),也稱為范數(shù)(norm),定義為子幀中MLT系數(shù)的RMS(均方根)值,和如下計(jì)算-ATwOO=/-2W/"r,M)m/《7",w)公式5M(。^其中r是子幀的索引,M^是子幀的大小,可以是16、24或32,m/f(h"」是第r個(gè)子幀的第w個(gè)MLT系數(shù)。在當(dāng)前的例子中,當(dāng)B/^10時(shí),M^是16,所有這些子幀都在第一組中,0-4kHz;當(dāng)110S15時(shí),M(^是24,所有這些子幀都在第二組中,4kHz-7kHz;當(dāng)16^r^24時(shí),Mf^是32,所有這些子幀都在第三組中,6.8kHz-14kHz;當(dāng)25^《34時(shí),Mf^是32,所有這些子幀都在第四組中,14kHz-22kHz;m^W值用對(duì)數(shù)量化器計(jì)算和標(biāo)量量化。下面的表1示出了對(duì)數(shù)量化器的碼本。表1范數(shù)量化的40-級(jí)碼本<table>tableseeoriginaldocumentpage18</column></row><table>72,3.5172"272"372-L58182823"382-2.0921251927.52922'5392'"第一子幀的振幅包絡(luò),rm^",用5比特量化,并且將它的量化索引被直接發(fā)送到解碼器。因此,僅有前32個(gè)碼字被用于量化/vn^/入剩下的33個(gè)振幅包絡(luò)用全部40個(gè)碼字量化,并如下差分編碼得到的索引。差分索引=index(i+l)-index(i)公式6其中1=0,1,2,...。差分索引被約束到[-15,16]的范圍。首先調(diào)節(jié)負(fù)的差分索引,然后調(diào)節(jié)正的差分索引。最后,對(duì)調(diào)節(jié)的差分索引使用霍夫曼編碼。接下來(lái),將用于霍夫曼編碼的總比特與用于直接編碼(即,不用霍夫曼編碼)的比特?cái)?shù)比較。如果總比特少于不用霍夫曼編碼的,那么可以將霍夫曼代碼在信道上發(fā)送。否則,量化索引的差分碼將被發(fā)送到解碼器。因此,用于編碼的比特總是最少的。如果使用霍夫曼代碼,那么設(shè)置霍夫曼標(biāo)記,并將節(jié)省的比特返回到可用比特。例如,如果霍夫曼編碼的總比特是160比特,那么節(jié)省170-160=10比特。可用比特成為10+1104=1114比特。自適應(yīng)比特分配方案可以將一種基于變換系數(shù)的組的能量的自適應(yīng)比特分配方案用于在子幀之間分配幀中的可用比特。在一個(gè)實(shí)施例中,可以使用一種改進(jìn)的比特分配方案。與G.722.1中使用這方案不同,系數(shù)索引的自適應(yīng)比特分配不是通過(guò)類別固定,而是通過(guò)在量化振幅包絡(luò)的同時(shí)的分配處理過(guò)程來(lái)固定??梢允侨缦碌谋忍胤峙?。設(shè)/ema/;^w代表可用比特的總數(shù),Af"J代表分配給第"子幀的比特?cái)?shù)。在上述例子中,在對(duì)振幅包絡(luò)使用霍夫曼編碼時(shí),iemm>^r=1114:步驟0,將比特分配初始化到零,即,^"戶0,其中"=1,2,3,…N,其中N是子幀的總數(shù)。在上述例子中,N是34。步驟l,找到子幀中具有最大RMS的子幀的索引"。步驟2,將Af「"片匕特分配給第"子幀,即,rW7W+Jkf「"入(在這里,^Tf^是第"子幀中系數(shù)的數(shù)量)。步驟3,用2除n7wfhj,并且7ema/wcfer-Aema/"(ier-M"(^)。步驟4,如果/^ma!'打^^16,那么重復(fù)步驟1至3。否則停止。在這樣的比特分配之后,除了少數(shù)剩余比特之外的所有比特被分配到子幀。有一些子幀可能沒(méi)有任何比特分配給它們,因?yàn)檫@些子幀的RMS值太小,即,從頻譜的該部分沒(méi)有對(duì)音頻信號(hào)的可察覺(jué)的貢獻(xiàn)。頻譜的該部分可以忽略??焖冱c(diǎn)陣向量量化盡管可以使用現(xiàn)有技術(shù)的量化和編碼方法來(lái)實(shí)現(xiàn)上述實(shí)施例以將處理過(guò)的音頻信號(hào)擴(kuò)大到全音頻頻譜,但是它們沒(méi)能將全部潛力帶給廣大聽眾。使用現(xiàn)有技術(shù)的方法,比特率需求可能很高,這使得更難發(fā)送處理過(guò)的全譜頻音頻信號(hào)??梢允褂酶鶕?jù)本發(fā)明一個(gè)實(shí)施例的新的快速點(diǎn)陣向量量化(FLVQ)方案,這個(gè)方案提高了編碼效率和減少了比特需求。FLVQ可以用于任何音頻信號(hào)的量化和編碼。將MLT系數(shù)分別劃分到16、24、和32個(gè)系數(shù)的子幀中。計(jì)算每個(gè)子幀的RMS,或,范數(shù),即,子幀中系數(shù)的均方根值,并用量化的范數(shù)對(duì)系數(shù)進(jìn)行歸一化。用快速LVQ以8-維向量量化每個(gè)子幀中的歸一化系數(shù)??焖冱c(diǎn)陣向量量化器包括高速量化器(HRQ)和低速量化器(LRQ)。高速量化器被設(shè)計(jì)用來(lái)以高于1比特/系數(shù)的速度量化系數(shù),低速量化器用于以1比特/系數(shù)的速度量化。點(diǎn)陣向量量化器最好是用于均勻分布源。點(diǎn)陣是點(diǎn)在N維歐幾里得空間中的規(guī)則排列。在這種情況下,源(即,MLT系數(shù))是非均勻的,因此,將熵編碼-霍夫曼編碼-應(yīng)用于高速量化的索引,以改善HRQ的性能。高速量化高速量化可以基于用于點(diǎn)陣D8的Voronoi碼,并且設(shè)計(jì)用來(lái)以2至6比特/系數(shù)的速度量化規(guī)格化MLT。這個(gè)子量化器的碼本可以從點(diǎn)陣D8的有限區(qū)域構(gòu)造,并且不存儲(chǔ)在存儲(chǔ)器中。碼向量可以通過(guò)簡(jiǎn)單的代數(shù)方法產(chǎn)生。點(diǎn)陣Ds定義如下<formula>formulaseeoriginaldocumentpage21</formula>公式7其中Zs是整數(shù)坐標(biāo)的所有點(diǎn)組成的點(diǎn)陣。可以看到,Ds是一個(gè)整數(shù)點(diǎn)陣,并且是由具有帶有偶數(shù)和的整數(shù)坐標(biāo)的點(diǎn)"0^2,>^4,>^^7,>0組成的。例如,向量尸(-l,-l,0,2,l,-3,2,4)具有4的偶數(shù)和,因此y是Ds的一個(gè)點(diǎn)陣點(diǎn)。Conway和Sloane開發(fā)了用于某些已知點(diǎn)陣的快速量化算法,這些算法可以用于Ds。但是,他們的算法假設(shè)了一個(gè)不能在實(shí)時(shí)音頻編碼中用作碼本的無(wú)限點(diǎn)陣。也就是說(shuō),對(duì)于一個(gè)給定速度,他們的算法不能用于量化位于截?cái)帱c(diǎn)陣區(qū)域外面的輸入向量。在一個(gè)實(shí)施例中,分別以2、3、4、和5比特/系數(shù)的速度量化歸一化的MLT系數(shù)。在另一個(gè)實(shí)施例中,例如,在檢測(cè)到打擊樂(lè)器類型信號(hào)時(shí),最大量化速度可以是6比特/系數(shù)。為了使給定速度下失真最小,可以截?cái)嗖⒍?biāo)點(diǎn)陣Ds。實(shí)際上,是定標(biāo)系數(shù)而不是點(diǎn)陣碼本,以便使用Conway等描述的快速搜索算法,并且,隨后在解碼器重新定標(biāo)重構(gòu)的系數(shù)。此外,可以開發(fā)一種量化"局外者"的快速方法。對(duì)于給定速度R比特/維(1</<7),可以如下量化每個(gè)8維系數(shù)向量<formula>formulaseeoriginaldocumentpage21</formula>1)將一個(gè)小偏移量《=2-6應(yīng)用到向量x的每個(gè)分量,以避開截?cái)郪oronoi區(qū)域的邊界上的任何點(diǎn)陣點(diǎn),即;c,=;c-a,其中a=(2"6,2"6,2_6,2-6,2"6,2-6,2_6,2-6)。2)用定標(biāo)因數(shù)a定標(biāo)向量^^-ar,。對(duì)于給定的速度R,按經(jīng)驗(yàn)選擇最佳定標(biāo)因數(shù),并在下面的表2中示出。表2用于高速量化器的定標(biāo)因數(shù)<table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table>3)尋找最靠近定標(biāo)向量A的i^的點(diǎn)陣點(diǎn)v。這可以利用Conway和Sloane中所述的搜索算法進(jìn)行。4)假設(shè)v是以給定速度R截?cái)嗟腣oronoi區(qū)域中的碼向量,并計(jì)算v的索引向量A-(mmit7,it8),其中02夂S2"和Z-l,2,…8。索引A由公式8給出A=(vG-1)modulorr=2&公式8其中G是Z)s的生成器矩陣,并且定義如下<formula>formulaseeoriginaldocumentpage22</formula>公式9<formula>formulaseeoriginaldocumentpage23</formula>公式IO5)利用Conway等描述的算法,從索引向量A計(jì)算碼向量》然后與v比較。如果^和v嚴(yán)格相同,那么&是對(duì)&的最好碼向量的索引,并在這里停止。否則,輸入向量A是一個(gè)局外者,并可以通過(guò)以下步驟量化。6)用2除以向量X2:jc2=x2/2。7)尋找最靠近^的Z)s的點(diǎn)陣點(diǎn)w,然后計(jì)算"的索引向量》8)從索引向量7尋找碼向量》然后將^與w比較。如果j與"不同,那么重復(fù)步驟6)至8)。否則,計(jì)算w-;c/16。由于MLT系數(shù)的歸一化,執(zhí)行少量的重復(fù)就可以在截?cái)帱c(diǎn)陣中找到一個(gè)對(duì)局外者的碼向量。9)計(jì)算X2-^+W。10)找到最靠近A的Ds的點(diǎn)陣點(diǎn)M,然后計(jì)算"的索引向量》11)從索引向量J發(fā)現(xiàn)碼向量》然后將^與"比較。如果y和"嚴(yán)格相同,那么^=/并重復(fù)步驟9)至ll)。否則,A:是對(duì)A的最好碼向量,并停止。高速量化器的解碼過(guò)程可以如下進(jìn)行1)根據(jù)給定的速度i,從索引向量^尋找碼向量》2)用前面表2中給出的定標(biāo)因數(shù)"給碼向量;;重新定標(biāo)^=y/。3)將量化處理的步驟1)中使用的同樣的偏移a加到重新定標(biāo)的碼向量力少2-少i+a,然后停止。低速量化可以提供基于所謂的旋轉(zhuǎn)Gosset點(diǎn)陣/^s的低速量化器以1比特/系數(shù)的速度量化歸一化的MLT系數(shù)。點(diǎn)陣Ms是由落在圓心在原點(diǎn)上、半徑為2V^"的同心球面上的點(diǎn)組成的,其中f0,1,2,3,...。球面上的點(diǎn)的集構(gòu)成球面碼,并且可以用作量化碼本。在低速量化器中,碼本是由落在r=l的球面上的i^的全部240個(gè)點(diǎn),和不屬于點(diǎn)陣/^s的16個(gè)附加點(diǎn)構(gòu)成的。附加點(diǎn)是通過(guò)排列兩個(gè)向量的分量(-2,0,0,0,0,0,0,0)和(2,0,0,0,0,0,0,0)得至U的,并用于量化靠近原點(diǎn)的輸入向量。為了開發(fā)快速索引算法,用一種特殊次序排列碼本的碼向量,并在下面的表3中示出。對(duì)于每個(gè)8維系數(shù)向量^0,,:C2,^,^;C5,^—,X8),可以如下執(zhí)行量化1)將偏移^2"^應(yīng)用到向量c的每個(gè)分量;c,;c-",其中<3=(2-6,2-6,2"6,2-6,2-6,2,2—6,2-6)。2)用定標(biāo)因數(shù)a定標(biāo)向量x,:^-a^。將最佳定標(biāo)因數(shù)經(jīng)驗(yàn)地選擇為a=1.25。3)通過(guò)用遞降順序給x2的分量重新排序獲得新的向量、。4)在表4中找到就均方根誤差(MSE)而言的^的最匹配的向量/。下面表4中給出的向量被稱為碼向量的引導(dǎo)部分(leader),并且碼本中的任何碼向量都可以通過(guò)它的引導(dǎo)部分的排列產(chǎn)生。5)通過(guò)以原始順序給/的分量重新排序,得到最好碼向量》6)在下面的表5中找到/的標(biāo)記向量,然后通過(guò)以原始順序給標(biāo)記向量的分量重新排列,得到向量"標(biāo)記向量定義如下如果引導(dǎo)部分是由-2,2和0組成的,那么用l指示-2和2,并且用0指示0;如果引導(dǎo)部分是由-l和l組成的,那么用l指示-l,并用0指示1。7)在下面的表6中尋找有關(guān)引導(dǎo)部分/索引偏移《。8)如果引導(dǎo)部分/是(2,0,0,0,0,0,0,-2)和碼向量y具有索引低于分量-2的索引的分量2,那么將偏移《調(diào)節(jié)為AT-尺+28。9)計(jì)算向量點(diǎn)積f=z//,其中;=(1,2,4,8,16,32,64,128)。10)在表7中從f找到有關(guān)碼向量y的索引增量_/。11)計(jì)算碼向量少的索引h&=i^/,然后停止。在低速量化器的解碼過(guò)程中可以采用以下步驟1)在表3中從接收的索引^找到碼向量》2)通過(guò)定標(biāo)因數(shù)a-1.5給碼向量少重新定標(biāo)"-y/"。3)將解碼過(guò)程的步驟1)使用的相同的偏移a加到重新定標(biāo)的碼向量然后停止。表3低速量化器(LRQ)的碼本<table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table>表4LRQ的碼向量的引導(dǎo)部分<table>tableseeoriginaldocumentpage26</column></row><table>表5<table>tableseeoriginaldocumentpage26</column></row><table><table>tableseeoriginaldocumentpage27</column></row><table>表6用于索引LRQ的碼向量的有關(guān)引導(dǎo)部分的索E<table>tableseeoriginaldocumentpage27</column></row><table>表7有關(guān)LRQ的碼向量的索引增量<table>tableseeoriginaldocumentpage28</column></row><table>量化索引的霍夫曼編碼MLT系數(shù)不是均勻分布的。已經(jīng)觀察到8維系數(shù)向量具有在原點(diǎn)周圍的高度集中的概率。因此,點(diǎn)陣向量量化器的碼本對(duì)于非均勻源不是最佳的。為了改進(jìn)上述高速量化器的特性,可以使用霍夫曼編碼器對(duì)量化的索引編碼。由于低速(<2比特/取樣)編碼,大多數(shù)對(duì)應(yīng)于14-22kHz頻帶的"超額(extra)"子幀不被高速量化器量化。因此,霍夫曼編碼不用于超額子幀。對(duì)于給定速度R比特/維(1</<6),通過(guò)高速量化器量化8維系數(shù)向量x,并且在(^、<2",/=1,2,...8得到最佳碼向量的索引向量A:=(m、,H^,、)。然后,根據(jù)表8-11對(duì)A:的分量進(jìn)行霍夫曼編碼。通過(guò)使用霍夫曼編碼,用可變數(shù)量比特為量化索引進(jìn)行了編碼。對(duì)于給定速度A較多的頻率索引需要低于A的比特,和較少的頻率索引可能需要大于/的比特。因此,在霍夫曼編碼之后碼長(zhǎng)被改變,并且在一個(gè)幀中使用了三個(gè)標(biāo)記比特來(lái)指示是否將霍夫曼編碼應(yīng)用到頭三個(gè)子幀組中的每一個(gè)。標(biāo)記比特作為輔助信息發(fā)送到解碼器。對(duì)于一個(gè)子幀組,只有在使用霍夫曼編碼需要的比特?cái)?shù)不大于可用于這個(gè)組的比特的總數(shù)的時(shí)侯,才對(duì)量化索引進(jìn)行霍夫曼編碼。在這種情況下,將霍夫曼編碼標(biāo)記設(shè)置到l。但是,對(duì)于打擊樂(lè)器類型信號(hào),不再對(duì)量化索引使用霍夫曼編碼。量化索引被直接發(fā)送到解碼器。在解碼器,檢査霍夫曼編碼標(biāo)記。如果設(shè)置了一個(gè)子幀組的霍夫曼編碼標(biāo)記,那么對(duì)這個(gè)組的編碼數(shù)據(jù)進(jìn)行霍夫曼解碼,以獲得量化索引。否則,將編碼數(shù)據(jù)直接用作量化索引。表8具有2比特/維的速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage29</column></row><table>具有3比特/維的速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table>表10具有4比特/維的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table>表11具有5比特/維速度的HRQ的量化索引的霍夫曼代碼<table>tableseeoriginaldocumentpage30</column></row><table><table>tableseeoriginaldocumentpage31</column></row><table>通過(guò)編碼器產(chǎn)生的比特流圖3A示出了根據(jù)本發(fā)明實(shí)施例的編碼比特流的例子。在一個(gè)實(shí)施例中,一個(gè)幀中的比特總數(shù)是640,960和1280比特,分別對(duì)應(yīng)于32kbps,48kbps,和64kbps的比特率。在信道上發(fā)送的比特流可以包括3個(gè)部分標(biāo)記比特,范數(shù)代碼比特,和MLT系數(shù)的代碼比特。標(biāo)記比特可以首先發(fā)送,接下來(lái)是范數(shù)代碼比特,最后是用于MLT系數(shù)的代碼比特。標(biāo)記部分302包含多個(gè)用于各種不同目的的標(biāo)記比特。在本例中,標(biāo)記比特可以包括用于指示當(dāng)前幀的模式和發(fā)送到解碼器的模式標(biāo)記。例如,模式標(biāo)記可以用于指示打擊樂(lè)器類型信號(hào)模式。作為另一個(gè)例子,模式標(biāo)記可以用于指示語(yǔ)音和一般音樂(lè)。標(biāo)記也可以包括用于指示有多少以32kbps編碼的子幀并且作為輔助信息發(fā)送到解碼器的標(biāo)記。下一部分具有固定的長(zhǎng)度。在本例中,它具有四個(gè)比特。四個(gè)比特用于指示是否將霍夫曼編碼用于范數(shù),組1系數(shù)索引,組2系數(shù)索引,和組3系數(shù)索引。組4一般不使用霍夫曼編碼,因?yàn)榻M4一般只有很少的比特,并且霍夫曼編碼一般不減少比特需求。比特流可以進(jìn)一步包括所有子幀的范數(shù)代碼比特304。如果沒(méi)有使用霍夫曼編碼,那么長(zhǎng)度是固定的。在這個(gè)例子中,固定長(zhǎng)度是170比特(34范數(shù)x5比特每范數(shù))。如果使用了霍夫曼編碼,那么長(zhǎng)度是由霍夫曼編碼確定的。比特流可以進(jìn)一步包括用于組1-4的編碼系數(shù)索引306。分配給每個(gè)組或每個(gè)系數(shù)的比特的數(shù)量是可以變化的。它們是根據(jù)每個(gè)子幀的范數(shù)通過(guò)比特分配確定的。組1-3的索引也可能依賴是否使用了霍夫曼編碼。組4的索引一般不使用霍夫曼編碼。但是,分配給組4的比特的數(shù)量仍然是可能改變的,因?yàn)槠渌糠值谋忍財(cái)?shù)可以改變。當(dāng)其他組由于霍夫曼編碼而使用較少的比特時(shí),那些省下的比特可以用于組4。圖3B示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的標(biāo)記比特302的示例結(jié)構(gòu)。在本例中,標(biāo)記比特302可以包括指示當(dāng)前幀的模式并且發(fā)送到解碼器的標(biāo)記M308。在打擊樂(lè)器類型信號(hào)模式中,只有模式標(biāo)記308可以發(fā)送,其他標(biāo)記不需要發(fā)送。在語(yǔ)音和一般音樂(lè)模式中,所有的標(biāo)記都可以發(fā)送。標(biāo)記比特302可以進(jìn)一步包括用于指示有多少子幀要以低速(例如,32kbps)編碼的標(biāo)記L310。標(biāo)記比特302可以進(jìn)一步包括指示范數(shù)是否被霍夫曼編碼的標(biāo)記N312。標(biāo)記比特302可以進(jìn)一步包括指示每個(gè)MLT系數(shù)的組(在本例中,組1到組3)是否被霍夫曼編碼的標(biāo)記Gl到G3。圖3C示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的用系數(shù)代碼比特306量化的(和可能霍夫曼編碼的)變換系數(shù)的組合集的示例結(jié)構(gòu)。在本例中,邊界頻率是大約7kHz。長(zhǎng)幀變換系數(shù)320代表高達(dá)大約7kHz的頻率。短幀變換系數(shù)322代表從大約6.8kHz到大約22kHz的頻率。長(zhǎng)幀變換和短幀變換可以在它們的邊界上重疊,以使過(guò)渡更平滑。圖3D示出了根據(jù)本發(fā)明另一個(gè)實(shí)施例的以系數(shù)代碼比特306量化的(可能霍夫曼編碼的)變換系數(shù)的組合集的另一個(gè)示例結(jié)構(gòu)。在本例中,邊界頻率是大約800Hz。長(zhǎng)幀變換系數(shù)324代表高達(dá)大約800Hz的頻率。短幀變換系數(shù)326代表從大約600Hz到大約22kHz的頻率。長(zhǎng)幀變換和短幀變換可以在它們的邊界重疊,以使過(guò)渡更為平滑。編碼器處理過(guò)程現(xiàn)在參考圖4,圖4示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的整個(gè)編碼處理的示例處理流程圖。編碼處理過(guò)程在步驟400開始。在步驟410,可以對(duì)音頻信號(hào)使用兩個(gè)MLT變換,以便使音頻取樣及時(shí)地轉(zhuǎn)換成變換系數(shù)的幀。長(zhǎng)幀變換系數(shù)用于低頻的信號(hào)(例如,大約20Hz到大約7kHz),而短幀變換系數(shù)用于高頻信號(hào)(例如,大約6.8kHz到大約22kHz)??梢詫LT系數(shù)劃分成具有34個(gè)子幀的4個(gè)組。在步驟420,計(jì)算每個(gè)子幀的范數(shù),并且用固定的比特?cái)?shù)量化。然后,每個(gè)子幀通過(guò)它的量化的范數(shù)規(guī)格化,并且得到規(guī)格化的變換系數(shù)??梢詫?duì)所有量化范數(shù)嘗試霍夫曼編碼。如果使用的比特?cái)?shù)少于分配給范數(shù)量化的總比特?cái)?shù),那么可使用霍夫曼編碼。設(shè)置霍夫曼標(biāo)記(標(biāo)記N),并將超額比特存儲(chǔ)在比特剩余中。如果使用的比特?cái)?shù)不低于分配給范數(shù)量化的總比特?cái)?shù),那么不使用霍夫曼編碼,并且清除霍夫曼標(biāo)記。比特剩余是總比特?cái)?shù)減去6個(gè)標(biāo)記比特和范數(shù)用去的比特。在步驟430,可以使用自適應(yīng)比特分配方案,以在子幀之間分配幀中可用的比特。首先,將每個(gè)子幀中所有比特設(shè)置到零(總共有34個(gè)子幀),并且將比特剩余設(shè)置到總可用比特。接下來(lái),找到子幀的最大范數(shù),并且給子幀中每個(gè)系數(shù)分配1比特,總共是M比特;那么,假設(shè)它的范數(shù)=范數(shù)/2,比特剩余-比特剩余-M。對(duì)于具有16個(gè)系數(shù)的子幀,M=16,對(duì)于具有24或32個(gè)系數(shù)的子幀,M分別是24或32。如果比特剩余小于16,那么停止分配;否則重復(fù)最后步驟。當(dāng)進(jìn)行了比特分配時(shí),比特剩余少于16。一些子幀的每個(gè)系數(shù)分配了幾個(gè)比特;其他的可能具有零比特。在決定步驟440中,如果每個(gè)系數(shù)的比特大于1,那么可以通過(guò)點(diǎn)陣i^進(jìn)行量化,步驟450中的高速量化;否則,在步驟460中通過(guò)利用點(diǎn)陣及&的低速量化進(jìn)行量化?,F(xiàn)在已經(jīng)知道分配給每個(gè)組的比特。在步驟470,可以對(duì)每個(gè)子幀的量化的系數(shù)有選擇地嘗試進(jìn)行霍夫曼編碼。將前三個(gè)組的每個(gè)組所需的比特總數(shù)相加。如果霍夫曼編碼的比特少于分配的比特,那么可以對(duì)該組使用霍夫曼編碼,并且設(shè)置該組的霍夫曼代碼標(biāo)記;并且將節(jié)省的比特分配到剩余比特。如果霍夫曼編碼比特不少于固定的分配比特,那么不使用霍夫曼編碼,并清除霍夫曼代碼標(biāo)記。根據(jù)上述的比特分配方案,將剩余比特分配到下一個(gè)組。分配所有比特,并且在步驟480結(jié)束該處理過(guò)程。形成比特流并且可以發(fā)送??梢詫?duì)結(jié)合圖4說(shuō)明的示例編碼器處理進(jìn)行各種修改。根據(jù)本發(fā)明的一些實(shí)施例,雙變換可以是任選的。根據(jù)本發(fā)明的其他實(shí)施例,可以有少于兩個(gè)或多于兩個(gè)的變換。此外,并如上所述,可以使用任何類型的變換,例如MLT、FFT、DCT、等等。解碼器處理過(guò)程解碼器基本上以與編碼器相反的順序處理編碼比特流??偙忍厥且阎牟⑶沂峭耆恢碌?。在解碼器,可以檢查數(shù)據(jù)完整性和解碼協(xié)議,以保證將適當(dāng)?shù)慕獯a器用于比特流。一旦解碼器驗(yàn)證用根據(jù)上述示例的編碼器對(duì)比特流進(jìn)行了編碼,那么它對(duì)比特流進(jìn)行解碼,如圖5中所示并說(shuō)明如下在接收到輸入到解碼器的編碼比特流時(shí),處理流程在步驟500開始。在步驟510,檢查標(biāo)記比特。例如,確定前三個(gè)組的范數(shù)或系數(shù)索引是否受到霍夫曼編碼。如果設(shè)置了霍夫曼代碼標(biāo)記,那么在步驟520對(duì)范數(shù)的量化索引進(jìn)行霍夫曼解碼。在對(duì)所有范數(shù)進(jìn)行解碼之后,知道了范數(shù)使用的總比特。也知道了作為剩余比特的用于編碼系數(shù)索引的比特?cái)?shù)。如果沒(méi)有設(shè)置霍夫曼代碼標(biāo)記,則在步驟530使用固定速度。知道了范數(shù)使用的比特?cái)?shù)。知道了系數(shù)索引的比特總數(shù)。在步驟530中,通過(guò)去量化量化索引得到量化范數(shù)。從量化范數(shù),可以執(zhí)行自適應(yīng)比特分配540,與圖4中方框430的操作相同,以確定哪個(gè)子幀具有多少比特。如果為一個(gè)組設(shè)置了霍夫曼標(biāo)記,那么接收的數(shù)據(jù)是霍夫曼代碼,并且必須對(duì)該組內(nèi)每個(gè)子幀進(jìn)行解碼。如果沒(méi)有設(shè)置霍夫曼標(biāo)記,那么接收的數(shù)據(jù)是系數(shù)的量化索引。在步驟560中,從量化范數(shù)和量化索引,可以重構(gòu)MLT系數(shù)。對(duì)于沒(méi)有分配任何比特的子幀,它們的MLT系數(shù)可以填充零,或用隨機(jī)數(shù)產(chǎn)生??梢曰謴?fù)一個(gè)長(zhǎng)變換的低頻系數(shù)和四個(gè)短變換的高頻系數(shù)。長(zhǎng)變換中的高頻可以用零填充;同樣,四個(gè)短變換的低頻可以填充零。沿高頻和低頻的邊界,可以使用某種形式的平滑過(guò)渡。例如,一種最簡(jiǎn)單的平滑函數(shù)是邊界附近少數(shù)幾個(gè)系數(shù)上的漸變斜率。一旦重構(gòu)了長(zhǎng)變換和四個(gè)短變換的所有系數(shù),它們可以被逆變換到數(shù)字音頻取樣。在步驟570,對(duì)長(zhǎng)李換和四個(gè)短變換執(zhí)行從頻域到時(shí)域的逆變換。例如,可以使用雙IMLT來(lái)重構(gòu)MLT系數(shù)?,F(xiàn)在有兩個(gè)數(shù)字音頻信號(hào),每個(gè)覆蓋相同的20ms時(shí)幀。在步驟580,將兩個(gè)時(shí)域信號(hào)組合,以形成一個(gè)單一的音頻信號(hào)??梢詫⑿盘?hào)轉(zhuǎn)換成模擬信號(hào)并作為聲音再現(xiàn)??梢酝ㄟ^(guò)硬件、軟件、固件、或任何上述的組合執(zhí)行本發(fā)明的各個(gè)實(shí)施例的方法。例如,該方法可以通過(guò)編碼器或解碼器或其他處理器在諸如電話會(huì)議系統(tǒng)或視頻會(huì)議系統(tǒng)之類的音頻系統(tǒng)中執(zhí)行這些方法。此外,本發(fā)明的各個(gè)實(shí)施例的方法可以應(yīng)用到流動(dòng)音頻,例如,經(jīng)過(guò)互聯(lián)網(wǎng)。圖6示出了根據(jù)本發(fā)明的各個(gè)實(shí)施例的編碼器。圖7示出了根據(jù)本發(fā)明的各個(gè)實(shí)施例的解碼器。在一些實(shí)施例中,編碼器和解碼器可以是分離的,或在其他實(shí)施例中它們可以組合成一個(gè)編解碼器。在圖6的編碼器中,可以將數(shù)字取樣的輸入音頻信號(hào)饋送到至少兩個(gè)變換模塊610和620中,以使音頻取樣及時(shí)轉(zhuǎn)換成變換系數(shù)的幀。在其它實(shí)施例中,可以將輸入音頻信號(hào)饋送到單變換。為了便于敘述,將變換模塊610和620稱為MLT模塊,雖然可以使用其它類型的變換模塊。在一個(gè)實(shí)施例中,每20ms,可以將最近的1920個(gè)音頻取樣饋送到變換模塊610,和每5ms,將最近的480個(gè)音頻取樣饋送到變換模塊620。長(zhǎng)幀變換模塊610可以產(chǎn)生大約960個(gè)系數(shù)的集,而短幀變換模塊620可以產(chǎn)生各大約為240個(gè)系數(shù)的四個(gè)集。長(zhǎng)幀變換系數(shù)可以用于低頻信號(hào),而短幀變換系數(shù)可以用于高頻信號(hào)。例如,在一個(gè)實(shí)施例中,長(zhǎng)幀變化系數(shù)代表大約20Hz至大約7kHz之間的頻率,而短幀變換系數(shù)代表大約6.8kHz至大約22kHz之間的頻率。在另一個(gè)實(shí)施例中,可以任選地提供模塊630,以指示打擊樂(lè)器類型信號(hào)的存在。如果檢測(cè)到打擊樂(lè)器類型信號(hào),那么可以將指示打擊樂(lè)器類型模式的模式標(biāo)記發(fā)送到多路復(fù)用器695以傳輸。如果檢測(cè)到打擊樂(lè)器類型信號(hào),那么可以將邊界頻率調(diào)節(jié)到大約800Hz。在這種情況下,雙變換系數(shù)是代表高達(dá)800Hz的頻率的長(zhǎng)變換系數(shù)和代表600Hz以上頻率的短變換系數(shù)的組合。在其他實(shí)施例中,邊界頻率可以是7kHz,或大約800Hz和大約7kHz之間的任何頻率。長(zhǎng)幀變換系數(shù)和短幀變換系數(shù)是通過(guò)組合器模塊640組合的。組合的系數(shù)被應(yīng)用到范數(shù)量化模塊650,范數(shù)量化模塊650計(jì)算和量化每個(gè)子幀的范數(shù)。將編碼模塊670應(yīng)用于范數(shù)的量化索引。編碼模塊可以任選地執(zhí)行霍夫曼編碼。得到的范數(shù)代碼比特被饋送到多路復(fù)用器695。也可以將霍夫曼代碼標(biāo)記饋送到多路復(fù)用器695,以指示范數(shù)是否被霍夫曼編碼。將來(lái)自范數(shù)量化模塊650的量化范數(shù)和來(lái)自組合器模塊640的組合MLT系數(shù)饋送到規(guī)格化MLT系數(shù)的規(guī)格化模塊660。也可以將量化范數(shù)饋入到在子幀之間的幀中分配可用比特的自適應(yīng)比特分配模塊675。隨著比特分配的完成,接下來(lái),可以通過(guò)點(diǎn)陣向量量化模塊680—幀接一幀地量化歸一化的MLT系數(shù)。如果每個(gè)系數(shù)的比特大于1,那么可以通過(guò)高速量化器進(jìn)行量化,否則,可以通過(guò)低速量化器進(jìn)行量化。如果沒(méi)有檢測(cè)到打擊樂(lè)器類型信號(hào),那么可以將最大量化速度設(shè)定到5比特每個(gè)系數(shù)??梢詫⒒舴蚵幋a模塊685任選地應(yīng)用到MLT系數(shù)的量化索引。但是,對(duì)于打擊樂(lè)器類型信號(hào),不將霍夫曼編碼模塊685應(yīng)用于MLT系數(shù)的量化索引。得到的霍夫曼代碼比特從霍夫曼編碼模塊685饋送到比較和數(shù)據(jù)選擇模塊690。比較和數(shù)據(jù)選擇模塊690比較從量化模塊680輸出的量化索引和從霍夫曼編碼模塊685輸出的霍夫曼代碼。對(duì)于前三個(gè)子幀組的每個(gè)組,如果霍夫曼編碼的比特少于分配比特,那么可以為該組選擇霍夫曼編碼的比特,并且設(shè)置該組的霍夫曼代碼標(biāo)記;和把節(jié)省的比特分配給剩余比特。如果霍夫曼編碼的比特不小于固定的分配比特,那么為該組選擇量化索引,并清除該組的霍夫曼代碼標(biāo)記。將選擇的MLT代碼比特與任何霍夫曼代碼標(biāo)記一起饋送到多路復(fù)用器695。形成比特流并且能夠被發(fā)送。圖7的解碼器可以操作以從編碼比特流重構(gòu)音頻信號(hào)。將編碼比特流提供到去多路復(fù)用器710,去多路復(fù)用器710將數(shù)據(jù)去多路復(fù)用為范數(shù)代碼比特、MLT代碼比特、和各種標(biāo)記,例如,模式標(biāo)記、用于以32kbit/s編碼的子幀數(shù)量的標(biāo)記、范數(shù)的霍夫曼代碼標(biāo)記、和每個(gè)MLT系數(shù)的組的霍夫曼代碼標(biāo)記、等等。盡管可以使用其他類型的變換模塊,為了便于參考,在本例中使用了標(biāo)示MLT代碼比特和MLT系數(shù)。范數(shù)代碼比特被饋送到解碼模塊720,解碼模塊720對(duì)子幀范數(shù)的量化索引進(jìn)行解碼。如果霍夫曼代碼標(biāo)記(標(biāo)記N)指出使用了霍夫曼編碼對(duì)范數(shù)進(jìn)行編碼,那么可以使用霍夫曼解碼。然后,去量化模塊725對(duì)子幀范數(shù)進(jìn)行去量化??梢允褂米赃m應(yīng)比特分配模塊730在子幀之間分配幀中的可用比特。將MLT代碼比特從去多路復(fù)用器710饋送到解碼模塊735,解碼模塊735給MLT系數(shù)的量化索引解碼。如果任何霍夫曼代碼標(biāo)記指出使用了霍夫曼編碼對(duì)任何MLT系數(shù)組進(jìn)行了編碼,那么可以使用霍夫曼解碼。如果沒(méi)有霍夫曼代碼標(biāo)記指示使用了霍夫曼編碼法對(duì)任何MLT系數(shù)組編碼,那么量化索引通過(guò)到去量化模塊740。因此,將解碼的MLT代碼比特或MLT系數(shù)的量化索引饋入到去量化模塊740,去量化模塊740對(duì)MLT系數(shù)進(jìn)行去量化。重構(gòu)模塊745可以從量化的范數(shù)和量化索引重構(gòu)MLT系數(shù)。分離器模塊750將MLT系數(shù)分離成MLT系數(shù)的一個(gè)長(zhǎng)幀,和四個(gè)短幀MLT系數(shù)集。將長(zhǎng)幀逆變換模塊760應(yīng)用于長(zhǎng)幀MLT系數(shù)集,并且將短幀逆變換模塊770應(yīng)用于四個(gè)短幀MLT系數(shù)集。逆變換模塊760和770可以包括逆調(diào)制重迭變換(IMLT)模塊。將得到的時(shí)域信號(hào)相加,導(dǎo)致可以從數(shù)字轉(zhuǎn)換到模擬并且作為聲音再現(xiàn)的輸出音頻信號(hào)??梢栽诟鱾€(gè)領(lǐng)域中找到本發(fā)明各個(gè)實(shí)施例的有效應(yīng)用,例如音頻會(huì)議,視頻會(huì)議,和流媒體,包括流音樂(lè)或語(yǔ)音?,F(xiàn)在參考圖8,圖8示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的示例會(huì)議系統(tǒng)的方框圖。該系統(tǒng)包括可以操作以經(jīng)過(guò)網(wǎng)絡(luò)850與一個(gè)或更多遠(yuǎn)端終端840通信的本地終端810。通信可以包括音頻、視頻、和數(shù)據(jù)的交換。熟悉本領(lǐng)域的人員應(yīng)當(dāng)知道,視頻能力是可選的,并且終端810可以是沒(méi)有視頻能力的音頻會(huì)議裝置。例如,終端810可以包括喇叭擴(kuò)音器,或其他音頻會(huì)議裝置。同樣,每個(gè)遠(yuǎn)端終端840可以包括音頻會(huì)議裝置或視頻會(huì)議裝置。本地終端810包括音頻編解碼器812,和音頻I/0接口814。音頻編解碼器812可以包括諸如圖6的編碼器之類的編碼器。音頻編解碼器可以進(jìn)一步包括諸如圖7的解碼器之類的解碼器。音頻I/O接口814可以執(zhí)行模-數(shù)和數(shù)-模轉(zhuǎn)換,以及與處理從一個(gè)或更多話筒816接收的或發(fā)送到一個(gè)或更多揚(yáng)聲器818的音頻信息結(jié)合的其他信號(hào)處理任務(wù)。一個(gè)或更多話筒816可以包括帶有智能話筒混合和動(dòng)態(tài)降噪功能的選通話筒。在一些實(shí)施例中,一個(gè)或更多話筒816可以與終端810集成為一體,或它們可以是從終端810分離的,或是組合的。同樣,一個(gè)或更多揚(yáng)聲器818可以與終端810集成為一體,或與終端810分離,或組合。如果它們是與終端810分離的,那么話筒816和揚(yáng)聲器818可以經(jīng)過(guò)有線連接或無(wú)線連接發(fā)送和接收信息。本地終端810可以捕獲通過(guò)一個(gè)或更多話筒816產(chǎn)生的音頻信息(一般代表本地會(huì)議參與者的語(yǔ)音或聲音)。本地終端810數(shù)字化和處理捕獲的音頻信息。將音頻編碼和經(jīng)過(guò)網(wǎng)絡(luò)接口820發(fā)送到一個(gè)或更多遠(yuǎn)端終端840。終端810可以從遠(yuǎn)端會(huì)議終端840接收音頻信息(一般代表遠(yuǎn)端會(huì)議參與者的語(yǔ)音和聲音)。接收的音頻信息是通過(guò)網(wǎng)絡(luò)接口820接收的。將接收的音頻信息解碼、處理、轉(zhuǎn)換成模擬信號(hào),并經(jīng)過(guò)一個(gè)或更多揚(yáng)聲器818作為音頻再現(xiàn)。在一些實(shí)施例中,終端可以任選地包括視頻能力。在這樣的實(shí)施例中,終端810可以包括視頻編解碼器822,視頻I/O接口824,一個(gè)或更多視頻攝像機(jī)826,和一個(gè)或更多顯示裝置828。一個(gè)或更多的攝像機(jī)826可以與終端810—體,或與終端810分離,或組合。同樣,一個(gè)或更多顯示裝置828可以與終端810—體,或與終端810分離,或組合。在具有視頻能力的實(shí)施例中,終端810可以捕獲一個(gè)或更多攝像機(jī)826產(chǎn)生的視頻信息(一般代表本地會(huì)議參與者的圖像)。終端810處理捕獲的視頻信息,并將處理的信息經(jīng)過(guò)網(wǎng)絡(luò)接口820發(fā)送到一個(gè)或更多遠(yuǎn)端終端840。視頻輸入/輸出接口轉(zhuǎn)換和處理從一個(gè)或更多攝像機(jī)826接收的視頻信息,并發(fā)送到一個(gè)或更多視頻監(jiān)視器828。視頻編解碼器824編碼和解碼視頻信息。終端810可以接收來(lái)自遠(yuǎn)端終端840的視頻信息(一般代表遠(yuǎn)端會(huì)議參與者的圖像)。終端810處理接收的視頻信息,并將處理的視頻信息導(dǎo)向一個(gè)或更多顯示裝置828。終端810也可以從其他周圍裝置接收輸入,或直接輸出到其他周圍裝置,例如,視頻磁帶播放機(jī)/錄像機(jī),文件攝像機(jī),或LCD投影機(jī),等等。終端810的各個(gè)組件可以通過(guò)至少一條總線830相互連接,以便相互通信。終端810的組件也可以包括中央處理單元(CPU)832。CPU832解釋和執(zhí)行可以從存儲(chǔ)器834裝載的程序指令??梢园ㄒ资訰AM、非易失性ROM、和/或諸如磁盤驅(qū)動(dòng)器或CD-ROM之類的存儲(chǔ)裝置的存儲(chǔ)器834存儲(chǔ)可執(zhí)行程序、數(shù)據(jù)文件、和其他信息。在終端810中可以具有附加的組件和部件。例如,終端810可以包括回波消除或降低以允許全雙工操作的模塊。一個(gè)或更多遠(yuǎn)端終端840可以包括與前面參考本地終端810說(shuō)明的類似的組件。網(wǎng)絡(luò)850可以包括PSTN(公共交換電話網(wǎng)),或基于IP的網(wǎng)絡(luò)。盡管圖示和說(shuō)明了本發(fā)明的示例實(shí)施例,應(yīng)當(dāng)知道可以進(jìn)行各種不同的改變而不脫離本發(fā)明的精神和范圍。已經(jīng)借助參考示例實(shí)施例說(shuō)明了本發(fā)明。熟悉本領(lǐng)域的人員應(yīng)當(dāng)知道,可以對(duì)這些示例實(shí)施例進(jìn)行各種修改,而不脫離本發(fā)明的精神和范圍。此外,盡管已經(jīng)在其特定環(huán)境下和特定應(yīng)用下的具體實(shí)現(xiàn)的情況下說(shuō)明了本發(fā)明,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)知道,本發(fā)明的用途不限于此,而是本發(fā)明可以有利地應(yīng)用到任何數(shù)量的環(huán)境和實(shí)現(xiàn)。因此上述說(shuō)明和附圖只是為了說(shuō)明的目的而沒(méi)有限制的意思。權(quán)利要求1.一種在對(duì)音頻信號(hào)編碼中使用的量化方法,所述方法包括從截?cái)帱c(diǎn)陣構(gòu)造碼本,其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣,所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo);和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。2.根據(jù)權(quán)利要求1所述的方法,其中量化局外者源向量的操作包括(a)按一半來(lái)定標(biāo)每個(gè)局外者源向量,以形成定標(biāo)的局外者源向量;(b)確定與定標(biāo)的局外者向量最近的點(diǎn)陣點(diǎn)M;(c)計(jì)算M的索引向量y';(d)從索引向量_/確定碼向量"(e)將y與"進(jìn)行比較;(f)如果7與w不同,則重復(fù)步驟(a)至(e)的操作;(g)將定標(biāo)的局外者源向量的十六分之一加到定標(biāo)的局外者源向量,以形成新的定標(biāo)的局外者源向量;(h)重復(fù)步驟(b)至(e)的操作;(i)如果y與"相同,重復(fù)步驟(g)至(h)。3.根據(jù)權(quán)利要求1所述的方法,其中所述點(diǎn)陣包括8維的D8點(diǎn)陣。4.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括-量化的可變比特長(zhǎng)度編碼索引。5.—種在對(duì)音頻信號(hào)編碼中使用的量化方法,所述方法包括-從點(diǎn)陣構(gòu)造碼本,所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣;和量化源向量。6.根據(jù)權(quán)利要求5所述的方法,其中量化操作包括-(a)偏移和定標(biāo)源向量;(b)按降序?qū)Χ?biāo)的源向量的分量進(jìn)行重排序;(c)根據(jù)均方差來(lái)確定重排序向量的引導(dǎo)向量/;(d)按定標(biāo)的源向量的分量的原始順序來(lái)排列引導(dǎo)向量/的分量的順序,以獲得碼向量"(e)確定引導(dǎo)向量/的標(biāo)記向量;(f)通過(guò)按原始順序排列標(biāo)記向量的分量的順序來(lái)獲得向量z;(g)確定與引導(dǎo)向量/有關(guān)的索引偏移《;(h)如果引導(dǎo)向量/是(2,0,0,0,0,0,0,-2)且碼向量少包括索引低于分量-2的索引的分量2,則將偏移尺調(diào)節(jié)為《=《+28;(i)計(jì)算向量點(diǎn)積/=z;/,其中p=(1,2,4,8,16,32,64,128);(j)確定與碼向量y有關(guān)的索引增量》(k)計(jì)算碼向量y的索引h其中^:=尺+乂。7.根據(jù)權(quán)利要求5所述的方法,其中所述點(diǎn)陣包括旋轉(zhuǎn)Gosset點(diǎn)陣瑪。8.—種在對(duì)音頻信號(hào)編碼中使用的量化方法,所述方法包括-使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化變換系數(shù);和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化變換系數(shù)。9.根據(jù)權(quán)利要求8所述的方法,其中使用第一點(diǎn)陣向量量化器的操作包括從截?cái)帱c(diǎn)陣構(gòu)造碼本,其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣,所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo);和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。10.根據(jù)權(quán)利要求8所述的方法,其中使用第二點(diǎn)陣向量量化器的操作包括從點(diǎn)陣構(gòu)造碼本,所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣;禾口量化源向量。11.根據(jù)權(quán)利要求8所述的方法,進(jìn)一步包括針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)的量化的可變比特長(zhǎng)度編碼索引。12.—種對(duì)音頻信號(hào)進(jìn)行編碼的方法,所述方法包括將音頻信號(hào)的取樣組從時(shí)域變換到頻域,以形成變換系數(shù)的幀;將變換系數(shù)的每一幀分成多個(gè)組,其中每組包含多個(gè)子幀,和其中每個(gè)子幀包含特定數(shù)量的變換系數(shù);根據(jù)子幀的均方根來(lái)確定每個(gè)子幀的范數(shù);量化每個(gè)子幀的均方根;通過(guò)用子幀的量化均方根除子幀內(nèi)的每個(gè)系數(shù)來(lái)歸一化每個(gè)子幀的系數(shù);使用第一點(diǎn)陣向量量化器以每個(gè)系數(shù)大于1比特的速率量化系數(shù);和使用第二點(diǎn)陣向量量化器以每個(gè)系數(shù)1比特的速率量化系數(shù)。13.根據(jù)權(quán)利要求12所述的方法,其中使用第一點(diǎn)陣向量量化器的操作包括-從截?cái)帱c(diǎn)陣構(gòu)造碼本,其中所述點(diǎn)陣包括所有碼向量的多維點(diǎn)陣,所有碼向量具有帶有偶數(shù)和的整數(shù)坐標(biāo);和量化位于截?cái)帱c(diǎn)陣之外的局外者源向量。14.根據(jù)權(quán)利要求12所述的方法,其中使用第二點(diǎn)陣向量量化器的操作包括-從點(diǎn)陣構(gòu)造碼本,所述點(diǎn)陣包括落在同心球上的所有碼向量的多維點(diǎn)陣;和量化源向量。15.根據(jù)權(quán)利要求12所述的方法,進(jìn)一步包括針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)的量化的可變比特長(zhǎng)度編碼索引。16.根據(jù)權(quán)利要求12所述的方法,進(jìn)一步包括將變換系數(shù)的組合集分組成多個(gè)分組,其中每個(gè)分組包括子幀,和其中每個(gè)子幀包含特定數(shù)量的系數(shù);計(jì)算子幀之一的均方根;通過(guò)用子幀的均方根劃分子幀內(nèi)每個(gè)系數(shù)來(lái)歸一化子幀的系數(shù);為每個(gè)分組保持霍夫曼編碼標(biāo)記;為對(duì)每個(gè)分組編碼而保持固定的比特?cái)?shù);為分組計(jì)算使用霍夫曼編碼所需的比特?cái)?shù);如果使用霍夫曼編碼所需的比特?cái)?shù)少于針對(duì)該分組的固定比特?cái)?shù),則設(shè)置霍夫曼標(biāo)記和使用霍夫曼編碼;和如果使用霍夫曼編碼所需的比特?cái)?shù)不少于針對(duì)該分組的固定比特?cái)?shù),則清除霍夫曼標(biāo)記和使用固定的比特?cái)?shù)編碼。17.—種其上記錄有程序的計(jì)算機(jī)可讀介質(zhì),由機(jī)器執(zhí)行所述程序以執(zhí)行權(quán)利要求l,5,8,或12中的任何一項(xiàng)所述的方法。18.—種對(duì)音頻信號(hào)編碼的22kHz編碼器,所述編碼器包括變換模塊,用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域,以形成變換系數(shù)的幀;第一點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)大于l比特的速率量化變換系數(shù);和第二點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)l比特的速率量化變換系數(shù)。19.根據(jù)權(quán)利要求8所述的編碼器,進(jìn)一步包括編碼器模塊,用于針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。20.—種終端,包括音頻輸入/輸出接口;可通信地耦合到所述音頻輸入/輸出接口的話筒;可通信地耦合到所述音頻輸入/輸出接口的揚(yáng)聲器;和可通信地耦合到所述音頻輸入/輸出接口的22kHz的音頻編碼器;其中所述22kHz的音頻編碼器包括變換模塊,用于將音頻信號(hào)的時(shí)域取樣的幀變換到頻域,以形成變換系數(shù)的幀;第一點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)大于1比特的速率量化系數(shù);和第二點(diǎn)陣向量量化器模塊,用于以每個(gè)系數(shù)l比特的速率量化系數(shù)。21.根據(jù)權(quán)利要求20所述的終端,其中所述22kHz的音頻編碼器進(jìn)一步包括編碼器模塊,用于針對(duì)由所述第一點(diǎn)陣向量量化器量化的系數(shù)進(jìn)行量化的可變比特長(zhǎng)度編碼索引。22.根據(jù)權(quán)利要求20所述的終端,進(jìn)一步包括可通信地耦合到音頻輸入/輸出接口的總線;可通信地耦合到總線的視頻輸入/輸出接口;可通信地耦合到視頻輸入/輸出接口的攝像機(jī);和可通信地耦合到視頻輸入/輸出接口的顯示裝置。全文摘要披露了對(duì)音頻進(jìn)行編碼和解碼的方法、裝置、和系統(tǒng)。音頻信號(hào)的數(shù)字取樣被從時(shí)域變換到頻域。用快速點(diǎn)陣向量量化器對(duì)得到的變換系數(shù)編碼。量化器具有高速量化器和低速量化器。高速量化器包括截?cái)帱c(diǎn)陣的方案。低速量化器具有基于表的搜索方法。低速量化器也可以包括基于表的索引方案。高速量化器進(jìn)一步包括用于變換系數(shù)的量化索引的霍夫曼編碼技術(shù),以提高量化/編碼效率。文檔編號(hào)G10L19/00GK101165777SQ200710167128公開日2008年4月23日申請(qǐng)日期2007年10月18日優(yōu)先權(quán)日2006年10月18日發(fā)明者謝敏杰申請(qǐng)人:寶利通公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1