專(zhuān)利名稱(chēng):數(shù)字信號(hào)再生裝置以及數(shù)字信號(hào)壓縮裝置的制作方法
技術(shù)領(lǐng)域:
本說(shuō)明書(shū)公開(kāi)的技術(shù)涉及進(jìn)行對(duì)包含人的聲音的音頻信號(hào)進(jìn)行了編碼的比特流的再生處理的數(shù)字信號(hào)再生裝置,以及從包含人的聲音的音頻信號(hào)生成比特流的數(shù)字信號(hào)壓縮裝置。
背景技術(shù):
對(duì)電視廣播信號(hào)進(jìn)行數(shù)字壓縮,并存儲(chǔ)到DVD(Digital Versatile Disc,數(shù)字通用光盤(pán))、BD(Blu_ray Disc,藍(lán)光光盤(pán))、HDD (Hard Disk Drive,硬盤(pán)驅(qū)動(dòng)器)等保存介質(zhì)中的記錄器設(shè)備的開(kāi)發(fā)正在進(jìn)行。特別是,近年來(lái),伴隨著存儲(chǔ)介質(zhì)的存儲(chǔ)容量的增大,長(zhǎng)時(shí)間的電視廣播的記錄成為可能。因此,錄制保留的節(jié)目變得龐大,出現(xiàn)用戶無(wú)法取得觀看該節(jié)目的足夠時(shí)間的情況。對(duì)此,在記錄器設(shè)備中搭載了使用比記錄所需的時(shí)間更短的時(shí)間來(lái)再生記錄的節(jié)目的高速再生功能。例如,在進(jìn)行1. 5倍速再生的情況下,能夠用40分鐘再生一個(gè)小時(shí)的節(jié)目。但是,進(jìn)行這種高速再生后,難以聽(tīng)到臺(tái)詞或者廣播等的話。為了解決該問(wèn)題,開(kāi)發(fā)了對(duì)包含臺(tái)詞或廣播等的聲音(人的聲音)的區(qū)間不進(jìn)行高速再生,對(duì)不包含聲音的區(qū)間進(jìn)行高速再生的技術(shù)。例如,在專(zhuān)利文獻(xiàn)1中,公開(kāi)了以下技術(shù)。即,進(jìn)行音頻數(shù)據(jù)的分析,決定并保存每個(gè)區(qū)間的再生速度,在實(shí)際再生音頻信號(hào)等的時(shí)候,按照已經(jīng)決定的再生速度進(jìn)行再生。在專(zhuān)利文獻(xiàn)2中公開(kāi)了不進(jìn)行保存,按照基于音頻數(shù)據(jù)決定的再生速度再生音頻信號(hào)等的技術(shù)?,F(xiàn)有技術(shù)文獻(xiàn)專(zhuān)利文獻(xiàn)專(zhuān)利文獻(xiàn)1 特開(kāi)2003-309814號(hào)公報(bào)專(zhuān)利文獻(xiàn)2 國(guó)際公開(kāi)第2006/082787號(hào)
發(fā)明內(nèi)容
發(fā)明要解決的問(wèn)題但是,在專(zhuān)利文獻(xiàn)1以及專(zhuān)利文獻(xiàn)2的結(jié)構(gòu)中,必須從作為解碼比特流得到的時(shí)域信號(hào)的PCM(Pulse Code Modulation,脈沖碼調(diào)制)信號(hào)中檢測(cè)是否包含人的聲音,因而需要龐大數(shù)量的運(yùn)算。這是因?yàn)樵谶@種檢測(cè)中,需要判定PCM信號(hào)的頻率特性是否與人的聲音的頻率特性類(lèi)似、PCM信號(hào)的基本頻率(基音頻率)是否符合人的聲音的特征等,需要進(jìn)行向頻域信號(hào)的變換和自相關(guān)處理等運(yùn)算量較大的信號(hào)處理。本發(fā)明的目的在于提供以較少的運(yùn)算量進(jìn)行包含人的聲音的區(qū)間的判定的數(shù)字信號(hào)再生裝置。另外,本發(fā)明的目的在于提供生成包含人的聲音的區(qū)間的判定較為容易的比特流的數(shù)字信號(hào)壓縮裝置。用于解決問(wèn)題的手段根據(jù)本發(fā)明的實(shí)施方式的數(shù)字信號(hào)再生裝置,具有音頻解碼部,對(duì)音頻比特流進(jìn)行解碼,輸出得到的音頻信號(hào);音頻比特流分析部,分析所述音頻比特流是否包含人的聲音;再生速度決定部,基于所述音頻比特流分析部中的分析結(jié)果決定再生速度;以及可變速再生部,按照所述再生速度決定部決定的再生速度再生所述音頻信號(hào)。據(jù)此,根據(jù)解碼前的音頻比特流直接判定是否包含聲音,因而能夠減少是否包含聲音的判定所需的運(yùn)算量。根據(jù)本發(fā)明的實(shí)施方式的數(shù)字信號(hào)壓縮裝置具有音頻信號(hào)分析部,針對(duì)每個(gè)指定長(zhǎng)度的區(qū)間分析音頻信號(hào),檢測(cè)表示所述音頻信號(hào)的區(qū)間內(nèi)包含人的聲音的成分的程度的指數(shù);以及音頻編碼部,對(duì)所述音頻信號(hào)的對(duì)應(yīng)于所述指數(shù)的區(qū)間,在所述指數(shù)大于指定閾值的情況下以預(yù)測(cè)編碼方式進(jìn)行編碼,在所述指數(shù)為所述指定閾值以下的情況下以頻率變換編碼方式進(jìn)行編碼,并輸出得到的編碼數(shù)據(jù)。據(jù)此,能夠提高編碼質(zhì)量。進(jìn)而,在得到的編碼數(shù)據(jù)的再生時(shí),僅分析使用預(yù)測(cè)編碼方式的頻度,就能容易地進(jìn)行是否包含聲音的判定。發(fā)明的效果根據(jù)本發(fā)明的實(shí)施方式,在數(shù)字信號(hào)再生裝置中,能夠減少是否包含聲音的判定所需的運(yùn)算量。另外,在數(shù)字信號(hào)壓縮裝置中得到的編碼數(shù)據(jù)的再生時(shí),能夠容易地進(jìn)行是否包含聲音的判定。因此,能夠容易地實(shí)現(xiàn)在進(jìn)行高速再生的同時(shí)容易聽(tīng)到聲音。
圖1是表示本發(fā)明的第一實(shí)施方式的數(shù)字信號(hào)再生裝置的結(jié)構(gòu)例的模塊圖。圖2是表示本發(fā)明的第一實(shí)施方式的數(shù)字信號(hào)壓縮裝置的結(jié)構(gòu)例的模塊圖。圖3是表示圖2的數(shù)字信號(hào)壓縮裝置的第一變形例的結(jié)構(gòu)的模塊圖。圖4是表示圖2的數(shù)字信號(hào)壓縮裝置的第二變形例的結(jié)構(gòu)的模塊圖。圖5是表示具有圖1的數(shù)字信號(hào)再生裝置與圖2的數(shù)字信號(hào)壓縮裝置的記錄器系統(tǒng)的一例的模塊圖。圖6是表示本發(fā)明的第二實(shí)施方式的數(shù)字信號(hào)再生裝置的結(jié)構(gòu)例的模塊圖。圖7是表示圖6的數(shù)字信號(hào)再生裝置的變形例的結(jié)構(gòu)的模塊圖。圖8是表示跳過(guò)的圖像(picture)的種類(lèi)以及個(gè)數(shù)、以及再生速度的組合的代表例的說(shuō)明圖。
具體實(shí)施例方式以下,參照
本發(fā)明的實(shí)施方式。圖中后兩位用相同的參照編號(hào)表示的結(jié)構(gòu)要素相互對(duì)應(yīng),是相同或類(lèi)似的結(jié)構(gòu)要素。在本說(shuō)明書(shū)中,設(shè)聲音表示人的聲音,聲音信號(hào)主要是表示人的聲音的信號(hào)。設(shè)音頻信號(hào)是可以表示人的聲音之外的樂(lè)器等所有聲音的信號(hào)。本說(shuō)明書(shū)中的各功能模塊典型地用硬件實(shí)現(xiàn)。例如,各功能模塊可以作為IC(集成電路)的一部分在半導(dǎo)體基板上形成。此處,IC包含LSI (Large-Scale Integrated circuit, ^ !^] -) >ASIC (Application-Specific Integrated Circuit,
電路)、門(mén)陣列、FPGA(Field Programmable Gate Array,現(xiàn)場(chǎng)可編程門(mén)陣列)等。作為代替,各功能模塊的一部分或全部可以用軟件實(shí)現(xiàn)。例如,這種功能模塊可以通過(guò)在處理器上執(zhí)行的程序來(lái)實(shí)現(xiàn)。換言之,本說(shuō)明書(shū)中說(shuō)明的各功能模塊可以用硬件實(shí)現(xiàn),也可以用軟件實(shí)現(xiàn),還可以用硬件與軟件的任意組合實(shí)現(xiàn)。(第一實(shí)施方式)圖1是表示本發(fā)明的第一實(shí)施方式的數(shù)字信號(hào)再生裝置的結(jié)構(gòu)例的模塊圖。圖1 的數(shù)字信號(hào)再生裝置100具有音頻解碼部112、可變速再生部114、音頻比特流分析部122、 以及再生速度決定部124。在音頻解碼部112以及音頻比特流分析部122中輸入音頻比特流ABS。作為例子, 音頻比特流ABS是使用由MPEG (Moving Picture Experts Group,動(dòng)態(tài)圖像專(zhuān)家組)標(biāo)準(zhǔn) (IS0/IEC13818-7)規(guī)定的AAC (Advanced Audio Coding,高級(jí)音頻編碼)方式進(jìn)行了編碼的比特流。簡(jiǎn)單地說(shuō)明使用AAC方式對(duì)輸入音頻信號(hào)進(jìn)行編碼以生成音頻比特流時(shí)的處理。 在音頻比特流生成時(shí),作為PCM(Pulse Code Modulation,脈沖碼調(diào)制)信號(hào)的輸入音頻信號(hào)由與其性質(zhì)相對(duì)應(yīng)的適當(dāng)?shù)木幋a工具(tool)進(jìn)行編碼。例如,在輸入音頻信號(hào)為立體聲信號(hào),L聲道(channel)的信號(hào)與R聲道的信號(hào)具有類(lèi)似的頻率成分的情況下,使用 “ Intensity Stereo (強(qiáng)度立體聲)”或“M/S (Mid/Side Stereo Coding,中側(cè)立體聲編碼)” 工具。另外,在輸入信號(hào)的時(shí)間變動(dòng)較大的情況下,使用“block SWitChing(塊切換),, 或“TNS (Temporal Noise Siaping,時(shí)域噪聲整形)”工具。AAC方式是進(jìn)行將時(shí)域信號(hào)變換為頻域信號(hào)(頻率信號(hào))的處理(頻率變換),并對(duì)頻域信號(hào)進(jìn)行編碼的方式(頻率變換編碼方式)。"block sWitChing(塊切換)”在輸入信號(hào)的時(shí)間變動(dòng)較大的情況下,以較短的時(shí)間間隔進(jìn)行向頻域信號(hào)的變換處理,由此提高時(shí)間分辨率。在輸入信號(hào)的時(shí)間變動(dòng)較大的情況下,通過(guò)“block sWitChing(塊切換)”頻繁地進(jìn)行向頻域信號(hào)的變換處理?!癟NS” 是頻率信號(hào)的預(yù)測(cè)編碼器。在輸入信號(hào)的時(shí)間變動(dòng)較大的情況下,頻率信號(hào)變得平坦,因而通過(guò)使用預(yù)測(cè)編碼器提高壓縮效率的情況較多。聲音在非常短的時(shí)間內(nèi)反復(fù)子音與母音,因而時(shí)間變動(dòng)較大。因此,在AAC編碼器中,對(duì)于聲音信號(hào),使用“block switching (塊切換),,以及“TNS”的頻度較高。音頻比特流分析部122分析音頻比特流ABS是否包含人的聲音。此時(shí),音頻比特流分析部122例如在音頻比特流ABS中,針對(duì)指定長(zhǎng)度的每個(gè)區(qū)間分析編碼對(duì)象的音頻信號(hào)進(jìn)行預(yù)測(cè)編碼的頻度以及進(jìn)行向頻域信號(hào)的變換的頻度。進(jìn)行預(yù)測(cè)編碼的頻度根據(jù)音頻比特流ABS中包含的表示進(jìn)行了“TNS”的標(biāo)志等求出。向頻域信號(hào)進(jìn)行變換的頻度根據(jù)音頻比特流ABS中包含的表示進(jìn)行了 “block sWitChing(塊切換)”的標(biāo)志等求出。音頻比特流分析部122將求出的頻度作為分析結(jié)果輸出到再生速度決定部124。音頻解碼部112對(duì)輸入的音頻比特流ABS進(jìn)行解碼,將得到的音頻信號(hào)(PCM信號(hào))輸出到可變速再生部114。關(guān)于使用AAC方式編碼的比特流的解碼的細(xì)節(jié)記載在MPEG 標(biāo)準(zhǔn)中,因而省略其說(shuō)明。接著,再生速度決定部IM基于音頻比特流分析部122中的分析結(jié)果決定再生速度。此時(shí),再生速度決定部1 例如根據(jù)各個(gè)區(qū)間中音頻信號(hào)進(jìn)行預(yù)測(cè)編碼的頻度以及向頻域信號(hào)進(jìn)行變換的頻度決定各區(qū)間的再生速度。在每個(gè)區(qū)間中以高于指定閾值的頻度使用了 “block SWitChing(塊切換)”以及“TNS”的情況下,再生速度決定部IM判定為該區(qū)間中較多地包含聲音信號(hào),以即使在高速再生時(shí)(作為目標(biāo)的平均再生速度即目標(biāo)再生速度例如為2倍速時(shí))也進(jìn)行比較慢的再生 (例如1.3倍速等的再生)的方式?jīng)Q定再生速度。在其他情況下,再生速度決定部IM判定為該區(qū)間中不包含聲音信號(hào),以進(jìn)行比目標(biāo)再生速度更高速的再生(例如,在目標(biāo)再生速度為2倍速的情況下,進(jìn)行3倍速或4倍速的再生)的方式?jīng)Q定再生速度。為了更正確地進(jìn)行是否包含聲音的判定,可以并用解碼后的PCM信號(hào)的分析。例如,對(duì)于解碼后的PCM信號(hào),使用與以往相同的分析方法進(jìn)行是否包含聲音的判定,根據(jù)音頻比特流分析部122中的分析結(jié)構(gòu)決定其判定基準(zhǔn)。這樣,能夠更為正確地進(jìn)行判定。可變速再生部114使用由再生速度決定部IM決定的再生速度再生從音頻解碼部 112輸出的音頻信號(hào),輸出變更了再生速度的音頻信號(hào)ASR。在改變?cè)偕俣葧r(shí),可以使用信號(hào)的時(shí)間軸方向的縮短以及交叉衰落(cross fade)處理等以往進(jìn)行的任意方法。這樣,根據(jù)圖1的數(shù)字信號(hào)再生裝置,根據(jù)解碼前的音頻比特流直接判定是否包含聲音,因而能夠減少是否包含聲音的判定所需的運(yùn)算量。此外,再生速度決定部IM可以根據(jù)“block SwitChing(塊切換),,以及“TNS”中
的一者的頻度來(lái)決定再生速度。以上,作為輸入音頻比特流是用AAC方式編碼的流進(jìn)行了說(shuō)明,但不限于此。例如,使用近年來(lái)由MPEG音頻的標(biāo)準(zhǔn)化組織進(jìn)行研究以及標(biāo)準(zhǔn)化的所謂“聲音/音頻綜合編解碼器”的編碼方式進(jìn)行了編碼的流也適于作為輸入比特流。在“聲音/音頻綜合編解碼器”中,在對(duì)聲音信號(hào)(人的聲音)進(jìn)行編碼的情況與對(duì)其他音頻信號(hào)(音樂(lè)、自然聲音) 進(jìn)行編碼的情況下,自動(dòng)選擇各自相應(yīng)的編碼方式。在作為編碼結(jié)果得到的編碼比特流中, 應(yīng)當(dāng)包含明確表示使用了哪種編碼方式的信息。在此情況下,通過(guò)從比特流中取出這種信息,聲音/非聲音的判斷變得非常容易。另外,關(guān)于圖1,關(guān)注于再生數(shù)字信號(hào)時(shí)的再生速度的控制功能進(jìn)行了說(shuō)明,但圖 1的結(jié)構(gòu)也可以具有其他功能。例如,再生速度決定部1 可以按照音頻比特流分析部122 的分析結(jié)果,決定均衡特性或空間音響特性??勺兯僭偕?14可以具有實(shí)現(xiàn)決定的均衡特性或空間音響特性的功能。可變速再生部114例如可以在輸入信號(hào)為聲音的情況下,適用用于更為鮮明地再生聲音頻帶(基音頻帶或共振峰(formant)頻帶)的濾波器,可以在輸入信號(hào)為多聲道的音樂(lè)的情況下,適用用于擴(kuò)大空間音響特性的濾波器。圖2是表示本發(fā)明的第一實(shí)施方式的數(shù)字信號(hào)壓縮裝置的結(jié)構(gòu)例的模塊圖。圖2 的數(shù)字信號(hào)壓縮裝置200具有音頻信號(hào)分析部254、第一控制部沈2、預(yù)測(cè)編碼部沈4、頻率變換編碼部沈6、以及第二控制部272。第一控制部沈2、預(yù)測(cè)編碼部沈4、以及頻率變換編碼部266構(gòu)成音頻編碼部沈0。首先,音頻信號(hào)分析部2M對(duì)指定長(zhǎng)度的每個(gè)區(qū)間分析輸入音頻信號(hào)ASG,檢測(cè)表示音頻信號(hào)中包含聲音(人的聲音)成分的程度的指數(shù)R并輸出到第一控制部沈2。其方法可以是以往已知的任何方法,例如可以基于聲音的共振峰頻帶的信號(hào)強(qiáng)度或其時(shí)間變動(dòng),也可以基于聲音的基音頻帶中是否存在指定以上強(qiáng)度的信號(hào)。第一控制部262根據(jù)從音頻信號(hào)分析部2M輸出的指數(shù)R,決定在哪個(gè)編碼部中對(duì)音頻信號(hào)ASG進(jìn)行編碼。即,第一控制部262在指數(shù)R比指定閾值大的情況(人的聲音的成分包含較多的情況)下決定在預(yù)測(cè)編碼部沈4中,在指數(shù)R在指定閾值以下的情況(人的聲音的成分包含較少的情況)下決定在頻率變換編碼部266中,對(duì)音頻信號(hào)ASG的與指數(shù)R對(duì)應(yīng)的區(qū)間進(jìn)行編碼,并將音頻信號(hào)ASG輸出到?jīng)Q定的編碼部。預(yù)測(cè)編碼部264使用預(yù)測(cè)編碼方式對(duì)從第一控制部262輸出的音頻信號(hào)進(jìn)行編碼,并將生成的編碼數(shù)據(jù)輸出到第二控制部272。在預(yù)測(cè)編碼方式中,將聲音(人的聲音) 分離為音源成分與預(yù)測(cè)系數(shù)(音響特性系數(shù)),對(duì)它們分別進(jìn)行壓縮編碼。此處,預(yù)測(cè)編碼方式例如可以是由 ITU-T (International Telecommunication Union-Telecommunication kctor,國(guó)際電信聯(lián)盟遠(yuǎn)程通信組織)定義的G. 729等聲音用編碼方式,也可以是由 3GPP(Third Generation Partnership Project,第三代合作伙伴計(jì)劃)定義的 AMR-NB、 AMR-WB等聲音用編碼方式。頻率變換編碼部266使用頻率變換編碼方式對(duì)從第一控制部262輸出的音頻信號(hào)進(jìn)行編碼,并將生成的編碼數(shù)據(jù)輸出到第二控制部272。在頻率變換編碼方式中,通過(guò) MDCT(Modified Discrete Cosine Transform, ^( ^ ^ ) QMF(Quadrature Mirror Filters,正交鏡像濾波器)等將輸入音頻信號(hào)變換為頻域信號(hào),對(duì)頻域信號(hào)的各頻率成分進(jìn)行加權(quán)并且進(jìn)行壓縮編碼。此處,頻率變換編碼方式例如是由AAC或 HE-AAC (High-Efficiency Advanced Audio Coding,高效率高級(jí)音頻編碼)定義的音頻用編碼方式。第二控制部272從由預(yù)測(cè)編碼部沈4以及頻率變換編碼部266生成的編碼數(shù)據(jù)生成音頻比特流ABS并輸出。根據(jù)圖2的數(shù)字信號(hào)壓縮裝置200,在比特流生成時(shí)(編碼時(shí)),對(duì)指定長(zhǎng)度的每個(gè)區(qū)間分析音頻信號(hào)中包含聲音成分的程度,根據(jù)該結(jié)果決定編碼方式,因而能提高編碼質(zhì)量。進(jìn)而,在生成的編碼數(shù)據(jù)的再生時(shí),僅通過(guò)分析使用預(yù)測(cè)編碼方式的頻度,就能容易地進(jìn)行是否是包含聲音的區(qū)間的判定。在圖2的數(shù)字信號(hào)壓縮裝置200中,輸入音頻信號(hào)ASG的全部頻帶使用預(yù)測(cè)編碼方式以及頻率變換編碼方式中的任一者進(jìn)行編碼。但是,不必一定如此。例如,若考慮聲音信號(hào)的主要頻率成分集中在低頻帶這一特征,可以將根據(jù)聲音/非聲音切換編碼方式的對(duì)象限定為低頻成分。在此情況下,高頻成分例如可以通過(guò)由MPEG標(biāo)準(zhǔn)AAC+SBR(Spectral Band R印lication,頻帶復(fù)制)方式(IS0/IEC14496-3)規(guī)定的作為頻帶擴(kuò)大技術(shù)的SBR進(jìn)行編碼。圖3是表示圖2的數(shù)字信號(hào)壓縮裝置的第一變形例的結(jié)構(gòu)的模塊圖。圖3的數(shù)字信號(hào)壓縮裝置具有圖2的數(shù)字信號(hào)壓縮裝置200、低頻成分提取部352、高頻成分編碼部 356、以及復(fù)用部374。首先,低頻成分提取部352提取輸入音頻信號(hào)ASG的低頻帶的信號(hào),并輸出到音頻信號(hào)分析部354以及第一控制部362。作為提取方法,可以使用低通濾波器,也可以使用將變換為頻域信號(hào)的信號(hào)的低域成分變換為時(shí)域信號(hào)的方法來(lái)取出。高頻成分編碼部356使用頻帶擴(kuò)大技術(shù)對(duì)輸入音頻信號(hào)ASG的高頻成分進(jìn)行編碼,并輸出得到的編碼數(shù)據(jù)。作為頻帶擴(kuò)大技術(shù),例如使用由MPEG標(biāo)準(zhǔn)AAC+SBR方式(IS0/IEC14496-3)規(guī)定的SBR。數(shù)字信號(hào)壓縮裝置200除了輸入低頻成分提取部352的輸出信號(hào)這一點(diǎn)以外,與參照?qǐng)D2說(shuō)明的裝置同樣構(gòu)成,因而省略其說(shuō)明。復(fù)用部374對(duì)從第二控制部372輸出的音頻比特流與從高頻成分編碼部356輸出的編碼數(shù)據(jù)進(jìn)行復(fù)用,生成音頻比特流ABS并輸出ο這樣,由于人的聲音的主要頻率成分集中在低頻區(qū)域,所以圖3的數(shù)字信號(hào)壓縮裝置僅對(duì)輸入音頻信號(hào)ASG的低頻成分進(jìn)行預(yù)測(cè)編碼方式的編碼。因此,與圖2的數(shù)字信號(hào)壓縮裝置相比,能夠進(jìn)一步提高編碼質(zhì)量。進(jìn)而,在再生時(shí),僅通過(guò)分析比特流中的低頻區(qū)域的數(shù)據(jù),就能容易地進(jìn)行是否是包含聲音的區(qū)間的判定。圖4是表示圖2的數(shù)字信號(hào)壓縮裝置200的第二變形例的結(jié)構(gòu)的模塊圖。圖4的數(shù)字信號(hào)壓縮裝置在代替復(fù)用部374而具有復(fù)用部474這一點(diǎn)上,與圖3的數(shù)字信號(hào)壓縮裝置不同。復(fù)用部474將音頻信號(hào)分析部3M檢測(cè)出的指數(shù)R或者對(duì)其進(jìn)行了編碼的值復(fù)用到從第二控制部372輸出的音頻比特流以及從高頻成分編碼部356輸出的編碼數(shù)據(jù)中, 并作為音頻比特流ABS輸出。據(jù)此,在再生比特流時(shí),能夠更為正確地判定區(qū)間內(nèi)以何種程度包含了聲音成分。 輸入音頻信號(hào)ASG有時(shí)無(wú)法簡(jiǎn)單地分類(lèi)為聲音/非聲音這兩個(gè)種類(lèi),因而能夠在再生裝置側(cè)知道作為其判定因素的指數(shù)R可對(duì)更高品質(zhì)的再生做出貢獻(xiàn)。例如,在指數(shù)R的值非常大的情況下,可以知道音頻信號(hào)ASG中幾乎只含有聲音成分,因而可以實(shí)施與聲音相適應(yīng)的再生處理(聲音頻帶成分的加重等)。相反,在指數(shù)R的值非常小的情況下,可以知道音頻信號(hào)ASG不包含聲音,因而可以實(shí)施與音頻相適應(yīng)的再生處理(基于重低音或高域信號(hào)的加重的層次豐富的聲音制作等)。如果指數(shù)R為中間的值,則可以適當(dāng)進(jìn)行兩方面的處理。圖5是表示具有圖1的數(shù)字信號(hào)再生裝置與圖2的數(shù)字信號(hào)壓縮裝置的記錄器系統(tǒng)的一例的模塊圖。圖5的記錄器系統(tǒng)具有圖1的數(shù)字信號(hào)再生裝置、圖2的數(shù)字信號(hào)壓縮裝置、以及比特流保存部502。比特流保存部502可以是能夠保存數(shù)據(jù)的任意保存介質(zhì), 例如可以是DVD、BD、CD (Compact Disc,緊湊式光盤(pán))、HDD、存儲(chǔ)卡中的任一種。另外,也可以組合比特流保存部502與圖1的數(shù)字信號(hào)再生裝置100。(第二實(shí)施方式)圖6是表示本發(fā)明的第二實(shí)施方式的數(shù)字信號(hào)再生裝置的結(jié)構(gòu)例的模塊圖。圖6 的數(shù)字信號(hào)再生裝置具有音頻解碼部612、音頻緩沖部613、可變速再生部614、視頻解碼控制部616、音頻比特流分析部622、再生速度決定部624、AV(audiovisual,音視頻)數(shù)據(jù)保存部632、流分離部634、視頻緩沖部636、以及視頻解碼部638。AV數(shù)據(jù)保存部632中存儲(chǔ)對(duì)視頻比特流與音頻比特流進(jìn)行了復(fù)用的比特流。AV 數(shù)據(jù)保存部632將該比特流作為AV比特流AVS輸出到流分離部634。流分離部634將AV 比特流AVS分離為視頻比特流VBS與音頻比特流ABS,將視頻比特流VBS輸出到視頻緩沖部 636,將音頻比特流ABS輸出到音頻解碼部612以及音頻比特流分析部622。音頻解碼部612、可變速再生部614、音頻比特流分析部622、以及再生速度決定部 6M與參照?qǐng)D1說(shuō)明的對(duì)應(yīng)的結(jié)構(gòu)要素相同,因而省略它們的說(shuō)明。音頻緩沖部613存儲(chǔ)從音頻解碼部612輸出的音頻信號(hào),并輸出到可變速再生部614。視頻緩沖部636存儲(chǔ)視頻比特流VBS并輸出到視頻解碼部638。視頻解碼控制部 616進(jìn)行與視頻比特流VBS的解碼處理有關(guān)的決定,使得以與再生速度決定部擬4決定的再生速度對(duì)應(yīng)的速度再生影像。視頻解碼部638按照視頻解碼控制部616的決定,對(duì)從視頻緩沖部636輸出的視頻比特流進(jìn)行解碼,并輸出得到的影像信號(hào)VSR。
下面對(duì)以上述方式構(gòu)成的圖6的數(shù)字信號(hào)再生裝置的動(dòng)作進(jìn)行詳細(xì)說(shuō)明。假設(shè)在AV數(shù)據(jù)保存部632中,保存基于MPEG-2視頻(IS0/IEC13818-2)的視頻比特流與基于 MPEG-2AAC(IS0/IEC13818-7)的音頻比特流使用 MPEG-2 TS (Transport Stream,傳輸流) 格式(IS0/IEC13818-1)進(jìn)行了復(fù)用的比特流。MPEG-2視頻是利用了幀間預(yù)測(cè)的運(yùn)動(dòng)圖像壓縮方式,構(gòu)成影像信號(hào)的圖像 (picture)根據(jù)其預(yù)測(cè)方法分類(lèi)為I圖像(I picture), P圖像(P picture), B圖像(B picture)這三種圖像。I圖像是作為運(yùn)動(dòng)圖像再生的起點(diǎn)的圖像,該圖像能夠單獨(dú)再生。P 圖像若沒(méi)有時(shí)間上位于前面的I圖像、P圖像則無(wú)法進(jìn)行再生,但與I圖像相比代碼量較小。 B圖像若沒(méi)有時(shí)間上位于前后的I圖像、P圖像則無(wú)法進(jìn)行再生,但與I圖像、P圖像相比代碼量較小例如,在數(shù)字廣播中,考慮畫(huà)質(zhì)與代碼量的平衡,往往組合上述的I圖像(記為I)、 P圖像(記為P)、以及B圖像(記為B),以用IBBPBBPBBPBBPBB的順序表示的方式進(jìn)行圖像構(gòu)成。另外,為了從比特流的中間也能再生影像,往往在0.5秒左右返回到I圖像。在數(shù)字廣播中,往往每秒發(fā)送30幀,每幀由一個(gè)圖像構(gòu)成。在0. 5秒中為15個(gè)圖像,因此圖像結(jié)構(gòu)往往是 IBBPBBPBBPBBPBB(IPBB...)的反復(fù)。MPEG-2 TS是數(shù)字廣播等中采用較多的視頻比特流與音頻比特流進(jìn)行了復(fù)用的比特流,將視頻比特流以及音頻比特流分別分割為固定長(zhǎng)度而得到的分組(packet)在時(shí)間上交互配置。一般而言,視頻比特流的代碼量比音頻比特流的代碼量大,因而在MPEG-2TS 的比特流中,視頻分組(記為V)與音頻分組(記為A)例如以AVVVVVVAVVVVVV等順序構(gòu)成。首先,流分離部634從由AV數(shù)據(jù)保存部632輸入的MPEG-2TS格式的比特流中取出視頻分組(V),結(jié)合取出的各分組,并輸出到視頻緩沖部636。另外,流分離部634取出音頻分組(A),結(jié)合取出的各分組,并輸出到音頻比特流分析部622以及音頻解碼部612。此處,假設(shè)再生速度決定部擬4例如將再生速度決定為3倍,則為了同步再生音頻與視頻,不僅是音頻,視頻也需要以3倍速進(jìn)行再生。但是,在數(shù)字廣播中,需要處理 HD (High Definition,高清晰)影像(每幀1920X 1080像素)的龐大的影像數(shù)據(jù),簡(jiǎn)單地以3倍的速度進(jìn)行解碼再生需要3倍的運(yùn)算量,因此并不現(xiàn)實(shí)。如前所述,在數(shù)字廣播中, IBBPBBPBBPBBPBB這樣的圖像結(jié)構(gòu)較多,因此如果跳過(guò)例如B圖像的解碼,僅解碼再生I圖像與P圖像,則僅解碼15個(gè)圖像中的5個(gè)圖像便可,因此能夠使再生速度變?yōu)?倍。這樣,視頻解碼控制部616按照再生速度決定部6M決定的再生速度,決定跳過(guò)哪個(gè)圖像的再生、進(jìn)行哪個(gè)圖像的再生,并通知給視頻解碼部638。視頻解碼部638按照視頻解碼控制部616的決定,進(jìn)行視頻比特流的解碼,并輸出得到的影像信號(hào)。另外,為了使影像信號(hào)與聲音信號(hào)完全同步并輸出,需要緩沖器。如已經(jīng)描述的那樣,視頻的圖像結(jié)構(gòu)為IBBPBBPBBPBBPBBPBB,但編碼的順序不是該順序。由于B圖像還將時(shí)間上較后的P圖像用于預(yù)測(cè),所以編碼成為IPBBPBBPBBPBBPBB的順序,P圖像位于B圖像的前面,即,在比特流中,按照與實(shí)際再生的時(shí)機(jī)不同的順序進(jìn)行配置。因此,在MPEG-2TS格式中,雖然音頻分組與視頻分組在時(shí)間上均等地進(jìn)行復(fù)用,但若關(guān)注特定的圖像,則與音頻相比,視頻在時(shí)間上先進(jìn)行復(fù)用。另外,從在流分離部634中分離音頻比特流起,到在再生速度決定部擬4中決定再生速度為止,存在延遲時(shí)間。即,在決定再生速度之前,先進(jìn)行流的分離和視頻解碼。
由于上述兩個(gè)理由,若將流分離部634分離的視頻比特流立即在視頻解碼部638 中進(jìn)行解碼,則在再生速度決定部624中決定了再生速度時(shí),與音頻對(duì)應(yīng)的視頻解碼已經(jīng)完成,無(wú)法如所意料的那樣跳過(guò)圖像。對(duì)此,如圖6所示,采用在流分離部634與視頻解碼部638之間,設(shè)置視頻緩沖部 636,保存視頻比特流的結(jié)構(gòu)。能夠?qū)⒁曨l比特流保存在視頻緩沖部636中,在再生速度決定部擬4中決定了再生速度之后,開(kāi)始視頻解碼部638的處理。此時(shí),在視頻緩沖部636中, 至少需要與P圖像的先行編碼圖像數(shù)(在本實(shí)施例的情況下,在時(shí)間順序上P圖像在2個(gè)圖像之前進(jìn)行編碼,因而是2個(gè)圖像)的比特流、以及到再生速度決定為止的延遲時(shí)間相當(dāng)?shù)娜萘俊A硗?,在MPEG-2 TS格式中,為了能夠同步輸出影像信號(hào)與聲音信號(hào),與時(shí)機(jī)相配合,對(duì)視頻比特流與音頻比特流進(jìn)行復(fù)用。在圖6的結(jié)構(gòu)中,若利用視頻緩沖部636僅延遲影像信號(hào),則聲音信號(hào)先輸出,在聲音信號(hào)輸出時(shí)無(wú)法與影像輸出取得同步。對(duì)此,在音頻解碼部612的后級(jí)設(shè)置音頻緩沖部613,能夠延遲聲音信號(hào)輸出,與影像信號(hào)輸出取得同
止
少ο此外,在圖6的結(jié)構(gòu)中,將音頻緩沖部613設(shè)置在音頻解碼部612的后級(jí),但也可以設(shè)置在音頻解碼部613的前級(jí)或者可變速再生部614的后級(jí)。S卩,以能夠與影像信號(hào)相配合地延遲聲音信號(hào)的方式構(gòu)成即可。在圖6的結(jié)構(gòu)中,再生速度決定部6M通過(guò)音頻比特流分析部622的比特流分析結(jié)果決定再生速度,但再生速度的決定方法不限于此。例如,可以根據(jù)音頻解碼部612的解碼結(jié)果進(jìn)行聲音數(shù)據(jù)的分析,進(jìn)行聲音區(qū)間檢測(cè),根據(jù)該檢測(cè)結(jié)果決定再生速度。在圖6中,需要視頻緩沖部636以及音頻緩沖部613,但兩個(gè)緩沖器所需的大小依賴(lài)于需要以何種程度延遲視頻的解碼。在已經(jīng)描述的圖像的結(jié)構(gòu)中,需要延遲2 3幀以上。另外,再生速度的決定并不是能夠立即決定的,是通過(guò)聲音區(qū)間與非聲音區(qū)間的比例等聲音的前后關(guān)系決定的,因此在決定再生速度之前產(chǎn)生延遲時(shí)間。此時(shí),若延遲時(shí)間取得較大,則根據(jù)聲音區(qū)間的持續(xù)時(shí)間調(diào)整再生速度,或者在雖然暫時(shí)變?yōu)榉锹曇魠^(qū)間但立即繼續(xù)聲音區(qū)間的情況下使該非聲音區(qū)間的再生速度與聲音區(qū)間相同,這樣能夠更為適當(dāng)?shù)貨Q定再生速度。作為由圖像結(jié)構(gòu)產(chǎn)生的延遲時(shí)間、決定再生速度之前的延遲時(shí)間等,假設(shè)需要1秒左右的延遲,則視頻緩沖部636所需的大小例如在數(shù)字廣播的情況下為20Mbit 左右。另外,音頻緩沖部613所需的大小在配置在音頻解碼部612的后級(jí)的情況下為 48kHzX16bitX5. Ich = 3. 92Mbit左右。提高再生速度的精度后,需要并非1秒,而是數(shù)秒左右的延遲,會(huì)產(chǎn)生視頻緩沖部636、音頻緩沖部613的容量增加在成本上無(wú)法允許的情況。對(duì)此,可以不使用這些緩沖器。圖7是表示圖6的數(shù)字信號(hào)再生裝置的變形例的結(jié)構(gòu)的模塊圖。圖7的數(shù)字信號(hào)再生裝置具有音頻解碼部712、可變速再生部714、視頻解碼控制部716、第一流分離部721、 音頻比特流分析部722、再生速度決定部724、AV數(shù)據(jù)保存部732、第二流分離部734、以及視頻解碼部738。第一流分離部721從復(fù)用的AV比特流AVSl中分離音頻比特流并輸出。音頻比特流分析部722分析由第一流分離部721分離的音頻比特流ABSl是否包含人的聲音。第二流分離部734將對(duì)AV比特流AVSl進(jìn)行了延遲的AV比特流AVS2分離為音頻比特流與視頻比特流并輸出。音頻解碼部712對(duì)由第二流分離部734分離的音頻比特流ABS2進(jìn)行解碼。以下詳細(xì)說(shuō)明圖7的數(shù)字信號(hào)再生裝置的動(dòng)作。首先,第一流分離部721從AV數(shù)據(jù)保存部732中保存的MPEG-2TS格式的比特流AVSl中取出音頻分組,結(jié)合取出的各分組, 作為音頻比特流ABSl輸出到音頻比特流分析部722。第一流分離部721丟棄視頻分組。音頻解碼部712、可變速再生部714、音頻比特流分析部722、以及再生速度決定部 7M與參照?qǐng)D1說(shuō)明的對(duì)應(yīng)的結(jié)構(gòu)要素相同,視頻解碼控制部716以及視頻解碼部738與參照?qǐng)D6說(shuō)明的對(duì)應(yīng)的結(jié)構(gòu)要素相同,因而省略它們的說(shuō)明。接著,第二流分離部734對(duì)于AV數(shù)據(jù)保存部732中保存的與之前相同的MPEG-2 TS格式的比特流AVS1,經(jīng)過(guò)一段時(shí)間后作為比特流AVS2再次讀入,這次取出視頻分組,結(jié)合取出的各分組,作為視頻比特流VBS輸出到視頻解碼部738。另外,第二流分離部734同樣取出音頻分組,結(jié)合取出的各分組,作為音頻比特流ABS2輸出到音頻解碼部712。在圖7的數(shù)字信號(hào)再生裝置中,與圖6的裝置不同,在視頻解碼之前,由再生速度決定部7M決定再生速度,因此無(wú)需視頻緩沖部。另外,影像信號(hào)中不產(chǎn)生延遲,因此也無(wú)需音頻緩沖部。第一流分離部721以及第二流分離部734對(duì)相同的AV比特流并行動(dòng)作,但首先, 使第一流分離部721先對(duì)比特流AVSl開(kāi)始處理,隨后第二流分離部734對(duì)使比特流AVSl 進(jìn)行了延遲的比特流AVS2進(jìn)行處理。此外,在圖7的裝置中,與圖6的裝置中的視頻緩沖器同樣,使第一流分離部721 先進(jìn)行動(dòng)作的時(shí)間需要至少根據(jù)視頻編碼的幀預(yù)測(cè)的性質(zhì)為2幀以上,再加上再生速度決定部724的處理延遲時(shí)間(依賴(lài)于再生速度的精度)。若先進(jìn)行動(dòng)作的時(shí)間過(guò)短,則在影像或聲音再生時(shí),再生速度尚未決定,因而需要注意。另外,與圖6的情況不同,即使先進(jìn)行動(dòng)作的時(shí)間過(guò)大,也不存在對(duì)緩沖器大小的影響,但需要注意的是,需要保存再生速度決定部7M決定的再生速度信息的緩沖器。進(jìn)而,還需要注意的是,從變更再生速度,到實(shí)際上反映到影像信號(hào)、聲音信號(hào)的輸出為止的延遲時(shí)間變長(zhǎng)。根據(jù)上述理由,需要對(duì)先進(jìn)行動(dòng)作的時(shí)間設(shè)定適當(dāng)?shù)臅r(shí)間。在圖7的結(jié)構(gòu)中,再生速度決定部7 通過(guò)音頻比特流分析部722的音頻流分析結(jié)果決定再生速度,但再生速度的決定方法不限于此。例如,還可以對(duì)第一流分離部721輸出的音頻比特流進(jìn)行解碼,進(jìn)行作為其輸出的聲音數(shù)據(jù)的分析,進(jìn)行聲音區(qū)間檢測(cè),根據(jù)該聲音區(qū)間檢測(cè)的結(jié)果決定再生速度。在圖7的結(jié)構(gòu)中,假定第一流分離部721與第二流分離部734同時(shí)動(dòng)作,但也可以使一個(gè)流分離部時(shí)分交互地作為兩個(gè)流分離部動(dòng)作。在圖6以及圖7的數(shù)字信號(hào)再生裝置的說(shuō)明中,作為例子示出了再生速度為3倍的情況,但再生速度也可以為3倍以外。如已經(jīng)描述的那樣,在數(shù)字廣播中,圖像結(jié)構(gòu)往往為IBBPBBPBBPBBPBB(IBBP...)的反復(fù),因而使用作為該反復(fù)的單位的15個(gè)圖像,說(shuō)明3倍以外的再生速度的實(shí)現(xiàn)方法。在MPEG-2視頻中,若跳過(guò)I圖像的解碼,則無(wú)法進(jìn)行在預(yù)測(cè)中利用該圖像的P圖像或B圖像的解碼。若跳過(guò)P圖像的解碼,則無(wú)法進(jìn)行在預(yù)測(cè)中利用該圖像的(在其后面的)P圖像或B圖像的解碼。即使跳過(guò)B圖像的解碼,也不會(huì)有對(duì)其他圖像的解碼的影響,可以利用上述性質(zhì)。例如,如下所示,可以知道,若跳過(guò)4個(gè)B圖像的解碼則能夠?qū)崿F(xiàn)1.5 倍速,若跳過(guò)全部(8個(gè))B圖像的解碼則能夠?qū)崿F(xiàn)3倍速,若跳過(guò)全部(8個(gè)B圖像、4個(gè)P 圖像)B圖像以及P圖像的解碼則能夠?qū)崿F(xiàn)15倍速。若用文字表示各圖像,則表示為IBBPBBPBBPBBPBBI ... 1 倍IB PB PB PB PB I …1. 5 倍IPPPPI ".3 倍II ... 15 倍通過(guò)精細(xì)地控制跳過(guò)的圖像,能夠使再生速度變化為上述以外的速度。圖8是表示跳過(guò)的圖像(picture)的種類(lèi)以及個(gè)數(shù)、以及再生速度的組合的代表例的說(shuō)明圖。在圖8 的例子中,能夠?qū)崿F(xiàn)12種再生速度。另外,在本實(shí)施方式中,以15幀為單位控制了圖像跳過(guò),若以其他單位(例如6幀、30幀等)進(jìn)行控制,則能夠?qū)崿F(xiàn)進(jìn)一步不同的再生速度。視頻解碼控制部616、716決定作為控制圖像跳過(guò)的單位的幀數(shù)以及跳過(guò)的圖像的種類(lèi)及個(gè)數(shù),從而以對(duì)應(yīng)于再生速度決定部6M或7M決定的再生速度的速度再生影像。另外,作為解碼的圖像的模式,不使用影像不自然地運(yùn)動(dòng)的模式。代替這種模式, 采用影像不會(huì)不自然地運(yùn)動(dòng)的模式,進(jìn)一步進(jìn)行幀的提取和幀的反復(fù),使影像的再生速度與音頻的再生速度相符合。在本實(shí)施方式中,基于圖像跳過(guò)所需的時(shí)間為0決定了再生速度,但實(shí)際上,在跳過(guò)了圖像的情況下,產(chǎn)生直到下一個(gè)圖像的頭部為止找到比特流的所需部分的開(kāi)頭的時(shí)間。雖然假定跳過(guò)一個(gè)圖像的比特流的時(shí)間與解碼時(shí)間相比非常短,但在跳過(guò)的圖像較多的情況下會(huì)產(chǎn)生無(wú)法忽略的延遲時(shí)間。圖像的跳過(guò)時(shí)間依賴(lài)于跳過(guò)的比特流的大小,但 MPEG2視頻中每個(gè)圖像的大小不固定,因此需要設(shè)想最大的大小。此處,設(shè)想圖像跳過(guò)時(shí)間為解碼時(shí)間的五分之一,作為圖8的實(shí)質(zhì)再生速度示出重新計(jì)算了再生速度而得到的速度。在本實(shí)施方式中,使用IBBPBBPBBPBBPBB的圖像結(jié)構(gòu)進(jìn)行了說(shuō)明,但只要是能夠進(jìn)行至少一個(gè)以上圖像解碼的跳過(guò)的圖像結(jié)構(gòu),都能實(shí)現(xiàn)同樣的再生。在本實(shí)施方式中,以用再生速度決定部624、7M決定的再生速度一定能夠?qū)崿F(xiàn)視頻解碼為前提進(jìn)行了說(shuō)明,但在可跳過(guò)的圖像比預(yù)想少的圖像結(jié)構(gòu)的情況(例如突然變化為IPPPPPPPPPPPPPP的圖像結(jié)構(gòu)的情況)、圖像跳過(guò)所需的時(shí)間比預(yù)想長(zhǎng)的情況(在本實(shí)施方式中設(shè)想為解碼時(shí)間的五分之一,但與此相比需要較長(zhǎng)時(shí)間的情況)下,有時(shí)無(wú)法用再生速度決定部624、7M決定的再生速度再生影像信號(hào)。此時(shí),在輸出聲音信號(hào)的時(shí)機(jī),影像信號(hào)的解碼未結(jié)束,因而不得不繼續(xù)輸出相同的影像信號(hào)。為了從這種事態(tài)迅速恢復(fù),在無(wú)法進(jìn)行指定再生速度的再生的情況下,可以控制為從視頻解碼控制部638、738對(duì)再生速度決定部624、7M進(jìn)行反饋以放慢再生速度,從而隨后能夠以指定再生速度進(jìn)行影像信號(hào)的再生。在本實(shí)施方式中,作為影像信號(hào)的編碼方式采用MPEG-2視頻,但只要能夠進(jìn)行圖像解碼的跳過(guò),H. 264或其他運(yùn)動(dòng)圖像編碼方式也同樣能夠使用。在本實(shí)施方式中,作為聲音信號(hào)的編碼方式采用MPEG-2AAC,但其他的任意聲音編碼方式也同樣能夠使用。在本實(shí)施方式中,作為影像信號(hào)與聲音信號(hào)的復(fù)用方式,利用MPEG-2TS,但在圖6的結(jié)構(gòu)中,只要是組合要在相同時(shí)間輸出的視頻比特流與音頻比特流并進(jìn)行復(fù)用的復(fù)用方式,就同樣能夠使用。在圖9的結(jié)構(gòu)中,MPEG-2PS(IS0/IEC13818"1)等視頻比特流與音頻比特流獨(dú)立進(jìn)行復(fù)用的復(fù)用方式、其他任何復(fù)用方式也同樣能夠使用。本發(fā)明的許多特征以及優(yōu)越性根據(jù)記載的說(shuō)明而變得明確,因此,希望通過(guò)附加的權(quán)利要求書(shū),涵蓋本發(fā)明的全部上述特征以及優(yōu)越性。進(jìn)而,本領(lǐng)域技術(shù)人員能夠容易地進(jìn)行許多變更以及改變,因而本發(fā)明不應(yīng)限定于與圖示和記載的完全相同的結(jié)構(gòu)以及動(dòng)作。因此,全部適當(dāng)?shù)母淖兾镆约暗葍r(jià)物均在本發(fā)明的范圍內(nèi)。產(chǎn)業(yè)上的利用可能性如以上所說(shuō)明的那樣,根據(jù)本發(fā)明的實(shí)施方式,能夠以較少的運(yùn)算量進(jìn)行是否包含人的聲音的判定,另外,這種判定變得容易,因而本發(fā)明對(duì)數(shù)字信號(hào)再生裝置以及數(shù)字信號(hào)壓縮裝置等是有用的。進(jìn)而,對(duì)于BD、DVD、HDD、以及存儲(chǔ)卡等的再生器以及記錄器是有
用的。
符號(hào)說(shuō)明
112、612、712音頻解碼部
114、614、714可變速再生部
122、622、722音頻比特流分析部
124、624、724再生速度決定部
254音頻信號(hào)分析部
260音頻編碼部
352低頻成分提取部
356高頻成分編碼部
374,474復(fù)用部
613音頻緩沖部
616、716視頻解碼控制部
634流分離部
636視頻緩沖部
638、738視頻解碼部
721第一流分離部
734第二流分離部
權(quán)利要求
1.一種數(shù)字信號(hào)再生裝置,其特征在于包括音頻解碼部,對(duì)音頻比特流進(jìn)行解碼,輸出得到的音頻信號(hào);音頻比特流分析部,分析所述音頻比特流是否包含人的聲音;再生速度決定部,基于所述音頻比特流分析部中的分析結(jié)果,決定再生速度;以及可變速再生部,按照所述再生速度決定部決定的再生速度,再生所述音頻信號(hào)。
2.根據(jù)權(quán)利要求1所述的數(shù)字信號(hào)再生裝置,其特征在于所述音頻比特流分析部針對(duì)每個(gè)指定長(zhǎng)度的區(qū)間分析所述音頻比特流中進(jìn)行預(yù)測(cè)編碼的頻度;所述再生速度決定部根據(jù)各區(qū)間中進(jìn)行預(yù)測(cè)編碼的頻度決定各區(qū)間的再生速度。
3.根據(jù)權(quán)利要求1所述的數(shù)字信號(hào)再生裝置,其特征在于所述音頻比特流分析部針對(duì)每個(gè)指定長(zhǎng)度的區(qū)間分析所述音頻比特流中進(jìn)行向頻域信號(hào)的變換的頻度;所述再生速度決定部根據(jù)各區(qū)間中進(jìn)行頻率變換的頻度決定各區(qū)間的再生速度。
4.根據(jù)權(quán)利要求1所述的數(shù)字信號(hào)再生裝置,其特征在于還包括視頻解碼控制部,進(jìn)行關(guān)于視頻比特流的解碼處理的決定,從而以與所述再生速度決定部決定的再生速度對(duì)應(yīng)的速度再生影像;以及視頻解碼部,按照所述視頻解碼控制部的決定,對(duì)所述視頻比特流進(jìn)行解碼。
5.根據(jù)權(quán)利要求4所述的數(shù)字信號(hào)再生裝置,其特征在于還包括 流分離部,將復(fù)用的比特流分離為所述音頻比特流和所述視頻比特流;第一緩沖器,存儲(chǔ)由所述流分離部分離的所述視頻比特流并輸出到所述視頻解碼部;以及第二緩沖器,存儲(chǔ)從所述音頻解碼部輸出的所述音頻信號(hào)并輸出到所述可變速再生部。
6.根據(jù)權(quán)利要求4所述的數(shù)字信號(hào)再生裝置,其特征在于還包括 流分離部,將復(fù)用的比特流分離為所述音頻比特流和所述視頻比特流;第一緩沖器,存儲(chǔ)由所述流分離部分離的所述視頻比特流并輸出到所述視頻解碼部;以及第二緩沖器,存儲(chǔ)由所述流分離部分離的所述音頻比特流并輸出到所述音頻解碼部。
7.根據(jù)權(quán)利要求4所述的數(shù)字信號(hào)再生裝置,其特征在于還包括 第一流分離部,從復(fù)用的比特流中分離并輸出第一音頻比特流;以及第二流分離部,將對(duì)所述復(fù)用的比特流進(jìn)行了延遲的比特流分離為第二音頻比特流和所述視頻比特流并輸出;所述音頻比特流分析部分析所述第一音頻比特流是否包含人的聲音; 所述音頻解碼部對(duì)所述第二音頻比特流進(jìn)行解碼。
8.一種數(shù)字信號(hào)壓縮裝置,其特征在于包括音頻信號(hào)分析部,針對(duì)每個(gè)指定長(zhǎng)度的區(qū)間分析音頻信號(hào),檢測(cè)表示所述音頻信號(hào)的區(qū)間內(nèi)包含人的聲音的成分的程度的指數(shù);以及音頻編碼部,對(duì)所述音頻信號(hào)的對(duì)應(yīng)于所述指數(shù)的區(qū)間,在所述指數(shù)大于指定閾值的情況下以預(yù)測(cè)編碼方式進(jìn)行編碼,在所述指數(shù)為所述指定閾值以下的情況下以頻率變換編碼方式進(jìn)行編碼,并輸出得到的編碼數(shù)據(jù)。
9.根據(jù)權(quán)利要求8所述的數(shù)字信號(hào)壓縮裝置,其特征在于還包括 低頻成分提取部,從所述音頻信號(hào)中提取并輸出低頻成分;高頻成分編碼部,使用頻帶擴(kuò)大技術(shù)對(duì)所述音頻信號(hào)的高頻成分進(jìn)行編碼,輸出得到的編碼數(shù)據(jù);以及復(fù)用部;所述音頻信號(hào)分析部分析所述低頻成分提取部提取的低頻成分; 所述音頻編碼部對(duì)所述低頻成分提取部提取的低頻成分進(jìn)行編碼并輸出; 所述復(fù)用部對(duì)高頻成分編碼部生成的編碼數(shù)據(jù)與所述音頻編碼部生成的編碼數(shù)據(jù)進(jìn)行復(fù)用,以生成音頻比特流。
10.根據(jù)權(quán)利要求9所述的數(shù)字信號(hào)壓縮裝置,其特征在于 所述復(fù)用部還將所述指數(shù)復(fù)用到所述音頻比特流中。
全文摘要
以較少的運(yùn)算量進(jìn)行包含人的聲音的區(qū)間的判定。數(shù)字信號(hào)再生裝置具有音頻解碼部,對(duì)音頻比特流進(jìn)行解碼,輸出得到的音頻信號(hào);音頻比特流分析部,分析所述音頻比特流是否包含人的聲音;再生速度決定部,基于所述音頻比特流分析部中的分析結(jié)果決定再生速度;以及可變速再生部,按照所述再生速度決定部決定的再生速度再生所述音頻信號(hào)。
文檔編號(hào)G10L19/00GK102414744SQ20108001844
公開(kāi)日2012年4月11日 申請(qǐng)日期2010年4月22日 優(yōu)先權(quán)日2009年4月28日
發(fā)明者宮阪修二, 池田浩 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社