国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      聲頻信號(hào)特征波形的合成方法

      文檔序號(hào):2820561閱讀:559來(lái)源:國(guó)知局
      專利名稱:聲頻信號(hào)特征波形的合成方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及聲頻信號(hào)處理技術(shù),特別是涉及聲頻信號(hào)特征波形合成方法。
      由于數(shù)字電子技術(shù)的發(fā)展,使得模擬信號(hào)波形可藉模擬/數(shù)字轉(zhuǎn)換后成為數(shù)字信號(hào),以便于存儲(chǔ)、處理、甚或傳輸,因此,更能加速電子數(shù)據(jù)的流通與共享。
      公知截取信號(hào)波形數(shù)據(jù)并予以記錄時(shí),通常視所需的精度而定,是以八個(gè)位或十六個(gè)位來(lái)表示所被取樣波形各點(diǎn)的振幅值。如果一段波形以8K個(gè)點(diǎn)取樣,且以八個(gè)位表示每個(gè)取樣點(diǎn)量化后的值,則該段波形須占用64K位。換句話說(shuō),如果記錄聲頻信號(hào)的信號(hào)時(shí),以每秒8K的取樣率并以8位量化,則每秒所截取的信號(hào)便需要64K位的存儲(chǔ)空間。
      以上述脈碼調(diào)制(PCMPulse Code Modulation)方式處理聲頻信號(hào)雖可為實(shí)時(shí)(real time)的處理,但所處理得的龐大數(shù)據(jù)會(huì)占用大量的存儲(chǔ)空間,對(duì)其實(shí)際的應(yīng)用構(gòu)成極大的限制。如果使用自適應(yīng)差分脈碼調(diào)制(ADPCMAdaptive Differential Pulse Code Modulation)方式編碼,雖可節(jié)省一半的存儲(chǔ)空間,但對(duì)低速中央處理器(諸如Z80、80386等)而言,因運(yùn)算法則過(guò)于復(fù)雜繁瑣,因而無(wú)法以實(shí)時(shí)的方式處理。因此,在低速中央處理器的應(yīng)用領(lǐng)域里,尋求一種聲頻信號(hào)處理方法,同時(shí)兼具不會(huì)占用大量存儲(chǔ)空間及能實(shí)時(shí)處理等功能,成為此領(lǐng)域人士所期盼的。
      因此,本發(fā)明的主要目的,在于提供一種聲頻信號(hào)特征波形合成方法,可減少對(duì)存儲(chǔ)空間的需求。
      本發(fā)明的另一目的,在于提供一種聲頻信號(hào)特征波形合成方法,可適用于低速中央處理器得對(duì)聲頻信號(hào)做實(shí)時(shí)處理。
      為達(dá)到上述目的,本發(fā)明提供一種聲頻信號(hào)特征波形合成方法,該方法包括如下步驟截取聲頻信號(hào);對(duì)所截取的聲頻信號(hào)進(jìn)行取樣與量化處理;進(jìn)行特征波形的選?。淮鎯?chǔ)特征波形及時(shí)間間隔;讀取所存儲(chǔ)的能代表一聲頻信號(hào)的第一特征波形和第二特征波形;以內(nèi)插法合成出其間的內(nèi)插波形。
      為達(dá)到上述目的,本發(fā)明提供一種聲頻信號(hào)特征波形合成方法來(lái)完成,其中,第一特征波形的周期為Ma、振幅為Aa[t],而第二特征波形的周期為Mb、振幅為Ab[t],該第一特征波形和該第二特征波形之間的時(shí)間間隔為L(zhǎng)。根據(jù)本發(fā)明方法是以內(nèi)插法合成出第一特征波形和該第二特征波形間的內(nèi)插波形。而各內(nèi)插波形的振幅值為Ar[t]=(L-K)/L×Ar′[t]+(1+k)/L×Ar″[t];各內(nèi)插波形的周期為Mr=Ma-r×(Ma-Mb)/(1+R)其中,r=1,2,...,R;其中,R=2L/(Ma+Mb);Ar′[t]=Aa[(Ma/Mr)×t];Ar″[t]=Ab[(Mb/Mr)×t];r=1,2,...,R;t=0,1,...,Mr-1;以及k=(M1+M2+...+M(r-1)),(M1+M2+...+M(r-1)+1),...,(M1+M2+...+M(r-1)+(Mr-1))。
      為使本發(fā)明的上述和其他目的、特征、和優(yōu)點(diǎn)能更明顯易懂,下文特舉一較佳實(shí)施例,并配合附圖作詳細(xì)說(shuō)明如下。


      圖1是顯示一段聲頻信號(hào)波形圖;圖2是顯示經(jīng)選取后的特征波形圖;圖3是顯示根據(jù)本發(fā)明聲頻信號(hào)特征波形合成方法合成后的波形圖;圖4是顯示本發(fā)明方法的流程圖;以及圖5是顯示本發(fā)明方法一個(gè)實(shí)施例的流程圖。
      本發(fā)明所提供的聲頻信號(hào)特征波形合成方法,是先對(duì)待處理的波形進(jìn)行分析,篩選出具代表性的特征波形(characteristic waveform)。當(dāng)在存儲(chǔ)時(shí),僅需記錄這些特征波形及其相關(guān)參數(shù),而不必記錄整個(gè)信號(hào)的波形,于是,便可減省大量的存儲(chǔ)空間。由于篩選出特征波形前,聲頻信號(hào)已經(jīng)過(guò)取樣量化等處理,故而所選取的特征波形根據(jù)其取樣率呈離散值(discrete value)。后續(xù)合成還原時(shí),藉由讀出此等特征波形及其相關(guān)參數(shù),再以一內(nèi)插運(yùn)算法就可以合成還原出波形。此內(nèi)插運(yùn)算法并非屬?gòu)?fù)雜繁瑣的方法,故還原速度相當(dāng)快,就以80486中央處理器還原4000K位數(shù)據(jù)量的波形為例,約僅需五秒鐘的光景。因此,本發(fā)明方法相當(dāng)符合低速中央處理器的應(yīng)用領(lǐng)域。以下便就本發(fā)明方法做詳細(xì)說(shuō)明如下。
      若要談?wù)撀曨l信號(hào)特征波形合成,則必然先得說(shuō)明特征波形是如何選取。由于包括語(yǔ)音、音樂(lè)、音素、音效等的聲頻信號(hào)都具有一些共同的特點(diǎn),即是在某一時(shí)間區(qū)段里具有準(zhǔn)周期性,另外,聲頻信號(hào)亦具有連續(xù)性。根據(jù)這兩個(gè)主要特點(diǎn),針對(duì)一段聲頻信號(hào)波形進(jìn)行觀察,選出其中具代表性的特征波形,并把這些特征波形記錄存儲(chǔ),同時(shí)也將兩相鄰特征波形之間的長(zhǎng)度也一并予以記錄存儲(chǔ)。
      為便于后續(xù)波形的還原,得以降低合成后的聲頻信號(hào)波形間連接處過(guò)大的跳動(dòng)而產(chǎn)生的噪音,因此,所選取的特征波形起始和終止位置最好選擇在振幅等于零或接近零處,且與相鄰波形連接處同為向上或向下的趨勢(shì),以確保相位一致。此一特征波形選取步驟,譬如可以一邊選取特征波形、一邊利用本發(fā)明的聲頻信號(hào)特征波形合成方法(如后詳述)合成信號(hào),然后聽(tīng)合成后的效果;如果不理想,則重新選取合成,直至尋找能得到最佳效果的特征波形為止。再者,也可使用自相關(guān)函數(shù)及互相關(guān)函數(shù)來(lái)計(jì)算信號(hào)的周期,并據(jù)以選取特征波形。若聲頻信號(hào)屬語(yǔ)音信號(hào),則其信號(hào)的周期很明顯,很容易篩選出具有代表性的特征波形。
      圖1所示為一段聲頻信號(hào)波形圖,根據(jù)這段波形,選取如圖2所示的兩個(gè)特征波形A和B并予以存儲(chǔ),同時(shí)將兩個(gè)特征波形間的時(shí)間長(zhǎng)度L也予以記錄存儲(chǔ),此時(shí)長(zhǎng)度L是指特征波形A的終止點(diǎn)至特征波形B的起始點(diǎn)而言。在此再次強(qiáng)調(diào),由于篩選出特征波形前,聲頻信號(hào)已經(jīng)過(guò)取樣量化等處理,故而所選取的特征波形根據(jù)其取樣率呈離散值(discrete value)。
      如上所述,經(jīng)選取的之特征波形A和B,波形A是一個(gè)周期為Ma、振幅為Aa[t]的波形,波形B是一個(gè)周期為Mb、振幅為Ab[t]的波形,波形A和波形B之間的時(shí)間間隔為L(zhǎng),故在時(shí)間間隔L預(yù)計(jì)要內(nèi)插的波形次數(shù)為R=2L/(Ma+Mb);各個(gè)內(nèi)插波形的周期Mr分別為Mr=Ma-r×(Ma-Mb)/(1+R)其中,r=1,2...,R;波形A按Mr周期延拓A1′[t]=Aa[(Ma/M1)×t]其中,t=0,1,...,M1-1;A2′[t]=Aa[(Ma/M2)×t]其中,t=0,1,...,M2-1; Ar′[t]=Aa[(Ma/Mr)×t]其中,t=0,1,...,Mr-1;波形B按Mr周期延拓A1″[t]=Ab[(Mb/M1)×t]其中,t=0,1,...,M1-1;A2″[t]=Ab[(Mb/M1)×t]其中,t=0,1,...,M2-1; Ar″[t]=Ab[(Mb/Mr)×t]其中,t=0,1,...,Mr-1;再者,波形A按(L-k)/L的比例依次對(duì)各合成波形延拓影響,波形B按(1+k)/L的比例依次對(duì)各合成波形延拓影響。則還原后的各個(gè)重復(fù)波形振幅值為Ar[t]=(L-K)/L×Ar′[t]+(1+k)/L×Ar″[t];其中,r=1,2,...,R;t=0,1,...,Mr-1;以及k=(M1+M2+...+M(r-1)),(M1+M2+...+M(r-1)+1),...,(M1+M2+...+M(r-1)+(Mr-1))。
      據(jù)此,由波形A和波形B所合成的波形即如圖3所示。原先需要存儲(chǔ)圖1所示的整段波形,根據(jù)本發(fā)明聲頻信號(hào)特征波形合成方法后,僅需存儲(chǔ)波形A和波形B、以及其間的時(shí)間間隔長(zhǎng)度L即可,故可大幅減省存儲(chǔ)空間。
      本發(fā)明方法適用于處理聲頻信號(hào),壁如是用WAV或PCM記錄的聲音信號(hào),故可套用WAV的基本格式。
      本發(fā)明的特征波形存儲(chǔ)可以包括標(biāo)題區(qū)(header block)及數(shù)據(jù)區(qū)(DataBlock)兩個(gè)區(qū)塊組成的格式存儲(chǔ),現(xiàn)詳細(xì)說(shuō)明如下標(biāo)題區(qū)該標(biāo)題區(qū)包含一些基本信息,其包括文件長(zhǎng)度、檔案名類型、格式類型、通道數(shù)、取樣頻率值、每秒平均數(shù)據(jù)傳送速率、PCM數(shù)據(jù)取樣位數(shù)、以及特征波形個(gè)數(shù)等。此特征波形的文件數(shù)據(jù)結(jié)構(gòu)可如下述的C語(yǔ)言所示<pre listing-type="program-listing"><![CDATA[typedef struct {char RIFF[4];long Whfilelen;char BWSfmt[8];long version;int FormatTag;int Channels;long SamplePerSec;long AvgBytesPersecint blockalign;int BitPerSample;char data[4];long SjpeWaveNum;};]]></pre>而,AvgBytesPerSec=Channels×SamplePerSec×(BitPerSample/8);Blockalign=Channels×(BitPerSample/8));數(shù)據(jù)區(qū)該數(shù)據(jù)區(qū)存放特征波形的PCM取樣數(shù)據(jù)及特征波形信息參數(shù)。譬如,一個(gè)八位單聲道脈碼調(diào)制數(shù)據(jù)的存儲(chǔ)格式可以是
      16位16位 8位8位 8位其中,信息位為三個(gè)位組成,特征波形周期是以十三個(gè)位表示。一個(gè)八位雙聲道脈碼調(diào)制數(shù)據(jù)的存儲(chǔ)格式可以是
      16位16位 8位8位 8位其中,信息位為三個(gè)位組成,特征波形周期是以十三個(gè)位表示。一個(gè)十六位單聲道脈碼調(diào)制數(shù)據(jù)的存儲(chǔ)格式可以是
      16位 16位 8位 8位 8位 8位 8位其中,信息位為三個(gè)位組成,特征波形周期是以十三個(gè)位表示。一個(gè)十六位雙聲道脈碼調(diào)制數(shù)據(jù)的存儲(chǔ)格式可以是
      16位16位 8位 8位 8位 8位 8位其中,信息位為三個(gè)位組成,特征波形周期是以十三個(gè)位表示。
      上述各格式的信息位三個(gè)位是用來(lái)區(qū)分特征波形的類型。譬如待選取的聲頻信號(hào)為英語(yǔ)單字的發(fā)音,則特征波形可以分為子音、母音及靜音等。如果是靜音,則記錄波形周期的13個(gè)位連同后續(xù)的16個(gè)位總共29個(gè)位,用以記錄此靜音的長(zhǎng)度,于是,一共可以記錄512M個(gè)取樣點(diǎn);若靜音長(zhǎng)度超過(guò)此一數(shù)值,則可再占用4個(gè)位來(lái)記錄靜音長(zhǎng)度。
      當(dāng)在特征波形合成時(shí),內(nèi)插波形與特征波形間的連接,如果不是很平滑就會(huì)產(chǎn)生噪音。為了避免該噪音的出現(xiàn),當(dāng)在選取特征波形時(shí),就應(yīng)當(dāng)注重特征波形的起始點(diǎn)的選擇,盡可能選擇每個(gè)起始點(diǎn)振幅為零或近于零處。因此,得以確保波形連接處的平滑,則根據(jù)本法所合成的聲音為自然。
      在上述特征波形合成過(guò)程中,運(yùn)用內(nèi)插法計(jì)算出經(jīng)選取的兩特征波形的時(shí)間間隔L內(nèi)所需內(nèi)插的波形個(gè)數(shù)及每個(gè)內(nèi)插波形的周期。然而,在合成還原后,由內(nèi)插波形所組成的時(shí)間長(zhǎng)度L′較之L為小,其間之差介于0~較小的特征波形周期長(zhǎng)度間。為能保證所合成波形與原始波形長(zhǎng)度一致,可在內(nèi)插波形中再均勻內(nèi)插1~2點(diǎn),促使L′和L二者趨于一致。另外,也可以利用一低通濾波器對(duì)聲頻信號(hào)進(jìn)行過(guò)濾,消除因連接不平滑所產(chǎn)生的噪音。
      參照?qǐng)D4和5,所示分別是本發(fā)明方法的流程圖及一實(shí)施例(TTSText toSpeech)的流程圖。
      如圖4所示,為本發(fā)明方法的流程圖。首先,在步驟40,從磁帶等媒體截取記錄在其上的聲頻信號(hào),若是應(yīng)用于文字轉(zhuǎn)換語(yǔ)音技術(shù),則此聲頻信號(hào)是指由發(fā)音規(guī)則所歸納得的音素。再在步驟42,對(duì)所截取的聲頻信號(hào)進(jìn)行取樣與量化處理,簡(jiǎn)言之,就是做數(shù)位化處理,以便于形成如WAV格式的文件。接著,在步驟44,進(jìn)行特征波形的選取,為便于后續(xù)波形的還原,得以降低合成后的聲頻信號(hào)波形間連接處過(guò)大的跳動(dòng)而產(chǎn)生噪音,故所選取的特征波形起始和終止位置最好選擇振幅等于零或接近于零處,且與相鄰波形連接處同為向上或向下的趨勢(shì),以確保相位一致。目前可以建立一個(gè)工作環(huán)境,一邊選取特征波形、一邊利用本發(fā)明聲頻信號(hào)特征波形合成方法合成信號(hào),然后聽(tīng)合成后的效果;如不理想,則重新選取合成,直至尋找能得到最佳效果的特征波形止。再者,亦可使用自相關(guān)函數(shù)及互相關(guān)函數(shù)來(lái)計(jì)算信號(hào)的周期,并據(jù)以選取特征波形。若聲頻信號(hào)屬語(yǔ)音信號(hào),則其信號(hào)的周期很明顯,很容易便可決定較適當(dāng)?shù)奶卣鞑ㄐ?。然后,在步驟46,將所選取的特征波形和兩特征波形間的時(shí)間長(zhǎng)度予以存儲(chǔ),之后,在步驟48,讀取特征波形及時(shí)間間隔,所讀取的是所存儲(chǔ)的能代表一聲頻信號(hào)的第一特征波形和第二特征波形,在步驟50,進(jìn)行特征波形合成,最后,在步驟52,發(fā)聲。
      如圖5所示,所示為本發(fā)明方法應(yīng)用于文字轉(zhuǎn)換語(yǔ)音(TTSText to Speech)技術(shù)的合成方塊流程圖。首先,在步驟50,讀取單詞,此單詞譬如是由使用者查詢得的某一單字,再在步驟52,分析單詞的音標(biāo)組合,并在步驟54,依特定規(guī)則選取音素,譬如以英文單字“HELLO”為例,依讀音規(guī)則可切分成&lt;*h&gt;、&lt;ha&gt;、&lt;al&gt;、&lt;lo&gt;、&lt;o*&gt;等音素,其中,符號(hào)*代表靜音。而步驟56是根據(jù)本發(fā)明方法合成所選取的音素,再在步驟58,將所合成的音素組合成單詞,并在步驟60,對(duì)此單詞發(fā)聲。上述步驟50、52、54、58等步驟的詳細(xì)流程已揭露于申請(qǐng)?zhí)?5112444和85112445等各案,但其并非為本發(fā)明的重點(diǎn),故于此不再贅述。
      綜上所述,運(yùn)用本發(fā)明聲頻信號(hào)特征波形合成方法,是對(duì)聲頻信號(hào)篩選具代表性的特征波形,后續(xù)再根據(jù)特征波形以內(nèi)插法合成還原。然而,其壓縮率和還原效果端賴所被選取的原始聲頻信號(hào)波形,本發(fā)明方法已對(duì)音樂(lè)和音效測(cè)試,針對(duì)8K取樣率、8位量化、傳輸率為64Kbits/sec的原始聲頻信號(hào)而言,其速率約介于8~32Kbits/sec,此速率介于自適應(yīng)差分脈碼調(diào)制(ADPCM)和向量和激勵(lì)線性預(yù)測(cè)(VSELP)之間,然而其所合成的音質(zhì)則接近自適應(yīng)差分脈碼調(diào)制(ADPCM)。
      雖然本發(fā)明已以較佳實(shí)施例揭露如上,但其并非用以限定本發(fā)明,任何本領(lǐng)域的技術(shù)人員,在不脫離本發(fā)明的精神范圍內(nèi),可作更動(dòng)與潤(rùn)飾,因此本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求所界定的范圍為準(zhǔn)。
      權(quán)利要求
      1.一種聲頻信號(hào)特征波形合成方法,其特征在于,該方法按如下步驟執(zhí)行截取聲頻信號(hào);對(duì)所截取的聲頻信號(hào)進(jìn)行取樣與量化處理;進(jìn)行特征波形的選??;存儲(chǔ)特征波形及時(shí)間間隔;讀取所存儲(chǔ)的能代表一聲頻信號(hào)的第一特征波形和第二特征波形;以內(nèi)插法合成出其間的內(nèi)插波形。
      2.如權(quán)利要求1所述的聲頻信號(hào)特征波形合成方法,其中,該第一特征波形的周期為Ma、振幅為Aa[t],該第二特征波形的周期為Mb、振幅為Ab[t],該第一特征波形和該第二特征波形之間的時(shí)間間隔為L(zhǎng)。
      3.如權(quán)利要求2所述的該聲頻信號(hào)特征波形合成方法,其中,該內(nèi)插波形的關(guān)系如下各個(gè)該內(nèi)插波形的振幅值為Ar[t]=(L-k)/L×Ar′[t]+(1+k)/L×Ar″[t];各個(gè)內(nèi)插波形的周期為Mr=Ma-r×(Ma-Mb)/(1+R)其中,r=1,2,...,R;其中,R=2L/(Ma+Mb);Ar′[t]=Aa[(Ma/Mr)×t];Ar″[t]=Ab[(Mb/Mr)×t];r=1,2,...,R;t=0,1,...,Mr-1;以及k=(M1+M2+...+M(r-1)),(M1+M2+...+M(r-1)+1),...,(M1+M2+...+M(r-1)+(Mr-1))。
      4.如權(quán)利要求1所述的聲頻信號(hào)特征波形合成方法,其中,該第一特征波形和該第二特征波形的起始點(diǎn)和終止點(diǎn)振幅近于零。
      5.如權(quán)利要求4所述的聲頻信號(hào)特征波形合成方法,其中,該第一特征波形和該第二特征波形的起始點(diǎn)和終止點(diǎn)振幅等于零。
      全文摘要
      聲頻信號(hào)特征波形合成及選取方法,是先對(duì)待處理的波形進(jìn)行分析,篩選出具代表性的特征波形。在存儲(chǔ)時(shí),僅記錄這些特征波形及其相關(guān)參數(shù),不必記錄整個(gè)信號(hào)的波形,可減省大量的存儲(chǔ)空間。在后續(xù)合成還原時(shí),通過(guò)讀出此特征波形及其相關(guān)參數(shù),再以一內(nèi)插運(yùn)算法就可以合成還原出波形。其所合成的音質(zhì)接近自適應(yīng)差分脈碼調(diào)制(ADPCM)的音質(zhì),故符合低速中央處理器的應(yīng)用領(lǐng)域。
      文檔編號(hào)G10L13/00GK1245326SQ9811836
      公開(kāi)日2000年2月23日 申請(qǐng)日期1998年8月17日 優(yōu)先權(quán)日1998年8月17日
      發(fā)明者張景嵩, 溫世義, 全晨, 方國(guó)平 申請(qǐng)人:英業(yè)達(dá)股份有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1