国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種語音識別的方法和裝置制造方法

      文檔序號:2825446閱讀:200來源:國知局
      一種語音識別的方法和裝置制造方法
      【專利摘要】本發(fā)明提供了一種語音識別的方法和裝置,其中方法包括:訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的隱馬爾科夫模型(HMM),在解碼網(wǎng)絡(luò)中的詞尾增加靜音(sil)模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;利用所述解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。更進一步地,在解碼網(wǎng)絡(luò)中語言模型的末尾增加一條到該語言模型頭部的跳轉(zhuǎn)來模擬句間停頓對語言模型上下文信息的影響。通過本發(fā)明能夠提高語音識別的效果。
      【專利說明】一種語音識別的方法和裝置
      【【技術(shù)領(lǐng)域】】
      [0001]本發(fā)明涉及計算機應(yīng)用【技術(shù)領(lǐng)域】,特別涉及一種語音識別的方法和裝置。
      【【背景技術(shù)】】
      [0002]語音識別技術(shù)是讓機器通過識別和理解過程將語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)文本或命令的技術(shù),其中隱馬爾科夫模型(HMM)技術(shù)的成熟和不斷完善成為語音識別的主流方法。
      [0003]HMM是對語音信號的時間序列結(jié)構(gòu)建立統(tǒng)計模型,將之看做一個數(shù)學(xué)上的雙重隨機過程:一個是用具有有限狀態(tài)數(shù)的馬爾科夫鏈來模擬語音信號統(tǒng)計特性變化的隱含的隨機過程,另一個是與馬爾科夫鏈的每一個狀態(tài)相關(guān)聯(lián)的觀測序列的隨機過程。前者通過后者表現(xiàn)出來,但前者的具體參數(shù)是不可測的。人的言語過程實際上就是一個雙重隨機過程,語音信號本身是一個可觀測的時變序列,HMM合理地模仿了這一過程,是較為理想的一種語音模型。
      [0004]基于HMM方法的語音識別原理是通過在所有可能的HMM狀態(tài)跳轉(zhuǎn)序列中找出最優(yōu)的跳轉(zhuǎn)序列,將其對應(yīng)的文本信息作為識別結(jié)果。而解碼網(wǎng)絡(luò)描述所有可能的HMM狀態(tài)跳轉(zhuǎn),語音識別就是在解碼網(wǎng)絡(luò)上搜尋最佳跳轉(zhuǎn)序列的過程,識別的結(jié)果一定是解碼網(wǎng)絡(luò)所能描述的所有可能中的一種。識別過程中HMM狀態(tài)跳轉(zhuǎn)的序列被稱為路徑。以只識別“中”和“國”的簡單孤立詞為例,其解碼網(wǎng)絡(luò)如圖1所示,其中“中”對應(yīng)的HMM狀態(tài)跳轉(zhuǎn)序列為“4”、“0叩”,“國”對應(yīng)的!1麗狀態(tài)跳轉(zhuǎn)序列為1”、“110”,〈8>和</s>分別是語言模型的開始和結(jié)束符號。
      [0005]在人們說話過程中,說話人往往因思考、遲疑、咳嗽、驚訝、口吃等原因都會產(chǎn)生停頓,在語音信號中停頓會體現(xiàn)為一段時間沒有聲音,或者有聲音但不是語音聲,而是咳嗽或噴嚏聲。停頓在語音中分為句中`停頓和句間停頓,顧名思義,句中停頓指人在說一句話的過程中的停頓,句間停頓指人在說多句話時,句與句之間的停頓。
      [0006]在現(xiàn)有的語音識別中,一般認(rèn)為只在語音的頭尾有靜音,而語音中間是沒有停頓的,這樣在語音中有停頓時會把停頓錯誤識別為有語義的詞,而且更嚴(yán)重的是,由于語音識別是個根據(jù)當(dāng)前狀態(tài)向后擴展的過程,這種錯誤會直接影響到后面的識別過程,導(dǎo)致識別結(jié)果錯上加錯。解決這個問題的關(guān)鍵是正確的識別出語音中的停頓,使得后續(xù)的識別過程在正確的結(jié)果下向后進行;而正確識別出語音中停頓的前提是在解碼網(wǎng)絡(luò)中正確的描述所有的HMM狀態(tài)跳轉(zhuǎn)的可能。
      [0007]現(xiàn)有常用的方法是在解碼網(wǎng)絡(luò)中的詞尾增加靜音模型(sil模型),這樣在識別過程中遇到停頓時,sil模型會與其他有語義的模型競爭,如果sil模型占優(yōu)勢,則識別為停頓(又稱為被sil模型吸收)。圖2為在解碼網(wǎng)絡(luò)中增加sil模型的示意圖,圖中<s>和〈/s>分別是語言模型的開始和結(jié)束符號。
      [0008]但在實際應(yīng)用中,因為語音中的停頓會影響附近的聲學(xué)發(fā)音,停頓時間越長影響越大,另外,對于句間停頓語言模型的上下文信息會發(fā)生突變,現(xiàn)有技術(shù)中的識別方法并不能解決這些問題,識別效果有限。【
      【發(fā)明內(nèi)容】

      [0009]本發(fā)明提供了一種語音識別的方法和裝置,以便于提高語音識別的效果。
      [0010]具體技術(shù)方案如下:
      [0011]一種語音識別的方法,該方法包括:
      [0012]訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;
      [0013]利用所述解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。
      [0014]根據(jù)本發(fā)明一優(yōu)選實施例,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān);
      [0015]所述調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文具體為:將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
      [0016]根據(jù)本發(fā)明一優(yōu)選實施例,該方法還包括:在所述解碼網(wǎng)絡(luò)中語言模型的末尾增加一條到該語言模型頭部的跳轉(zhuǎn)。
      [0017]根據(jù)本發(fā)明一優(yōu)選實施例,該方法還包括:在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
      [0018]根據(jù)本發(fā)明一優(yōu)選實施例,該方法還包括:`[0019]依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點符號。
      [0020]一種語音識別的裝置,該裝置包括:
      [0021]網(wǎng)絡(luò)訓(xùn)練單元,用于訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文;
      [0022]路徑確定單元,用于利用所述解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。
      [0023]根據(jù)本發(fā)明一優(yōu)選實施例,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān);
      [0024]所述網(wǎng)絡(luò)訓(xùn)練單元在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時,具體將解碼網(wǎng)絡(luò)中該si I模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
      [0025]根據(jù)本發(fā)明一優(yōu)選實施例,所述網(wǎng)絡(luò)訓(xùn)練單元,還用于在所述解碼網(wǎng)絡(luò)中語言模型的末尾增加一條到該語言模型頭部的跳轉(zhuǎn)。
      [0026]根據(jù)本發(fā)明一優(yōu)選實施例,所述路徑確定單元,還用于在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型確定最優(yōu)路徑;
      [0027]該裝置還包括:
      [0028]停頓識別單元,用于如果所述路徑確定單元確定出的最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
      [0029]根據(jù)本發(fā)明一優(yōu)選實施例,所述停頓識別單元,還用于依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點符號。
      [0030]由以上技術(shù)方案可以看出,本發(fā)明在訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的HMM模型,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文的方式,模擬停頓對聲學(xué)模型上下文的影響,基于該解碼網(wǎng)絡(luò)進行的語音識別提高了語音識別的效果O
      【【專利附圖】

      【附圖說明】】
      [0031]圖1為解碼網(wǎng)絡(luò)的一個簡單實例圖;
      [0032]圖2為現(xiàn)有技術(shù)中在解碼網(wǎng)絡(luò)中增加sil模型的示意圖;
      [0033]圖3為本發(fā)明實施例提供的解碼網(wǎng)絡(luò)的一種示意圖;
      [0034]圖4為本發(fā)明實施例提供的解碼網(wǎng)絡(luò)的另一種示意圖;
      [0035]圖5為本發(fā)明實施例提供的語音識別裝置的結(jié)構(gòu)圖。
      【【具體實施方式】】
      [0036]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述。
      [0037]對于語音識別的過程實際上是依賴于所訓(xùn)練的解碼網(wǎng)絡(luò)的,也就是說,語音識別至少包含兩個過程:第一個是解碼網(wǎng)絡(luò)的訓(xùn)練過程,第二個是基于解碼網(wǎng)絡(luò)對待識別語音進行的語音識別過程。其中,對待識別語音進行的語音識別過程中涉及到聲學(xué)模型的查詢和語言模型的查詢,聲學(xué)模型的查詢是基于解碼網(wǎng)絡(luò)查詢聲學(xué)模型(本發(fā)明實施例中用的聲學(xué)模型包括HMM和sil模型)以獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列,語言模型的查詢是基于解碼網(wǎng)絡(luò)查詢語言模型,從而確定出最優(yōu)路徑獲得語音識別的結(jié)果。
      [0038]在本發(fā)明實施例中`訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的HMM,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文。
      [0039]首先對上下文相關(guān)的HMM進行簡單介紹,所謂上下文相關(guān)的HMM用于描述同一個音素的HMM隨著聲學(xué)音素上下文的不同而不同,以“中國”為例,采用上下文無關(guān)的HMM描述時,HMM狀態(tài)跳轉(zhuǎn)序列為:“zh”、“0ng”、“g”和“uo”,此時的解碼網(wǎng)絡(luò)如圖1中所示。如果米用上下文相關(guān)的HMM描述時,HMM狀態(tài)跳轉(zhuǎn)序列為:“zh+ong”、“zh-ong+g”、“ong-g+uo”、“g-uo”,其中“ + ”表示下文,表示上文,例如“zh+ong”表示“zh”的下文為“ong”時的狀態(tài),“zh-ong+g”表示“ong”的上文為“zh”且下文為“g”的狀態(tài),“g-uo”表示“g”的下文為“uo”的狀態(tài)。
      [0040]在本發(fā)明實施例中,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型,sil模型是語音識別中用來描述靜音、噪聲、非語音、停頓等的HMM,由于語音中的停頓會影響到附近的聲學(xué)發(fā)音,因此在解碼網(wǎng)絡(luò)中的詞尾增加sil模型后,需要對聲學(xué)的上下文進行調(diào)整,使得新增加的sil模型附近的聲學(xué)上下文符合相關(guān)原則。具體地,可以將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。如圖3所示,將“ong”的下文替換為“sil”,將“uo”的下文也替換為“sil”,將“zh”的上文替換為“sil”,將“g”的上文替換為“sil”。
      [0041]進行上述增加sil模型和調(diào)整聲學(xué)上下文后,同樣以“中國”為例,HMM狀態(tài)跳轉(zhuǎn)序列為 “ s i 1-zh ”、“ zh-ong+s i I ”、“ s i I ”、“ s i 1-g+uo ”、“ g-guo+s i I ”。
      [0042]上述方式中增加的sil模型是統(tǒng)一的靜音模型,語音中的停頓對聲學(xué)上下文的影響主要是對前后發(fā)音因素的影響,而非靜音音素本身,上述通過調(diào)整插入的sil模型附近的聲學(xué)上下文的方式準(zhǔn)確地描述了這種影響,從而能夠提高識別效果。
      [0043]在語音識別過程中,對于聲學(xué)模型查詢和語言模型查詢的方式以及最優(yōu)路徑的確定方式均不發(fā)生變化,在確定最優(yōu)路徑的過程中,在詞尾處,sil模型與其他HMM模型進行競爭,如果sil模型勝出,則該處語音被識別為sil。
      [0044]對于句間停頓這種特殊的情況,在停頓處語言模型的上下文信息會發(fā)生突變,假設(shè)一段語音的內(nèi)容是Wl、W2、W3、W4,其中在W2和W3之間存在停頓。如果這段語音是一句話,則這是個句中停頓,那么對應(yīng)的最優(yōu)路徑為:<s>Wl W2 W3 W4〈/s>。如果這段語音是兩句話,則是個句間停頓,對應(yīng)的最優(yōu)路徑為:〈s>Wl W2〈/s>〈s>W3 W4〈/s>,也就是說,W2的語言模型下文從W3變成了 </s>,W3的語言模型上文從W2變成了〈S〉。為了實現(xiàn)句間停頓的識別,在本發(fā)明實施例中可以進一步在解碼網(wǎng)絡(luò)中語言模型的末尾</s>增加一條到該語言模型頭部<s>的跳轉(zhuǎn),如圖4所示。
      [0045]在語音識別過程中,在語言模型末尾,該語言模型的下文會在</s>和其他語言模型之間競爭,對于句間停頓</s>會勝出。仍以Wl、W2、W3、W4的語音為例,在識別到W2的語言模型時,W2的語言模型下文在</s>和W3的語言模型之間競爭,如果是句間停頓,則〈/s>會勝出,如果是句中停頓,則W3會勝出。
      [0046]在解碼網(wǎng)絡(luò)中語言模型的末尾</s>增加一條到該語言模型頭部〈S〉的跳轉(zhuǎn)之后,采用該解碼網(wǎng)絡(luò)進行語音識別過程中,在聲學(xué)模型查詢得到的HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型,確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從語言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。以圖4所示解碼網(wǎng)絡(luò)為例,通過該解碼網(wǎng)絡(luò)進行語音識別時,由于增加了從語言模型末尾</s>到該語言模型頭部〈S〉的跳轉(zhuǎn),在最優(yōu)路徑計算過程中,“中”至“國”的跳轉(zhuǎn)增加了 “中”至停頓的跳轉(zhuǎn),如果“中”至停頓的跳轉(zhuǎn)勝出,則說明“中”為句尾,“中”和“國”之間的停頓為句間停頓,在最優(yōu)路徑中就體現(xiàn)為“中”的語言模型的末尾</s>到頭部<s>的跳轉(zhuǎn),標(biāo)識就是識別結(jié)果中存在“〈/sXs〉”。
      [0047]句間停頓的識別可以用于在語音識別結(jié)果基礎(chǔ)上,在句間停頓的位置添加標(biāo)點符號,標(biāo)點符號的添加類型本發(fā)明并不加以限定,可以采用諸如依據(jù)停頓時長設(shè)置不同的標(biāo)點符號,例如停頓時長較短添加逗號,停頓時長較長添加句號等。
      [0048]以上是對本發(fā)明所提供方法進行的詳細描述,下面對本發(fā)明所提供的裝置進行詳細描述。
      [0049]圖5為本發(fā)明實施例提供的語音識別裝置的結(jié)構(gòu)圖,如圖5所示,該裝置可以包括:網(wǎng)絡(luò)訓(xùn)練單元500和路徑確定單元510。
      [0050]其中網(wǎng)絡(luò)訓(xùn)練單元500訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的HMM,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文。
      [0051]路徑確定單元510利用解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。
      [0052]上述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān),即用于描述同一個音素的HMM隨著聲學(xué)音素上下文的不同而不同。此種情況下,網(wǎng)絡(luò)訓(xùn)練單元500在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時,具體將解碼網(wǎng)絡(luò)中該Si I模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。
      [0053]除了上述緩解停頓對語音中聲學(xué)上下文的影響之外,對于句間停頓處語言模型的上下文信息發(fā)生突變的情況,網(wǎng)絡(luò)訓(xùn)練單元500,還用于在解碼網(wǎng)絡(luò)中語言模型的末尾〈/s>增加一條到該語言模型頭部的跳轉(zhuǎn)〈S〉。
      [0054]上述的獲取HMM狀態(tài)跳轉(zhuǎn)序列是聲學(xué)模型的查詢過程,除此之外,還會結(jié)合語言模型的查詢確定最優(yōu)路徑,即路徑確定單元500,還用于在HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型確定最優(yōu)路徑。
      [0055]進一步地,該裝置還可以包括:停頓識別單元520,用于如果路徑確定單元510確定出的最優(yōu)路徑中存在從語言模型的末尾</s>至頭部〈S〉的跳轉(zhuǎn),則確定存在句間停頓。更進一步的應(yīng)用可以是諸如在句間停頓的位置添加標(biāo)點符號。
      [0056]由以上描述可以看出,本發(fā)明提供的方法和裝置具備以下優(yōu)點:
      [0057]I)本發(fā)明在訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的HMM模型,在解碼網(wǎng)絡(luò)中的詞尾增加sil模型并調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文的方式,模擬停頓對聲學(xué)模型上下文的影響,基于該解碼網(wǎng)絡(luò)進行的語音識別提高了語音識別的效果。
      [0058]2)本發(fā)明在解碼網(wǎng)絡(luò)中增加語言模型的末尾至頭部的跳轉(zhuǎn)來模擬句間停頓,解決句間停頓引起的語言模型上下文信息發(fā)生突變所帶來的影響,更進一步提高語音識別的效果O
      [0059]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明保護的范圍之內(nèi)。
      【權(quán)利要求】
      1.一種語音識別的方法,其特征在于,該方法包括: 訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文; 利用所述解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān); 所述調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文具體為:將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為si I,將解碼網(wǎng)絡(luò)中該si I模型之后的HMM狀態(tài)中音素的上文替換為sil。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,該方法還包括:在所述解碼網(wǎng)絡(luò)中語言模型的末尾增加一條到該語言模型頭部的跳轉(zhuǎn)。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于,該方法還包括:在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型確定最優(yōu)路徑后,如果最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
      5.根據(jù)權(quán)利要求4所述的方法,其特征在于,該方法還包括: 依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點符號。
      6.一種語音識別的裝置,其特征在于,該裝置包括: 網(wǎng)絡(luò)訓(xùn)練單元,用于訓(xùn)練解碼網(wǎng)絡(luò)時采用上下文相關(guān)的隱馬爾科夫模型HMM,在解碼網(wǎng)絡(luò)中的詞尾增加靜音sil模型并調(diào)整該sil模型前后HMM狀態(tài)的聲學(xué)上下文; 路徑確定單元,用于利用所述解碼網(wǎng)絡(luò)獲得待識別語音的HMM狀態(tài)跳轉(zhuǎn)序列。
      7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述上下文相關(guān)的HMM中HMM狀態(tài)與音素的上下文相關(guān); 所述網(wǎng)絡(luò)訓(xùn)練單元在調(diào)整sil模型前后HMM狀態(tài)的聲學(xué)上下文時,具體將解碼網(wǎng)絡(luò)中該sil模型之前的HMM狀態(tài)中音素的下文替換為sil,將解碼網(wǎng)絡(luò)中該sil模型之后的HMM狀態(tài)中音素的上文替換為sil。
      8.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述網(wǎng)絡(luò)訓(xùn)練單元,還用于在所述解碼網(wǎng)絡(luò)中語言模型的末尾增加一條到該語言模型頭部的跳轉(zhuǎn)。
      9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述路徑確定單元,還用于在所述HMM狀態(tài)跳轉(zhuǎn)序列基礎(chǔ)上查詢語言模型確定最優(yōu)路徑; 該裝置還包括: 停頓識別單元,用于如果所述路徑確定單元確定出的最優(yōu)路徑中存在從所述語言模型的末尾至頭部的跳轉(zhuǎn),則確定存在句間停頓。
      10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述停頓識別單元,還用于依據(jù)所述待識別語音的最優(yōu)路徑,在所述句間停頓的位置添加標(biāo)點符號。
      【文檔編號】G10L15/14GK103680500SQ201210314129
      【公開日】2014年3月26日 申請日期:2012年8月29日 優(yōu)先權(quán)日:2012年8月29日
      【發(fā)明者】錢勝 申請人:北京百度網(wǎng)訊科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1