国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      漢語發(fā)音判斷方法

      文檔序號(hào):2825047閱讀:640來源:國(guó)知局
      專利名稱:漢語發(fā)音判斷方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種發(fā)音判斷方法,尤其是一種漢語發(fā)音判斷方法。
      背景技術(shù)
      由于近年來計(jì)算機(jī)計(jì)算能力的提升以及語音辨識(shí)技術(shù)的進(jìn)步,語音處理在日常生活上的應(yīng)用與日俱增,如語音辨識(shí)、語音合成及語者辨識(shí)等等,其中,在跨國(guó)界的語言學(xué)習(xí)中,以計(jì)算機(jī)輔助使用者進(jìn)行非母語學(xué)習(xí)的研究已受到相當(dāng)?shù)刂匾?,各方都已紛紛投入研其中,又以漢語為使用人數(shù)最多的一門語種,因此學(xué)習(xí)漢語逐漸形成語言學(xué)習(xí)的主流趨勢(shì)。然而在語言學(xué)習(xí)的過程中,師資的缺乏與昂貴的學(xué)習(xí)支出讓不少人為之卻步,雖然市面上已推出許多語言發(fā)音學(xué)習(xí)產(chǎn)品,其中,不乏有技術(shù)發(fā)展較為成熟的復(fù)讀機(jī),但其僅能提供跟讀,不能提供使用者語音分析信息,即使有一些基于語音信號(hào)分析而給予發(fā)音評(píng)分的產(chǎn)品,卻是以通過波形對(duì)比來進(jìn)行判別,其判別結(jié)果的可靠性不高,又或者無法針對(duì)漢語發(fā)音提供高準(zhǔn)確率的聲調(diào)辨別。因此,發(fā)展一種基于非特定人語音辨識(shí)技術(shù),用來提供使用者自身發(fā)音相對(duì)于標(biāo)準(zhǔn)發(fā)音內(nèi)容相似度與聲調(diào)所屬類型的判別方法是產(chǎn)業(yè)界亟欲發(fā)展的技術(shù)。

      發(fā)明內(nèi)容
      本發(fā)明為解決背景技術(shù)中存在的上述技術(shù)問題,而提出漢語發(fā)音判斷方法。本發(fā)明的技術(shù)解決方案是本發(fā)明為一種漢語發(fā)音判斷方法,其特殊之處在于該方法包含以下步驟1)提供多個(gè)聲學(xué)模板,每個(gè)聲學(xué)模板包含標(biāo)準(zhǔn)音素的數(shù)學(xué)模型;2)接收使用者發(fā)音,該使用者發(fā)音包含發(fā)音音素與發(fā)音聲調(diào);3)比對(duì)發(fā)音音素與標(biāo)準(zhǔn)音素而取得音素相似度;4)根據(jù)發(fā)音聲調(diào)取得聲調(diào)類型;5)輸出發(fā)音的音素相似度與聲調(diào)類型。上述步驟1)中的聲學(xué)模板為隱藏式馬可夫模型(Hidden Markov Model, HMM)。上述步驟3)的具體步驟如下32)計(jì)算發(fā)音音素的時(shí)間區(qū)段;34)根據(jù)時(shí)間區(qū)段判斷音素為聲母或韻母;36A)根據(jù)標(biāo)準(zhǔn)音素計(jì)算聲母的音素相似度;36B)根據(jù)標(biāo)準(zhǔn)音素計(jì)算韻母的音素相似度;38)計(jì)算發(fā)音音素相似度。上述步驟32)的具體步驟如下將使用者發(fā)音經(jīng)過音框化(Frame Blocking), 預(yù)強(qiáng)調(diào)(Pre-emphasis)、加漢明窗(Hamming Window)、快速傅立葉轉(zhuǎn)換(Fast Fourier Transform),三角帶通濾波(Triangular Band Pass Filters)、離散余弦轉(zhuǎn)換(Discrete Cosine Transform,DCT),并提取梅爾倒頻譜系數(shù)(Mel-Frequency Cepstrum Coefficients, MFCC)用來獲取出其39維的語音音素特征參數(shù);接著,利用維特比算法 (Viterbi Algorithm)以強(qiáng)制對(duì)齊(Forced Alignment)方式計(jì)算切割使用者發(fā)音以得到每個(gè)發(fā)音音素的時(shí)間區(qū)段。上述步驟4)的具體步驟如下42)由發(fā)音聲調(diào)取出基頻軌跡;44)根據(jù)基頻軌跡判斷聲調(diào)類型。上述步驟42)中具體步驟如下以平均幅度差參數(shù)從發(fā)音聲調(diào)中計(jì)算提取出基頻,并以動(dòng)態(tài)規(guī)劃算法消除基頻的倍頻半頻誤差而取得上述基頻軌跡。上述步驟44)中具體步驟如下提取基頻軌跡的特征參數(shù),且根據(jù)發(fā)音音素的時(shí)間區(qū)段與基頻軌跡的特征參數(shù)從而判斷發(fā)音聲調(diào)的聲調(diào)類型。上述基頻特征參數(shù)包含總變化率、變化趨勢(shì)率、最小基頻所屬區(qū)間與最大基頻所屬區(qū)間。上述聲調(diào)類型包含陰平、陽平、上聲與去聲。本發(fā)明提供的利用語音辨識(shí)技術(shù),以強(qiáng)制對(duì)齊(Forced Alignment)方式計(jì)算切割使用者發(fā)音從而得到發(fā)音音素的時(shí)間區(qū)段,用來比對(duì)發(fā)音的音素相似度與判斷發(fā)音的聲調(diào)類型,進(jìn)而對(duì)使用者進(jìn)行公正的發(fā)音評(píng)分,據(jù)此達(dá)成輔助漢語發(fā)音的學(xué)習(xí)。


      圖1為本發(fā)明漢語發(fā)音判斷方法的流程圖;圖2為本發(fā)明步驟30,計(jì)算音素相似度的流程圖。
      具體實(shí)施例方式參見圖1,上述漢語發(fā)音判斷方法包含下列步驟步驟10:提供多個(gè)聲學(xué)模板的制作方法,利用隱藏式馬可夫模型開發(fā)工具 (Hidden Markov Model Toolkit,HTK)訓(xùn)練語音發(fā)音樣本,獲得隱藏式馬可夫模型(Hidden Markov Model, HMM)的多個(gè)聲學(xué)模板,而每個(gè)上述聲學(xué)模板包含標(biāo)準(zhǔn)音素的數(shù)學(xué)模型。其中,為提高聲學(xué)模板的準(zhǔn)確度,采集的語音發(fā)音樣本數(shù)至少為50人,其中,要求上述語音發(fā)音樣本的發(fā)音準(zhǔn)確,此外,上述樣本數(shù)包含男性與女性,且涵蓋各個(gè)年齡層。步驟20 接收使用者發(fā)音,使用者發(fā)音包含兩項(xiàng)特征發(fā)音音素與發(fā)音聲調(diào)。其中,使用者能夠選取所需的漢語單字或多字,聽取提供的標(biāo)準(zhǔn)發(fā)音,并且,能夠利用錄音單元,將使用者發(fā)音轉(zhuǎn)換成數(shù)字格式暫存在儲(chǔ)存系統(tǒng)。步驟30 比對(duì)發(fā)音音素與標(biāo)準(zhǔn)音素的相似度,參見圖2,包含以下步驟步驟32 計(jì)算發(fā)音音素的時(shí)間區(qū)段。其中,將使用者發(fā)音經(jīng)過音框化(Frame Blocking)、預(yù)強(qiáng)調(diào)(Pre-emphasis)、加漢明窗(Hamming Window)、快速傅立葉轉(zhuǎn)換(Fast Fourier ^Transform)、三角帶通濾波 (Triangular Band Pass Filters)、離散余弦轉(zhuǎn)換(Discrete Cosine Transform,DCT),并提取梅爾倒頻譜系數(shù)(Mel-Frequency Cepstrum Coefficients,MFCC)用來獲取出其39維的語音音素特征參數(shù)。接著,利用維特比算法(Viterbi Algorithm)以強(qiáng)制對(duì)齊(ForcedAlignment)方式計(jì)算切割上述使用者發(fā)音以便得到每個(gè)上述發(fā)音音素的時(shí)間區(qū)段。步驟34 根據(jù)時(shí)間區(qū)段判斷音素為聲母或韻母。步驟36A 根據(jù)標(biāo)準(zhǔn)音素計(jì)算聲母的音素相似度。步驟36B 根據(jù)標(biāo)準(zhǔn)音素計(jì)算韻母的音素相似度。步驟38 計(jì)算發(fā)音音素相似度。其中,根據(jù)上述發(fā)音音素的時(shí)間區(qū)段而判斷發(fā)音音素為聲母或韻母,并比對(duì)發(fā)音音素與標(biāo)準(zhǔn)音素,從而計(jì)算出音素相似度。步驟40 判斷發(fā)音聲調(diào)類型,由發(fā)音聲調(diào)取出基頻軌跡,并且根據(jù)基頻軌跡判斷聲調(diào)類型,上述聲調(diào)類型包含陰平、陽平、上聲與去聲。其中,以平均幅度差參數(shù)從上述發(fā)音聲調(diào)中計(jì)算提取出基頻,并以動(dòng)態(tài)規(guī)劃算法消除上述基頻的倍頻半頻誤差而取得上述基頻軌跡,其次,提取上述基頻軌跡的特征參數(shù), 如總變化率、變化趨勢(shì)率、最小基頻所屬區(qū)間與最大基頻所屬區(qū)間,且根據(jù)上述時(shí)間區(qū)段與基頻軌跡的特征參數(shù)從而判斷發(fā)音聲調(diào)的聲調(diào)類型,其中,聲學(xué)模板的基頻軌跡的特征參數(shù)表如表一所示。
      權(quán)利要求
      1.一種漢語發(fā)音判斷方法,其特征在于該方法包含以下步驟1)提供多個(gè)聲學(xué)模板,每個(gè)聲學(xué)模板包含標(biāo)準(zhǔn)音素的數(shù)學(xué)模型;2)接收使用者發(fā)音,該使用者發(fā)音包含發(fā)音音素與發(fā)音聲調(diào);3)比對(duì)發(fā)音音素與標(biāo)準(zhǔn)音素而取得音素相似度;4)根據(jù)發(fā)音聲調(diào)取得聲調(diào)類型;5)輸出發(fā)音的音素相似度與聲調(diào)類型。
      2.根據(jù)權(quán)利要求1所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟1)中的聲學(xué)模板為隱藏式馬可夫模型(Hidden Markov Model,HMM)。
      3.根據(jù)權(quán)利要求1或2所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟;3)的具體步驟如下32)計(jì)算發(fā)音音素的時(shí)間區(qū)段;34)根據(jù)時(shí)間區(qū)段判斷音素為聲母或韻母;36A)根據(jù)標(biāo)準(zhǔn)音素計(jì)算聲母的音素相似度;36B)根據(jù)標(biāo)準(zhǔn)音素計(jì)算韻母的音素相似度;38)計(jì)算發(fā)音音素相似度。
      4.根據(jù)權(quán)利要求3所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟32)的具體步驟如下將使用者發(fā)音經(jīng)過音框化(Frame Blocking)、預(yù)強(qiáng)調(diào)(Pre-emphasis)、加漢明窗(Hamming Window)、快速傅立葉轉(zhuǎn)換(Fast Fourier ^Transform)、三角帶通濾波 (Triangular Band Pass Filters)、離散余弦轉(zhuǎn)換(Discrete Cosine Transform,DCT),并提取梅爾倒頻譜系數(shù)(Mel-Frequency Cepstrum Coefficients, MFCC)用來獲取出其39 維的語音音素特征參數(shù);接著,利用維特比算法(Viterbi Algorithm)以強(qiáng)制對(duì)齊O^orced Alignment)方式計(jì)算切割使用者發(fā)音以得到每個(gè)發(fā)音音素的時(shí)間區(qū)段。
      5.根據(jù)權(quán)利要求4所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟4)的具體步驟如下42)由發(fā)音聲調(diào)取出基頻軌跡;44)根據(jù)基頻軌跡判斷聲調(diào)類型。
      6.根據(jù)權(quán)利要求5所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟42)中具體步驟如下以平均幅度差參數(shù)從發(fā)音聲調(diào)中計(jì)算提取出基頻,并以動(dòng)態(tài)規(guī)劃算法消除基頻的倍頻半頻誤差而取得基頻軌跡。
      7.根據(jù)權(quán)利要求6所述的一種漢語發(fā)音判斷方法,其特征在于所述步驟44)中具體步驟如下提取基頻軌跡的特征參數(shù),且根據(jù)發(fā)音音素的時(shí)間區(qū)段與基頻軌跡的特征參數(shù)從而判斷發(fā)音聲調(diào)的聲調(diào)類型。
      8.根據(jù)權(quán)利要求7所述的一種漢語發(fā)音判斷方法,其特征在于所述基頻特征參數(shù)包含總變化率、變化趨勢(shì)率、最小基頻所屬區(qū)間與最大基頻所屬區(qū)間。
      9.根據(jù)權(quán)利要求5所述的一種漢語發(fā)音判斷方法,其特征在于所述聲調(diào)類型包含陰平、陽平、上聲與去聲。
      全文摘要
      本發(fā)明涉及一種漢語發(fā)音的判斷方法,該方法包括以下步驟1)提供多個(gè)聲學(xué)模板,每個(gè)聲學(xué)模板包含標(biāo)準(zhǔn)音素的數(shù)學(xué)模型;2)接收使用者發(fā)音,該使用者發(fā)音包含發(fā)音音素與發(fā)音聲調(diào);3)比對(duì)發(fā)音音素與標(biāo)準(zhǔn)音素而取得音素相似度;4)根據(jù)發(fā)音聲調(diào)取得聲調(diào)類型;5)輸出發(fā)音的音素相似度與聲調(diào)類型。本發(fā)明可實(shí)現(xiàn)對(duì)漢語發(fā)音的判斷。
      文檔編號(hào)G10L15/14GK102163428SQ20111007092
      公開日2011年8月24日 申請(qǐng)日期2011年3月23日 優(yōu)先權(quán)日2011年1月19日
      發(fā)明者周驍, 薛麗娟, 陳淮琰 申請(qǐng)人:無敵科技(西安)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1