基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置的制造方法_3

文檔序號(hào)：9349932閱讀：來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)>基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法及裝置的制造方法

0057] 這里，利用大規(guī)模單語(yǔ)語(yǔ)料庫(kù)通過(guò)N元語(yǔ)言模型特征優(yōu)化了翻譯結(jié)果局部的流利程度。需要說(shuō)明的是，N元語(yǔ)言模型中當(dāng)前詞出現(xiàn)的概率僅和其之前的N-I個(gè)詞有關(guān)系。例如，當(dāng)N取值為2時(shí)，當(dāng)前詞的出現(xiàn)概率僅和其前一個(gè)詞有關(guān)系。具體地，可通過(guò)以下公式 (4)執(zhí)行所述計(jì)算每個(gè)所述初選詞的N元語(yǔ)言模型特征的處理：
[0059] 其中，hlni為N元語(yǔ)言模型特征，e ,為目標(biāo)語(yǔ)言的語(yǔ)句中第j個(gè)初選詞，e , i，…，e] n+1 為獲取初選詞^之前預(yù)測(cè)出的前n-1個(gè)候選詞。
[0060] 最后，可通過(guò)以下公式（5)執(zhí)行所述根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征，結(jié)合所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率值的處理：
[0062] 其中，m為翻譯特征的個(gè)數(shù)，hjfw)為第i個(gè)翻譯特征，A1為第i個(gè)翻譯特征對(duì) 應(yīng)的特征權(quán)重，e為所述初選詞，f為源語(yǔ)言的單詞，p (e I f)為初選詞e的翻譯概率。需要說(shuō)明的是，公式（5)中的'是求和函數(shù)中的臨時(shí)變量，和求和符號(hào)一起使用表示對(duì)所有的初選詞求和。
[0063] 在具體的實(shí)現(xiàn)方式中，依據(jù)公式（1)至公式（4)分別計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征h_、統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征h tpl、htp2和h lni，將上述多個(gè)翻譯特征以及各自對(duì)應(yīng)的特征權(quán)重代入公式（5)，計(jì)算每個(gè)所述初選詞的得分（即翻譯概率值），就可以采用得分排序方式從多個(gè)初選詞中選取候選詞。這里，翻譯特征不同，其對(duì)應(yīng)的特征權(quán)重所起的作用也不同。在實(shí)際應(yīng)用中，由于源語(yǔ)言的單詞f?一旦給定，公式（5)中分母部分的計(jì) 算結(jié)果是一個(gè)常量，因此只需計(jì)算分子部分即可。
[0064] 在步驟S140,根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0065] 為了能夠生成可讀性及流暢性強(qiáng)的語(yǔ)句，進(jìn)一步地，步驟S130還可以包括：依據(jù) 所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系。仍以圖2為例，由于任一所述候選詞的預(yù)測(cè)處理均是基于神經(jīng)網(wǎng)絡(luò)翻譯模型的，而神經(jīng)網(wǎng)絡(luò)翻譯模型的重要特點(diǎn)就是考慮上下文的關(guān)聯(lián)關(guān)系，使得翻譯結(jié)果更加流暢。圖2示出的候選詞之間的箭頭線代表了候選詞之間的關(guān)聯(lián)關(guān)系。例如，位于第二位的候選詞taxi與位于第一位的候選詞 the是相關(guān)聯(lián)的。
[0066] 相應(yīng)地，根據(jù)本發(fā)明的示例性實(shí)施例，步驟S140包括：根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。例如，參照?qǐng)D2,重復(fù)執(zhí)行前述候選詞的預(yù)測(cè)處理步驟，直至預(yù)測(cè)到設(shè)定的結(jié)束詞（EOS)為止。圖2中使用棧的結(jié)構(gòu)描述候選詞及各個(gè)候選詞之間的關(guān)系，第一個(gè)棧（Stack-I)中的詞語(yǔ)是位于目標(biāo)語(yǔ)言的語(yǔ)句中第一位的候選詞，第i個(gè)棧 (Stack-i)的詞語(yǔ)是位于目標(biāo)語(yǔ)言的語(yǔ)句中第i位的候選詞，依據(jù)圖2示出的候選詞之間的箭頭線就可以查找到具有關(guān)聯(lián)關(guān)系的所有候選詞，從而生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0067] 本發(fā)明實(shí)施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法，在獲取源語(yǔ)言的語(yǔ)句之后，對(duì)其進(jìn)行編碼得到向量序列，再基于向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞，在任一所述候選詞的預(yù)測(cè)處理過(guò)程中，首先從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，基于結(jié)合了神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征的對(duì)數(shù)線性模型，計(jì)算每個(gè) 所述初選詞的翻譯概率，根據(jù)翻譯概率計(jì)算結(jié)果從多個(gè)初選詞選取候選詞，最終，根據(jù)經(jīng)上述預(yù)測(cè)處理得到候選詞，從而自動(dòng)地生成長(zhǎng)度適宜的目標(biāo)語(yǔ)言語(yǔ)句，提高了翻譯結(jié)果的準(zhǔn) 確度、可讀性和流暢性。同時(shí)，降低了漏詞率。
[0068] 實(shí)施例二
[0069] 圖4是示出本發(fā)明實(shí)施例二的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置的邏輯框圖?？捎糜?執(zhí)行如圖1所示實(shí)施例的方法步驟。
[0070] 參照?qǐng)D4,所述基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置包括語(yǔ)句獲取模塊410、語(yǔ)句編碼模塊420、候選詞預(yù)測(cè)模塊430和語(yǔ)句生成模塊440。
[0071] 語(yǔ)句獲取模塊410用于獲取源語(yǔ)言的語(yǔ)句。
[0072] 進(jìn)一步地，所述語(yǔ)句獲取模塊410可包括以下單元之一：
[0073] 文本數(shù)據(jù)接收單元（未示出）用于接收文本數(shù)據(jù)，并將所述文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句。
[0074] 語(yǔ)音數(shù)據(jù)接收及識(shí)別單元（未示出）用于接收語(yǔ)音數(shù)據(jù)，對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ) 音識(shí)別得到經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ) 句。
[0075] 圖片數(shù)據(jù)接收及識(shí)別單元（未示出）用于接收?qǐng)D片數(shù)據(jù)，對(duì)所述圖片數(shù)據(jù)進(jìn)行光學(xué)字符識(shí)別OCR得到經(jīng)OCR識(shí)別的文本數(shù)據(jù)，并將所述經(jīng)OCR識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ)句。
[0076] 語(yǔ)句編碼模塊420用于將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列。
[0077] 具體地，所述語(yǔ)句編碼模塊420用于對(duì)源語(yǔ)言的語(yǔ)句進(jìn)行分詞，將分得的多個(gè)分詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量，由多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量序列。
[0078] 候選詞預(yù)測(cè)模塊430用于基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞。其中，在任一所述候選詞的預(yù)測(cè)處理中，從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，并且基于對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率，以根據(jù)所述翻譯概率從所述多個(gè)初選詞選取所述候選詞，所述對(duì)數(shù)線性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征建立的。
[0079] 根據(jù)本發(fā)明的示例性實(shí)施例，所述候選詞預(yù)測(cè)模塊430可包括：
[0080] 初選詞獲取單元（未示出）用于從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞， M為正整數(shù)。
[0081] 神經(jīng)網(wǎng)絡(luò)模型特征計(jì)算單元（未示出）用于根據(jù)所述向量序列和在獲取M個(gè)初選詞之前預(yù)測(cè)出的候選詞，計(jì)算每個(gè)所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征。
[0082] 統(tǒng)計(jì)機(jī)器模型特征計(jì)算單元（未示出）用于計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征。
[0083] 翻譯概率計(jì)算單元（未示出）用于根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征，結(jié)合所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率值。
[0084] 候選詞選取單元（未示出）用于對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序，并將與前N位的翻譯概率值相應(yīng)的初選詞選取為所述候選詞，N為正整數(shù)，且N < M。
[0085] 為了優(yōu)化單詞互譯程度，提高翻譯質(zhì)量，優(yōu)選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征可包括雙向單詞翻譯模型特征。
[0086] 可選地，所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還包括N元語(yǔ)言模型特征和/或詞懲罰特征。通過(guò)N元語(yǔ)言模型特征優(yōu)化了翻譯結(jié)果局部的流利程度，結(jié)合詞懲罰特征，對(duì)過(guò)短的翻譯結(jié)果進(jìn)行懲罰，進(jìn)而優(yōu)化翻譯結(jié)果長(zhǎng)度。
[0087] 語(yǔ)句生成模塊440用于根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0088] 為了能夠生成可讀性及流暢性強(qiáng)的語(yǔ)句，進(jìn)一步地，所述候選詞預(yù)測(cè)模塊430還可以包括：候選詞關(guān)聯(lián)單元（未示出）用于依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系。
[0089] 相應(yīng)地，所述語(yǔ)句生成模塊440用于根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ) 言的語(yǔ)句。
[0090] 本發(fā)明實(shí)施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置，在獲取源語(yǔ)言的語(yǔ)句之后，對(duì)其進(jìn)行編碼得到向量序列，再基于向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞，在任一所述候選詞的預(yù)測(cè)處理過(guò)程中，首先從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞，基于結(jié)合了神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征的對(duì)數(shù)線性模型，計(jì)算每個(gè) 所述初選詞的翻譯概率，根據(jù)翻譯概率計(jì)算結(jié)果從多個(gè)初選詞選取候選詞，最終，根據(jù)經(jīng)上述預(yù)測(cè)處理得到候選詞，從而自動(dòng)地生成長(zhǎng)度適宜的目標(biāo)語(yǔ)言的語(yǔ)句，顯著提升了翻譯質(zhì) 量，同時(shí)提高了翻譯結(jié)果的可

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第3頁(yè)1 2 3 4

相關(guān)技術(shù)