0057] 這里,利用大規(guī)模單語(yǔ)語(yǔ)料庫(kù)通過(guò)N元語(yǔ)言模型特征優(yōu)化了翻譯結(jié)果局部的流利 程度。需要說(shuō)明的是,N元語(yǔ)言模型中當(dāng)前詞出現(xiàn)的概率僅和其之前的N-I個(gè)詞有關(guān)系。例 如,當(dāng)N取值為2時(shí),當(dāng)前詞的出現(xiàn)概率僅和其前一個(gè)詞有關(guān)系。具體地,可通過(guò)以下公式 (4)執(zhí)行所述計(jì)算每個(gè)所述初選詞的N元語(yǔ)言模型特征的處理:
[0059] 其中,hlni為N元語(yǔ)言模型特征,e ,為目標(biāo)語(yǔ)言的語(yǔ)句中第j個(gè)初選詞,e , i,…,e] n+1 為獲取初選詞^之前預(yù)測(cè)出的前n-1個(gè)候選詞。
[0060] 最后,可通過(guò)以下公式(5)執(zhí)行所述根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特 征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征,結(jié)合所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概 率值的處理:
[0062] 其中,m為翻譯特征的個(gè)數(shù),hjfw)為第i個(gè)翻譯特征,A1為第i個(gè)翻譯特征對(duì) 應(yīng)的特征權(quán)重,e為所述初選詞,f為源語(yǔ)言的單詞,p (e I f)為初選詞e的翻譯概率。需要 說(shuō)明的是,公式(5)中的'是求和函數(shù)中的臨時(shí)變量,和求和符號(hào)一起使用表示對(duì)所有的 初選詞求和。
[0063] 在具體的實(shí)現(xiàn)方式中,依據(jù)公式(1)至公式(4)分別計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模 型的翻譯特征h_、統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征h tpl、htp2和h lni,將上述多個(gè)翻譯特征以及 各自對(duì)應(yīng)的特征權(quán)重代入公式(5),計(jì)算每個(gè)所述初選詞的得分(即翻譯概率值),就可以 采用得分排序方式從多個(gè)初選詞中選取候選詞。這里,翻譯特征不同,其對(duì)應(yīng)的特征權(quán)重所 起的作用也不同。在實(shí)際應(yīng)用中,由于源語(yǔ)言的單詞f?一旦給定,公式(5)中分母部分的計(jì) 算結(jié)果是一個(gè)常量,因此只需計(jì)算分子部分即可。
[0064] 在步驟S140,根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0065] 為了能夠生成可讀性及流暢性強(qiáng)的語(yǔ)句,進(jìn)一步地,步驟S130還可以包括:依據(jù) 所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所述候選詞之間的關(guān)聯(lián)關(guān)系。仍以圖2為例,由于 任一所述候選詞的預(yù)測(cè)處理均是基于神經(jīng)網(wǎng)絡(luò)翻譯模型的,而神經(jīng)網(wǎng)絡(luò)翻譯模型的重要特 點(diǎn)就是考慮上下文的關(guān)聯(lián)關(guān)系,使得翻譯結(jié)果更加流暢。圖2示出的候選詞之間的箭頭線 代表了候選詞之間的關(guān)聯(lián)關(guān)系。例如,位于第二位的候選詞taxi與位于第一位的候選詞 the是相關(guān)聯(lián)的。
[0066] 相應(yīng)地,根據(jù)本發(fā)明的示例性實(shí)施例,步驟S140包括:根據(jù)具有關(guān)聯(lián)關(guān)系的所有 候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。例如,參照?qǐng)D2,重復(fù)執(zhí)行前述候選詞的預(yù)測(cè)處理步驟,直至 預(yù)測(cè)到設(shè)定的結(jié)束詞(EOS)為止。圖2中使用棧的結(jié)構(gòu)描述候選詞及各個(gè)候選詞之間的 關(guān)系,第一個(gè)棧(Stack-I)中的詞語(yǔ)是位于目標(biāo)語(yǔ)言的語(yǔ)句中第一位的候選詞,第i個(gè)棧 (Stack-i)的詞語(yǔ)是位于目標(biāo)語(yǔ)言的語(yǔ)句中第i位的候選詞,依據(jù)圖2示出的候選詞之間的 箭頭線就可以查找到具有關(guān)聯(lián)關(guān)系的所有候選詞,從而生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0067] 本發(fā)明實(shí)施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯方法,在獲取源語(yǔ)言的語(yǔ)句之后, 對(duì)其進(jìn)行編碼得到向量序列,再基于向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞,在任 一所述候選詞的預(yù)測(cè)處理過(guò)程中,首先從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞,基于結(jié)合了 神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征的對(duì)數(shù)線性模型,計(jì)算每個(gè) 所述初選詞的翻譯概率,根據(jù)翻譯概率計(jì)算結(jié)果從多個(gè)初選詞選取候選詞,最終,根據(jù)經(jīng)上 述預(yù)測(cè)處理得到候選詞,從而自動(dòng)地生成長(zhǎng)度適宜的目標(biāo)語(yǔ)言語(yǔ)句,提高了翻譯結(jié)果的準(zhǔn) 確度、可讀性和流暢性。同時(shí),降低了漏詞率。
[0068] 實(shí)施例二
[0069] 圖4是示出本發(fā)明實(shí)施例二的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置的邏輯框圖??捎糜?執(zhí)行如圖1所示實(shí)施例的方法步驟。
[0070] 參照?qǐng)D4,所述基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置包括語(yǔ)句獲取模塊410、語(yǔ)句編碼模 塊420、候選詞預(yù)測(cè)模塊430和語(yǔ)句生成模塊440。
[0071] 語(yǔ)句獲取模塊410用于獲取源語(yǔ)言的語(yǔ)句。
[0072] 進(jìn)一步地,所述語(yǔ)句獲取模塊410可包括以下單元之一:
[0073] 文本數(shù)據(jù)接收單元(未示出)用于接收文本數(shù)據(jù),并將所述文本數(shù)據(jù)作為所述源 語(yǔ)言的語(yǔ)句。
[0074] 語(yǔ)音數(shù)據(jù)接收及識(shí)別單元(未示出)用于接收語(yǔ)音數(shù)據(jù),對(duì)所述語(yǔ)音數(shù)據(jù)進(jìn)行語(yǔ) 音識(shí)別得到經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù),并將所述經(jīng)語(yǔ)音識(shí)別的文本數(shù)據(jù)作為所述源語(yǔ)言的語(yǔ) 句。
[0075] 圖片數(shù)據(jù)接收及識(shí)別單元(未示出)用于接收?qǐng)D片數(shù)據(jù),對(duì)所述圖片數(shù)據(jù)進(jìn)行光 學(xué)字符識(shí)別OCR得到經(jīng)OCR識(shí)別的文本數(shù)據(jù),并將所述經(jīng)OCR識(shí)別的文本數(shù)據(jù)作為所述源 語(yǔ)言的語(yǔ)句。
[0076] 語(yǔ)句編碼模塊420用于將所述源語(yǔ)言的語(yǔ)句進(jìn)行編碼得到向量序列。
[0077] 具體地,所述語(yǔ)句編碼模塊420用于對(duì)源語(yǔ)言的語(yǔ)句進(jìn)行分詞,將分得的多個(gè)分 詞分別轉(zhuǎn)換成與每個(gè)所述分詞對(duì)應(yīng)的詞向量,由多個(gè)分詞各自對(duì)應(yīng)的詞向量得到所述向量 序列。
[0078] 候選詞預(yù)測(cè)模塊430用于基于所述向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選 詞。其中,在任一所述候選詞的預(yù)測(cè)處理中,從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞,并且基 于對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率,以根據(jù)所述翻譯概率從所述多個(gè)初選詞 選取所述候選詞,所述對(duì)數(shù)線性模型根據(jù)神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模 型的翻譯特征建立的。
[0079] 根據(jù)本發(fā)明的示例性實(shí)施例,所述候選詞預(yù)測(cè)模塊430可包括:
[0080] 初選詞獲取單元(未示出)用于從預(yù)設(shè)的翻譯詞表中獲取M個(gè)詞語(yǔ)作為初選詞, M為正整數(shù)。
[0081] 神經(jīng)網(wǎng)絡(luò)模型特征計(jì)算單元(未示出)用于根據(jù)所述向量序列和在獲取M個(gè)初選 詞之前預(yù)測(cè)出的候選詞,計(jì)算每個(gè)所述初選詞的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征。
[0082] 統(tǒng)計(jì)機(jī)器模型特征計(jì)算單元(未示出)用于計(jì)算每個(gè)所述初選詞的統(tǒng)計(jì)機(jī)器翻譯 模型的翻譯特征。
[0083] 翻譯概率計(jì)算單元(未示出)用于根據(jù)計(jì)算得到的神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征 和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征,結(jié)合所述對(duì)數(shù)線性模型計(jì)算每個(gè)所述初選詞的翻譯概率 值。
[0084] 候選詞選取單元(未示出)用于對(duì)計(jì)算得到的M個(gè)翻譯概率值進(jìn)行排序,并將與 前N位的翻譯概率值相應(yīng)的初選詞選取為所述候選詞,N為正整數(shù),且N < M。
[0085] 為了優(yōu)化單詞互譯程度,提高翻譯質(zhì)量,優(yōu)選地,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特 征可包括雙向單詞翻譯模型特征。
[0086] 可選地,所述統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征還包括N元語(yǔ)言模型特征和/或詞懲 罰特征。通過(guò)N元語(yǔ)言模型特征優(yōu)化了翻譯結(jié)果局部的流利程度,結(jié)合詞懲罰特征,對(duì)過(guò)短 的翻譯結(jié)果進(jìn)行懲罰,進(jìn)而優(yōu)化翻譯結(jié)果長(zhǎng)度。
[0087] 語(yǔ)句生成模塊440用于根據(jù)預(yù)測(cè)得到的候選詞生成目標(biāo)語(yǔ)言的語(yǔ)句。
[0088] 為了能夠生成可讀性及流暢性強(qiáng)的語(yǔ)句,進(jìn)一步地,所述候選詞預(yù)測(cè)模塊430還 可以包括:候選詞關(guān)聯(lián)單元(未示出)用于依據(jù)所述神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征標(biāo)記所 述候選詞之間的關(guān)聯(lián)關(guān)系。
[0089] 相應(yīng)地,所述語(yǔ)句生成模塊440用于根據(jù)具有關(guān)聯(lián)關(guān)系的所有候選詞生成目標(biāo)語(yǔ) 言的語(yǔ)句。
[0090] 本發(fā)明實(shí)施例提供的基于神經(jīng)網(wǎng)絡(luò)模型的翻譯裝置,在獲取源語(yǔ)言的語(yǔ)句之后, 對(duì)其進(jìn)行編碼得到向量序列,再基于向量序列逐詞地預(yù)測(cè)目標(biāo)語(yǔ)言中相應(yīng)的候選詞,在任 一所述候選詞的預(yù)測(cè)處理過(guò)程中,首先從預(yù)設(shè)的翻譯詞表中獲取多個(gè)初選詞,基于結(jié)合了 神經(jīng)網(wǎng)絡(luò)翻譯模型的翻譯特征和統(tǒng)計(jì)機(jī)器翻譯模型的翻譯特征的對(duì)數(shù)線性模型,計(jì)算每個(gè) 所述初選詞的翻譯概率,根據(jù)翻譯概率計(jì)算結(jié)果從多個(gè)初選詞選取候選詞,最終,根據(jù)經(jīng)上 述預(yù)測(cè)處理得到候選詞,從而自動(dòng)地生成長(zhǎng)度適宜的目標(biāo)語(yǔ)言的語(yǔ)句,顯著提升了翻譯質(zhì) 量,同時(shí)提高了翻譯結(jié)果的可