国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置制造方法

      文檔序號(hào):6521915閱讀:307來(lái)源:國(guó)知局
      一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置制造方法
      【專利摘要】一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置,本發(fā)明屬于機(jī)器翻譯【技術(shù)領(lǐng)域】,涉及一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置。解決現(xiàn)有翻譯方法和裝置在源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)構(gòu)建中要求源語(yǔ)言到樞軸語(yǔ)的翻譯規(guī)則與該樞軸語(yǔ)到目標(biāo)語(yǔ)的翻譯規(guī)則,中的樞軸語(yǔ)短語(yǔ)必須完全相同而導(dǎo)致的潛在翻譯規(guī)則丟失問(wèn)題。通過(guò)用向量表示樞軸語(yǔ)短語(yǔ)并利用向量夾角余弦值對(duì)樞軸語(yǔ)進(jìn)行匹配關(guān)聯(lián),建立源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),通過(guò)源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)進(jìn)行自然語(yǔ)言翻譯。并根據(jù)上述步驟功能模塊化制成基于相似度匹配的樞軸語(yǔ)言翻譯裝置。本發(fā)明用于自然語(yǔ)言翻譯。
      【專利說(shuō)明】一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明屬于機(jī)器翻譯【技術(shù)領(lǐng)域】,涉及一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置。
      【背景技術(shù)】
      [0002]基于統(tǒng)計(jì)的機(jī)器翻譯技術(shù)興起于20世紀(jì)90年代,它可以從雙語(yǔ)平行語(yǔ)料庫(kù)中自動(dòng)提取翻譯規(guī)則,不需要人工干預(yù),具有廣泛的語(yǔ)言適用性,是當(dāng)前使用最為廣泛的機(jī)器翻譯系統(tǒng)?;诮y(tǒng)計(jì)的機(jī)器翻譯系統(tǒng)的翻譯質(zhì)量很大程度上取決于雙語(yǔ)平行語(yǔ)料庫(kù)的質(zhì)量。語(yǔ)料庫(kù)的質(zhì)量越高、數(shù)據(jù)數(shù)量越高,則使用該語(yǔ)料庫(kù)所獲得的統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的翻譯質(zhì)量越高。但對(duì)于大多數(shù)語(yǔ)言對(duì)都面臨著無(wú)法獲得足夠數(shù)量的高質(zhì)量語(yǔ)料的問(wèn)題。
      [0003]針對(duì)語(yǔ)料稀疏的問(wèn)題,目前普遍采用的解決方案是引入第三種語(yǔ)言,即樞軸語(yǔ)言。對(duì)于樞軸語(yǔ)言的引入,存在著下列兩個(gè)方面的要求:
      [0004]第一,源語(yǔ)言與樞軸語(yǔ)言之間存在著大量高質(zhì)量雙語(yǔ)平行語(yǔ)料,滿足構(gòu)建源語(yǔ)言到樞軸語(yǔ)言翻譯系統(tǒng)的需要;
      [0005]第二,樞軸 語(yǔ)言與目標(biāo)語(yǔ)言之間存在著大量高質(zhì)量雙語(yǔ)平行語(yǔ)料,滿足構(gòu)建樞軸語(yǔ)言到目標(biāo)語(yǔ)言翻譯系統(tǒng)的需要。
      [0006]給定滿足上述條件的樞軸語(yǔ)言,如果存在一個(gè)源語(yǔ)言到樞軸語(yǔ)的翻譯規(guī)則(規(guī)則I)及一個(gè)該樞軸語(yǔ)到目標(biāo)語(yǔ)的翻譯規(guī)則(規(guī)則2),那么可以構(gòu)建出一個(gè)源語(yǔ)言到目標(biāo)語(yǔ)的翻譯規(guī)則。該方法嚴(yán)格要求規(guī)則I與規(guī)則2中的樞軸語(yǔ)短語(yǔ)完全相同。這會(huì)導(dǎo)致一些潛在的源語(yǔ)言到目標(biāo)語(yǔ)翻譯規(guī)則丟失。

      【發(fā)明內(nèi)容】

      [0007]本發(fā)明為解決現(xiàn)有翻譯方法和裝置在源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)構(gòu)建中要求源語(yǔ)言到樞軸語(yǔ)的翻譯規(guī)則與該樞軸語(yǔ)到目標(biāo)語(yǔ)的翻譯規(guī)則,即規(guī)則I和規(guī)則2中的樞軸語(yǔ)短語(yǔ)必須完全相同而導(dǎo)致的的潛在翻譯規(guī)則丟失問(wèn)題,而提出一種基于相似度匹配的樞軸語(yǔ)言翻譯方法和裝置。
      [0008]本發(fā)明中一種基于相似度匹配的樞軸語(yǔ)言翻譯方法,具體是按照以下步驟進(jìn)行:
      [0009]步驟一、建立源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),具體包括以下步驟:
      [0010]步驟一一、建立源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù),在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0011]步驟一二、建立樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0012]步驟一三、在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中查找與源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)短語(yǔ)的向量表不;
      [0013]步驟一四、在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有向量相似性的至少一個(gè)第二樞軸語(yǔ)短語(yǔ)的向量表示;所述的具有向量相似性的判斷依據(jù)是指兩個(gè)向量之間的夾角的余弦值大于0.8。
      [0014]步驟一五、在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第二樞軸語(yǔ)短語(yǔ)的向量表示匹配的目標(biāo)語(yǔ)短語(yǔ);
      [0015]步驟一六、將各所述源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)組成源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù);
      [0016]步驟二、根據(jù)步驟一中建立的源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)對(duì)源語(yǔ)言進(jìn)行翻譯。
      [0017]本發(fā)明中一種基于相似度匹配的樞軸語(yǔ)言翻譯裝置,所述裝置包括:
      [0018]一、樞軸語(yǔ)言短語(yǔ)向量表示模塊410,用于在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式以及在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0019]二、樞軸語(yǔ)言短語(yǔ)查找模塊420,用于在源語(yǔ)言-樞軸語(yǔ)言翻譯規(guī)則庫(kù)中查找與第一源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)言短語(yǔ)的向量表示;
      [0020]三、向量相似度計(jì)算模塊430,用于計(jì)算樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中的樞軸語(yǔ)短語(yǔ)與第一樞軸語(yǔ)短語(yǔ)的語(yǔ)義相似度;
      [0021]四、目標(biāo)語(yǔ)短語(yǔ)查找模塊440,用于在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有語(yǔ)義相似度的目標(biāo)語(yǔ)短語(yǔ);
      [0022]五、短語(yǔ)對(duì)組合模塊450,用于將所述第一源語(yǔ)言短語(yǔ)與第一目標(biāo)語(yǔ)短語(yǔ)組合,形成至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)之間的短語(yǔ)對(duì);
      [0023]六、短語(yǔ)對(duì)存儲(chǔ)模塊460,用于將形成的至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)言短語(yǔ)之間的短語(yǔ)對(duì)存儲(chǔ)至源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)。
      [0024]七、目標(biāo)語(yǔ)短語(yǔ)輸出模塊470,用于根據(jù)源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)將與源語(yǔ)言對(duì)應(yīng)的目標(biāo)語(yǔ)輸出,完成翻譯處理。
      [0025]本發(fā)明優(yōu)點(diǎn):
      [0026]本發(fā)明通過(guò)對(duì)源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)以及樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中的樞軸語(yǔ)短語(yǔ)進(jìn)行向量表示,并計(jì)算各樞軸語(yǔ)短語(yǔ)之間的語(yǔ)義相似度來(lái)構(gòu)建源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),解決了樞軸語(yǔ)翻譯方法中要求的源語(yǔ)言到樞軸語(yǔ)的翻譯規(guī)則與該樞軸語(yǔ)到目標(biāo)語(yǔ)的翻譯規(guī)則,即規(guī)則I和規(guī)則2中的樞軸語(yǔ)短語(yǔ)必須完全相同而導(dǎo)致的潛在翻譯規(guī)則丟失問(wèn)題。
      【專利附圖】

      【附圖說(shuō)明】
      [0027]圖1基于相似度匹配的樞軸語(yǔ)言翻譯方法流程圖;
      [0028]圖2基于相似度匹配的樞軸語(yǔ)言翻譯方法裝置結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0029]【具體實(shí)施方式】一:本【具體實(shí)施方式】中一種基于相似度匹配的樞軸語(yǔ)言翻譯方法,具體是按照以下步驟進(jìn)行:
      [0030]步驟一、建立源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),具體包括以下步驟:
      [0031]步驟一一、建立源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù),在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0032]步驟一二、建立樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0033]步驟一三、在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中查找與源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)短語(yǔ)的向量表不;
      [0034]步驟一四、在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有向量相似性的至少一個(gè)第二樞軸語(yǔ)短語(yǔ)的向量表示;所述的具有向量相似性的判斷依據(jù)是指兩個(gè)向量之間的夾角的余弦值大于0.8。
      [0035]步驟一五、在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第二樞軸語(yǔ)短語(yǔ)的向量表示匹配的目標(biāo)語(yǔ)短語(yǔ);
      [0036]步驟一六、將各所述源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)組成源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)。
      [0037]步驟二、根據(jù)步驟一中所建立的源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)對(duì)源語(yǔ)言進(jìn)行翻譯。
      [0038]【具體實(shí)施方式】二:本【具體實(shí)施方式】中一種基于相似度匹配的樞軸語(yǔ)言翻譯裝置,所述裝置包括:
      [0039]一、樞軸語(yǔ)言短語(yǔ)向量表示模塊410,用于在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式以及在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式;
      [0040]二、樞軸語(yǔ)言短語(yǔ)查找模塊420,其功能為:在源語(yǔ)言-樞軸語(yǔ)言翻譯規(guī)則庫(kù)中查找與第一源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)言短語(yǔ)的向量表示;
      [0041]三、向量相似度計(jì)算模塊430,用于計(jì)算樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中的樞軸語(yǔ)短語(yǔ)與第一樞軸語(yǔ)短語(yǔ)的語(yǔ)義相似度;
      [0042]四、目標(biāo)語(yǔ)短語(yǔ)查找模塊440,用于在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有語(yǔ)義相似度的目標(biāo)語(yǔ)短語(yǔ);
      [0043]五、短語(yǔ)對(duì)組合模塊450,用于將所述第一源語(yǔ)言短語(yǔ)與第一目標(biāo)語(yǔ)短語(yǔ)組合,形成至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)之間的短語(yǔ)對(duì);
      [0044]六、短語(yǔ)對(duì)存儲(chǔ)模塊460,用于將形成的至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)言短語(yǔ)之間的短語(yǔ)對(duì)存儲(chǔ)至源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù);
      [0045]七、目標(biāo)語(yǔ)短語(yǔ)輸出模塊470,用于根據(jù)源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)將與源語(yǔ)言對(duì)應(yīng)的目標(biāo)語(yǔ)輸出,完成翻譯處理。
      [0046]實(shí)施例
      [0047]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部?jī)?nèi)容。
      [0048]實(shí)施例1
      [0049]人類語(yǔ)言也稱自然語(yǔ)言,是以文字的形式存在。為了計(jì)算語(yǔ)言自己的相似度,需要將人類語(yǔ)言表示為向量的形式。對(duì)于將人類語(yǔ)言使用向量進(jìn)行表示,有多種方法可以實(shí)現(xiàn)此過(guò)程,本實(shí)例使用了基于深度學(xué)習(xí)的詞向量表示形式,并將其擴(kuò)展到短語(yǔ)表示中。本實(shí)施例中以英語(yǔ)作為樞軸語(yǔ)言的一條中文“開(kāi)始”到西班牙文“iniciar”翻譯規(guī)則的建立過(guò)程為例具體說(shuō)明本發(fā)明技術(shù)方案,具體包括以下步驟(如圖1所示):
      [0050]步驟一,建立源語(yǔ)言-樞軸語(yǔ)言翻譯規(guī)則庫(kù),在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式。[0051]步驟二,在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中,將樞軸語(yǔ)短語(yǔ)表示為向量形式。
      [0052]表1
      [0053]
      【權(quán)利要求】
      1.一種基于相似度匹配的樞軸語(yǔ)言翻譯方法,其特征在于具體是按照以下步驟進(jìn)行:步驟一、建立源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),具體包括以下步驟:步驟一一、建立源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù),在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中,將其中的樞軸語(yǔ)短語(yǔ)表示為向量形式;步驟一二、建立樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù),在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中,將其中的樞軸語(yǔ)短語(yǔ)表示為向量形式;步驟一三、在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中查找與源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)短語(yǔ)的向量表示;步驟一四、在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有向量相似性的至少一個(gè)第二樞軸語(yǔ)短語(yǔ)的向量表示,并關(guān)聯(lián)第一樞軸語(yǔ)短語(yǔ)與第二樞軸語(yǔ)短語(yǔ);所述的具有向量相似性的判斷依據(jù)是指兩個(gè)向量之間的夾角的余弦值大于0.8 ;所述的向量夾角余弦的計(jì)算公式為:

      2.根據(jù)權(quán)利要求1中所述一種基于相似度匹配的樞軸語(yǔ)言翻譯方法,其特征在于步驟一中所使用的向量表不形式為基于深度學(xué)習(xí)的詞向量表不形式。
      3.一種基于相似度匹配的樞軸語(yǔ)言翻譯裝置,其特征在于包括以下功能模塊:樞軸語(yǔ)言短語(yǔ)向量表示模塊(410),用于在源語(yǔ)言-樞軸語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式以及在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中將樞軸語(yǔ)短語(yǔ)表示為向量形式;樞軸語(yǔ)言短語(yǔ)查找模塊(420),用于在源語(yǔ)言-樞軸語(yǔ)言翻譯規(guī)則庫(kù)中查找與第一源語(yǔ)言短語(yǔ)語(yǔ)義匹配的至少一個(gè)第一樞軸語(yǔ)言短語(yǔ)的向量表示;向量相似度計(jì)算模塊(430),用于計(jì)算樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中的樞軸語(yǔ)短語(yǔ)與第一樞軸語(yǔ)短語(yǔ)的語(yǔ)義相似度;目標(biāo)語(yǔ)短語(yǔ)查找模塊(440),用于在樞軸語(yǔ)-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)中查找與第一樞軸語(yǔ)短語(yǔ)具有語(yǔ)義相似度的目標(biāo)語(yǔ)短語(yǔ);短語(yǔ)對(duì)組合模塊(450),用于將所述源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)組合,形成至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)短語(yǔ)之間的短語(yǔ)對(duì);短語(yǔ)對(duì)存儲(chǔ)模塊(460),用于將形成的至少一個(gè)源語(yǔ)言短語(yǔ)與目標(biāo)語(yǔ)言短語(yǔ)之間的短語(yǔ)對(duì)存儲(chǔ)至源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù);目標(biāo)語(yǔ)短語(yǔ)輸出模塊(470),用于根據(jù)源語(yǔ)言-目標(biāo)語(yǔ)翻譯規(guī)則庫(kù)將與源語(yǔ)言對(duì)應(yīng)的目標(biāo)語(yǔ)輸出,完成翻譯處理。
      【文檔編號(hào)】G06F17/28GK103605644SQ201310636884
      【公開(kāi)日】2014年2月26日 申請(qǐng)日期:2013年12月2日 優(yōu)先權(quán)日:2013年12月2日
      【發(fā)明者】朱聰慧, 朱曉寧, 趙鐵軍, 鄭德權(quán), 楊沐昀, 曹海龍, 徐冰 申請(qǐng)人:哈爾濱工業(yè)大學(xué)
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1