国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法及裝置與流程

      文檔序號(hào):11286267閱讀:359來源:國知局
      一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法及裝置與流程

      本發(fā)明涉及自然語言處理,文本語義分析技術(shù)領(lǐng)域,尤其是涉及一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法和裝置。



      背景技術(shù):

      在日常工作和生活中,往往遇到這樣的需求:在不懂第三方國家語言的情況下,想通過網(wǎng)絡(luò)了解同一個(gè)問題在第三方語言的國家里是怎么的狀態(tài)。目前,這個(gè)問題還不能得到有效的解決,主要在于,尚缺乏有效的從中文到第三方國家語言的語義匹配方案。



      技術(shù)實(shí)現(xiàn)要素:

      本發(fā)明的目的在于克服現(xiàn)有技術(shù)的缺陷,提供一種以中文為源語言,面向第三方語言的語義吻合度評(píng)測(cè)方法和裝置,基于該方案,使用戶能夠基于中文,較準(zhǔn)確地找到想要的第三方語言描述的同類或類似相關(guān)問題或人、事、物。

      為實(shí)現(xiàn)上述目的,本發(fā)明提出如下技術(shù)方案:一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法,包括:

      s1,建立源背景語義模型實(shí)例;

      s2,建立與源背景語義模型相對(duì)應(yīng)的拓展背景語義模型實(shí)例;

      s3,建立目標(biāo)背景語義模型實(shí)例和語境結(jié)構(gòu)模型實(shí)例;

      s4,計(jì)算所述目標(biāo)背景語義模型實(shí)例和目標(biāo)語境結(jié)構(gòu)模型實(shí)例到所述拓展背景語義模型實(shí)例的語義距離,根據(jù)計(jì)算出的語義距離評(píng)測(cè)第三方語言目標(biāo)文本的語義是否與所提供的源語言語義相吻合。

      優(yōu)選地,所述源背景語義模型包括模型的應(yīng)用領(lǐng)域和至少一個(gè)第一模型屬性,每個(gè)所述第一模型屬性用二元組(keywordi,weighti)表示,其中,keywordi為源語言關(guān)鍵詞,weighti為keywordi在整個(gè)源背景語義模型中所占有的權(quán)重,i=(1,2……n),i,n均為大于等于1的自然數(shù);所述建立源背景語義模型實(shí)例過程包括:將所述模型的應(yīng)用領(lǐng)域、源語言關(guān)鍵詞和權(quán)重實(shí)例化為具體的字符串值。

      優(yōu)選地,建立所述拓展背景語義模型實(shí)例過程包括建立第一拓展模型實(shí)例和第二拓展模型實(shí)例,其中,所述第一拓展模型為源語言經(jīng)中間語言到目標(biāo)語言的拓展模型,所述第二拓展模型為源語言到目標(biāo)語言的拓展模型。

      優(yōu)選地,所述第一拓展模型和第二拓展模型結(jié)構(gòu)相同,均包括第一外文翻譯詞列表,及至少一個(gè)第二模型屬性,所述第一外文翻譯詞列表與源背景語義模型的應(yīng)用領(lǐng)域相對(duì)應(yīng),每個(gè)所述第二模型屬性用三元組(keywordlisti,weighti,αi)表示,其中,keywordlisti為與keywordi相對(duì)應(yīng)的第二外文翻譯詞列表,weighti為keywordi在整個(gè)源背景語義模型中所占有的權(quán)重,αi為源語言關(guān)鍵詞到外文翻譯詞之間的相似度閾值,i=(1,2……n),i,n均為大于等于1的自然數(shù);所述建立拓展背景語義模型實(shí)例過程包括:將所述模型的第一外文翻譯詞列表、第二外文翻譯詞列表、權(quán)重和語義距離閾值實(shí)例化為具體的字符串值。

      優(yōu)選地,所述第二外文翻譯詞列表keywordlisti中包括至少一個(gè)單元結(jié)構(gòu),每個(gè)所述單元結(jié)構(gòu)用二元組(keywordi,propertyi)表示,其中,keywordi為與源背景語義模型中的源語言關(guān)鍵詞相對(duì)應(yīng)的中間語言關(guān)鍵詞或第三方語言關(guān)鍵詞,propertyi為keywordi的詞性,i=(1,2……n),i,n均為大于等于1的自然數(shù)。

      優(yōu)選地,所述目標(biāo)背景語義模型包括按詞頻降序排列的目標(biāo)文本實(shí)義詞列表,及至少一個(gè)第三模型屬性,每個(gè)所述第三模型屬性用三元組(notationalwordi,propertyi,wfrequencyi)表示,其中,notationalwordi為目標(biāo)文本實(shí)義詞,propertyi為notationalwordi的詞性,wfrequencyi為notationalwordi在目標(biāo)文本中的詞頻,i=(1,2……n),i,n均為大于等于1的自然數(shù);所述建立目標(biāo)背景語義模型實(shí)例過程包括:將所述模型的目標(biāo)文本實(shí)義詞列表、目標(biāo)文本實(shí)義詞notationalwordi、詞性propertyi和詞頻wfrequencyi實(shí)例化為具體的字符串值。

      優(yōu)選地,所述目標(biāo)語境結(jié)構(gòu)模型包括按詞頻降序排列的目標(biāo)文本實(shí)義詞列表,及至少一個(gè)第四模型屬性,每個(gè)所述第四模型屬性用notationalwordarraylisti表示,其中,notationalwordarraylisti表示目標(biāo)文本中一個(gè)完整子句的實(shí)義詞結(jié)構(gòu)數(shù)組,i=(1,2……n),i,n均為大于等于1的自然數(shù);所述建立目標(biāo)語境結(jié)構(gòu)模型實(shí)例過程包括:將所述模型的目標(biāo)文本實(shí)義詞列表、實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti實(shí)例化為第三方語言中具體的字符串值。

      優(yōu)選地,所述實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti包括多個(gè)單元結(jié)構(gòu),每個(gè)所述單元結(jié)構(gòu)用三元組(notationalwordi,propertyi,wfrequencyi)表示,其中,notationalwordi為目標(biāo)文本實(shí)義詞,propertyi為notationalwordi的詞性,wfrequencyi為notationalwordi在目標(biāo)文本中的詞頻,i=(1,2……n),i,n均為大于等于1的自然數(shù)。

      優(yōu)選地,所述s4包括:

      s401,獲得目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的交集,若兩交集均不為空,則進(jìn)入s402;

      s402,計(jì)算目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的背景語義相關(guān)性;

      s403,計(jì)算目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的句子結(jié)構(gòu)語義相關(guān)性;

      s404,計(jì)算目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的綜合語義相關(guān)性;然后根據(jù)計(jì)算出的綜合語義相關(guān)性判斷第三方語言目標(biāo)文本是否與當(dāng)前的源背景語義模型實(shí)例語義吻合。

      優(yōu)選地,步驟s401中,采用閾值相似度交叉比對(duì)函數(shù)tscc(δ,α,a,b),結(jié)合交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算;

      步驟s402中,采用所述交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算;

      步驟s403中,采用語境結(jié)構(gòu)模型語義計(jì)算函數(shù)cmssf(a,b,α)進(jìn)行計(jì)算;

      步驟s404中,采用綜合語義相關(guān)性評(píng)測(cè)函數(shù)ssrf(a,b,c,d)進(jìn)行計(jì)算;

      其中,a,b,c,d為集合變量,δ為集合a,b的交集的勢(shì),α為相似度閾值,δ,α為可調(diào)參數(shù)。

      本發(fā)明還提供了另外一種技術(shù)方案:一種面向第三方語言文本的語義吻合度評(píng)測(cè)裝置,包括:

      第一模型實(shí)例構(gòu)建模塊,用于建立源背景語義模型實(shí)例,基于自動(dòng)向?qū)У姆绞?,引?dǎo)用戶創(chuàng)建所想要匹配的中文知識(shí)的語義特征;

      第二模型實(shí)例構(gòu)建模塊,用于建立與源背景語義模型相對(duì)應(yīng)的拓展背景語義模型實(shí)例;

      第三模型實(shí)例構(gòu)建模塊,用于建立目標(biāo)背景語義模型實(shí)例和語境結(jié)構(gòu)模型實(shí)例;

      語義吻合度評(píng)測(cè)模塊,用于計(jì)算目標(biāo)背景語義模型實(shí)例和目標(biāo)語境結(jié)構(gòu)模型實(shí)例分別到拓展背景語義模型實(shí)例的語義距離,并根據(jù)計(jì)算出的語義距離評(píng)測(cè)第三方語言目標(biāo)文本的語義是否與所提供的源語言語義相吻合。

      優(yōu)選地,所述第二模型實(shí)例構(gòu)建模塊包括第一拓展模型實(shí)例構(gòu)建模塊和第二拓展模型實(shí)例構(gòu)建模塊,所述第一拓展模型實(shí)例構(gòu)建模塊用于構(gòu)建第一拓展模型,所述第一拓展模型為源語言經(jīng)中間語言到目標(biāo)語言的拓展模型實(shí)例;所述第二拓展模型實(shí)例構(gòu)建模塊用于構(gòu)建第二拓展模型,所述第二拓展模型為源語言到目標(biāo)語言的拓展模型實(shí)例。

      優(yōu)選地,所述語義吻合度評(píng)測(cè)模塊包括:

      交集計(jì)算模塊,用于獲得目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的交集;

      背景語義相關(guān)性計(jì)算模塊,用于獲得目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的背景語義相關(guān)性;

      句子結(jié)構(gòu)語義相關(guān)性模塊,用于獲得目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的句子結(jié)構(gòu)語義相關(guān)性;

      綜合語義相關(guān)性評(píng)測(cè)模塊,用于計(jì)算目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的綜合語義相關(guān)性;然后根據(jù)計(jì)算出的綜合語義相關(guān)性判斷第三方語言目標(biāo)文本是否與當(dāng)前的源背景語義模型實(shí)例語義吻合。

      優(yōu)選地,所述交集計(jì)算模塊,采用閾值相似度交叉比對(duì)函數(shù)tscc(δ,α,a,b),結(jié)合交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算;

      所述背景語義相關(guān)性計(jì)算模塊,采用所述交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算;

      所述句子結(jié)構(gòu)語義相關(guān)性計(jì)算模塊,采用語境結(jié)構(gòu)模型語義計(jì)算函數(shù)cmssf(a,b,α)進(jìn)行計(jì)算;

      所述綜合語義相關(guān)性評(píng)測(cè)模塊,采用綜合語義相關(guān)性評(píng)測(cè)函數(shù)ssrf(a,b,c,d)進(jìn)行計(jì)算;

      其中,a,b,c,d為集合變量,δ為集合a,b的交集的勢(shì),α為相似度閾值,δ,α為可調(diào)參數(shù)。

      與現(xiàn)有技術(shù)相比,本發(fā)明可實(shí)現(xiàn)以源語言(如中文)對(duì)第三方語言表達(dá)的文本進(jìn)行語義匹配和查找,擴(kuò)大了語義匹配和查找的范圍,大大拓展了知識(shí)的來源渠道。

      附圖說明

      圖1是本發(fā)明語義吻合度評(píng)測(cè)方法的流程示意圖;

      圖2是本發(fā)明源背景語義模型的結(jié)構(gòu)示意圖;

      圖3是本發(fā)明拓展背景語義模型的結(jié)構(gòu)示意圖;

      圖4是本發(fā)明第二外文翻譯詞列表的結(jié)構(gòu)示意圖;

      圖5是本發(fā)明目標(biāo)背景語義模型的結(jié)構(gòu)示意圖;

      圖6是本發(fā)明目標(biāo)語境結(jié)構(gòu)模型的結(jié)構(gòu)示意圖;

      圖7是本發(fā)明實(shí)義詞結(jié)構(gòu)數(shù)組的結(jié)構(gòu)示意圖;

      圖8是本發(fā)明步驟s4的流程示意圖。

      具體實(shí)施方式

      下面將結(jié)合本發(fā)明的附圖,對(duì)本發(fā)明實(shí)施例的技術(shù)方案進(jìn)行清楚、完整的描述。

      本發(fā)明實(shí)施例所揭示的一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法及裝置,實(shí)現(xiàn)以中文為源語言,面向第三方語言文本進(jìn)行語義匹配和查找,當(dāng)然不限于源語言為中文,也可是其他語種。

      如圖1所示,本發(fā)明實(shí)施例所揭示的一種面向第三方語言文本的語義吻合度評(píng)測(cè)方法,包括以下步驟:

      s1,建立中文背景語義模型實(shí)例。

      具體地,本發(fā)明實(shí)施例中,中文背景語義模型定義為如圖2所示結(jié)構(gòu),以表格形式表示,在該表格中包括:第一類屬和至少一個(gè)第一模型屬性,第一類屬用變量xxx表示,表示整個(gè)中文背景語義模型所屬的應(yīng)用領(lǐng)域;每個(gè)第一模型屬性用二元組(keywordi,weighti)表示,其中,keywordi為中文關(guān)鍵詞,weighti為keywordi在整個(gè)中文背景語義模型中所占的權(quán)重。

      建立中文背景語義模型實(shí)例的過程即為將模型中的類屬xxx、源語言關(guān)鍵詞keywordi,權(quán)重weighti實(shí)例化為具體的字符串值。

      s2,建立與中文背景語義模型對(duì)應(yīng)的外文拓展背景語義模型實(shí)例。

      具體地,建立外文拓展背景語義模型實(shí)例包括兩個(gè)過程,即建立第一拓展模型實(shí)例和第二拓展模型實(shí)例,第一拓展模型實(shí)例建立為源語言經(jīng)中間語言(如英文)到第三方語言的拓展模型實(shí)例(en2rdemi),另一個(gè)就是直接建立中文到第三方語言的拓展模型實(shí)例(rdemi)。

      在本發(fā)明實(shí)施例中,第一拓展模型及第二拓展模型均定義為如圖3和圖4所示結(jié)構(gòu),同樣以表格形式但不限于表格形式,在圖3所示表格中包括:第二類屬和至少一個(gè)第二模型屬性,第二類屬用變量xxx-list表示,表示第一外文翻譯詞列表,第一外文翻譯詞列表與中文背景語義模型所屬的應(yīng)用領(lǐng)域(xxx)相對(duì)應(yīng),每個(gè)第二模型屬性用三元組(keywordlisti,weighti,αi)表示,其中,keywordlisti為上述中文關(guān)鍵詞keywordi對(duì)應(yīng)的第二外文翻譯詞列表,且表內(nèi)的翻譯詞與中文關(guān)鍵詞keywordi同義,weighti為keywordi在整個(gè)中文背景語義模型中所占的權(quán)重,αi為第二外文翻譯詞列表keywordlisti與對(duì)應(yīng)的中文關(guān)鍵詞keywordi之間的相似度閾值,一般,第二外文翻譯詞列表keywordlisti與中文關(guān)鍵詞keywordi之間的語義距離小于αi,且兩者之間的語義距離越小,說明兩者的語義越接近。

      優(yōu)選地,第二外文翻譯詞列表keywordlisti定義為如圖4示結(jié)構(gòu),同樣以表格形式但不限于表格形式表示,在該表格中包括至少一個(gè)單元結(jié)構(gòu),每個(gè)單元結(jié)構(gòu)用二元組(keywordi,propertyi)表示,其中,keywordi為與中文背景語義模型中的中文關(guān)鍵詞相對(duì)應(yīng)的英文關(guān)鍵詞或第三方目標(biāo)語言關(guān)鍵詞,propertyi為keywordi的詞性。

      建立外文拓展背景語義模型實(shí)例的過程(即包括建立中文經(jīng)英文到第三方語言的拓展模型實(shí)例和建立中文到第三方語言的拓展模型實(shí)例過程)具體為:將模型中的第一外文翻譯詞列表xxx-list、第二外文翻譯詞列表keywordlisti、權(quán)重weighti和相似度閾值αi實(shí)例化為第三方語言中具體的字符串值,得到en2rdemi和rdemi。

      s3,建立第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)和語境結(jié)構(gòu)模型實(shí)例(rdscmi)。

      具體地,本發(fā)明實(shí)施例中,第三方語言目標(biāo)文本的背景語義模型定義為如圖5所示結(jié)構(gòu),同樣以表格形式表示,圖5所示表格中包括第三方語言目標(biāo)文本的實(shí)義詞列表及至少一個(gè)第三模型屬性,目標(biāo)文本實(shí)義詞列表也用變量xxx-list表示;每個(gè)屬性用三元組(notationalwordi,propertyi,wfrequencyi)表示,其中,notationalwordi為第三方語言目標(biāo)文本中的實(shí)義詞,propertyi為第三方語言目標(biāo)文本中的實(shí)義詞notationalwordi的詞性,wfrequencyi為實(shí)義詞notationalwordi在第三方語言目標(biāo)文本中的詞頻。目標(biāo)文本實(shí)義詞列表中的目標(biāo)文本實(shí)義詞notationalwordi優(yōu)選按詞頻wfrequencyi降序排列。

      建立第三方語言目標(biāo)文本的背景語義模型實(shí)例的過程即為將模型中的目標(biāo)文本實(shí)義詞列表xxx-list、目標(biāo)文本中的實(shí)義詞notationalwordi,詞性propertyi,詞頻wfrequencyi實(shí)例化為第三方語言中具體的字符串值,得到rdbmi。

      本發(fā)明實(shí)施例中,第三方語言目標(biāo)文本的語境結(jié)構(gòu)模型定義為如圖6和圖7所示結(jié)構(gòu),也是以表格形式表示,在圖6所示表格中包括第三方語言目標(biāo)文本的實(shí)義詞列表,及至少一個(gè)第四模型屬性,目標(biāo)文本實(shí)義詞列表同樣用變量xxx-list表示;每個(gè)第四模型屬性用三元組notationalwordarraylisti表示,notationalwordarraylisti表示目標(biāo)文本中一個(gè)完整子句的實(shí)義詞結(jié)構(gòu)數(shù)組。

      優(yōu)選地,如圖7所示,目標(biāo)文本中一個(gè)完整子句的實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti包括多個(gè)單元結(jié)構(gòu),每個(gè)單元結(jié)構(gòu)用三元組(notationalwordi,propertyi,wfrequencyi)表示,其中,notationalwordi為第三方語言目標(biāo)文本中的實(shí)義詞,propertyi為第三方語言目標(biāo)文本中的實(shí)義詞notationalwordi的詞性,wfrequencyi為實(shí)義詞notationalwordi在第三方語言目標(biāo)文本中的詞頻。目標(biāo)文本實(shí)義詞列表中的目標(biāo)文本實(shí)義詞notationalwordi優(yōu)選按詞頻wfrequencyi降序排列。

      建立第三方語言目標(biāo)文本的語境結(jié)構(gòu)模型實(shí)例的過程即為將模型中的實(shí)義詞列表xxx-list和實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti實(shí)例化為第三方語言中具體的字符串值,得到rdscmi。

      s4,計(jì)算第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)和目標(biāo)語境結(jié)構(gòu)模型實(shí)例(rdscmi)分別到外文拓展背景語義模型實(shí)例(rdemi和en2rdemi)的語義距離,并以此評(píng)測(cè)第三方語言文本的語義是否與所提供的中文語義吻合。

      具體地,如圖8所示,包括以下幾個(gè)步驟:

      s401,獲得第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)與第二拓展模型實(shí)例(rdemi),以及第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)與第一拓展模型實(shí)例(en2rdemi)的交集。

      具體地,在交叉語義極值函數(shù)csmvf(a,b,α)滿足一定條件的基礎(chǔ)下,使用閾值相似度交叉比對(duì)函數(shù)tscc(δ,α,a,b)來分別獲得rdbmi和rdemi,以及rdbmi和en2rdemi的交集,定義計(jì)算出的rdbmi與rdemi的交集為φ1,rdbmi與rdemi的交集為φ2,即:

      tscc(δ,α,rdbmi,rdemi)=φ1;

      tscc(δ,α,rdbmi,en2rdemi)=φ2;

      如果φ1為空或者φ2為空,也就是說明當(dāng)前第三方語言目標(biāo)文本與當(dāng)前的中文背景語義模型實(shí)例語義不吻合,則停止計(jì)算;否則,繼續(xù)下一步步驟s402。

      其中,閾值相似度交叉比對(duì)函數(shù)tscc(δ,α,a,b)定義為:

      如果令csmvf(a,b,α)≥α,且|a∩b|≥δ;其中,δ為集合a,b的交集的勢(shì),α為相似度閾值,δ,α為可調(diào)參數(shù)。

      交叉語義極值函數(shù)csmvf(a,b,α)定義為:

      ak∈a,|a|為a的勢(shì);

      且1≤m,i≤|b|,有semanticdisval(ak,bi)≥semanticdisval(ak,bm)且semanticdisval(ak,bi)≥α且bi∈b且bm∈b。

      semanticdisval(ai,bi)定義為:關(guān)鍵詞ai,bi在關(guān)鍵詞本體庫中依據(jù)語義距離計(jì)算所得語義相似度數(shù)值。

      s402,計(jì)算第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)與第二拓展模型實(shí)例(rdemi),以及第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)與第一拓展模型實(shí)例(en2rdemi)的背景語義相關(guān)性。

      具體地,采用上述交叉語義極值函數(shù)csmvf(a,b,α)計(jì)算rdbmi和rdemi,以及rdbmi和en2rdemi的背景語義相關(guān)性,交叉語義極值函數(shù)csmvf(a,b,α)的定義可具體參照上述描述,這里不再贅述。

      s403,計(jì)算第三方語言目標(biāo)文本的語境結(jié)構(gòu)模型實(shí)例(rdscmi)與第二拓展模型實(shí)例(rdemi),以及第三方語言目標(biāo)文本的語境結(jié)構(gòu)模型實(shí)例(rdscmi)與第一拓展模型實(shí)例(en2rdemi)的句子結(jié)構(gòu)語義相關(guān)性。

      具體地,采用語境結(jié)構(gòu)模型語義計(jì)算函數(shù)cmssf(a,b,α)來計(jì)算rdscmi和rdemi,rdscmi和en2rdemi的句子結(jié)構(gòu)語義相關(guān)性。

      語境結(jié)構(gòu)模型語義計(jì)算函數(shù)cmssf(a,b,α)定義為:

      函數(shù)中,n為rdscmi模型結(jié)構(gòu)中屬性下實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti的數(shù)目,sssf為參照model2計(jì)算單個(gè)語句結(jié)構(gòu)語義的函數(shù),δ為調(diào)和參數(shù),sentencenumber_rd為第三方網(wǎng)絡(luò)文本中的實(shí)際所含單個(gè)語句數(shù);

      其中,n為array_keywordsi數(shù)組的長度,θ為model2中與nwi最相似的那個(gè),同在外文拓展背景語義模型中所帶權(quán)重(即圖3單元結(jié)構(gòu)中的weighti),nwi為array_keywordsi中的元素中的實(shí)義詞;ε:如果nwi與最相似的詞的詞性相同,取值ρ,否則,取值σ,其中ρ和σ都是調(diào)和參數(shù);

      s403,計(jì)算第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)/語境結(jié)構(gòu)模型實(shí)例(rdscmi)與第二拓展模型實(shí)例(rdemi),以及第三方語言目標(biāo)文本的背景語義模型實(shí)例(rdbmi)/語境結(jié)構(gòu)模型實(shí)例(rdscmi)與第一拓展模型實(shí)例(en2rdemi)的綜合語義相關(guān)性,然后根據(jù)計(jì)算出的綜合語義相關(guān)性判斷第三方語言目標(biāo)文本是否與當(dāng)前的中文背景語義模型實(shí)例語義吻合。

      具體地,采用綜合語義相關(guān)性評(píng)測(cè)函數(shù)ssrf(a,b)來計(jì)算rdbmi/rdscmi與rdemi,以及rdbmi/rdscmi與en2rdemi的綜合語義相關(guān)性。

      綜合語義相關(guān)性評(píng)測(cè)函數(shù)ssrf(a,b,c,d)定義為:

      若sssrf(rdscmi,rdbmi,rdemi,enemi)≥ω,則認(rèn)為第三方語言目標(biāo)文本的語義與當(dāng)前的中文背景語義模型實(shí)例的語義相吻合,否則,認(rèn)為二者不吻合,其中,ω為可調(diào)參數(shù)。

      需要說明的是,上述i=1,2……n,其中,i,n均為大于等于1的自然數(shù)。

      本發(fā)明所提供一種面向第三方語言文本的語義吻合度評(píng)測(cè)裝置,包括:

      第一模型實(shí)例構(gòu)建模塊,用于建立源背景語義模型實(shí)例,基于自動(dòng)向?qū)У姆绞?,引?dǎo)用戶創(chuàng)建所想要匹配的中文知識(shí)的語義特征。

      具體地,第一模型實(shí)例構(gòu)建模塊構(gòu)建的中文背景語義模型結(jié)構(gòu)見上述具體描述,第一模型實(shí)例構(gòu)建模塊用于將模型的應(yīng)用領(lǐng)域、源語言關(guān)鍵詞和權(quán)重實(shí)例化為具體的字符串值。

      第二模型實(shí)例構(gòu)建模塊,用于建立與源背景語義模型相對(duì)應(yīng)的拓展背景語義模型實(shí)例。

      具體地,第二模型實(shí)例構(gòu)建模塊包括第一拓展模型實(shí)例構(gòu)建模塊和第二拓展模型實(shí)例構(gòu)建模塊,第一拓展模型實(shí)例構(gòu)建模塊用于構(gòu)建第一拓展模型,第一拓展模型為中間語言到目標(biāo)語言的拓展模型實(shí)例;第二拓展模型實(shí)例構(gòu)建模塊用于構(gòu)建第二拓展模型,第二拓展模型為源語言到目標(biāo)語言的拓展模型實(shí)例。

      第一拓展模型和第二拓展模型的結(jié)構(gòu)相同,詳見上面描述,第二模型實(shí)例構(gòu)建模塊用于將模型的第一外文翻譯詞列表、第二外文翻譯詞列表、權(quán)重和相似度閾值實(shí)例化為第三方語言中具體的字符串值。

      第三模型實(shí)例構(gòu)建模塊,用于建立目標(biāo)背景語義模型實(shí)例和語境結(jié)構(gòu)模型實(shí)例。

      目標(biāo)背景語義模型和語境結(jié)構(gòu)模型的結(jié)構(gòu)詳見上面描述,第三模型實(shí)例構(gòu)建模塊用于將目標(biāo)背景語義模型中的目標(biāo)文本實(shí)義詞列表、目標(biāo)文本實(shí)義詞notationalwordi、詞性propertyi和詞頻wfrequencyi實(shí)例化為第三方語言中具體的字符串值,以及用于將目標(biāo)語境結(jié)構(gòu)模型中的目標(biāo)文本實(shí)義詞列表、實(shí)義詞結(jié)構(gòu)數(shù)組notationalwordarraylisti實(shí)例化為第三方語言中具體的字符串值。

      語義吻合度評(píng)測(cè)模塊,用于計(jì)算目標(biāo)背景語義模型實(shí)例和目標(biāo)語境結(jié)構(gòu)模型實(shí)例分別到拓展背景語義模型實(shí)例的語義距離,并根據(jù)計(jì)算出的語義距離評(píng)測(cè)第三方語言目標(biāo)文本的語義是否與所提供的源語言語義相吻合。

      具體地,語義吻合度評(píng)測(cè)模塊包括:

      交集計(jì)算模塊,用于獲得目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的交集;

      背景語義相關(guān)性計(jì)算模塊,用于獲得目標(biāo)背景語義模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例與第二拓展模型實(shí)例的背景語義相關(guān)性;

      句子結(jié)構(gòu)語義相關(guān)性,用于獲得目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的句子結(jié)構(gòu)語義相關(guān)性;

      綜合語義相關(guān)性評(píng)測(cè)模塊,用于目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第一拓展模型實(shí)例,以及目標(biāo)背景語義模型實(shí)例/目標(biāo)語境結(jié)構(gòu)模型實(shí)例與第二拓展模型實(shí)例的綜合語義相關(guān)性;然后根據(jù)計(jì)算出的綜合語義相關(guān)性判斷第三方語言目標(biāo)文本是否與當(dāng)前的源背景語義模型實(shí)例語義吻合。

      優(yōu)選地,交集計(jì)算模塊,采用閾值相似度交叉比對(duì)函數(shù)tscc(δ,α,a,b),結(jié)合交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算。

      背景語義相關(guān)性計(jì)算模塊,采用所述交叉語義極值函數(shù)csmvf(a,b,α)進(jìn)行計(jì)算。

      句子結(jié)構(gòu)語義相關(guān)性計(jì)算模塊,采用語境結(jié)構(gòu)模型語義計(jì)算函數(shù)cmssf(a,b,α)進(jìn)行計(jì)算。

      綜合語義相關(guān)性評(píng)測(cè)模塊,采用綜合語義相關(guān)性評(píng)測(cè)函數(shù)ssrf(a,b,c,d)進(jìn)行計(jì)算。

      其中,a,b,c,d為集合變量,δ為集合a,b的交集的勢(shì),α為相似度閾值,δ,α為可調(diào)參數(shù)。

      上述這些函數(shù)在評(píng)測(cè)方法中均有詳細(xì)描述,便不再贅述。

      本發(fā)明的技術(shù)內(nèi)容及技術(shù)特征已揭示如上,然而熟悉本領(lǐng)域的技術(shù)人員仍可能基于本發(fā)明的教示及揭示而作種種不背離本發(fā)明精神的替換及修飾,因此,本發(fā)明保護(hù)范圍應(yīng)不限于實(shí)施例所揭示的內(nèi)容,而應(yīng)包括各種不背離本發(fā)明的替換及修飾,并為本專利申請(qǐng)權(quán)利要求所涵蓋。

      當(dāng)前第1頁1 2 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1