国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于提及檢測(cè)中的消歧的方法和系統(tǒng)的制作方法_5

      文檔序號(hào):9865488閱讀:來(lái)源:國(guó)知局
      一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
      [0074]以上已經(jīng)描述了本發(fā)明的各實(shí)施例,上述說(shuō)明是示例性的,并非窮盡性的,并且也不限于所披露的各實(shí)施例。在不偏離所說(shuō)明的各實(shí)施例的范圍和精神的情況下,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō)許多修改和變更都是顯而易見(jiàn)的。本文中所用術(shù)語(yǔ)的選擇,旨在最好地解釋各實(shí)施例的原理、實(shí)際應(yīng)用或?qū)κ袌?chǎng)中技術(shù)的技術(shù)改進(jìn),或者使本技術(shù)領(lǐng)域的其它普通技術(shù)人員能理解本文披露的各實(shí)施例。
      【主權(quán)項(xiàng)】
      1.一種用于提及檢測(cè)中的消歧的方法,所述方法包括: 確定文本中的目標(biāo)詞形在所述文本中出現(xiàn)的至少一個(gè)位置;基于所述目標(biāo)詞形在每個(gè)所述位置處的詞袋上下文,獲取所述目標(biāo)詞形在所述文本中的總體詞袋上下文,每個(gè)所述位置處的所述詞袋上下文包含所述位置的預(yù)定鄰域內(nèi)的詞;基于所述目標(biāo)詞形在每個(gè)所述位置處的資源上下文,獲取所述目標(biāo)詞形在所述文本中的總體資源上下文,每個(gè)所述位置處的所述資源上下文包含所述位置的預(yù)定鄰域內(nèi)的其他詞形所對(duì)應(yīng)的資源;以及 基于所述總體詞袋上下文和所述總體資源上下文來(lái)確定所述目標(biāo)詞形與用于所述目標(biāo)詞形的候選資源之間的相似度。2.根據(jù)權(quán)利要求1所述的方法,其中獲取所述目標(biāo)詞形在所述文本中的總體詞袋上下文包括合并所述目標(biāo)詞形在所述至少一個(gè)位置處的所述詞袋上下文, 并且其中獲取所述目標(biāo)詞形在所述文本中的總體資源上下文包括合并所述目標(biāo)詞形在所述至少一個(gè)位置處的所述資源上下文。3.根據(jù)權(quán)利要求1所述的方法,其中基于所述總體詞袋上下文和所述總體資源上下文來(lái)確定所述目標(biāo)詞形與用于所述目標(biāo)詞形的候選資源之間的相似度包括: 基于所述總體詞袋上下文和所述總體資源上下文,構(gòu)建所述目標(biāo)詞形的詞形上下文向量; 獲取所述候選資源的候選資源上下文向量,所述候選資源上下文向量包括所述候選資源的總體詞袋上下文和總體資源上下文;以及 基于所述詞形上下文向量和所述候選資源上下文向量來(lái)確定所述目標(biāo)詞形與所述候選資源之間的所述相似度。4.根據(jù)權(quán)利要求3所述的方法,其中基于所述詞形上下文向量和所述候選資源上下文向量來(lái)確定所述目標(biāo)詞形與所述候選資源之間的所述相似度包括: 獲取所述詞形上下文向量中的元素的第一組權(quán)重,所述第一組權(quán)重指示所述詞形上下文向量中的所述元素的重要性; 獲取所述候選資源上下文向量中的元素的第二組權(quán)重,所述第二組權(quán)重指示所述候選資源上下文向量中的所述元素的重要性;以及 基于所述第一組權(quán)重與所述第二組權(quán)重來(lái)計(jì)算所述詞形上下文向量與所述候選資源上下文向量的內(nèi)積,以確定所述目標(biāo)詞形與所述候選資源之間的所述相似度。5.根據(jù)權(quán)利要求4所述的方法,其中獲取所述詞形上下文向量中的元素的第一組權(quán)重包括: 基于所述詞形上下文向量中的所述元素的詞頻TF和逆文檔頻率IDF中的至少一個(gè)來(lái)計(jì)算所述權(quán)重。6.根據(jù)權(quán)利要求3所述的方法,其中獲取所述候選資源的候選資源上下文向量包括: 從與所述目標(biāo)詞形相關(guān)聯(lián)的索引中獲取所述候選資源上下文向量。7.根據(jù)權(quán)利要求1所述的方法,其中確定文本中的目標(biāo)詞形在所述文本中出現(xiàn)的至少一個(gè)位置包括確定所述目標(biāo)詞形,確定所述目標(biāo)詞形包括: 獲取所述文本中的多個(gè)詞形中的每個(gè)詞形的總體詞袋上下文; 基于所述多個(gè)詞形中的每個(gè)詞形的所述總體詞袋上下文,確定所述多個(gè)詞形中的每個(gè)詞形與相應(yīng)候選資源之間的粗略相似度;以及 從所述多個(gè)詞形中選擇所述目標(biāo)詞形,使得所述目標(biāo)詞形的所述粗略相似度低于第一閾值,并且所述目標(biāo)詞形的預(yù)定鄰域內(nèi)的其他詞形的所述粗略相似度高于第二閾值。8.一種用于提及檢測(cè)中的消歧的系統(tǒng),所述系統(tǒng)包括: 詞形位置確定單元,被配置為確定文本中的目標(biāo)詞形在所述文本中出現(xiàn)的至少一個(gè)位置; 詞袋上下文獲取單元,被配置為基于所述目標(biāo)詞形在每個(gè)所述位置處的詞袋上下文,獲取所述目標(biāo)詞形在所述文本中的總體詞袋上下文,每個(gè)所述位置處的所述詞袋上下文包含所述位置的預(yù)定鄰域內(nèi)的詞; 資源上下文獲取單元,被配置為基于所述目標(biāo)詞形在每個(gè)所述位置處的資源上下文,獲取所述目標(biāo)詞形在所述文本中的總體資源上下文,每個(gè)所述位置處的所述資源上下文包含所述位置的預(yù)定鄰域內(nèi)的其他詞形所對(duì)應(yīng)的資源;以及 消歧單元,被配置為基于所述總體詞袋上下文和所述總體資源上下文來(lái)確定所述目標(biāo)詞形與用于所述目標(biāo)詞形的候選資源之間的相似度。9.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述詞袋上下文獲取單元包括詞袋上下文合并單元,被配置為合并所述目標(biāo)詞形在所述至少一個(gè)位置處的所述詞袋上下文, 并且其中所述資源上下文獲取單元包括資源上下文合并單元,被配置為合并所述目標(biāo)詞形在所述至少一個(gè)位置處的所述資源上下文。10.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述消歧單元包括: 詞形上下文向量構(gòu)建單元,被配置為基于所述總體詞袋上下文和所述總體資源上下文,構(gòu)建所述目標(biāo)詞形的詞形上下文向量; 候選資源上下文向量獲取單元,被配置為獲取所述候選資源的候選資源上下文向量,所述候選資源上下文向量包括所述候選資源的總體詞袋上下文和總體資源上下文;以及相似度確定單元,被配置為基于所述詞形上下文向量和所述候選資源上下文向量來(lái)確定所述目標(biāo)詞形與所述候選資源之間的所述相似度。11.根據(jù)權(quán)利要求10所述的系統(tǒng),其中所述相似度確定單元包括: 第一權(quán)重獲取單元,被配置為獲取所述詞形上下文向量中的元素的第一組權(quán)重,所述第一組權(quán)重指示所述詞形上下文向量中的所述元素的重要性; 第二權(quán)重獲取單元,被配置為獲取所述候選資源上下文向量中的元素的第二組權(quán)重,所述第二組權(quán)重指示所述候選資源上下文向量中的所述元素的重要性;以及 內(nèi)積計(jì)算單元,被配置為基于所述第一組權(quán)重與所述第二組權(quán)重來(lái)計(jì)算所述詞形上下文向量與所述候選資源上下文向量的內(nèi)積,以確定所述目標(biāo)詞形與所述候選資源之間的所述相似度。12.根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述第一權(quán)重獲取單元包括: 基于頻率的獲取單元,被配置為基于所述詞形上下文向量中的所述元素的詞頻TF和逆文檔頻率IDF中的至少一個(gè)來(lái)計(jì)算所述權(quán)重。13.根據(jù)權(quán)利要求10所述的系統(tǒng),其中所述候選資源上下文向量獲取單元包括: 索引訪問(wèn)單元,被配置為從與所述目標(biāo)詞形相關(guān)聯(lián)的索引中獲取所述候選資源上下文向量。14.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述詞形位置確定單元包括詞形確定單元,所述詞形確定單元包括: 初始詞袋上下文獲取單元,被配置為獲取所述文本中的多個(gè)詞形中的每個(gè)詞形的總體詞袋上下文; 粗略相似度確定單元,被配置為基于所述多個(gè)詞形中的每個(gè)詞形的所述總體詞袋上下文,確定所述多個(gè)詞形中的每個(gè)詞形與相應(yīng)候選資源之間的粗略相似度;以及 詞形選擇單元,被配置為從所述多個(gè)詞形中選擇所述目標(biāo)詞形,使得所述目標(biāo)詞形的所述粗略相似度低于第一閾值,并且所述目標(biāo)詞形的預(yù)定鄰域內(nèi)的其他詞形的所述粗略相似度高于第二閾值。
      【專利摘要】本公開(kāi)內(nèi)容涉及用于提及檢測(cè)中的消歧的方法和系統(tǒng)。一個(gè)實(shí)施例公開(kāi)了一種用于提及檢測(cè)中的消歧的方法,包括:確定文本中的目標(biāo)詞形在文本中出現(xiàn)的至少一個(gè)位置;基于目標(biāo)詞形在每個(gè)位置處的詞袋上下文,獲取目標(biāo)詞形在文本中的總體詞袋上下文,每個(gè)位置處的詞袋上下文包含位置的預(yù)定鄰域內(nèi)的詞;基于目標(biāo)詞形在每個(gè)位置處的資源上下文,獲取目標(biāo)詞形在文本中的總體資源上下文,每個(gè)位置處的資源上下文包含位置的預(yù)定鄰域內(nèi)的其他詞形所對(duì)應(yīng)的資源;以及基于總體詞袋上下文和總體資源上下文來(lái)確定目標(biāo)詞形與用于目標(biāo)詞形的候選資源之間的相似度。還描述了相應(yīng)的系統(tǒng)。
      【IPC分類】G06F17/27
      【公開(kāi)號(hào)】CN105630763
      【申請(qǐng)?zhí)枴緾N201410601824
      【發(fā)明人】?;奂? 倪淵, 許瓊愷, 曹鋒, N·斯洛寧
      【申請(qǐng)人】國(guó)際商業(yè)機(jī)器公司
      【公開(kāi)日】2016年6月1日
      【申請(qǐng)日】2014年10月31日
      【公告號(hào)】US20160124939
      當(dāng)前第5頁(yè)1 2 3 4 5 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1