国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      歧義消解的方法和系統(tǒng)的制作方法

      文檔序號:6549763閱讀:305來源:國知局
      歧義消解的方法和系統(tǒng)的制作方法
      【專利摘要】本發(fā)明實施例公開了一種語言處理技術(shù),尤其涉及一種歧義消解的方法和系統(tǒng),用以通過新的方式實現(xiàn)在人機(jī)交互過程中處理器對語言的歧義消解。本發(fā)明實施例利用靜態(tài)知識和動態(tài)知識之間的關(guān)系,對自然語言歧義進(jìn)行動態(tài)分析,首先在詞法分析階段采用回溯試探切詞算法進(jìn)行歧義消解,對于未消除歧義的切詞結(jié)果進(jìn)行句法、語義、以及篇章分析。根據(jù)切詞結(jié)果中的各個切詞詞組在知識庫中進(jìn)行匹配,在匹配到對應(yīng)的歧義格式或多義詞后,對具體的多義詞引起的歧義和歧義結(jié)構(gòu)引起的歧義進(jìn)行重點分析,選取優(yōu)先度最高的實例化表示作為正確的語義表示,由此可以快速將存在歧義的語句進(jìn)行實例化表示,并在這些實例化表示中選取正確的語義表示,快速準(zhǔn)確地消除歧義。
      【專利說明】歧義消解的方法和系統(tǒng)

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及語言處理技術(shù),尤其涉及一種歧義消解的方法和系統(tǒng)。

      【背景技術(shù)】
      [0002]隨著電子信息技術(shù)的發(fā)展,越來越多的智能電視具備語音交互的功能,因此需要使智能電視能夠準(zhǔn)確識別語言的語義。而歧義問題是語言中普遍存在的現(xiàn)象,主要包括由多義詞引起的歧義以及由歧義結(jié)構(gòu)引起的歧義。其中,歧義結(jié)構(gòu)是指由多個詞語或者短語組合的構(gòu)成形式,由于各個詞語或者短語之間能夠形成多種內(nèi)部關(guān)系,由此所引起的歧義,例如“了解中國的留學(xué)生”、“咬死了獵人的狗”等。
      [0003]現(xiàn)有技術(shù)中采用的方法是以語句中的某一動詞作為語句核心,將切詞出現(xiàn)的動詞歧義結(jié)果上升到句法分析的層面,通過句子全局語義核心的預(yù)期知識對歧義結(jié)構(gòu)進(jìn)行判斷,得到歧義結(jié)構(gòu)的合理語義表示。而除了上述方法外,目前還沒有其它能夠應(yīng)用于人機(jī)交互的歧義消解方法。


      【發(fā)明內(nèi)容】

      [0004]本發(fā)明實施例提供一種歧義消解的方法和系統(tǒng),用以通過新的方式實現(xiàn)在人機(jī)交互過程中處理器對語言的歧義消解。
      [0005]本發(fā)明實施例提供的一種歧義消解的方法,該方法包括:
      [0006]確定語句的切詞結(jié)果中的切詞詞組的詞性;
      [0007]根據(jù)所述切詞詞組的詞性,將所述切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定所述切詞結(jié)果中存在歧義的切詞詞組的組合;
      [0008]在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示;
      [0009]選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      [0010]較佳地,在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,還包括:
      [0011]根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;
      [0012]對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      [0013]較佳地,根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示,包括:
      [0014]根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整;
      [0015]將所述存在歧義的切詞詞組的組合中的切詞詞組,代入所述調(diào)整后的單義式中,獲得所述單義式的實例化表示。
      [0016]較佳地,選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示,包括:
      [0017]進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0018]若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表示;
      [0019]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0020]將所述優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表
      /Jn ο
      [0021]本發(fā)明實施例提供的另一種歧義消解的方法,該方法包括:
      [0022]將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配,確定所述切詞結(jié)果中存在的多義詞組;
      [0023]在知識庫中查找所述多義詞組對應(yīng)的詞項變體,并根據(jù)所述詞項變體與其它切詞詞組的搭配限制關(guān)系,對所述切詞結(jié)果進(jìn)行實例化表示,其中所述詞項變體記錄有所述多義詞組的詞義及詞性;
      [0024]選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      [0025]較佳地,在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配之前,還包括:
      [0026]根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;
      [0027]對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      [0028]較佳地,選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示,包括:
      [0029]進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0030]若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表示;
      [0031]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0032]將所述優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      [0033]較佳地,上述方法還包括:
      [0034]將所述將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若所述知識庫中未匹配到所述切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將所述多個連續(xù)的切詞詞組的組合確定為未登錄詞;
      [0035]根據(jù)所述未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定所述未登錄詞的詞性;
      [0036]記錄所述未登錄詞被識別為該詞性的頻率和次數(shù);
      [0037]當(dāng)所述頻率和次數(shù)超過閾值時,將所述未登錄詞添加至知識庫中。
      [0038]本發(fā)明實施例提供的一種歧義消解的系統(tǒng),該系統(tǒng)包括:
      [0039]詞性確定模塊,用于確定語句的切詞結(jié)果中的切詞詞組的詞性;
      [0040]第一匹配模塊,用于根據(jù)所述切詞詞組的詞性,將所述切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定所述切詞結(jié)果中存在歧義的切詞詞組的組合;
      [0041 ] 第一實例化模塊,用于在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示;
      [0042]第一語義確定模塊,用于選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      [0043]較佳地,該系統(tǒng)還包括:
      [0044]第一切詞模塊,用于在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      [0045]較佳地,所述第一實例化模塊,具體用于:
      [0046]在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式;
      [0047]根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整;
      [0048]將所述存在歧義的切詞詞組的組合中的切詞詞組,代入所述調(diào)整后的單義式中,獲得所述單義式的實例化表示。
      [0049]較佳地,所述第一語義確定模塊,具體用于:
      [0050]進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0051]若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表示;
      [0052]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0053]將所述優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表
      /Jn ο
      [0054]本發(fā)明實施例提供的另一種歧義消解的系統(tǒng),該系統(tǒng)包括:
      [0055]第二匹配模塊,用于將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配,確定所述切詞結(jié)果中存在的多義詞組;
      [0056]第二實例化模塊,用于在知識庫中查找所述多義詞組對應(yīng)的詞項變體,并根據(jù)所述詞項變體與其它切詞詞組的搭配限制關(guān)系,對所述切詞結(jié)果進(jìn)行實例化表示,其中所述詞項變體記錄有所述多義詞組的詞義及詞性;
      [0057]第二語義確定模塊,用于選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表不。
      [0058]較佳地,該系統(tǒng)還包括:
      [0059]第二切詞模塊,用于在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配之前,根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      [0060]較佳地,所述第二語義確定模塊,具體用于:
      [0061]進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0062]若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表示;
      [0063]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0064]將所述優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      [0065]較佳地,上述系統(tǒng)還包括:
      [0066]識別模塊,用于將所述將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若所述知識庫中未匹配到所述切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將所述多個連續(xù)的切詞詞組的組合確定為未登錄詞;根據(jù)所述未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定所述未登錄詞的詞性;記錄所述未登錄詞被識別為該詞性的頻率和次數(shù);當(dāng)所述頻率和次數(shù)超過閾值時,將所述未登錄詞添加至知識庫中。
      [0067]本發(fā)明實施例在對語句進(jìn)行切詞處理后,根據(jù)切詞結(jié)果中的各個切詞詞組在知識庫中進(jìn)行匹配,在匹配到對應(yīng)的歧義格式或者多義詞后,能夠確定語句中存在的歧義。然后在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式或者多義詞所對應(yīng)的詞項變體,并根據(jù)語句的切詞結(jié)果中切詞詞組的搭配限制關(guān)系,進(jìn)行實例化表示,并選取優(yōu)先度最高的實例化表示作為正確的語義表示。通過查找知識庫中預(yù)先保存的靜態(tài)知識,可以快速將存在歧義的語句進(jìn)行實例化表示,并在這些實例化表示中選取正確的語義表示,快速準(zhǔn)確地消除歧義。

      【專利附圖】

      【附圖說明】
      [0068]圖1為本發(fā)明實施例一提供的一種歧義消解的方法的流程圖;
      [0069]圖2為本發(fā)明實施例一中對單義式進(jìn)行實例化過程的流程圖;
      [0070]圖3為本發(fā)明實施例一中確定語義表示過程的流程圖;
      [0071]圖4為本發(fā)明實施例一中進(jìn)行未登錄詞識別過程的流程圖;
      [0072]圖5為本發(fā)明實施例二提供的另一種歧義消解的方法的流程圖;
      [0073]圖6為本發(fā)明實施例三提供的一種針對歧義結(jié)構(gòu)進(jìn)行歧義消解的系統(tǒng)的結(jié)構(gòu)示意圖;
      [0074]圖7為本發(fā)明實施例四提供的一種針對多義詞進(jìn)行歧義消解的系統(tǒng)的結(jié)構(gòu)示意圖。

      【具體實施方式】
      [0075]本發(fā)明實施例中,在對語句進(jìn)行切詞處理后,根據(jù)切詞結(jié)果中的各個切詞詞組在知識庫中進(jìn)行匹配,在匹配到對應(yīng)的歧義格式或者多義詞后,能夠確定語句中存在的歧義。然后在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式或者多義詞所對應(yīng)的詞項變體,并根據(jù)語句的切詞結(jié)果中切詞詞組的搭配限制關(guān)系,進(jìn)行實例化表示,并選取優(yōu)先度最高的實例化表示作為正確的語義表示。
      [0076]在處理過程中,通過查找知識庫中預(yù)先保存的靜態(tài)知識,可以快速將存在歧義的語句進(jìn)行實例化表示,并在這些實例化表示中選取正確的語義表示,快速準(zhǔn)確地消除歧義。其中,知識庫中的靜態(tài)知識用于描述詞語之間的搭配限制關(guān)系、詞語的語義以及相互之間的邏輯常識,例如某一動詞和名詞之間的關(guān)聯(lián),可能存在的搭配關(guān)系等。上述靜態(tài)知識均與詞語之間建立有對應(yīng)關(guān)系,通過查找詞語即可確定與該詞語相關(guān)的靜態(tài)知識。
      [0077]下面結(jié)合說明書附圖對本發(fā)明實施例作進(jìn)一步詳細(xì)描述。
      [0078]如圖1所示,本發(fā)明實施例一提供的一種歧義消解的方法,可以應(yīng)用于計算機(jī)、智能電視、平板電腦或者手機(jī)等終端設(shè)備,以實現(xiàn)人機(jī)交互時的歧義消解。該方法包括:
      [0079]步驟101,確定語句的切詞結(jié)果中的切詞詞組的詞性。切詞詞組的選取由具體所采用的切詞算法決定,可以是單個的詞,也可以是由多個詞組成的短語。詞性的確定是根據(jù)預(yù)先設(shè)定的詞語和詞性之間的對應(yīng)關(guān)系來實現(xiàn),將獲得的切詞詞組在知識庫中進(jìn)行查找,查找到該切詞詞組的詞性后,將該詞性進(jìn)行標(biāo)記。
      [0080]步驟102,根據(jù)切詞詞組的詞性,將切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定切詞結(jié)果中存在歧義的切詞詞組的組合。歧義格式為存在歧義的切詞詞組的組合的形式化表示,例如“了解/中國/的/留學(xué)生”中,“了解”、“中國”、“留學(xué)生”的詞性依次為動詞、名詞和名詞。在對“了解/中國/的/留學(xué)生”這個切詞詞組的組合進(jìn)行匹配時,能夠在知識庫中匹配到對應(yīng)的歧義格式:“VP+NP1+的+NP2”。
      [0081]步驟103,在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式進(jìn)行實例化表示。
      [0082]知識庫除了預(yù)先保存有歧義格式,還保存有該歧義格式所對應(yīng)的相關(guān)靜態(tài)知識,例如該歧義格式所對應(yīng)的單義式以及存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系等。單義式即該歧義格式的理解方式,例如歧義格式“VP+NP1+的+NP2”的單義式數(shù)量為2,分別有動賓“VP+(NPl+的+NP2) ”和偏正“(VP+NP1+的)+NP2”兩種單義式,即存在上述兩種理解方式。
      [0083]在查找到單義式之后,可以根據(jù)知識庫中所保存的切詞詞組的搭配限制關(guān)系,來對單義式進(jìn)行實例化表示。本實施例中采用如圖2所示的方式對單義式進(jìn)行實例化表示,包括以下步驟:
      [0084]步驟201,根據(jù)存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整。其中切詞詞組的搭配限制關(guān)系是用于描述各類詞之間關(guān)系的靜態(tài)知識,用于確定各個切詞詞組之間如何搭配之后可以消除歧義,例如通過調(diào)整語序及結(jié)構(gòu)的方式。以“了解/中國/的/留學(xué)生”為例,對其兩種單義式進(jìn)行實例化。對于第一種單義式“VP+(NPl+的+NP2) ”,將語序調(diào)整為NP1+VP+的+NP2,同時在NPl前增加介詞;而對于第二種單義式“(VP+NP1+的)+NP2”,將語序調(diào)整為NP2+VP+NP1。
      [0085]步驟202,將存在歧義的切詞詞組的組合中的切詞詞組,代入調(diào)整后的單義式中,獲得單義式的實例化表示,所獲得的兩個實例化表示分別為“對中國了解的留學(xué)生”和“留學(xué)生了解中國”。本步驟通過語句中的具體概念激活了保存于知識庫中的靜態(tài)知識,使得單義式以及切詞詞組之間的搭配限制關(guān)系等靜態(tài)知識動態(tài)化,得到實例化表示。
      [0086]步驟104,選取優(yōu)先度最高的實例化表示作為存在歧義的切詞詞組的組合的語義表示。由此排除了表示其它含義的語義表示,實現(xiàn)了歧義消解。為了確定優(yōu)先度最高的實例化表示,本發(fā)明實施例提供了如圖3的方法,具體包括:
      [0087]步驟301,進(jìn)行對實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示。
      [0088]例如,對上述的兩個實例化表示“對中國了解的留學(xué)生”和“留學(xué)生了解中國”進(jìn)行語句內(nèi)的語義消歧,原語句為“我/ 了解/中國/的/留學(xué)生”,該存在歧義的切詞詞組的組合之前的為主語“我”,對于第二種實例化表示,無法查找到對應(yīng)的語義搭配關(guān)系,由此確定不符合語義,而第一種實例化表示,則可以查找到對應(yīng)的語義搭配關(guān)系,因而保留第一種實例化表示。而篇章消歧根據(jù)前后語句所得到的語義對該語句的語義進(jìn)行限定,排除不符合的語義限定范圍內(nèi)的實例化表示,例如后續(xù)語句所表述的語義均為留學(xué)生的情況,因此該句的語義中了解的賓語應(yīng)當(dāng)是留學(xué)生,由此排除第二中實例化表示。在具體實施時,可以采用采用其中一種方式,也可以同時或者依次采用上述兩種消歧方式。
      [0089]步驟302,判斷保留的實例化表示的數(shù)量是否超過一個,若只有一個,則執(zhí)行步驟303 ;若超過一個,則執(zhí)行步驟304。
      [0090]步驟303,將保留的實例化表不確定為優(yōu)先度最聞的實例化表不;
      [0091]步驟304,將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示,其中認(rèn)知頻率是指歧義結(jié)構(gòu)被理解為該單義式所對應(yīng)的實例化表示的頻率,即該實例化表示所指示的語義的可接受度。
      [0092]步驟305,將優(yōu)先度最高的實例化表示作為存在歧義的切詞詞組的組合的語義表
      /Jn ο
      [0093]在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,還需要對語句進(jìn)行切詞處理,本發(fā)明實施例中所采用的方式如圖4所示,包括:
      [0094]根據(jù)切分標(biāo)志和固定詞對語句進(jìn)行預(yù)切分,其中切分標(biāo)志包括字母、數(shù)字和符號;以數(shù)字為例,可以在進(jìn)行切詞處理之前,在語句中掃描出數(shù)字,然后在數(shù)字的左右位置掃描量詞、前綴詞等,將包含數(shù)字及其量詞、前綴詞的短語單獨作為一個切詞詞組。例如,對“北京舉辦第29屆奧運會”進(jìn)行預(yù)切分,其中,通過與知識庫中預(yù)先保存的靜態(tài)知識進(jìn)行匹配,能夠確定“第”為前綴詞,“屆”為量詞,則會先切分出“北京舉辦/第29屆/奧運會”。
      [0095]對預(yù)切分后的語句進(jìn)行切詞處理,獲得語句的切詞結(jié)果。根據(jù)所采用的切詞算法不同,得到的切詞結(jié)果也不相同,本發(fā)明實施例基于最長切詞原則,具體可以采用MM (Maximum Matching,正向最大匹配切詞)算法或者 RMM (Reverse Maximum Matching,逆向最大切詞)算法。
      [0096]由于在切詞處理的過程中,可識別的固定詞越多,那么切詞結(jié)果就越準(zhǔn)確,因此該方法還包括了對于未登錄詞的識別處理過程,具體流程如圖4所示,包括:
      [0097]步驟401,將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若知識庫中未匹配到切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將多個連續(xù)的切詞詞組的組合確定為未登錄詞。對于第一次出現(xiàn)的未登錄詞,其切詞的結(jié)果往往以多個切詞詞組的組合的形式出現(xiàn),例如“劉德華”這個詞,其切詞結(jié)果是“劉/德/華”,此時會將“劉德華”確定為未登錄詞。
      [0098]步驟402,根據(jù)未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定未登錄詞的詞性。根據(jù)知識庫中預(yù)先保存的靜態(tài)知識,“劉”是表示姓氏的詞,其處于詞的第一位時,該詞可能屬于一個姓名,因此確定“劉德華”的詞性為名詞。
      [0099]步驟403,記錄未登錄詞被識別為該詞性的頻率和次數(shù);
      [0100]步驟404,當(dāng)頻率和次數(shù)超過閾值時,將未登錄詞添加至知識庫中。此后,若輸入“我想看劉德華的電影”,那么其切詞結(jié)果為“我/想看/劉德華/的/電影”,能夠直接識別出“劉德華”這個詞。
      [0101]除了上述針對由歧義結(jié)構(gòu)引起的歧義進(jìn)行歧義消解的方案,在實際應(yīng)用中還會有由多義詞引起歧義的情況,本發(fā)明實施例還提供了一種針對由多義詞引起歧義的情況的解決方案。
      [0102]如圖5所示,本發(fā)明實施例二提供了另一種歧義消解的方法,該方法包括:
      [0103]步驟501,將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞進(jìn)行匹配,確定切詞結(jié)果中存在的多義詞。以語句“母親背著兒子去撿垃圾”為例,切詞結(jié)果為“母親/背著/兒子/去/撿/垃圾”。由于知識庫中已經(jīng)預(yù)先保存了多義詞“背著”,通過匹配知識庫可以確定切詞結(jié)果中存在的多義詞。
      [0104]步驟502,在知識庫中查找多義詞對應(yīng)的詞項變體,并根據(jù)詞項變體與其它切詞詞組的搭配限制關(guān)系,對切詞結(jié)果進(jìn)行實例化表示。在知識庫中通過統(tǒng)一的模版保存多義詞及其對應(yīng)的詞項變體的相關(guān)信息,其保存形式可以采用如下的格式:
      [0105]多義詞的信息模版:
      [0106](背著(詞名:背著)(詞項變體數(shù)量:2))
      [0107]多義詞對應(yīng)的詞項變體的信息模版:
      [0108](背著(詞名:背著)(詞性:動詞)(詞義:放置在背上))
      [0109](背著(詞名:背著)(詞性:動詞)(詞義:隱瞞))
      [0110]此外,與實施例一中類似,由于搭配限制關(guān)系是用于描述各類詞之間關(guān)系的靜態(tài)知識,用于確定各個切詞詞組之間如何搭配之后可以消除歧義。在對切詞結(jié)果進(jìn)行實例化表示時,還需要調(diào)整相關(guān)切詞詞組的語序。最終可以得到兩種實例化表示為:第一種為:“母親把兒子放置在背上去撿垃圾”,第二種為:“母親瞞著兒子去撿垃圾”。
      [0111]步驟503,選取優(yōu)先度最高的實例化表示作為切詞結(jié)果的語義表示。本步驟的處理方式與實施例一中相應(yīng)的步驟類似,首先進(jìn)行對實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示。
      [0112]在對上述兩個實例化表示進(jìn)行語句內(nèi)的語義消歧時,由于在語句內(nèi)這兩均符合語義,因此無法排除不符合語義的實例化表示。而在進(jìn)行篇章消歧時,若前后語句的語義中已經(jīng)包含兒子是剛滿月,那么由于“背著”的第二個此項變體中,“隱瞞”的賓語必須是有具有認(rèn)知能力的人,而剛滿月的兒子不屬于具有認(rèn)知能力的人,由此可以排除第二個實例化表示。上述消歧過程所需要用到的語義知識均通過預(yù)先定義的方式保存于知識庫中,包括動詞語義庫、名詞語義庫、介詞語義庫和量詞語義庫等,主要保存各類詞之間的語義關(guān)系。
      [0113]同樣,在具體實施時,可以采用采用其中一種方式,也可以同時或者依次采用上述兩種消歧方式。
      [0114]然后,根據(jù)保留的實例化表示的數(shù)量執(zhí)行對應(yīng)的處理過程。若僅保留了一個實例化表示,那么直接將其確定為優(yōu)先度最高的實例化表示,來作為最終的語義表示;若保留有至少兩個,那么還需要將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示,來作為最終的語義表示。
      [0115]較佳地,在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞進(jìn)行匹配之前,還包括:
      [0116]根據(jù)切分標(biāo)志和固定詞對語句進(jìn)行預(yù)切分,其中切分標(biāo)志包括字母、數(shù)字和符號;
      [0117]對預(yù)切分后的語句進(jìn)行切詞處理,獲得語句的切詞結(jié)果。
      [0118]較佳地,本發(fā)明實施例二中的方法還包括:
      [0119]將將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若知識庫中未匹配到切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將多個連續(xù)的切詞詞組的組合確定為未登錄詞;
      [0120]根據(jù)未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定未登錄詞的詞性;
      [0121]記錄未登錄詞被識別為該詞性的頻率和次數(shù);
      [0122]當(dāng)頻率和次數(shù)超過閾值時,將未登錄詞添加至知識庫中。
      [0123]為達(dá)到更好地歧義消解效果,本發(fā)明實施例一和實施例二中所提供的歧義消解的方法可以在不產(chǎn)生沖突的前提下同時使用。
      [0124]針對上述對歧義結(jié)構(gòu)和多義詞進(jìn)行歧義消解的方法流程,本發(fā)明實施例還提供了歧義消解的系統(tǒng),該系統(tǒng)的具體內(nèi)容可以參照上述方法的實施,在此不再贅述。
      [0125]如圖6所示,本發(fā)明實施例三提供了一種對歧義結(jié)構(gòu)進(jìn)行歧義消解的系統(tǒng),該系統(tǒng)包括:
      [0126]詞性確定模塊610,用于確定語句的切詞結(jié)果中的切詞詞組的詞性;
      [0127]第一匹配模塊620,用于根據(jù)切詞詞組的詞性,將切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定切詞結(jié)果中存在歧義的切詞詞組的組合;
      [0128]第一實例化模塊630,用于在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式進(jìn)行實例化表示;
      [0129]第一語義確定模塊640,用于選取優(yōu)先度最高的實例化表不作為存在歧義的切詞詞組的組合的語義表示。
      [0130]第一切詞模塊650,用于在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,對語句進(jìn)行切詞處理。
      [0131]較佳地,第一切詞模塊650,具體用于:
      [0132]根據(jù)切分標(biāo)志和固定詞對語句進(jìn)行預(yù)切分,其中切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得語句的切詞結(jié)果。
      [0133]較佳地,第一實例化模塊630,具體用于:
      [0134]在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式;
      [0135]根據(jù)存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整;
      [0136]將存在歧義的切詞詞組的組合中的切詞詞組,代入調(diào)整后的單義式中,獲得單義式的實例化表不。
      [0137]較佳地,第一語義確定模塊640,具體用于:
      [0138]進(jìn)行對實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0139]若保留的實例化表示的數(shù)量為一個,則將實例化表示確定為優(yōu)先度最高的實例化表不;
      [0140]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0141]將優(yōu)先度最高的實例化表示作為存在歧義的切詞詞組的組合的語義表示。
      [0142]較佳地,該系統(tǒng)還包括:
      [0143]識別模塊,用于將將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若知識庫中未匹配到切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將多個連續(xù)的切詞詞組的組合確定為未登錄詞;根據(jù)未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定未登錄詞的詞性;記錄未登錄詞被識別為該詞性的頻率和次數(shù);當(dāng)頻率和次數(shù)超過閾值時,將未登錄詞添加至知識庫中。
      [0144]如圖7所示,本發(fā)明實施例四提供了一種對多義詞進(jìn)行歧義消解的系統(tǒng),該系統(tǒng)包括:
      [0145]第二匹配模塊710,用于將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配,確定切詞結(jié)果中存在的多義詞組;
      [0146]第二實例化模塊720,用于在知識庫中查找多義詞組對應(yīng)的詞項變體,并根據(jù)詞項變體與其它切詞詞組的搭配限制關(guān)系,對切詞結(jié)果進(jìn)行實例化表示,其中詞項變體記錄有多義詞組的詞義及詞性;
      [0147]第二語義確定模塊730,用于選取優(yōu)先度最高的實例化表示作為切詞結(jié)果的語義表不。
      [0148]第二切詞模塊740,用于在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配之前,對語句進(jìn)行切詞處理。
      [0149]較佳地,第二切詞模塊740,具體用于:
      [0150]根據(jù)切分標(biāo)志和固定詞對語句進(jìn)行預(yù)切分,其中切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得語句的切詞結(jié)果。
      [0151]較佳地,第二語義確定模塊730,具體用于:
      [0152]進(jìn)行對實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;
      [0153]若保留的實例化表示的數(shù)量為一個,則將實例化表示確定為優(yōu)先度最高的實例化表不;
      [0154]若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最高的實例化表示;
      [0155]將優(yōu)先度最高的實例化表示作為切詞結(jié)果的語義表示。
      [0156]較佳地,該系統(tǒng)還包括:
      [0157]識別模塊,用于將將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若知識庫中未匹配到切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將多個連續(xù)的切詞詞組的組合確定為未登錄詞;根據(jù)未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定未登錄詞的詞性;記錄未登錄詞被識別為該詞性的頻率和次數(shù);當(dāng)頻率和次數(shù)超過閾值時,將未登錄詞添加至知識庫中。
      [0158]從上述內(nèi)容可以看出:在對語句進(jìn)行切詞處理后,根據(jù)切詞結(jié)果中的各個切詞詞組在知識庫中進(jìn)行匹配,在匹配到對應(yīng)的歧義格式或者多義詞后,能夠確定語句中存在的歧義。然后在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式或者多義詞所對應(yīng)的詞項變體,并根據(jù)語句的切詞結(jié)果中切詞詞組的搭配限制關(guān)系,進(jìn)行實例化表示,并選取優(yōu)先度最高的實例化表示作為正確的語義表示。通過查找知識庫中預(yù)先保存的靜態(tài)知識,可以快速將存在歧義的語句進(jìn)行實例化表示,并在這些實例化表示中選取正確的語義表示,快速準(zhǔn)確地消除歧義。
      [0159]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、系統(tǒng)、或計算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本申請可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。
      [0160]本申請是參照根據(jù)本申請實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
      [0161]這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
      [0162]這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
      [0163]盡管已描述了本申請的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本申請范圍的所有變更和修改。
      [0164]顯然,本領(lǐng)域的技術(shù)人員可以對本申請進(jìn)行各種改動和變型而不脫離本申請的精神和范圍。這樣,倘若本申請的這些修改和變型屬于本申請權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本申請也意圖包含這些改動和變型在內(nèi)。
      【權(quán)利要求】
      1.一種歧義消解的方法,其特征在于,該方法包括: 確定語句的切詞結(jié)果中的切詞詞組的詞性; 根據(jù)所述切詞詞組的詞性,將所述切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定所述切詞結(jié)果中存在歧義的切詞詞組的組合; 在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示; 選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      2.如權(quán)利要求1所述的方法,其特征在于,在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,還包括: 根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號; 對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      3.如權(quán)利要求1所述的方法,其特征在于,根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示,包括: 根據(jù)所述存在歧 義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整; 將所述存在歧義的切詞詞組的組合中的切詞詞組,代入所述調(diào)整后的單義式中,獲得所述單義式的實例化表示。
      4.如權(quán)利要求1所述的方法,其特征在于,選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示,包括: 進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示; 若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表不; 若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最聞的實例化表不; 將所述優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      5.—種歧義消解的方法,其特征在于,該方法包括: 將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配,確定所述切詞結(jié)果中存在的多義詞組; 在知識庫中查找所述多義詞組對應(yīng)的詞項變體,并根據(jù)所述詞項變體與其它切詞詞組的搭配限制關(guān)系,對所述切詞結(jié)果進(jìn)行實例化表示,其中所述詞項變體記錄有所述多義詞組的詞義及詞性; 選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      6.如權(quán)利要求5所述的方法,其特征在于,在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配之前,還包括: 根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      7.如權(quán)利要求5所述的方法,其特征在于,選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示,包括: 進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示; 若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表不; 若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最聞的實例化表不; 將所述優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      8.如權(quán)利要求1~7中任一所述的方法,其特征在于,該方法還包括: 將所述語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若所述知識庫中未匹配到所述切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將所述多個連續(xù)的切詞詞組的組合確定為未登錄詞; 根據(jù)所述未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定所述未登錄詞的詞性; 記錄所述未登錄詞被識別為該詞性的頻率和次數(shù); 當(dāng)所述頻率和次數(shù)超過閾值時,將所述未登錄詞添加至知識庫中。
      9.一種歧義消解的系統(tǒng),其特征在于,該系統(tǒng)包括: 詞性確定模塊,用于確定語句的切詞結(jié)果中的切詞詞組的詞性; 第一匹配模塊,用于根據(jù)所述切詞詞組的詞性,將所述切詞結(jié)果與知識庫中的歧義格式進(jìn)行匹配,確定所述切詞結(jié)果中存在歧義的切詞詞組的組合; 第一實例化模塊,用于在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式,并根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對所述單義式進(jìn)行實例化表示; 第一語義確定模塊,用于選取優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      10.如權(quán)利要求9所述的系統(tǒng),其特征在于,該系統(tǒng)還包括: 第一切詞模塊,用于在確定語句的切詞結(jié)果中的切詞詞組的詞性之前,根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      11.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述第一實例化模塊,具體用于: 在知識庫中查找與存在歧義的切詞詞組的組合匹配的歧義格式對應(yīng)的單義式; 根據(jù)所述存在歧義的切詞詞組的組合中各個切詞詞組的搭配限制關(guān)系,對單義式的語序及結(jié)構(gòu)進(jìn)行調(diào)整; 將所述存在歧義的切詞詞組的組合中的切詞詞組,代入所述調(diào)整后的單義式中,獲得所述單義式的實例化表示。
      12.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述第一語義確定模塊,具體用于: 進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示;若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表不; 若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最聞的實例化表不; 將所述優(yōu)先度最高的實例化表示作為所述存在歧義的切詞詞組的組合的語義表示。
      13.一種歧義消解的系統(tǒng),其特征在于,該系統(tǒng)包括: 第二匹配模塊,用于將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配,確定所述切詞結(jié)果中存在的多義詞組; 第二實例化模塊,用于在知識庫中查找所述多義詞組對應(yīng)的詞項變體,并根據(jù)所述詞項變體與其它切詞詞組的搭配限制關(guān)系,對所述切詞結(jié)果進(jìn)行實例化表示,其中所述詞項變體記錄有所述多義詞組的詞義及詞性; 第二語義確定模塊,用于選取優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表/Jn ο
      14.如權(quán)利要求13所述的系統(tǒng),其特征在于,該系統(tǒng)還包括: 第二切詞模塊,用 于在將語句的切詞結(jié)果中的切詞詞組與知識庫中的多義詞組進(jìn)行匹配之前,根據(jù)切分標(biāo)志和固定詞對所述語句進(jìn)行預(yù)切分,其中所述切分標(biāo)志包括字母、數(shù)字和符號;以及對預(yù)切分后的語句進(jìn)行切詞處理,獲得所述語句的切詞結(jié)果。
      15.如權(quán)利要求13所述的系統(tǒng),其特征在于,所述第二語義確定模塊,具體用于: 進(jìn)行對所述實例化表示進(jìn)行語句內(nèi)的語義消歧和/或篇章消歧,保留符合語義的實例化表示; 若保留的實例化表示的數(shù)量為一個,則將所述實例化表示確定為優(yōu)先度最高的實例化表不; 若保留的實例化表示的數(shù)量大于一個,則將認(rèn)知頻率最高的實例化表示確定為優(yōu)先度最聞的實例化表不; 將所述優(yōu)先度最高的實例化表示作為所述切詞結(jié)果的語義表示。
      16.如權(quán)利要求9~15中任一所述的系統(tǒng),其特征在于,該系統(tǒng)還包括: 識別模塊,用于將所述將語句的切詞結(jié)果與知識庫中預(yù)設(shè)的詞組組合關(guān)系進(jìn)行匹配,若所述知識庫中未匹配到所述切詞結(jié)果中多個連續(xù)的切詞詞組的組合關(guān)系,則將所述多個連續(xù)的切詞詞組的組合確定為未登錄詞;根據(jù)所述未登錄詞中各個切詞詞組的搭配限制關(guān)系,確定所述未登錄詞的詞性;記錄所述未登錄詞被識別為該詞性的頻率和次數(shù);當(dāng)所述頻率和次數(shù)超過閾值時,將所述未登錄詞添加至知識庫中。
      【文檔編號】G06F17/27GK104050157SQ201410267418
      【公開日】2014年9月17日 申請日期:2014年6月16日 優(yōu)先權(quán)日:2014年6月16日
      【發(fā)明者】李霞, 王勇進(jìn), 王峰 申請人:海信集團(tuán)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1