專利名稱:關聯(lián)詞語提示裝置的制作方法
技術領域:
本發(fā)明涉及制作由電子數據組成的聯(lián)想詞典的關聯(lián)詞語提示裝 置,尤其涉及制作表示與規(guī)定的單詞相關聯(lián)的其他單詞的聯(lián)想詞典, 并使用此聯(lián)想詞典,從而將相關聯(lián)的其他單詞作為關聯(lián)單詞來提示的 關聯(lián)詞語提示裝置。
背景技術:
以往,存在從用戶取得檢索單詞(檢索條件),并從電視節(jié)目的一 覽表中檢索與此檢索單詞相對應的節(jié)目的節(jié)目檢索裝置。
進而,提出了對用戶提示與以前輸入的檢索單詞相關聯(lián)的多個關 聯(lián)單詞,以便通過用戶反復輸入檢索單詞,從而能夠檢索所要的文章 (節(jié)目)的關聯(lián)詞語提示裝置(例如,參考專利文獻l)。
用戶通過從此關聯(lián)詞語提示裝置所提示的多個關聯(lián)單詞中選擇一 個作為新的檢索單詞的關聯(lián)單詞,并將其輸入到節(jié)目檢索裝置中,從 而能夠進行依據多個檢索單詞的節(jié)目的篩選檢索或防止遺漏檢索。
艮口,節(jié)目檢索裝置檢索與用戶輸入的檢索單詞相對應的節(jié)目,從 而將多個節(jié)目作為檢索結果來提示。在此,在節(jié)目檢索裝置檢索進行 篩選檢索的情況下,若用戶輸入下一個檢索單詞,則從作為針對以前 輸入的檢索單詞的檢索結果的多個節(jié)目之中,檢索并顯示與下一個檢 索單詞相對應的節(jié)目。另一方面,在節(jié)目檢索裝置進行防止遺漏檢索 的情況下,若用戶輸入下一個檢索單詞,則提示與下一個檢索單詞對 應的多個節(jié)目和與以前的檢索單詞對應的多個節(jié)目之間的邏輯和。
上述專利文獻1的關聯(lián)詞語提示裝置在針對用戶輸入的檢索單詞 的檢索結果數量少的情況下,以防止遺漏檢索為目的(防止遺漏檢索
7的目的),提示成為下一個檢索單詞的候選的關聯(lián)單詞。
因此,例如,在從專利文獻1的關聯(lián)詞語提示裝置所提示的多個 關聯(lián)單詞中,將一個關聯(lián)單詞作為下一個檢索單詞來選擇的情況下, 節(jié)目檢索裝置對此檢索單詞與以前的檢索單詞進行邏輯和連接并進行 再次檢索。在此,因為向用戶提示的關聯(lián)單詞與用戶輸入的檢索單詞 的關聯(lián)性強,所以用戶能夠從最初取得的檢索結果開始逐漸增加檢索 結果。
專利文獻l:(日本)特開平10—334106號公報
但是,上述專利文獻1的關聯(lián)詞語提示裝置存在不能夠使節(jié)目檢
索裝置進行適當的防止遺漏檢索的問題。
艮P,因為在以往的關聯(lián)詞語提示裝置中根據節(jié)目內的共現關系,
與檢索單詞有較強關聯(lián)的關聯(lián)單詞被提示,所以即使節(jié)目檢索裝置利
用這樣的關聯(lián)單詞執(zhí)行再次檢索(防止遺漏檢索),也會顯示與以前的 檢索結果相差小的檢索結果。即,在以往的關聯(lián)詞語提示裝置中,即 使在用戶想要取得與由節(jié)目檢索裝置取得的檢索結果不同的檢索結果 的情況下,也不能提示能夠取得這樣的檢索結果的關聯(lián)單詞。
作為節(jié)目的一覽表的節(jié)目信息按每個節(jié)目顯示作為元數據的此節(jié) 目的名稱、出場演員的名字以及節(jié)目梗概等。以往的關聯(lián)詞語提示裝 置將每個節(jié)目的元數據作為一篇文章來使用,并使在節(jié)目(元數據) 中共現的單詞彼此相關聯(lián),利用相互信息量等算出這些單詞彼此之間 的關聯(lián)度。
例如,如果單詞A和單詞B在同一節(jié)目中經常共現,則算出的單 詞A和單詞B的關聯(lián)度就大。而且,雖然在出現單詞A的節(jié)目中經常 出現單詞B,但是如果單詞B在不出現單詞A的節(jié)目中經常出現,則 算出的單詞A和單詞B的關聯(lián)度小。即,關聯(lián)度大的單詞是彼此在節(jié) 目中經常共現的單詞。
圖1是表示由以往的關聯(lián)詞語提示裝置提示的關聯(lián)詞語的圖。 例如,以往的關聯(lián)詞語提示裝置針對檢索單詞"體育運動"提示排在前十位的關聯(lián)度大的關聯(lián)單詞。這些關聯(lián)度大的關聯(lián)單詞是,與 檢索單詞"體育運動"在新聞節(jié)目或體育運動節(jié)目中經常共現的單詞。
但是,因為在這些關聯(lián)單詞中,根據節(jié)目內的共現關系針對檢索 單詞"體育運動"被算出大的關聯(lián)度,所以出現檢索單詞"體育運動" 的節(jié)目和出現關聯(lián)單詞的節(jié)目會有許多是重復的。例如,以關聯(lián)單詞
"氣象"而能夠檢索的節(jié)目的數量為44個,其中,以關聯(lián)單詞"體育 運動"而能夠檢索的節(jié)目的數量為41個。因此,即使節(jié)目檢索裝置以 檢索單詞"體育運動"來檢索節(jié)目,進而使用關聯(lián)單詞"氣象"來作 為下一個檢索單詞以進行防止遺漏檢索,以前的檢索結果和此后的檢 索結果幾乎沒有變化,只有三個不同節(jié)目。
這樣,在圖1所示的十個關聯(lián)單詞之中的一半以上(在此例中為 六個)的關聯(lián)單詞的每一個,以此關聯(lián)單詞能夠檢索的節(jié)目之中一半 以上的節(jié)目與以檢索單詞"體育運動"能夠檢索的節(jié)目相重復。
艮口,在以往的關聯(lián)詞語提示裝置中,即使為了防備用戶不滿意依 據檢索單詞的檢索結果,而向用戶提示與此檢索單詞關聯(lián)度大的關聯(lián) 單詞,成為依據此關聯(lián)單詞的再次檢索的檢索結果與依據原來的檢索 單詞的檢索結果沒有什么差異的情況的頻度也會很多。
在此,在如此的以往的關聯(lián)詞語提示裝置中,設想事先制作表示
各個單詞間的關聯(lián)度的聯(lián)想詞典。即,關聯(lián)詞語提示裝置包括制作表 示各個單詞間的關聯(lián)度的詞典的聯(lián)想詞典制作裝置。
但是,如上所述,因為如此的以往的關聯(lián)詞語提示裝置中的聯(lián)想 詞典制作裝置是根據節(jié)目內的共現關系計算出單詞間的關聯(lián)度,從而 制作聯(lián)想詞典,所以不能使節(jié)目檢索裝置進行適當的防止遺漏檢索。
發(fā)明內容
在此,本發(fā)明就是鑒于如此的問題而做出的發(fā)明,其目的在于, 提供一種能夠使節(jié)目檢索裝置進行適當的防止遺漏檢索的關聯(lián)詞語提 示裝置。
為了達到上述目的,本發(fā)明所涉及的關聯(lián)詞語提示裝置是一種關聯(lián)詞語提示裝置,制作多個聯(lián)想詞典,所述聯(lián)想詞典包括多個單詞和 所述多個單詞間的關聯(lián)度,該關聯(lián)詞語提示裝置具有以下特征節(jié)目 信息記憶單元,將作為由多個單詞表示的節(jié)目內容的信息的節(jié)目信息, 按每個所述節(jié)目進行記憶;分類單元,生成以基準單詞和在節(jié)目內所 共現的單詞的集合為單位而組成的至少一個以上的小組,所述基準單 詞是指屬于所述節(jié)目信息中包含的單詞的屬性的單詞,所述至少一個 以上的小組是按每個所述單詞的屬性而生成的;存儲單元,在詞典記 憶單元中存儲按每個所述屬性的聯(lián)想詞典,該按每個所述屬性的聯(lián)想 詞典包括按每個所述單詞的屬性的各個小組中的兩個單詞間的關聯(lián)度 和所述兩個單詞,所述兩個單詞間的關聯(lián)度按照所述兩個單詞所共現 的頻度而被算出;取得單元,取得檢索單詞和所述檢索單詞的屬性; 第一關聯(lián)單詞選擇單元,將按每個所述屬性的聯(lián)想詞典之中的、與所 述取得單元所取得的屬性相對應的所述聯(lián)想詞典之中的單詞,作為第 一關聯(lián)單詞進行選擇;以及提示單元,提示所述第一關聯(lián)單詞選擇單 元所選擇的所述第一關聯(lián)單詞。在此,在由所述存儲單元存儲的聯(lián)想 詞典中,按每個屬性,兩個單詞和所述兩個單詞間的關聯(lián)度具有固有 的關聯(lián)性。
而且,所述關聯(lián)詞語提示裝置也可以具有以下特征,還包括第 一關聯(lián)度計算單元,按每個所述單詞的屬性,計算按照在所述分類單 元所生成的各個小組中兩個單詞所共現的頻度的、所述兩個單詞間的 關聯(lián)度,并制作使所述兩個單詞和所述關聯(lián)度相關聯(lián)來表示的所述聯(lián) 想詞典。并且,也可以具有以下特征,所述第一關聯(lián)單詞選擇單元, 從與所述取得單元所取得的屬性相對應的所述聯(lián)想詞典中,將單詞作 為所述第一關聯(lián)單詞進行選擇,以使針對由所述取得單元取得的檢索 單詞的關聯(lián)度越大的單詞就越被優(yōu)先選擇。
因此,在本發(fā)明所涉及的關聯(lián)詞語提示裝置中,例如按每個種類 或人名等,節(jié)目信息中所包含的多個單詞被分類在各個小組中,根據 此小組內的共現關系而算出單詞間的關聯(lián)度并制作聯(lián)想詞典。在此,
10與一個屬性相對應的各個小組按每個作為存在于節(jié)目信息內的屬于此 屬性的單詞的基準單詞來構成,此小組是在節(jié)目信息中與基準單詞在 節(jié)目內共現的單詞的集合。因此,在如此制作的按每個屬性的聯(lián)想詞 典中,不是像以往那樣根據節(jié)目內的共現關系來計算單詞間的關聯(lián)度, 而是如上所述的,根據小組內的共現關系來計算單詞間的關聯(lián)度。艮P, 不是根據所謂節(jié)目的范圍,而是根據與基準單詞共現的單詞的集合, 也就是說,根據所謂具有共同的使用方法或意思的單詞的集合的范圍 中的共現關系來計算關聯(lián)度。
其結果為,例如,能夠使出現在同一節(jié)目中且即使出現在不同的 節(jié)目中也與相同的單詞(基準單詞)以多頻度所共現的單詞間的關聯(lián) 度比只在節(jié)目內共現的單詞間的關聯(lián)度大。進而,在不于節(jié)目內共現 但與相同的單詞(基準單詞)共現的頻度比在節(jié)目內的單詞的共現頻 度多的情況下,能夠使雖然出現在不同的節(jié)目中,但與形同的單詞(基 準單詞)以多頻度所共現的單詞彼此之間的關聯(lián)度比在節(jié)目內共現的 單詞彼此之間的關聯(lián)度大。
因此,在本發(fā)明所涉及的關聯(lián)詞語提示裝置中,因為從與檢索單 詞的屬性相對應的如上所述的聯(lián)想詞典中,與此檢索單詞的關聯(lián)度大 的單詞作為第一關聯(lián)單詞(代替單詞)被選擇并提示,所以能夠抑制
包含檢索單詞的多個節(jié)目與包含第一關聯(lián)單詞的多個節(jié)目的重復。艮P, 節(jié)目檢索裝置在檢索與檢索單詞相對應的節(jié)目并顯示檢索結果后,將 本發(fā)明所涉及的關聯(lián)詞語提示裝置所提示的第一關聯(lián)單詞作為下一個 檢索單詞來選擇,并在施行防止遺漏檢索的情況下,能夠顯示與以前 的檢索結果中所包含的節(jié)目不同的、具有適當的關聯(lián)性的多個節(jié)目。
而且,所述關聯(lián)詞語提示裝置也可以具有以下特征,還包括第 二關聯(lián)度計算單元,計算按照在所述節(jié)目信息所表示的各個節(jié)目中兩 個單詞所共現的頻度的、所述兩個單詞間的關聯(lián)度,并制作使所述兩 個單詞和所述關聯(lián)度相關聯(lián)來表示的節(jié)目聯(lián)想詞典,將所述節(jié)目聯(lián)想 詞典存儲在所述詞典記憶單元;以及第二關聯(lián)單詞選擇單元,從所述詞典記憶單元所記憶的節(jié)目聯(lián)想詞典中,將單詞作為第二關聯(lián)單詞進 行選擇,以使針對由所述取得單元取得的檢索單詞的關聯(lián)度越大的單 詞就越被優(yōu)先選擇,所述提示單元還提示由所述第二關聯(lián)單詞選擇單 元選擇的所述第二關聯(lián)單詞。
因此,表示根據節(jié)目內的共現關系而算出的單詞間的關聯(lián)度的節(jié)
目聯(lián)想詞典被制作,將與檢索單詞的關聯(lián)度大的單詞作為第二關聯(lián)單 詞(篩選單詞)從此節(jié)目聯(lián)想詞典中被選擇并被提示。其結果為,節(jié)
目檢索裝置在檢索與檢索單詞相對應的節(jié)目并顯示檢索結果后,將本 發(fā)明所涉及的關聯(lián)詞語提示裝置所提示的第二關聯(lián)單詞作為下一個檢 索單詞來選擇,并在施行篩選檢索的情況下,能夠適當地篩選以前的 檢索結果。
并且,所述關聯(lián)詞語提示裝置也可以具有以下特征,還包括節(jié) 目選擇單元,從所述節(jié)目信息所表示的多個節(jié)目之中,確定由用戶選 擇的多個節(jié)目,所述取得單元按照多個單詞的出現頻度,從所述多個 單詞之中取得一個作為所述檢索單詞的單詞,所述多個單詞是為了表 示由所述節(jié)目選擇單元確定的多個節(jié)目的內容,而被使用于所述節(jié)目 信息中的多個單詞。
因此,在用戶選擇多個節(jié)目的情況下,由于從此多個節(jié)目中推斷 檢索單詞,所以不需要用戶直接輸入檢索單詞就能夠使第一關聯(lián)單詞
被提示。即,即使用戶想不起明確的檢索單詞,只要選擇所注目的節(jié) 目,就能夠使第一關聯(lián)單詞被提示。
而且,所述第一關聯(lián)單詞選擇單元也可以具有以下特征,僅將與 由所述取得單元取得的檢索單詞的屬性相同的屬性的單詞作為所述第 一關聯(lián)單詞進行選擇。
因此,能夠只使屬于用戶所注目的屬性的單詞作為第一關聯(lián)單詞 被提示,在多個第一關聯(lián)單詞被提示的情況下,用戶能夠從其中容易 地選擇下一個檢索單詞。
并且,所述第一關聯(lián)單詞選擇單元也可以具有以下特征,在由所
12述取得單元取得檢索單詞之前的預先決定了的期間,在其他的檢索單 詞及所述其他的檢索單詞的屬性被取得的情況下,進一步,從與所述 其他的檢索單詞的屬性對應的聯(lián)想詞典選擇作為第三關聯(lián)單詞的單 詞,以使針對所述其他的檢索單詞的關聯(lián)度越大的單詞就越被優(yōu)先選 擇,所述提示單元還提示由所述第一關聯(lián)單詞選擇單元選擇的第三關 聯(lián)單詞。
因此,由于不僅提示針對最近的檢索單詞的第一關聯(lián)單詞,還提 示針對在此之前的過去的檢索單詞(其他的檢索單詞)的第三關聯(lián)單 詞,所以用戶能夠容易地將針對注目程度高的檢索單詞的關聯(lián)單詞作 為下一個檢索單詞進行選擇。
而且,所述第二關聯(lián)單詞選擇單元也可以具有以下特征,僅將與 由所述取得單元取得的檢索單詞的屬性不同屬性的單詞作為所述第二 關聯(lián)單詞進行選擇。
因此,因為只使與檢索單詞的屬性不同屬性的單詞作為第二關聯(lián)
單詞(篩選單詞)被提示,所以通過用戶將此第二關聯(lián)單詞作為下一
個檢索單詞來選擇,從而能夠依據與以前的檢索單詞的觀點不同的觀
點來進行篩選檢索。而且,例如即使多個第二關聯(lián)單詞被提示,由于
它們的屬性全部與檢索單詞的屬性不同,所以在用戶要依據與檢索單
詞的觀點不同的觀點進行篩選檢索的情況下,能夠從這些多個第二關 聯(lián)單詞中容易地選擇下一個檢索單詞。
并且,所述關聯(lián)詞語提示裝置也可以具有以下特征,還包括檢 索單元,從所述節(jié)目信息中檢索使用所述取得單元所取得的檢索單詞 來表示內容的節(jié)目,所述第一及第二關聯(lián)單詞選擇單元分別選擇多個 第一及第二關聯(lián)單詞,所述提示單元,在由所述檢索單元檢索的節(jié)目 的數量越多的情況下,與所述第一關聯(lián)單詞相比就越多地提示所述第 二關聯(lián)單詞;在由所述檢索單元檢索的節(jié)目的數量越少的情況下,與 所述第二關聯(lián)單詞相比就越多地提示所述第一關聯(lián)單詞。
因此,由于被檢索的節(jié)目的數量越多,被提示的第二關聯(lián)單詞(篩選單詞)就越多,所以在通過節(jié)目檢索裝置多個節(jié)目作為檢索結果被 顯示的情況下,用戶能夠從這些被提示的多個第一及第二關聯(lián)單詞之 中,容易地選擇用于篩選檢索結果的下一個檢索單詞。并且,因為被 檢索的節(jié)目的數量越少,被提示的第一關聯(lián)單詞(代替單詞)就越多, 所以在通過節(jié)目檢索裝置較少的節(jié)目作為檢索結果被顯示的情況下, 用戶能夠從這些被提示的多個第一及第二關聯(lián)單詞之中,容易地選擇 用于擴大檢索結果的下一個檢索單詞。S卩,用戶能夠根據檢索結果的 狀況容易地選擇適當的下一個檢索單詞。
另外,本發(fā)明不僅能夠作為如此的關聯(lián)詞語提示裝置來實現,還 能夠作為制作此裝置中的詞典的方法或提示關聯(lián)詞語的方法、使計算 機執(zhí)行依據這些方法的處理的程序、存儲這些程序的計算機可讀取的 存儲介質、以及集成電路來實現。
本發(fā)明的關聯(lián)詞語提示裝置,為了使與包含檢索單詞的節(jié)目不同 的多個節(jié)目被檢索,提示與檢索單詞相關聯(lián)的關聯(lián)單詞,從而取得能 夠使節(jié)目檢索裝置進行適當的防止遺漏檢索的有益效果。
圖1是表示由以往的關聯(lián)詞語提示裝置提示的關聯(lián)詞語的圖。
圖2是表示本發(fā)明的實施例所涉及的關聯(lián)詞語提示裝置的構成的 框圖。
圖3是表示同上的節(jié)目信息的一個例子的圖。
圖4是表示在與屬于同上的屬性"種類"的各個單詞對應的小組 中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
圖5是表示在與屬于同上的屬性"人名"的各個單詞對應的小組 中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
圖6是表示在與屬于同上的屬性"國名 場所"的各個單詞對應 的小組中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
圖7是表示同上的按A屬性區(qū)分的聯(lián)想詞典的一個例子的圖。
圖8是表示同上的按B屬性區(qū)分的聯(lián)想詞典的一個例子的圖。圖9是表示同上的按C屬性區(qū)分的聯(lián)想詞典的一個例子的圖。 圖IO是表示由同上的輸出部提示的內容的圖。 圖11是表示同上的聯(lián)想詞典制作部的工作的流程圖。 圖12是表示同上的關聯(lián)詞語提示裝置提示與用戶輸入的檢索單 詞相關聯(lián)的代替單詞的工作的流程圖。
圖13是用于說明同上的效果的說明圖。
圖14是表示在與屬于同上的屬性"種類"的各個單詞對應的小組 中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的其他的例子的圖。
圖15是表示同上的變形例1所涉及的關聯(lián)詞語提示裝置的構成的 框圖。
圖16是表示同上的變形例1所涉及的節(jié)目聯(lián)想詞典的一個例子的圖。
圖17是表示由同上的變形例1所涉及的輸出部提示的內容的圖。 圖18是表示同上的變形例2所涉及的關聯(lián)詞語提示裝置的構成的 框圖。
圖19是表示同上的變形例2所涉及的節(jié)目選擇部所顯示的畫面的圖。
圖20是表示同上的變形例3所涉及的關聯(lián)詞語提示裝置的構成的 框圖。
圖21是表示同上的變形例3所涉及的單詞比率表的一個例子的圖。
圖22是表示同上的變形例3所涉及的單詞比率表的其他的例子的圖。
圖23是表示同上的變形例3所涉及的單詞比率表的另一個其他的 例子的圖。
圖24是表示同上的關聯(lián)詞語提示裝置的適用例的設備的外形的圖。
附圖標記說明100、 100a、 100b、 100c關聯(lián)詞語提示裝置
101節(jié)目信息記憶部
101a節(jié)目信息
102聯(lián)想詞典記憶部
102a按A屬性區(qū)分的聯(lián)想詞典
102b按B屬性區(qū)分的聯(lián)想詞典
102c按C屬性區(qū)分的聯(lián)想詞典
102d節(jié)目聯(lián)想詞典
103、 113聯(lián)想詞典制作部 103a信息劃分部
103b關聯(lián)度計算部 103c節(jié)目聯(lián)想詞典制作部
104、 104a檢索條件取得部 105代替單詞取得部
106、 132輸出部 111篩選單詞取得部 121節(jié)目選擇部 131檢索部 133表存儲部 133a單詞比率表
具體實施例方式
以下,參照附圖對本發(fā)明的實施例中的關聯(lián)詞語提示裝置進行說明。
圖2是表示本發(fā)明的實施例所涉及的關聯(lián)詞語提示裝置的構成的 框圖。
此關聯(lián)詞語提示裝置100是為了使節(jié)目檢索裝置進行適當的防止 遺漏檢索,而提示與檢索單詞相關聯(lián)的關聯(lián)單詞的裝置,如圖2所示, 包括節(jié)目信息記憶部101、聯(lián)想詞典記憶部102、聯(lián)想詞典制作部103、檢索條件取得部104、代替單詞取得部105、以及輸出部106。
節(jié)目信息記憶部101記憶表示多個節(jié)目的一覽表的節(jié)目信息 101a。
聯(lián)想詞典制作部103制作按屬性區(qū)分的聯(lián)想詞典(按A屬性區(qū)分 的聯(lián)想詞典102a、按B屬性區(qū)分的聯(lián)想詞典102b以及按C屬性區(qū)分 的聯(lián)想詞典102c),該按屬性區(qū)分的聯(lián)想詞典按照節(jié)目信息101a所 包含的單詞的每一 個屬性,表示此節(jié)目信息101a所包含的多個單詞及 此多個單詞間的關聯(lián)度,并在聯(lián)想詞典記憶部102中存儲這些按屬性 區(qū)分的聯(lián)想詞典。再者,分別將按A屬性區(qū)分的聯(lián)想詞典102a、按B 屬性區(qū)分的聯(lián)想詞典102b以及按C屬性區(qū)分的聯(lián)想詞典102c總稱 為按屬性區(qū)分的聯(lián)想詞典。
并且,屬性是指用于將各個單詞進行分類的節(jié)目名稱以外的信息, 例如,包括單詞"完全"及"特別"等所屬于的屬性"形容表現"; 單詞"新聞"及"記實"等所屬于的屬性"種類";單詞"播音員"及 "導演"等所屬于的屬性"職業(yè)";單詞"美國"及"伏見稻荷神社" 等所屬于的屬性"國名,場所";以及單詞"松下次郎"及"松下太郎" 等所屬于的屬性"人名"等。
此聯(lián)想詞典制作部103包括信息劃分部103a和關聯(lián)度計算部 103b。
信息劃分部103a按照節(jié)目信息101a所包含的單詞的每一個屬 性,將節(jié)目信息101a所包含的多個單詞劃分為多個小組。gp,信息劃 分部103a按照節(jié)目信息101a所包含的單詞的每一個屬性,將與屬于 此屬性的單詞、即基準單詞在節(jié)目內共現的單詞的集合作為小組,按 照此基準單詞的每一個來生成。
關聯(lián)度計算部103b按每個節(jié)目信息101a所包含的單詞的屬性, 計算按照在信息劃分部103a所生成的各個小組中兩個單詞所共現的 頻度的此兩個單詞間的關聯(lián)度。而且,關聯(lián)度計算部103b在各個單 詞間進行這樣的關聯(lián)度的計算,從而制作使這些單詞與關聯(lián)度相關聯(lián)
17來表示的按屬性區(qū)分的聯(lián)想詞典,并在聯(lián)想詞典記憶部102中存儲此 按屬性區(qū)分的聯(lián)想詞典。
檢索條件取得部104按照用戶的輸入操作,取得成為檢索條件的 單詞(檢索單詞)和此單詞的屬性。例如,這樣的檢索條件取得部104 由鍵盤和滑鼠、遙控器等輸入裝置構成。
代替單詞取得部105將與由檢索條件取得部104取得的檢索單詞 相關聯(lián)的單詞,從聯(lián)想詞典記憶部102所保持的與此檢索單詞的屬性 對應的按屬性區(qū)分的聯(lián)想詞典中作為代替單詞(關聯(lián)單詞)來取得。
輸出部106向用戶提示由代替單詞取得部105取得的代替單詞。 例如,這樣的輸出部106包含CRT顯示器、液晶顯示器(LCD)、等 離子體顯示器(PDP)等顯示單元來構成。
再者,在本實施例中,聯(lián)想詞典制作裝置由節(jié)目信息記憶部101 和聯(lián)想詞典制作部103構成。并且,在本實施例中,信息劃分部103a 作為分類單元被構成,關聯(lián)度計算部103b作為第一關聯(lián)度計算單元 以及存儲單元被構成。進而,在本實施例中,聯(lián)想詞典記憶部102作 為詞典記憶單元被構成,檢索條件取得部104作為取得單元被構成, 代替單詞取得部105作為選擇代替單詞(第一關聯(lián)單詞)的第一關聯(lián) 單詞選擇單元被構成,輸出部106作為提示代替單詞(第一關聯(lián)單詞) 的提示單元被構成。
圖3是表示節(jié)目信息101a的一個例子的圖。
如圖3所示,按每個節(jié)目,節(jié)目信息101a包括作為用于識別 節(jié)目的標識符的節(jié)目ID、表示節(jié)目內容的元數據、節(jié)目的元數據中包 含的各個單詞以及由其屬性組成的單詞屬性群。
節(jié)目ID例如以"01,02,03,…"等被顯示,并被分配給各個節(jié)目。
并且,元數據包括作為播放節(jié)目的日期的播放日、作為節(jié)目的 開始時間的播放開始時間、節(jié)目名稱、節(jié)目所屬的種類、作為在節(jié)目 中出場的出場演員的名字的出場演員名字、說明節(jié)目的梗概的節(jié)目梗 概。
18例如,節(jié)目信息101a包括作為元數據的且與節(jié)目ID "01"對應 的播放日"2006/8/22"、播放開始時間"12:00"、節(jié)目名稱"松 下太郎時間"、種類"綜藝"、出場演員名字"松下太郎、松下三郎"、 節(jié)目梗概"松下太郎邀請日本知名人士作為嘉賓并進行訪談。"而且, 節(jié)目信息101a包括作為元數據的且與節(jié)目ID "02"對應的播放日 "2006/8/22"、播放開始時間"13:00"、節(jié)目名稱"午間日本列島"、 種類"信息"、出場演員名字"松下花子、松下次郎"、節(jié)目梗概"曰 本列島各地的實況轉播。"并且,節(jié)目信息101a包括作為元數據的且 與節(jié)目ID"03"對應的播放日"2006/8/23"、播放開始時間"16:00"、 節(jié)目名稱"托付松下次郎"、種類"綜藝"、出場演員名字"松下次郎、 松下四郎"、節(jié)目梗概"松下次郎回答觀眾的咨詢。還有健康信息。"
進而,例如,節(jié)目信息101a包括與節(jié)目ID"01"對應的單詞 屬性群"松下太郎/人名、綜藝/種類、松下三郎/人名、日本/國名*場 所、嘉賓/職業(yè)、訪談/種類"。另外,如"(單詞)/ (屬性)"那樣, 單詞和此單詞的屬性以"/"來隔開表示。例如,在"松下太郎/人名" 中,"松下太郎"為單詞,"人名"為此單詞"松下太郎"的屬性。
而且,節(jié)目信息101a包括與節(jié)目ID "02"對應的單詞屬性群 "日本/國名 場所、日本列島/國名 場所、信息/種類、松下花子/ 人名、松下次郎/人名"。并且,節(jié)目信息101a包括與節(jié)目ID "03" 對應的單詞屬性群"松下次郎/人名、綜藝/種類、松下四郎/人名、 咨詢/種類、健康/種類、信息/種類、健康信息/種類"。
在此,例如,也可以通過利用固有表現抽取技術或詞素分析技術 等,從元數據中抽取單詞屬性群的單詞及其屬性,從而使其包含在如 上所述的節(jié)目信息101a中。
聯(lián)想詞典制作部103的信息劃分部103a按照此節(jié)目信息101a 所示的每個單詞的屬性(種類和人名、國名,場所等),將節(jié)目信息101a 中包含的各個節(jié)目(節(jié)目ID)的單詞屬性群分類給與屬于此屬性的各 個單詞(基準單詞)對應的小組。即,信息劃分部103a按每個屬性,將屬于此屬性的單詞(基準單詞)和在節(jié)目(單詞屬性群)中共現的 多個單詞分類在一個小組中。
圖4是表示在與屬于屬性"種類"的各個單詞對應的小組中,各 個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
例如,由于節(jié)目ID "01"的單詞屬性群及節(jié)目ID "03"的單詞 屬性群分別包含屬于屬性"種類"的單詞"綜藝",因此信息劃分部103a 將這些單詞屬性群分類給與"綜藝/種類"對應的小組l。并且,由于 節(jié)目ID "01"的單詞屬性群包含屬于屬性"種類"的單詞"訪談", 因此信息劃分部103a將此單詞屬性群分類給與"訪談/種類"對應的 小組2。進而,由于節(jié)目ID "02"的單詞屬性群包含屬于屬性"種類" 的單詞"信息",因此信息劃分部103a將此單詞屬性群分類給與"信 息/種類"對應的小組3。
艮口,在屬性"種類"中,信息劃分部103a將在節(jié)目(單詞屬性群) 內與屬于此屬性"種類"的基準單詞"綜藝"共現的多個單詞分類給 小組1;將與屬于此屬性"種類"的其他的基準單詞"訪談"在節(jié)目(單 詞屬性群)內共現的多個單詞分類給小組2;將與屬于此屬性"種類" 的其他的基準單詞"信息"在節(jié)目(單詞屬性群)內共現的多個單詞 分類給小組3。
在此,在本實施例中,信息劃分部103a在將單詞屬性群分類成小 組的情況下,為了使同樣的單詞不會被分類在同樣的小組中,將單詞 屬性群中包含的多個單詞分類成小組。例如,信息劃分部103a在將節(jié) 目ID "01"的單詞屬性群分類給小組1之后,再將節(jié)目ID "03"的 單詞屬性群分類給小組l。此時,因為在節(jié)目ID "03"的單詞屬性群 中所包含的多個單詞之中,單詞"綜藝"已經被分類給小組l,所以信 息劃分部103a將除去節(jié)目ID "03"的單詞屬性群中所包含的多個單 詞之中的單詞"綜藝"后剩下的單詞分類給小組l。
圖5是表示在與屬于屬性"人名"的各個單詞對應的小組中,各 個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。例如,由于節(jié)目ID "01"的單詞屬性群包含屬于屬性"人名"的 單詞"松下太郎",因此信息劃分部103a將此單詞屬性群分類給與"松 下太郎/人名"對應的小組1。并且,由于節(jié)目ID "01"的單詞屬性 群包含屬于屬性"人名"的單詞"松下三郎",因此信息劃分部103a 將將此單詞屬性群分類給與"松下三郎/人名"對應的小組2。進而, 由于節(jié)目ID "02"的單詞屬性群及節(jié)目ID "03"的單詞屬性群分別 包含屬于屬性"人名"的單詞"松下次郎",因此信息劃分部103a將 這些單詞屬性群分類給與"松下次郎/人名"對應的小組3。
艮P,在屬性"人名"中,信息劃分部103a將在節(jié)目(單詞屬性群) 內與屬于此屬性"人名"的基準單詞"松下太郎"共現的多個單詞分 類給小組l;將與屬于此屬性"人名"的其他的基準單詞"松下三郎" 在節(jié)目(單詞屬性群)內共現的多個單詞分類給小組2;將與屬于此屬 性"人名"的其他的基準單詞"松下次郎"在節(jié)目(單詞屬性群)內 共現的多個單詞分類給小組3。
圖6是表示在與屬于屬性"國名 場所"的各個單詞對應的小組 中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
例如,由于節(jié)目ID "01"的單詞屬性群及節(jié)目ID "02"的單詞 屬性群分別包含屬于屬性"國名*場所"的單詞"日本",因此信息劃 分部103a將這些單詞屬性群分類給與"日本/國名 場所"對應的小 組l。而且,由于節(jié)目ID"02"的單詞屬性群包含屬于屬性"國名*場 所"的單詞"日本列島",因此信息劃分部103a將此單詞屬性群分類 給與"日本列島/國名 場所"對應的小組2。
艮P,在屬性"國名《場所"中,信息劃分部103a將在節(jié)目(單詞 屬性群)內與屬于此屬性"國名 場所"的基準單詞"日本"共現的 多個單詞分類給小組l;將與屬于此屬性"國名,場所"的其他的基準
單詞"日本列島"在節(jié)目(單詞屬性群)內共現的多個單詞分類給小 組2。
以下,將根據這樣的分類按照每個屬性制作的多個小組稱為按屬性區(qū)分的小組群。
再者,在本實施例中,雖然信息劃分部103a為了使同樣的單詞不 會被多個分類在同樣的小組中,將單詞屬性群中包含的多個單詞分類 成小組,但是也可以為同樣的單詞被多個分類在同樣的小組中。在此 情況下,信息劃分部103a在將單詞屬性群分類成小組的情況下,不用 確認已經被分類給此小組的單詞,而將單詞屬性群中包含的全部的單 詞分類給這個小組。
聯(lián)想詞典制作部103的關聯(lián)度計算部103b按照每個如上所述的 按屬性區(qū)分的小組群(屬性),計算出此按屬性區(qū)分的小組群中包含的 各個單詞間的關聯(lián)度,從而制作與此按屬性區(qū)分的小組群對應的按屬 性區(qū)分的聯(lián)想詞典。
艮口,關聯(lián)度計算部103b在制作一個按屬性區(qū)分的聯(lián)想詞典的情 況下,按照按屬性區(qū)分的小組群中包含的兩個單詞的每個組合來計算 單詞彼此之間的關聯(lián)度。并且,關聯(lián)度計算部103b按照每個這樣的 組合,制作使此組合中包含的兩個單詞與針對這些單詞計算出的關聯(lián) 度相關聯(lián)來表示的按屬性區(qū)分的聯(lián)想詞典,并存儲在聯(lián)想詞典記憶部 102中。
例如,關聯(lián)度計算部103b通過利用交互信息內容(MI),來算出各 個單詞間的關聯(lián)度。具體而言,若關聯(lián)度計算部103b設包含單詞Wl 和單詞W2雙方的小組的數量為a,設不包含單詞Wl而包含單詞W2 的小組的數量為b,設包含單詞Wl而不包含單詞W2的小組的數量 為c,設不包含單詞Wl和單詞W2雙方的小組的數量為d,設總共的 小組數量為N(=a+b+c+d),則根據MI=log2(aN/((a+b)(a+c))),將交 互信息內容(MI)作為關聯(lián)度算出。
再者,關聯(lián)度計算部103b也可以通過交互信息內執(zhí)MI)以外的一 般的方法,例如,可以根據Dice—coefficient (戴斯系數)、加權Dice —coefficient t—score (t分值)、x平方值、或對數似然比等算出 關聯(lián)度。在按屬性區(qū)分的小組群中,單詞Wl和單詞W2之間的關聯(lián)度是單詞W1和單詞W2共現的小組越多,關聯(lián)度就越大的值。而且,例如,多數包含單詞W1的小組中也包含單詞W2,但是,在多數不包含單詞W1的小組中包含單詞W2的情況下,此關聯(lián)度變小。g卩,所謂單詞間的關聯(lián)度大是表示這些單詞在多個小組中共現,它們的關聯(lián)較強。
例如,關聯(lián)度計算部103b算出如圖4所示的、屬性"種類"的按屬性區(qū)分的小組群中包含的單詞"松下太郎"與單詞"松下三郎"之間的關聯(lián)度,或算出單詞"松下太郎"與單詞"綜藝"之間的關聯(lián)度,以及單詞"松下太郎"與單詞"訪談"之間的關聯(lián)度等。其結果為,關聯(lián)度計算部103b制作表示屬性"種類"的在按屬性區(qū)分的小組群中各個單詞間的關聯(lián)度的按A屬性區(qū)分的聯(lián)想詞典102a。圖7是表示按A屬性區(qū)分的聯(lián)想詞典102a的一個例子的圖。按A屬性區(qū)分的聯(lián)想詞典102a使與屬性"種類"對應的按屬性區(qū)分的小組群之中的多組單詞彼此之間,例如,使參加節(jié)目演出的出場演員名字或種類等單詞彼此之間相關聯(lián),并表示這些單詞間的關聯(lián)度。
具體而言,按A屬性區(qū)分的聯(lián)想詞典102a表示出單詞W1"松下太郎"與單詞W2 "松下三郎"之間的關聯(lián)度"0.5";單詞Wl "松下太郎"與單詞W2 "綜藝"之間的關聯(lián)度"0.4";單詞W1 "松下太郎"與單詞W2 "訪談"之間的關聯(lián)度"0.5"等。
另外,按A屬性區(qū)分的聯(lián)想詞典102a還表示出各個單詞的屬性。并且,在此按A屬性區(qū)分的聯(lián)想詞典102a中,關聯(lián)度被表示的兩個單詞是被包含在同一小組中的單詞。
而且,關聯(lián)度計算部103b算出,如圖5所示的屬性"人名"的按屬性區(qū)分的小組群中包含的單詞"松下花子"與單詞"松下次郎"之間的關聯(lián)度,或單詞"松下花子"與單詞"日本"之間的關聯(lián)度,以及單詞"松下花子"與單詞"信息"之間的關聯(lián)度等。其結果為,關聯(lián)度計算部103b制作表示屬性"人名"的按屬性區(qū)分的小組群中的各個單詞間的關聯(lián)度的按B屬性區(qū)分的聯(lián)想詞典102b。
圖8是表示按B屬性區(qū)分的聯(lián)想詞典102b的一個例子的圖。按B屬性區(qū)分的聯(lián)想詞典102b使與屬性"人名"對應的按屬性區(qū)分的小組群之中的多組單詞彼此之間,例如,使參加節(jié)目演出的出場演員名字或種類等單詞彼此之間相關聯(lián),并表示這些單詞間的關聯(lián)度。
具體而言,按B屬性區(qū)分的聯(lián)想詞典102b表示出單詞Wl"松下花子"與單詞W2 "松下次郎"之間的關聯(lián)度"0.5";單詞W1 "松下花子"與單詞W2 "日本"之間的關聯(lián)度"0.2";單詞W1 "松下花子"與單詞W2 "信息"之間的關聯(lián)度"0.6"等。
另外,按B屬性區(qū)分的聯(lián)想詞典102b還表示出各個單詞的屬性。并且,在此按B屬性區(qū)分的聯(lián)想詞典102b中,關聯(lián)度被表示的兩個單詞是被包含在同一小組中的單詞。
而且,關聯(lián)度計算部103b算出如圖6所示的、屬性"國名 場所"的按屬性區(qū)分的小組群中包含的單詞"松下太郎"與單詞"松下三郎"之間的關聯(lián)度,或算出單詞"松下太郎"與單詞"綜藝"之間的關聯(lián)度,以及單詞"松下太郎"與單詞"訪談"之間的關聯(lián)度等。其結果為,關聯(lián)度計算部103b制作表示屬性"國名 場所"的在按屬性區(qū)分的小組群中各個單詞間的關聯(lián)度的按C屬性區(qū)分的聯(lián)想詞典102c。
圖9是表示按C屬性區(qū)分的聯(lián)想詞典102c的一個例子的圖。按C屬性區(qū)分的聯(lián)想詞典102c使與屬性"國名 場所"對應的按屬性區(qū)分的小組群之中的多組單詞彼此之間,例如,使參加節(jié)目演出的出場演員名字或種類等單詞彼此之間相關聯(lián),并表示這些單詞間的關聯(lián)度。
具體而言,按C屬性區(qū)分的聯(lián)想詞典102c表示出單詞W1 "松下太郎"與單詞W2 "松下三郎"之間的關聯(lián)度"0.5";單詞Wl "松下太郎"與單詞W2 "綜藝"之間的關聯(lián)度"0.4";單詞W1 "松下太郎"與單詞W2 "訪談"之間的關聯(lián)度"0.5"等。
另外,按C屬性區(qū)分的聯(lián)想詞典102c還表示出各個單詞的屬性。并且,在此按C屬性區(qū)分的聯(lián)想詞典102c中,關聯(lián)度被表示的兩個單詞是被包含在同一小組中的單詞。
而且,在本實施例中,雖然是針對屬性"種類"、"人名"以及"國名,場所",分別制作按屬性區(qū)分的聯(lián)想詞典,但是也可以針對其他的屬性制作按屬性區(qū)分的聯(lián)想詞典。例如,也可以將職業(yè)棒球或足球等體育運動的"隊名"或"體育運動名"、交響樂團等的"樂團名"、委員會或組織等的"委員會名"或"組織名"、播音員或棒球選手等職業(yè)的"職業(yè)名"、強烈或特價等的"修飾詞"等作為屬性,從而制作與這些屬性對應的按屬性區(qū)分的聯(lián)想詞典。并且,也可以將此屬性進行細化,例如設電視劇等的"角色名"或"主人公"、"配角"等為屬性,以取代屬性"人名",來制作針對此屬性的按屬性區(qū)分的聯(lián)想詞典。
代替單詞取得部105從聯(lián)想詞典記憶部102檢索并找出與由檢索條件取得部104取得的屬性對應的按屬性區(qū)分的聯(lián)想詞典。進而,代替單詞取得部105從此按屬性區(qū)分的聯(lián)想詞典中檢索并作為代替單詞(關聯(lián)單詞)取得,由檢索條件取得部104取得的與檢索單詞具有閾值以上的關聯(lián)度的單詞。g卩,代替單詞取得部105從與由檢索條件取得部104取得的屬性對應的按屬性區(qū)分的聯(lián)想詞典中,作為代替單詞(關聯(lián)單詞)來選擇單詞,以使針對由檢索條件取得部104取得的檢索單詞的關聯(lián)度越大的單詞就越被優(yōu)先選擇。并且,代替單詞取得部105使輸出部106提示此取得后的代替單詞。
圖10是表示由輸出部106提示的內容的圖。
例如,輸出部106與節(jié)目檢索裝置相連接,以顯示由此節(jié)目檢索裝置檢索的節(jié)目,并顯示上述代替單詞。再者,節(jié)目檢索裝置從由節(jié)目信息記憶部101的節(jié)目信息101a表示的多個節(jié)目之中,檢索與用戶輸入的檢索單詞對應的節(jié)目。這樣的輸出部106顯示,表示由節(jié)目檢索裝置檢索的節(jié)目的一覽表的檢索結果畫面106a和表示代替單詞的代替單詞顯示畫面106b。
例如,在代替單詞顯示畫面106b顯示作為代替單詞及其屬性的"松下次郎/人名"以及"松下四郎/人名"等。
圖11是表示聯(lián)想詞典制作部103的工作的流程圖。
信息劃分部103a按每個屬性,將節(jié)目信息101a的各個單詞屬性群分類為多個小組(步驟SIOO)。即,信息劃分部103a按每個屬性,將與節(jié)目信息記憶部101的節(jié)目信息101a中包含的單詞屬性群內的屬于此屬性的單詞(基準單詞)共現的多個單詞,分類給與此屬性及基準單詞對應的小組。如果存在多個屬于此屬性的單詞(基準單詞),則會生成與此基準單詞的數量相等數量的小組。其結果為,按照每個屬性來生成上述的按屬性區(qū)分的小組群。
例如,如圖4所示,信息劃分部103a在屬于屬性"種類"的基準單詞"綜藝"存在于節(jié)目信息101a的單詞屬性群中的情況下,將此基準單詞"綜藝"和在單詞屬性群內共現的單詞"松下太郎、綜藝、松下三郎等"分類給與"綜藝/種類"對應的小組l。進而,信息劃分部103a在屬于屬性"種類"的基準單詞"綜藝"以外,節(jié)目信息101a中還存在屬于屬性"種類"的單詞(信息、咨詢、健康、健康信息)的情況下,將這些單詞作為基準單詞,并將此基準單詞和在單詞屬性群內共現的多個單詞分類給與此基準單詞對應的小組。并且,信息劃分部103a在節(jié)目信息101a中存在其他的屬于屬性(人名、國名,場所等)的單詞的情況下,也針對這些屬性進行如上所述的分類。
其次,關聯(lián)度計算部103b從由上述信息劃分部103a分類時所利用的多個屬性之中選擇一個屬性(按屬性區(qū)分的小組群)(步驟S102),選擇按屬性區(qū)分的小組群中包含的一個單詞Wl (步驟S104),并且選擇按屬性區(qū)分的小組群中包含的另一個單詞W2 (步驟S106)。
并且,關聯(lián)度計算部103b根據在步驟S102選擇的屬性(按屬性區(qū)分的小組群),算出在步驟S104選擇的單詞Wl與在步驟S106選
26擇的單詞W2之間的關聯(lián)度(步驟S108)。此后,關聯(lián)度計算部103b使單詞W1、 W2與關聯(lián)度相關聯(lián),并寫入與此屬性對應的按屬性區(qū)分的聯(lián)想詞典中(步驟SllO)。
例如,關聯(lián)度計算部103b從節(jié)目信息101a中包含的單詞的屬性(種類、人名、國名,場所等)選擇屬性"種類",并參照此屬性的按屬性區(qū)分的小組群,從而算出單詞W1 "松下太郎/人名"和單詞W2"綜藝/種類"之間的關聯(lián)度。其結果為,例如,(單詞Wl、單詞W2、關聯(lián)度)作為(松下太郎/人名、綜藝/種類、0.4)被寫入按A屬性區(qū)分的聯(lián)想詞典102a中。
關聯(lián)度計算部103b在步驟SI 10之后,判別在按屬性區(qū)分的小組群中是否存在沒有作為單詞W2被選擇的單詞(步驟S112)。在此,關聯(lián)度計算部103b在判別為存在沒有被選擇的單詞的情況下(步驟SI 12的"是"),反復進行從S106開始的處理。即,關聯(lián)度計算部103b將此沒有被選擇的單詞作為新的單詞W2來選擇。
另一方面,關聯(lián)度計算部103b在判別為不存在沒有被選擇的單詞的情況下(步驟S112的"否"),進一步判別在按屬性區(qū)分的小組群中是否存在沒有作為單詞W1被選擇的單詞(步驟S114)。在此,關聯(lián)度計算部103b在判別為存在沒有被選擇的單詞的情況下(步驟S114的"是"),反復進行從步驟S104開始的處理。即,關聯(lián)度計算部103b將此沒有被選擇的單詞作為新的單詞Wl來選擇。
而且,關聯(lián)度計算部103b在判別為不存在沒有被選擇的單詞的情況下(步驟S114的"否"),則判斷為針對在步驟S102被選擇的屬性的按屬性區(qū)分的聯(lián)想詞典已經完成,并判別在用于根據信息劃分部103a的分類的多個屬性(按屬性區(qū)分的小組群)之中,是否存在沒有被選擇的屬性(步驟S116)。
關聯(lián)度計算部103b在判別為存在沒有被選擇的屬性的情況下(步驟S116的"是"),反復進行從步驟S102開始的處理。另一方面,關聯(lián)度計算部103b在判別為不存在沒有被選擇的屬性的情況下(步驟S116的"否"),則判斷為所有的按屬性區(qū)分的聯(lián)想詞典已經完成,并結束處理。
其次,關于根據本實施例的關聯(lián)詞語提示裝置100從按屬性區(qū)分的聯(lián)想詞典取得代替單詞時的工作進行說明。
圖12是表示關聯(lián)詞語提示裝置100提示與用戶輸入的檢索單詞相關聯(lián)的代替單詞的工作的流程圖。
首先,檢索條件取得部104按照用戶的輸入操作,取得檢索單詞和此檢索單詞的屬性并輸出到代替單詞取得部105(步驟S201)。代替單詞取得部105從與此屬性對應的按屬性區(qū)分的聯(lián)想詞典中,作為代替單詞(關聯(lián)單詞),取得以閾值以上的關聯(lián)度與此檢索單詞相關聯(lián)的單詞(步驟S202)。
例如,檢索條件取得部104作為檢索單詞/屬性,取得"松下花子/人名"。在此,聯(lián)想詞典記憶部102中存儲有如圖7—圖9所示的按屬性區(qū)分的聯(lián)想詞典。在此情況下,代替單詞取得部105從與此屬性"人名"對應的按B屬性區(qū)分的聯(lián)想詞典102b中,作為代替單詞,取得以閾值(例如0.5)以上的關聯(lián)度與此檢索單詞"松下花子"相關聯(lián)的單詞"松下次郎"、"松下四郎"以及"信息"。
另外,代替單詞取得部105可以不將以閾值以上的關聯(lián)度與檢索單詞相關聯(lián)的單詞作為代替單詞取得,而可以從與檢索單詞相關聯(lián)的關聯(lián)度大的單詞開始,依次取得作為代替單詞的、預先決定了的數量的單詞。而且,雖然代替單詞取得部105是從與檢索條件取得部104所取得的屬性對應的按屬性區(qū)分的聯(lián)想詞典中取得代替單詞,但是也可以從所有的按屬性區(qū)分的聯(lián)想詞典中取得代替單詞。
其次,輸出部106向用戶提示由代替單詞取得部105取得的代替單詞(歩驟S203)。例如,輸出部106向用戶提示由代替單詞取得部105取得的代替單詞"松下次郎"、"松下四郎"以及"信息"。另外,輸出部106在向用戶提示代替單詞的同時還提示此代替單詞的屬性。
如上所示,在本實施例中,按照每個節(jié)目信息101a的各個元數據
28中包含的單詞,將屬于此屬性的多個單詞分別作為基準單詞,并設定
與這些基準單詞對應的小組,從而將節(jié)目信息101a的各個元數據中包含的多個單詞分類給這些小組。并且,在本實施例中,按每個屬性來計算在各個小組共現的單詞彼此之間的關聯(lián)度。因此,與只在節(jié)目內共現的單詞間的相關聯(lián)的關聯(lián)度相比,能夠使出現在同一節(jié)目中,且雖然出現在不同的節(jié)目中但由于與相同的單詞(基準單詞)共現而被相關聯(lián)的單詞間的關聯(lián)度的一方的關聯(lián)性更強。進而,即使只在節(jié)目內共現的單詞但在彼此的出現頻度低的情況下,雖然不在節(jié)目內共現但在相同的小組內共現多的單詞彼此之間的關聯(lián)度,比這些單詞彼此之間的關聯(lián)度的關聯(lián)性更強。
其結果為,若節(jié)目檢索裝置在使用檢索單詞進行檢索之后,使用由本實施例中的關聯(lián)詞語提示裝置100提示的代替詞語執(zhí)行再次檢索(防止遺漏檢索),則此節(jié)目檢索裝置能夠適當地顯示抑制了與以前的檢索結果(節(jié)目的一覽表)的重復的、用戶所關心的檢索結果。
圖13是用于說明本實施例的效果的說明圖。
例如,在本實施例中的聯(lián)想詞典制作部103將表示3個月的地波六個頻道的約10,000個節(jié)目的一覽表作為節(jié)目信息101a來使用,并利用此電子節(jié)目表制作按屬性區(qū)分的聯(lián)想詞典。如圖13所示,如此制作的按屬性區(qū)分的聯(lián)想詞典針對作為單詞及其屬性的"體育運動/種類",顯示關聯(lián)度大的排在前十位的十個單詞及其屬性。
換言之,關聯(lián)詞語提示裝置100將"體育運動/種類"作為檢索單詞及其屬性來取得,并如圖13所示,將與此檢索單詞關聯(lián)度大的排在前十位的十個單詞作為代替單詞來提示。
在此,因為在這些被提示的關聯(lián)單詞中,根據上述小組內的共現關系,針對檢索單詞"體育運動"而算出大的關聯(lián)度,因此能夠抑制以檢索單詞"體育運動"檢索的節(jié)目和以代替單詞檢索的節(jié)目的重復。
例如,以代替單詞"專集"檢索的節(jié)目數量是124個,其中,與以單詞"體育運動"檢索的節(jié)目相重復的節(jié)目數量只有5個。艮口,本實施例中的關聯(lián)詞語提示裝置ioo能夠向用戶提示,在不同于與用戶輸入的檢索條件(檢索單詞)對應的節(jié)目的節(jié)目中出現的、且在小組內與相同的確定的單詞(基準單詞)共現多的代替單詞。并且,因為這樣的代替單詞與檢索單詞的使用方法相似,所以也與檢索單詞的意思相似。
因此,在節(jié)目檢索裝置以檢索單詞"體育運動"檢索節(jié)目,并且還以代替單詞"專集"進行防止遺漏檢索的情況下,能夠顯示以前的
檢索結果未包含的多個新的節(jié)目(119個節(jié)目)。
艮P,若節(jié)目檢索裝置利用由關聯(lián)詞語提示裝置IOO提示的關聯(lián)詞語進行防止遺漏檢索,就能夠顯示抑制了與以前的檢索結果的重復的新的檢索結果,并能夠進行適當的防止遺漏檢索。
再者,在信息劃分部103a按每個屬性,將屬于此屬性的單詞(基準單詞)和在節(jié)目(單詞屬性群)內共現的多個單詞分類在一個小組中的情況下,也可以使此基準單詞不包含在小組中。
圖4是表示在與屬于屬性"種類"的各個單詞對應的小組中,各個節(jié)目的單詞屬性群被分類后的狀態(tài)的圖。
例如,由于節(jié)目ID "01"的單詞屬性群及節(jié)目ID "03"的單詞屬性群分別包含屬于屬性"種類"的單詞"綜藝",因此信息劃分部103a將這些單詞屬性群分類給與"綜藝/種類"對應的小組l。并且,由于節(jié)目ID "01"的單詞屬性群包含屬于屬性"種類"的單詞"訪談",因此信息劃分部103a將將此單詞屬性群分類給與"訪談/種類"對應的小組2。進而,由于節(jié)目ID "02"的單詞屬性群及節(jié)目ID "03"的單詞屬性群分別包含屬于屬性"種類"的單詞"信息",因此信息劃分部103a將這些單詞屬性群分類給與"信息/種類"對應的小組3。
在此,如上所述,信息劃分部103a在將單詞屬性群分類給小組之時,從單詞屬性群中除去此小組的基準單詞,再將被除去了基準單詞的單詞屬性群分類給此小組。例如,信息劃分部103a在將節(jié)目ID"01"的單詞屬性群及節(jié)目ID "03"的單詞屬性群分類給小組1之時,從這些單詞屬性群中除去小組1的基準單詞"綜藝";在將節(jié)目ID "01"的單詞屬性群分類給小組2之時,從此單詞屬性群中除去小組2的基準單詞"訪談";在將節(jié)目ID "02"的單詞屬性群及節(jié)目ID "03"的單詞屬性群分類給小組3之時,從這些單詞屬性群中除去小組3的基準單詞"信息"。
如此,通過將被除去了基準單詞的單詞屬性群分類給小組,能夠減少直接共現的單詞的共現次數,其結果為,能夠使出現在不同的節(jié)目中的、與相同的單詞(基準單詞)共現的單詞彼此具有更強的關聯(lián)性。
(變形例1)
在此,對本實施例中的第一變形例進行說明。
本變形例所涉及的關聯(lián)詞語提示裝置不僅提示用于防止遺漏的關聯(lián)單詞(代替單詞),還提示用于篩選的關聯(lián)單詞(篩選單詞)??傊?,本變形例所涉及的聯(lián)想詞典制作部不僅制作用于代替單詞的按屬性區(qū)分的聯(lián)想詞典,還制作用于篩選單詞的節(jié)目聯(lián)想詞典。
圖15是表示本變形例所涉及的關聯(lián)詞語提示裝置的構成的框圖。
本變形例所涉及的關聯(lián)詞語提示裝置100a包括:節(jié)目信息記憶部101、聯(lián)想詞典制作部113、聯(lián)想詞典記憶部102、檢索條件取得部104、篩選單詞取得部lll、代替單詞取得部105、輸出部106。
即,本變形例所涉及的關聯(lián)詞語提示裝置100a與上述實施例中的關聯(lián)詞語提示裝置100相比,具備聯(lián)想詞典制作部113以取代聯(lián)想詞典制作部103,進而,還具備篩選單詞取得部111。而且,本變形例所涉及的聯(lián)想詞典記憶部102在按屬性區(qū)分的聯(lián)想詞典(按A屬性區(qū)分的聯(lián)想詞典102a、按B屬性區(qū)分的聯(lián)想詞典102b、按C屬性區(qū)分的聯(lián)想詞典102c)以外,還存儲有用于篩選單詞的節(jié)目聯(lián)想詞典102d。
聯(lián)想詞典制作部113與上述實施例中的聯(lián)想詞典制作部103同樣,具備信息劃分部103a及關聯(lián)度計算部103b,并且,還具備節(jié)目
31聯(lián)想詞典制作部103c。
節(jié)目聯(lián)想詞典制作部103c利用節(jié)目信息記憶部101的節(jié)目信息101a中包含的以每個節(jié)目為單位的元數據,按照各個節(jié)目的元數據中包含的兩個單詞的每一組合計算出單詞彼此之間的關聯(lián)度。并且,節(jié)目聯(lián)想詞典制作部103c按照每個組合,制作使此組合所包含的兩個單詞和針對這些單詞計算出的關聯(lián)度相關聯(lián)來表示的節(jié)目聯(lián)想詞典102d,并存儲在聯(lián)想詞典記憶部102。
艮P,本變形例所涉及的節(jié)目聯(lián)想詞典制作部103c將節(jié)目信息101a中包含的各個元數據如上述一個按屬性區(qū)分的小組群中所包含的小組一樣使用,以與關聯(lián)度計算部103b同樣的方法(交互信息內容等)計算出各個單詞間的關聯(lián)度。
篩選單詞取得部111從節(jié)目聯(lián)想詞典102d取得作為篩選單詞的、與由檢索條件取得部104取得的檢索單詞以閾值以上的關聯(lián)度相關聯(lián)的單詞。并且,輸出部106向用戶提示,由代替單詞取得部105取得的代替單詞和由篩選單詞取得部111取得的篩選單詞。
圖16是表示節(jié)目聯(lián)想詞典102d的一個例子的圖。
例如如圖16所示,節(jié)目聯(lián)想詞典102d使在同一節(jié)目中出現的單詞彼此之間相關聯(lián)來表示。具體而言,節(jié)目聯(lián)想詞典102d表示出單詞Wl "信息"與單詞W2 "松下次郎"之間的關聯(lián)度"0.6";單詞Wl "松下花子"與單詞W2 "日本"之間的關聯(lián)度"0.2";單詞Wl"松下花子"與單詞W2 "松下次郎"之間的關聯(lián)度"0.8"等。另外,節(jié)目聯(lián)想詞典102d還表示出各個單詞的屬性。
例如,篩選單詞取得部111在由檢索條件取得部104取得作為檢索單詞及其屬性的"松下花子/人名"的情況下,從節(jié)目聯(lián)想詞典102d
取得作為篩選單詞的、與此檢索單詞以閾值(例如為0.6)以上的關聯(lián)度相關聯(lián)的單詞"信息"及"松下次郎"。輸出部106向用戶提示在篩選單詞取得部111取得的篩選單詞"信息"及"松下次郎"。另外,輸出部106在向用戶提示篩選單詞的同時還可以提示此篩選單詞的屬性。
圖17是表示由輸出部106提示的內容的圖。
例如,輸出部106與節(jié)目檢索裝置相連接,以顯示由此節(jié)目檢索裝置檢索的節(jié)目,并顯示上述代替單詞及篩選單詞。再者,節(jié)目檢索裝置從由節(jié)目信息記憶部101的節(jié)目信息101a表示的多個節(jié)目之中,檢索與用戶輸入的檢索單詞對應的節(jié)目。
這樣的輸出部106顯示,表示由節(jié)目檢索裝置檢索的節(jié)目的一覽表的檢索結果畫面106a,表示篩選單詞的篩選單詞顯示畫面106c,以及表示代替單詞的代替單詞顯示畫面106b。
例如,在篩選單詞顯示畫面106c,作為篩選單詞及其屬性,顯示"松下次郎/人名"及"信息/種類"。而且,在代替單詞顯示畫面106b,作為代替單詞及其屬性,顯示"松卞四郎/人名"及"信息/種類"。
節(jié)目檢索裝置在此代替單詞顯示畫面106b所顯示的任一代替單詞被選擇的情況下,執(zhí)行利用此代替單詞的節(jié)目的防止遺漏檢索;在篩選單詞顯示畫面106c所顯示的任一篩選單詞被選擇的情況下,執(zhí)行利用此篩選單詞的節(jié)目的篩選檢索。
如此,在本變形例中,作為第二關聯(lián)度計算單元被構成的節(jié)目聯(lián)想詞典制作部103c按照在由節(jié)目信息101a所示的各個節(jié)目中兩個單詞共現的頻度,算出此兩個單詞間的關聯(lián)度,從而制作使此兩個單詞和關聯(lián)度相關聯(lián)來表示的節(jié)目聯(lián)想詞典102d,并將此節(jié)目聯(lián)想詞典102d存儲在聯(lián)想詞典記憶部102。并且,在本變形例中,作為第二關聯(lián)度計算單元被構成的篩選單詞取得部111從聯(lián)想詞典記憶部102中記憶的節(jié)目聯(lián)想詞典102d中將單詞作為篩選單詞(第二關聯(lián)單詞)進行選擇,以使針對由檢索條件取得部104取得的檢索單詞的關聯(lián)度越大的單詞,就越被優(yōu)先選擇。
因此,在本變形例中,制作了針對多個節(jié)目的分別共現的單詞表示關聯(lián)度大的節(jié)目聯(lián)想詞典102d,針對檢索單詞的關聯(lián)度大的單詞作為篩選單詞從節(jié)目聯(lián)想詞典102d中被抽取并顯示。其結果為,如果節(jié)目檢索裝置利用本變形例所涉及的關聯(lián)詞語提
示裝置lOOa,就能夠篩選針對檢索條件(檢索單詞)而得到的檢索結果(節(jié)目的一覽表)。并且,因為關聯(lián)詞語提示裝置100a所提示的篩選單詞是與檢索單詞在多個節(jié)目中共現的關聯(lián)性強的單詞,所以能夠逐漸對檢索結果進行篩選,從而能夠防止檢索結果驟然減少。
另外,篩選單詞取得部111可以不將以閾值以上的關聯(lián)度與檢索單詞相關聯(lián)的單詞作為篩選單詞取得,而可以從與檢索單詞相關聯(lián)的關聯(lián)度大的單詞開始,依次取得作為篩選單詞的、預先決定了的數量的單詞。
同時,雖然輸出部106向用戶提示了篩選單詞和代替單詞雙方的單詞,但是也可以只向用戶提示依據用戶的操作的任一方。(變形例2)
在此,對本實施例中的第二變形例進行說明。
本變形例所涉及的關聯(lián)詞語提示裝置不是直接從用戶取得檢索單詞和其屬性,而是根據用戶所選擇的節(jié)目來推斷檢索單詞和其屬性。
圖18是表示本變形例所涉及的關聯(lián)詞語提示裝置的構成的框圖。
本變形例所涉及的關聯(lián)詞語提示裝置100b包括節(jié)目信息記憶部101、聯(lián)想詞典制作部103、聯(lián)想詞典記憶部102、節(jié)目選擇部121、檢索條件取得部104a、代替單詞取得部105、輸出部106。
艮口,本變形例所涉及的關聯(lián)詞語提示裝置100b與上述實施例中的關聯(lián)詞語提示裝置100相比,具備檢索條件取得部104a以取代檢索條件取得部104,進而,還具備節(jié)目選擇部121。
節(jié)目選擇部121顯示由節(jié)目信息記憶部101的節(jié)目信息101a表示的節(jié)目的一覽表。節(jié)目選擇部121在用戶從此一覽表中選擇任一節(jié)目的情況下,將此被選擇的節(jié)目的節(jié)目ID輸出到檢索條件取得部104a。
檢索條件取得部104a從節(jié)目選擇部121取得節(jié)目ID,并從節(jié)目信息記憶部101的節(jié)目信息101a中取出與此節(jié)目ID相對應的單詞屬性群。并且,檢索條件取得部104a從此取出的單詞屬性群中,推斷適 于用戶的檢索單詞和其屬性。
例如,檢索條件取得部104a取得多個節(jié)目ID,在從節(jié)目信息101a 中取出了多個單詞屬性群的情況下,將這些多個單詞屬性群所包含的 最多的單詞和其屬性作為適于用戶的檢索單詞和其屬性來推斷。
圖19是表示節(jié)目選擇部121所顯示的畫面的圖。
節(jié)目選擇部121顯示例如如圖19所示的、節(jié)目信息記憶部101 的節(jié)目信息101a所表示的節(jié)目的一 覽表。
具體而言,節(jié)目選擇部121按照每個由節(jié)目信息101a表示的元 數據的種類(綜藝等), 一并顯示多個節(jié)目(播放日、節(jié)目名稱、節(jié)目 梗概等)。而且,若節(jié)目信息101a中包含各個節(jié)目的縮略圖,則節(jié)目 選擇部121也顯示此縮略圖。并且,節(jié)目選擇部121針對此一覽表的 各個節(jié)目,為了使用戶能夠選擇節(jié)目,而附加復選框CB來顯示。進而, 節(jié)目選擇部121顯示用于使針對檢索條件取得部104a的檢索單詞的 推斷開始的開始按鈕SB。
若看到這樣的節(jié)目選擇部121的畫面的用戶,從此一覽表中發(fā)現 所矚目的節(jié)目,則操作節(jié)目選擇部121,并選擇附加給此節(jié)目的復選 框CB,從而使此復選框CB中顯示勾選標記。并且,用戶選擇開始按 鈕SB。
其結果為,節(jié)目選擇部121將與在復選框CB內顯示著勾選標記 的節(jié)目相對應的節(jié)目ID,例如節(jié)目ID "01"以及"10"輸出到檢索 條件取得部104a。
如上所述,檢索條件取得部104a取得從節(jié)目選擇部121輸出的 節(jié)目ID "01"以及"10"。并且,檢索條件取得部104a從節(jié)目信息 記憶部101取得,與節(jié)目ID "01"對應的單詞屬性群"松下太郎/人 名、綜藝/種類、松下三郎/人名、日本/國名*場所、嘉賓/職業(yè)、訪 談/種類",和與節(jié)目ID "10"對應的單詞屬性群"松下太郎/人名、 綜藝/種類、世界/國名 場所"。
35在檢索條件取得部104a取得這樣的兩個單詞屬性群的情況下,例 如,將作為在這些單詞屬性群之中包含最多的單詞和其屬性的"松下 太郎/人名"或者"綜藝/種類",作為適于用戶的檢索單詞和其屬性來 推斷。
如此,在本變形例中,節(jié)目選擇部121從節(jié)目信息101a所顯示 的多個節(jié)目之中,確定用戶所選擇的多個節(jié)目,檢索條件取得部104 按照多個單詞的出現頻度,從這些多個單詞之中取得一個作為檢索單 詞的單詞,并確定此檢索單詞的屬性,該多個單詞是為了表示節(jié)目選 擇部121所確定的多個節(jié)目的內容而在節(jié)目信息101a中被使用的多 個單詞。
因此,在本變形例中,因為根據用戶所選擇的節(jié)目來推斷檢索單 詞及其屬性,所以用戶不用輸入檢索單詞,而是通過選擇用戶所注目 的節(jié)目,就能夠使與此節(jié)目相關聯(lián)的代替單詞被提示。
再者,在本變形例中,雖然是檢索條件取得部104a根據用戶從節(jié) 目信息101a所表示的多個節(jié)目之中選擇的節(jié)目來推斷檢索單詞,但是 也可以是根據用戶從依據節(jié)目檢索裝置的檢索結果所包含的多個節(jié)目 之中選擇的節(jié)目,來推斷檢索單詞。
例如,節(jié)目檢索裝置將如圖19所示的節(jié)目的一覽表作為檢索結 果,使輸出部106顯示。并且,若用戶選擇此一覽表中顯示的若干復 選框,則輸出部106從節(jié)目信息101a中取得與這些被選擇的若干復 選框對應的節(jié)目的節(jié)目ID,并輸出到檢索條件取得部104a。與上述 同樣,檢索條件取得部104a利用這些節(jié)目ID和節(jié)目信息101a來推 斷檢索單詞。
(變形例3)
在此,對本實施例中的第三變形例進行說明。
本變形例所涉及的關聯(lián)詞語提示裝置與變形例1的關聯(lián)詞語提示 裝置100a同樣,提示篩選單詞及代替單詞,并按照依據檢索條件來檢 索的節(jié)目的數量,而使被提示的篩選單詞的數量和代替單詞的數量的比率(單詞比率)變化。
圖20是表示本變形例所涉及的關聯(lián)詞語提示裝置的構成的框圖。
本變形例所涉及的關聯(lián)詞語提示裝置IOOC包括:節(jié)目信息記憶部
101、聯(lián)想詞典制作部113、聯(lián)想詞典記憶部102、檢索條件取得部 104、篩選單詞取得部111、代替單詞取得部105、檢索部131、表 存儲部133、以及輸出部132。
艮P,本變形例所涉及的關聯(lián)詞語提示裝置lOOc與變形例1所涉 及的關聯(lián)詞語提示裝置lOOa相比,具備輸出部132以取代輸出部 106,進而,還具備檢索部131及表存儲部133。
檢索部131從節(jié)目信息記憶部101的節(jié)目信息101a中檢索,由 檢索條件取得部104取得的檢索單詞被包含在單詞屬性群中的節(jié)目, 并向輸出部132輸出被檢索出的節(jié)目的數量。
表存儲部133存儲有單詞比率表133a。此單詞比率表133a將按 照檢索部131所檢索的節(jié)目的數量的、應該向用戶提示的篩選單詞的 數量(篩選單詞數)和代替單詞的數量(代替單詞數)之間的比率作 為單詞比率來表示。
艮P,此單詞比率表133a表示,在檢索部131所檢索的節(jié)目的數 量多的情況下,向用戶提示的篩選單詞的數量應該比代替單詞的數量 多,相反,在檢索部131所檢索的節(jié)目的數量少的情況下,向用戶提 示的篩選單詞的數量應該比代替單詞的數量少。
輸出部132取得從篩選單詞取得部111及代替單詞取得部105 輸出的多個篩選單詞及代替單詞,和從檢索部131輸出的節(jié)目的數量, 以及表存儲部133所存儲的單詞比率表133a。
并且,輸出部132根據單詞比率表133a,來確定按照從檢索部 131輸出的節(jié)目的數量的單詞比率。輸出部132從由篩選單詞取得部 111及代替單詞取得部105輸出的多個篩選單詞及代替單詞之中,以 從關聯(lián)度大的開始的順序,選擇并顯示篩選單詞和代替單詞,以便符 合如上所述的所確定的單詞比率。圖21是表示單詞比率表133a的一個例子的圖。
例如,如圖21所示,單詞比率表133a使檢索部131所檢索的 節(jié)目的數量(檢索結果數)和單詞比率相關聯(lián)來表示。
具體而言,若檢索結果數為1000以上,則單詞比率表133a表示 單詞比率"篩選單詞數:代替單詞數-8:2";若檢索結果數為500以上 且不足1000,則表示單詞比率"篩選單詞數:代替單詞數=6:4"。并且, 若檢索結果數為50以上且不足500,則單詞比率表133a表示單詞比 率"篩選單詞數:代替單詞數-4:6";若檢索結果不足50,則表示單詞 比率"篩選單詞數:代替單詞數-2:8"。
例如,在檢索部131將"小品/種類"作為從檢索條件取得部104 輸出的檢索單詞及其屬性來取得的情況下,從節(jié)目信息記憶部101中 檢索存在此"小品/種類"的節(jié)目。此時,若檢索部131找到2000個 節(jié)目,則將作為此節(jié)目的數量的檢索結果數"2000"輸出到輸出部 132。
輸出部132在從檢索部131取得檢索結果數"2000"的情況下, 根據單詞比率表133a確定與檢索結果數"2000"相對應的單詞比率 "8:2"。
其結果為,輸出部132從由篩選單詞取得部111及代替單詞取得 部105所分別輸出的多個篩選單詞及代替單詞之中,從關聯(lián)度大的篩 選單詞和代替單詞開始依次選擇并顯示,以便符合此被確定的單詞比 率"8:2"。
再者,在上述例子中,雖然是單詞比率表133a使檢索結果數和單
詞比率相關聯(lián)來顯示,但是也可以以相對于全部節(jié)目數的檢索結果數
的比例代替檢索結果數來顯示。
圖22是表示單詞比率表133a的其他的例子的圖。
此圖22所示的單詞比率表133a表示相對于全部節(jié)目數的檢索結
果數的比例和單詞比率。在此,全部節(jié)目數是指節(jié)目信息記憶部101
的節(jié)目信息101a所表示的全部的節(jié)目的數量。例如,若相對于全部節(jié)目數的檢索結果數的比例為0.75以上且不 足1.0,則單詞比率表133a表示單詞比率"篩選單詞數:代替單詞數 =8:2";若相對于全部節(jié)目數的檢索結果數的比例為0.5以上且不足 0.75,則表示單詞比率"篩選單詞數:代替單詞數=6:4"。
并且,在上述例子中,所然是單詞比率表133a使檢索結果數和單 詞比率相關聯(lián)來顯示,但是也可以以篩選單詞數及代替單詞數代替單 詞比率來顯示。
圖23是表示單詞比率表133a的其他的例子的圖。
此圖23所示的單詞比率表133a表示檢索結果數和篩選單詞數, 以及代替單詞數。
例如,若檢索結果數為1000以上,則單詞比率表133a表示篩選 單詞數為8以下且代替單詞數為2以下;若檢索結果數為500以上且 不足1000,則表示篩選單詞數為6以下且代替單詞數為4以下。
這樣,本變形例中,因為在檢索結果數多的情況下,被表示的篩 選單詞比代替單詞多,所以針對用戶能夠容易選擇適當的篩選單詞。 其結果為,在節(jié)目檢索裝置中,通過選擇篩選單詞,來利用檢索單詞 和篩選單詞執(zhí)行篩選檢索,從而能夠減少作為檢索結果的節(jié)目的數量。 而且,因為在檢索結果數少的情況下,被表示的代替單詞比篩選單詞 多,所以針對用戶能夠容易選擇適當的代替單詞。其結果為,在節(jié)目 檢索裝置中,通過選擇代替單詞,來利用檢索單詞和代替單詞執(zhí)行防 止遺漏檢索,從而能夠增加作為檢索結果的節(jié)目的數量??傊诒?br>
變形例中,能夠提示符合用戶的檢索行為的關聯(lián)單詞(篩選單詞或者 代替單詞)。
以上,關于本發(fā)明所涉及的關聯(lián)詞語提示裝置,使用上述實施例 及其變形例進行了說明,但是,本發(fā)明不僅限于此。
例如,在上述實施例及其變形例中,代替單詞取得部105在由檢 索條件取得部104取得檢索單詞及其屬性的情況下,從與此檢索單詞 的屬性相對應的按屬性區(qū)分的聯(lián)想詞典中,取得作為代替單詞的以閾值以上的關聯(lián)度與檢索單詞相關聯(lián)的單詞。但是,代替單詞取得部105 也可以從此屬性區(qū)分的聯(lián)想詞典中,只取得作為代替單詞的、以閾值 以上的關聯(lián)度與檢索單詞相關聯(lián)且與檢索單詞的屬性相同的單詞。
例如,代替單詞取得部105在由檢索條件取得部104作為檢索單 詞及其屬性取得"松下花子/人名"的情況下,從與此屬性"人名"對 應的如圖8所示的按B屬性區(qū)分的聯(lián)想詞典102b中,將以閾值(例 如0.6)以上的關聯(lián)度與檢索單詞"松下花子"相關聯(lián)的、且與檢索單 詞"松下花子"的屬性"人名"相同的屬性"人名"的單詞作為代替 單詞來取得。
因此,能夠只取得屬于用戶所注目的屬性的單詞來作為代替單詞, 進而,因為代替單詞與檢索單詞屬于相同的屬性,所以能夠容易地判 斷被提示的代替單詞是否適合作為下一個檢索單詞。
例如,在用戶想要以節(jié)目的出場演員名字來檢索節(jié)目時,存在將 "松下六郎/人名"輸入節(jié)目檢索裝置中,用戶不滿意針對此輸入的檢 索結果的情況。象這樣的情況,即使屬于與此檢索單詞的屬性"人名" 不同屬性"國名 場所"的單詞"世界"或,屬于屬性"種類"的單 詞"智力測驗"被作為代替單詞提示,由于被提示的代替單詞的屬性 與用戶想要輸入的檢索單詞的屬性"人名"不同,所以用戶難以估計 在將"世界"或"智力測驗"作為下一個檢索單詞輸入到節(jié)目檢索裝 置的情況下,所取得的檢索結果,其結果為,不容易選擇被提示的代 替單詞。在此,如上所述,通過將屬于與檢索單詞的屬性"人名"相 同的屬性的單詞"松下七郎"或"松下八郎"等作為代替單詞來提示, 用戶能夠容易地判斷應該將哪個代替單詞作為檢索單詞"松下六郎" 的下一個檢索單詞來選擇。
并且,在上述實施例及其變形例中,代替單詞取得部105在由檢 索條件取得部104取得檢索單詞及其屬性的情況下,從與此檢索單詞 的屬性相對應的按屬性區(qū)分的聯(lián)想詞典中,取得作為代替單詞的以閾 值以上的關聯(lián)度與檢索單詞相關聯(lián)的單詞。但是,代替單詞取得部105還按每個過去的檢索單詞及其屬性,從與此屬性相對應的按屬性區(qū)分 的聯(lián)想詞典中,將以閾值以上的關聯(lián)度閾此檢索單詞相關聯(lián)的單詞作 為代替單詞(第三關聯(lián)單詞)來取得,該過去的檢索單詞及其屬性是 在此檢索單詞及其屬性被取得為止的預先規(guī)定的期間內被取得的。
在此情況下,關聯(lián)詞語提示裝置具備用于對檢索條件取得部104 所取得的檢索單詞及其屬性進行記憶的檢索條件記憶部。檢索條件取 得部104每取得檢索單詞及其屬性,就將其存儲在此檢索條件記憶部 中,并在到該檢索單詞及其屬性被存儲為止的預先規(guī)定的期間之前, 刪除存儲在此檢索條件記憶部中的檢索單詞及其屬性。
并且,如上所述,代替單詞取得部105按每個存儲在檢索條件記 憶部中的檢索單詞及其屬性,從與此檢索單詞的屬性對應的按屬性區(qū) 分的聯(lián)想詞典中,取得作為代替單詞的、以閾值以上的關聯(lián)度與此檢 索單詞相關聯(lián)的單詞。
例如,檢索條件取得部104作為檢索單詞及其屬性取得"綜藝/ 種類",進而在此之后若取得"松下太郎/人名",則將其存儲在上述 檢索條件記憶部。并且,代替單詞取得部105首先從與檢索單詞"綜 藝"的屬性"種類"對應的按A屬性區(qū)分的聯(lián)想詞典102a中,將以 閾值以上的關聯(lián)度與此檢索單詞"綜藝"相關聯(lián)的單詞作為代替單詞 來取得,并從閾檢索單詞"松下太郎"的屬性"人名"對應的按B屬 性區(qū)分的聯(lián)想詞典102b中,將以閾值以上的關聯(lián)度與此檢索單詞"松 下太郎"相關聯(lián)的單詞作為代替單詞來取得。其結果為,輸出部106 顯示從按A屬性區(qū)分的聯(lián)想詞典102a取得的代替單詞,和從按B屬 性區(qū)分的聯(lián)想詞典102b取得的代替單詞。
因此,在用戶對過去的檢索單詞的注目程度比最近輸入的檢索單 詞高,且不能滿足于針對最近輸入的檢索單詞的檢索結果或代替單詞 的情況下,不用返回到針對注目程度高的過去的檢索單詞而提示代替 單詞的畫面,就能夠選擇針對注目程度高的檢索單詞的代替單詞。艮P, 由于不僅提示針對最近的檢索單詞的代替單詞,還提示針對在此之前的過去的檢索單詞的代替單詞,所以用戶能夠容易地選擇針對注目程 度高的檢索單詞的代替單詞。
再者,在上述的例子中,檢索條件取得部104每取得檢索單詞及 其屬性,就將其存儲在此檢索條件記憶部中,并在到該檢索單詞及其 屬性被存儲為止的預先規(guī)定的期間之前,刪除了存儲在此檢索條件記 憶部中的檢索單詞及其屬性。但是,檢索條件取得部104也可以根據 FIFO(First—In First—Out:先進先出)來使用檢索條件記憶部,在此 檢索條件記憶部中,按照被取得的順序存儲到預先規(guī)定的數量為止的 所取得的檢索單詞及其屬性。
而且,在變形例1及變形例3中,篩選單詞取得部lll從節(jié)目聯(lián) 想詞典102d取得作為篩選單詞的、與由檢索條件取得部104取得的 檢索單詞以閾值以上的關聯(lián)度相關聯(lián)的單詞。但是,篩選單詞取得部 111也可以從節(jié)目聯(lián)想詞典102d中,只取得作為篩選單詞的、以閾 值以上的關聯(lián)度與此檢索單詞相關聯(lián)且與檢索單詞的屬性不同的屬性 的單詞。
例如,篩選單詞取得部111在由檢索條件取得部104取得檢索單 詞"松下花子"及其屬性"人名"的情況下,從圖16所示的節(jié)目聯(lián)想 詞典102d中,在以閾值(例如0.6)以上的關聯(lián)度與此檢索單詞"松 下花子"相關聯(lián)的單詞"信息"及其屬性"種類"和單詞"松下次郎" 及其屬性"人名"之中,將與檢索單詞的屬性"人名"不同屬性的單 詞"信息"作為篩選單詞來取得。
因此,在根據節(jié)目檢索裝置的針對檢索單詞的檢索結果數多的情 況下,用戶能夠從關聯(lián)詞語提示裝置所提示的篩選單詞中容易地選擇, 能夠以與此檢索單詞不同的觀點(屬性)來篩選檢索結果的下一個檢 索單詞。即,因為不會提示在概念上與檢索單詞對抗的篩選單詞,所 以用戶能夠從被提示的篩選單詞中容易地選擇用于篩選用戶所估計的 檢索結果的下一個檢索單詞。
例如,用戶想要視聽"松下七郎"演出的節(jié)目,因而將作為檢索
42單詞及其屬性的"松下七郎/人名"輸入到節(jié)目檢索裝置中,其結果為, 節(jié)目檢索裝置顯示龐大數量的節(jié)目。
在這樣的情況下,若作為篩選單詞及其屬性的"松下六郎/人名" 或"松下八郎/人名"被提示,則因為被提示的篩選單詞的屬性"人名" 與由用戶輸入的檢索單詞的屬性"人名"相同,所以對用戶而言,難 以估計在將此篩選單詞作為下一個檢索單詞來選擇并執(zhí)行篩選檢索之 時的檢索結果。即,用戶難以選擇被提示的篩選單詞。
然而,如上所述的,在屬于與檢索單詞的屬性不同屬性的單詞作 為篩選單詞被提示的情況下,與作為檢索單詞及其屬性的"松下七郎/ 人名"有關聯(lián)的、且屬于與此屬性"人名"不同屬性"種類"的篩選 單詞"電視劇"或"綜藝",屬于屬性"國名 場所"的篩選單詞"關 西"等被提示。因此,因為與檢索單詞不同屬性的篩選單詞被提示, 所以用戶能夠容易地估計在將被提示的篩選單詞作為下一個檢索單詞 來選擇并執(zhí)行篩選檢索的情況下的檢索結果,從而能夠容易地選擇篩 選單詞。
而且,在上述實施例及其變形例中,雖然是檢索條件取得部104 從用戶直接取得檢索單詞,并且還直接取得此檢索單詞的屬性,但是 也可以是從用戶只取得檢索單詞。在此情況下,檢索條件取得部104 按每個單詞,保持表示此單詞的屬性的表。并且,檢索條件取得部104 在按照用戶的輸入操作取得檢索單詞的情況下,從表中檢索與此檢索 單詞相對應的屬性,并將找到的屬性和此檢索單詞輸出到代替單詞取 得部105等。因此,能夠節(jié)省用戶的輸入操作的時間。
本發(fā)明所涉及的關聯(lián)詞語提示裝置能夠將在與用戶所輸入的檢索 單詞不同的節(jié)目中出現的、且與此檢索單詞的意思相似的單詞作為關 聯(lián)單詞向用戶提示,能夠適用于例如,如圖24所示的,硬盤記錄器或 DVD記錄器、TV、音頻元件、能夠上網視聽節(jié)目的終端或提供服務的 服務器裝置等。
權利要求
1、一種關聯(lián)詞語提示裝置,制作多個聯(lián)想詞典,所述聯(lián)想詞典包括多個單詞和所述多個單詞間的關聯(lián)度,其特征在于,包括節(jié)目信息記憶單元,將節(jié)目信息按每個節(jié)目進行記憶,其中,該節(jié)目信息是由多個單詞來表示所述節(jié)目的內容的信息;分類單元,生成以基準單詞和在節(jié)目內所共現的單詞的集合為單位而組成的至少一個以上的小組,所述基準單詞是指屬于所述節(jié)目信息中包含的單詞的屬性的單詞,所述至少一個以上的小組的生成是按每個所述單詞的屬性而進行的;存儲單元,在詞典記憶單元中存儲按每個所述屬性的聯(lián)想詞典,該按每個所述屬性的聯(lián)想詞典包括按每個所述單詞的屬性的各個小組中的兩個單詞間的關聯(lián)度和所述兩個單詞,所述兩個單詞間的關聯(lián)度按照所述兩個單詞所共現的頻度而被算出;取得單元,取得檢索單詞和所述檢索單詞的屬性;第一關聯(lián)單詞選擇單元,將按每個所述屬性的聯(lián)想詞典之中的、與所述取得單元所取得的屬性相對應的所述聯(lián)想詞典之中的單詞,作為第一關聯(lián)單詞進行選擇;以及提示單元,提示所述第一關聯(lián)單詞選擇單元所選擇的所述第一關聯(lián)單詞。
2、 如權利要求1所述的關聯(lián)詞語提示裝置,其特征在于, 在由所述存儲單元存儲的聯(lián)想詞典中,按每個屬性,兩個單詞和所述兩個單詞間的關聯(lián)度具有固有的關聯(lián)性。
3、 如權利要求1所述的關聯(lián)詞語提示裝置,其特征在于, 所述分類單元從在所述小組中的節(jié)目內共現的單詞之中,除去所述小組中的基準單詞。
4、 如權利要求1所述的關聯(lián)詞語提示裝置,其特征在于,所述關聯(lián)詞語提示裝置還包括第一關聯(lián)度計算單元,按每個所述單詞的屬性,計算按照在所述 分類單元所生成的各個小組中兩個單詞所共現的頻度的、所述兩個單 詞間的關聯(lián)度,并制作使所述兩個單詞和所述關聯(lián)度相關聯(lián)來表示的 所述聯(lián)想詞典。
5、 如權利要求4所述的關聯(lián)詞語提示裝置,其特征在于,所述第一關聯(lián)單詞選擇單元,從與所述取得單元所取得的屬性相對應的所述聯(lián)想詞典中,將單 詞作為所述第一關聯(lián)單詞進行選擇,以使針對由所述取得單元取得的 檢索單詞的關聯(lián)度越大的單詞就越被優(yōu)先選擇。
6、 如權利要求5所述的關聯(lián)詞語提示裝置,其特征在于,所述關聯(lián)詞語提示裝置還包括第二關聯(lián)度計算單元,計算按照在所述節(jié)目信息所表示的各個節(jié) 目中兩個單詞所共現的頻度的、所述兩個單詞間的關聯(lián)度,并制作使 所述兩個單詞和所述關聯(lián)度相關聯(lián)來表示的節(jié)目聯(lián)想詞典,將所述節(jié)目聯(lián)想詞典存儲在所述詞典記憶單元;以及第二關聯(lián)單詞選擇單元,從所述詞典記憶單元所記憶的節(jié)目聯(lián)想 詞典中,將單詞作為第二關聯(lián)單詞進行選擇,以使針對由所述取得單 元取得的檢索單詞的關聯(lián)度越大的單詞就越被優(yōu)先選擇,所述提示單元還提示由所述第二關聯(lián)單詞選擇單元選擇的所述第 二關聯(lián)單詞。
7、 如權利要求6所述的關聯(lián)詞語提示裝置,其特征在于,所述第二關聯(lián)單詞選擇單元,僅將與由所述取得單元取得的檢索單詞的屬性不同屬性的單詞作 為所述第二關聯(lián)單詞進行選擇。
8、 如權利要求6所述的關聯(lián)詞語提示裝置,其特征在于,所述關聯(lián)詞語提示裝置還包括檢索單元,從所述節(jié)目信息中檢索使用所述取得單元所取得的檢 索單詞來表示內容的節(jié)目,所述第一及第二關聯(lián)單詞選擇單元分別選擇多個第一及第二關聯(lián) 單詞,所述提示單元,在由所述檢索單元檢索的節(jié)目的數量越多的情況下,與所述第一關聯(lián)單詞相比就越多地提示所述第二關聯(lián)單詞;在由所述檢索單元檢 索的節(jié)目的數量越少的情況下,與所述第二關聯(lián)單詞相比就越多地提 示所述第一關聯(lián)單詞。
9、 如權利要求5所述的關聯(lián)詞語提示裝置,其特征在于, 所述取得單元按照用戶的輸入操作取得所述檢索單詞及所述檢索單詞的屬性。
10、 如權利要求5所述的關聯(lián)詞語提示裝置,其特征在于,所述關聯(lián)詞語提示裝置還包括節(jié)目選擇單元,從所述節(jié)目信息所表示的多個節(jié)目之中,確定由 用戶選擇的多個節(jié)目,所述取得單元按照多個單詞的出現頻度,從所述多個單詞之中取 得一個作為所述檢索單詞的單詞,所述多個單詞是為了表示由所述節(jié) 目選擇單元確定的多個節(jié)目的內容,而被使用于所述節(jié)目信息中的多 個單詞。
11、 如權利要求5所述的關聯(lián)詞語提示裝置,其特征在于, 所述第一關聯(lián)單詞選擇單元,僅將與由所述取得單元取得的檢索單詞的屬性相同的屬性的單詞 作為所述第一關聯(lián)單詞進行選擇。
12、 如權利要求5所述的關聯(lián)詞語提示裝置,其特征在于, 所述第一關聯(lián)單詞選擇單元,在由所述取得單元取得檢索單詞之前的預先決定了的期間,在其 他的檢索單詞及所述其他的檢索單詞的屬性被取得的情況下,進一步, 從與所述其他的檢索單詞的屬性對應的聯(lián)想詞典選擇作為第三關聯(lián)單 詞的單詞,以使針對所述其他的檢索單詞的關聯(lián)度越大的單詞就越被 優(yōu)先選擇,所述提示單元還提示由所述第一關聯(lián)單詞選擇單元選擇的第三關 聯(lián)單詞。
13、 一種關聯(lián)詞語提示方法,制作多個聯(lián)想詞典,并利用所述多 個聯(lián)想詞典來提示與檢索單詞相關聯(lián)的關聯(lián)單詞,所述聯(lián)想詞典包括 多個單詞和所述多個單詞間的關聯(lián)度,其特征在于,使用節(jié)目信息記憶單元,所述節(jié)目信息記憶單元將節(jié)目信息按每 個節(jié)目進行記憶,其中,該節(jié)目信息是由多個單詞來表示所述節(jié)目的 內容的信息;所述關聯(lián)詞語提示方法包括-分類步驟,生成以基準單詞和在節(jié)目內所共現的單詞的集合為單 位而組成的至少一個以上的小組,所述基準單詞是指屬于所述節(jié)目信 息中包含的單詞的屬性的單詞,所述至少一個以上的小組的生成是按 每個所述單詞的屬性而進行的;存儲步驟,在詞典記憶單元中存儲按每個所述屬性的聯(lián)想詞典,該按每個所述屬性的聯(lián)想詞典包括按每個所述單詞的屬性的各個小組 中的兩個單詞間的關聯(lián)度和所述兩個單詞,所述兩個單詞間的關聯(lián)度按照所述兩個單詞所共現的頻度而被算出;取得步驟,取得檢索單詞和所述檢索單詞的屬性; 關聯(lián)單詞選擇步驟,將按每個所述屬性的聯(lián)想詞典之中的、與在所述取得步驟取得的屬性相對應的所述聯(lián)想詞典之中的單詞,作為關聯(lián)單詞進行選擇;以及提示步驟,提示在所述關聯(lián)單詞選擇步驟選擇的所述關聯(lián)單詞。
14、 一種程序,用于制作多個聯(lián)想詞典,并用于使用所述多個聯(lián) 想詞典提示與檢索單詞相關聯(lián)的關聯(lián)單詞,所述聯(lián)想詞典包括多個單 詞和所述多個單詞間的關聯(lián)度,其特征在于,使用節(jié)目信息記憶單元,所述節(jié)目信息記憶單元將節(jié)目信息按每 個節(jié)目進行記憶,,其中,該節(jié)目信息是由多個單詞來表示所述節(jié)目的 內容的信息;所述程序使計算機執(zhí)行以下步驟分類步驟,生成以基準單詞和在節(jié)目內所共現的單詞的集合為單 位而組成的至少一個以上的小組,所述基準單詞是指屬于所述節(jié)目信 息中包含的單詞的屬性的單詞,所述至少一個以上的小組的生成是按 每個所述單詞的屬性而進行的;存儲步驟,在詞典記憶單元中存儲按每個所述屬性的聯(lián)想詞典, 該按每個所述屬性的聯(lián)想詞典包括按每個所述單詞的屬性的各個小組 中的兩個單詞間的關聯(lián)度和所述兩個單詞,所述兩個單詞間的關聯(lián)度 按照所述兩個單詞所共現的頻度而被算出;取得步驟,取得檢索單詞和所述檢索單詞的屬性;關聯(lián)單詞選擇步驟,將按每個所述屬性的聯(lián)想詞典之中的、與在 所述取得步驟取得的屬性相對應的所述聯(lián)想詞典之中的單詞,作為關 聯(lián)單詞進行選擇;以及提示步驟,提示在所述關聯(lián)單詞選擇步驟選擇的所述關聯(lián)單詞。
全文摘要
用于進行適當的防止遺漏檢索的關聯(lián)詞語提示裝置(100)包括節(jié)目信息記憶部(101),按每個節(jié)目來記憶節(jié)目信息(101a);信息劃分部(103a),按每個節(jié)目信息(101a)中包含的單詞的屬性,生成以作為屬于此屬性的單詞的基準單詞和在節(jié)目內所共現的單詞的集合為單位而組成的至少一個以上的小組;關聯(lián)度計算部(103b),將按每個所述屬性的按屬性區(qū)分的聯(lián)想詞典(102a、102b、102c)存儲在聯(lián)想詞典記憶部(102),該按每個所述屬性的按屬性區(qū)分的聯(lián)想詞典包括,按每個單詞的屬性的各個小組中的兩個單詞所共現的頻度而算出的所述兩個單詞間的關聯(lián)度和所述兩個單詞;檢索條件取得部(104),取得檢索單詞和其屬性;代替單詞取得部(105),從與此被取得的屬性對應的按屬性區(qū)分的聯(lián)想詞典中選擇代替單詞;輸出部(106),提示被選擇的代替單詞。
文檔編號G06F17/30GK101601038SQ200880004000
公開日2009年12月9日 申請日期2008年7月30日 優(yōu)先權日2007年8月3日
發(fā)明者松浦聰, 續(xù)木貴史, 高田和豐 申請人:松下電器產業(yè)株式會社