專利名稱:聯(lián)想辭典制作裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及制作聯(lián)想辭典的聯(lián)想辭典制作裝置,該聯(lián)想辭典保存有存儲在數(shù)據(jù)庫中的信息中的單詞相互間的關(guān)聯(lián)。
背景技術(shù):
以往,作為制作用于檢索數(shù)據(jù)庫的聯(lián)想辭典的方法,已知有通過人手工檢查數(shù)據(jù)庫的信息的單詞相互間的關(guān)系而制作辭典的方法、以及對電子化文本中的所有單詞利用出現(xiàn)頻率信息等自動地制作聯(lián)想辭典的方法等。此外,還公開了下述文本處理裝置,該文本處理裝置為了制作各領(lǐng)域的聯(lián)想辭典而由用戶輸入檢索條件,以符合所輸入的檢索條件的文本為對象來制作聯(lián)想辭典,從而能夠制作符合檢索條件所表示的領(lǐng)域的聯(lián)想辭典(例如參照專利文獻(xiàn)1)。此外,公開了下述聯(lián)想辭典制作裝置,該聯(lián)想辭典制作裝置為了與個人的需求對應(yīng),通過增加從用戶所輸入的檢索關(guān)鍵字和用戶從與其對應(yīng)的多個關(guān)聯(lián)詞候補(bǔ)中選擇的關(guān)聯(lián)詞之間的關(guān)聯(lián)度,能夠制作適應(yīng)于用戶的聯(lián)想辭典(例如參照專利文獻(xiàn)2)。
專利文獻(xiàn)1日本特開平10-134075號公報專利文獻(xiàn)2日本特開2000-348042號公報但是,在以往的制作并利用各領(lǐng)域的聯(lián)想辭典的文本處理裝置中,為了制作各領(lǐng)域的聯(lián)想辭典而需要用戶輸入檢索條件。因此,在制作符合用戶嗜好的領(lǐng)域的聯(lián)想辭典的情況下,用戶為了取得精度較高的聯(lián)想辭典而必須輸入表示領(lǐng)域的最合適的檢索條件。這樣考慮最合適的檢索條件對于用戶來說是非常困難的。例如,頻繁地視聽新聞或文娛信息、經(jīng)濟(jì)市場狀況等信息節(jié)目的用戶,為了獲得符合嗜好的高精度的聯(lián)想辭典,作為檢索條件,不知道輸入“新聞”、“文娛”、“經(jīng)濟(jì)”、“信息”的哪一個為好。
此外,在通過用戶選擇對檢索關(guān)鍵字的關(guān)聯(lián)詞而自動地變更關(guān)聯(lián)度來制作適合于用戶的聯(lián)想辭典的以往的聯(lián)想辭典制作裝置中,用戶在取得適合的辭典之前必須輸入與嗜好匹配的全檢索關(guān)鍵字并選擇與該檢索關(guān)鍵字對應(yīng)的關(guān)聯(lián)詞,直到精度提高,從而用戶的負(fù)擔(dān)較大。例如,在對一個演出者姓名建立關(guān)聯(lián)并保存了多個演出者姓名的聯(lián)想辭典的情況下,為了提高聯(lián)想辭典的精度,用戶必須對多個演出者選擇保存在聯(lián)想辭典中的演出者姓名和從該演出者姓名聯(lián)想到的演出者,用戶的負(fù)擔(dān)較大。
發(fā)明內(nèi)容
所以,本發(fā)明是鑒于上述情況而做出的,目的是提供一種能夠簡單且有效地制作與用戶嗜好相匹配的聯(lián)想辭典的聯(lián)想辭典制作裝置。
為了達(dá)到上述目的,有關(guān)本發(fā)明的聯(lián)想辭典制作裝置是制作聯(lián)想辭典,該聯(lián)想辭典存儲多個單詞間的關(guān)系的聯(lián)想辭典制作裝置,其特征在于,具備單詞選擇機(jī)構(gòu),從表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)詞保存機(jī)構(gòu),根據(jù)保存有作為檢索對象的信息的數(shù)據(jù)庫,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞與上述關(guān)聯(lián)詞建立關(guān)聯(lián),保存到聯(lián)想辭典中。由此,能夠簡單且有效地制作與用戶嗜好相匹配的聯(lián)想辭典。
發(fā)明效果由以上的說明可知,根據(jù)有關(guān)本發(fā)明的聯(lián)想辭典制作裝置,能夠簡單且有效地制作聯(lián)想辭典,該聯(lián)想辭典保存有與用戶嗜好相匹配的單詞。
圖1是表示包括有關(guān)本發(fā)明的實(shí)施方式1的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。
圖2是表示保存在聯(lián)想辭典存儲部中的聯(lián)想辭典的一例的圖。
圖3是表示保存在簡檔(profile)存儲部中的簡檔的一例的圖。
圖4是表示在實(shí)施方式1的信息檢索裝置中制作聯(lián)想辭典時的動作的流程的流程圖。
圖5是表示在實(shí)施方式1的信息檢索裝置中檢索信息時的動作的流程的流程圖。
圖6是表示保存在聯(lián)想辭典存儲部中的聯(lián)想辭典的一例的圖。
圖7是表示包括有關(guān)本發(fā)明的實(shí)施方式2的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。
圖8是表示在實(shí)施方式2的信息檢索裝置中制作聯(lián)想辭典時的動作的流程的流程圖。
圖9是表示保存在聯(lián)想辭典存儲部中的聯(lián)想辭典的一例的圖。
圖10是表示由實(shí)施方式2、4的信息檢索裝置檢索的內(nèi)容的一例的圖。
圖11是表示實(shí)施方式2、4的信息檢索裝置的(a)在顯示部中顯示的內(nèi)容的一例、(b)保存在顯示內(nèi)容存儲部中的內(nèi)容的一例的圖。
圖12是表示實(shí)施方式2、4的信息檢索裝置的(a)在顯示部中顯示的內(nèi)容的一例、(b)保存在顯示內(nèi)容存儲部中的內(nèi)容的一例的圖。
圖13是表示包括有關(guān)本發(fā)明的實(shí)施方式3的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。
圖14是表示在實(shí)施方式3的信息檢索裝置中制作聯(lián)想辭典時的動作的流程的流程圖。
圖15是表示保存在聯(lián)想辭典存儲部中的聯(lián)想辭典的一例的圖。
圖16是表示包括有關(guān)本發(fā)明的實(shí)施方式3的聯(lián)想辭典制作裝置的信息檢索裝置的其他結(jié)構(gòu)的框圖。
圖17是表示包括有關(guān)本發(fā)明的實(shí)施方式4的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。
圖18是表示在實(shí)施方式4的信息檢索裝置中制作聯(lián)想辭典時的動作的流程的流程圖。
符號說明101內(nèi)容存儲部102聯(lián)想辭典存儲部103、201、301、401聯(lián)想辭典制作部104簡檔存儲部105、203、304 單詞選擇部106、305 關(guān)聯(lián)度計(jì)算部107輸入部108聯(lián)想檢索部109檢索條件生成部110檢索部202顯示內(nèi)容存儲部204顯示部205畫面制作部206廣播波接收部302嗜好內(nèi)容提取部303嗜好符合信息存儲部
具體實(shí)施例方式
有關(guān)本發(fā)明的聯(lián)想辭典制作裝置是制作聯(lián)想辭典,該聯(lián)想辭典存儲多個單詞間的關(guān)系的聯(lián)想辭典制作裝置,其特征在于,具備單詞選擇機(jī)構(gòu),從表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)詞保存機(jī)構(gòu),根據(jù)保存有作為檢索對象的信息的數(shù)據(jù)庫,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞與上述關(guān)聯(lián)詞建立關(guān)聯(lián),保存到聯(lián)想辭典中。由此,能夠簡單且有效地制作與用戶嗜好相匹配的聯(lián)想辭典。
這里,上述單詞選擇機(jī)構(gòu)也可以從保存有表示用戶嗜好的信息的簡檔中取得上述表示用戶嗜好的信息。由此,能夠簡單地取得表示用戶嗜好的信息。
此外,上述關(guān)聯(lián)詞保存機(jī)構(gòu)也可以根據(jù)在上述數(shù)據(jù)庫中的出現(xiàn)頻率,分別計(jì)算上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞候補(bǔ)之間的關(guān)聯(lián)度,選擇計(jì)算出的關(guān)聯(lián)度為閾值以上的上述關(guān)聯(lián)詞候補(bǔ),作為與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞。由此,能夠選擇關(guān)聯(lián)度較高的關(guān)聯(lián)詞,能夠制作存儲有關(guān)聯(lián)度較高的關(guān)聯(lián)詞的聯(lián)想辭典。
此外,上述聯(lián)想辭典制作裝置也可以還具備顯示信息提取機(jī)構(gòu),該顯示信息提取機(jī)構(gòu)提取與用戶所閱覽的顯示有關(guān)的信息;上述單詞選擇機(jī)構(gòu)將由上述顯示信息提取機(jī)構(gòu)提取的與上述顯示有關(guān)的信息作為上述表示用戶嗜好的信息,從與上述顯示有關(guān)的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在與上述顯示有關(guān)的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ)。由此,能夠從與用戶所閱覽的顯示有關(guān)的信息中提取表示用戶嗜好的信息。
此外,上述聯(lián)想辭典制作裝置也可以還具備檢索機(jī)構(gòu),該檢索機(jī)構(gòu)從上述數(shù)據(jù)庫中檢索符合檢索條件的信息;上述用戶所閱覽的顯示是信息檢索的結(jié)果;上述顯示信息提取機(jī)構(gòu)提取與上述信息檢索的結(jié)果有關(guān)的信息,作為與上述顯示有關(guān)的信息。由此,能夠從與由用戶進(jìn)行的信息檢索的結(jié)果有關(guān)的信息中取得表示用戶嗜好的信息。
此外,上述顯示信息提取機(jī)構(gòu)也可以從上述信息檢索的結(jié)果中提取在顯示畫面上顯示規(guī)定時間以上的信息,作為與上述顯示有關(guān)的信息。由此,能夠?qū)⒗鐑H以較少的時間顯示的信息等不判斷為由用戶閱覽的信息而將其排除。
此外,上述用戶所閱覽的顯示也可以是播放節(jié)目;上述顯示信息提取機(jī)構(gòu)提取與上述播放節(jié)目有關(guān)的信息,作為與上述顯示有關(guān)的信息。由此,能夠制作適應(yīng)于用戶的視聽行為的聯(lián)想辭典。
此外,上述顯示信息提取機(jī)構(gòu)也可以從上述播放節(jié)目中提取與在顯示畫面上顯示規(guī)定時間以上的播放節(jié)目有關(guān)的信息,作為與上述顯示有關(guān)的信息。由此,能夠?qū)⒗鐑H以較少的時間顯示的播放節(jié)目等不判斷為由用戶視聽的信息而將其排除。
此外,上述聯(lián)想辭典制作裝置也可以還具備嗜好符合信息提取機(jī)構(gòu),該嗜好符合信息提取機(jī)構(gòu)利用保存有表示用戶嗜好的信息的簡檔,從上述數(shù)據(jù)庫中提取符合用戶嗜好的信息,作為嗜好符合信息;上述關(guān)聯(lián)詞保存機(jī)構(gòu)參照從上述數(shù)據(jù)庫中提取的上述嗜好符合信息,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞建立關(guān)聯(lián)并保存到聯(lián)想辭典中。由此,能夠制作使單詞的關(guān)聯(lián)程度適合于用戶的聯(lián)想辭典。
此外,上述單詞選擇機(jī)構(gòu)也可以將由上述嗜好符合信息提取機(jī)構(gòu)提取的上述嗜好符合信息作為上述表示用戶嗜好的信息,從上述嗜好符合信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述嗜好符合信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)。由此,能夠制作僅存儲有符合用戶喜好的單詞的聯(lián)想辭典。
此外,上述單詞選擇機(jī)構(gòu)也可以從保存有表示用戶嗜好的信息的簡檔中取得上述表示用戶嗜好的信息,從上述表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)。由此,能夠制作僅存儲有符合用戶喜好的單詞的聯(lián)想辭典。
此外,上述聯(lián)想辭典制作裝置也可以還具備顯示信息提取機(jī)構(gòu),提取與用戶所閱覽的顯示有關(guān)的信息;嗜好符合信息提取機(jī)構(gòu),利用保存有表示用戶嗜好的信息的簡檔,從上述數(shù)據(jù)庫中提取符合用戶嗜好的信息作為嗜好符合信息;上述單詞選擇機(jī)構(gòu)將由上述顯示信息提取機(jī)構(gòu)提取的與上述顯示有關(guān)的信息作為上述表示用戶嗜好的信息,從與上述顯示有關(guān)的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在與上述顯示有關(guān)的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ);上述關(guān)聯(lián)詞保存機(jī)構(gòu)參照從上述數(shù)據(jù)庫中提取的上述嗜好符合信息,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞建立對應(yīng)并保存到聯(lián)想辭典中。由此,能夠制作聯(lián)想辭典,該聯(lián)想辭典僅存儲與用戶的視聽行為適應(yīng)的單詞,并且單詞的關(guān)聯(lián)程度適應(yīng)于用戶嗜好。
另外,本發(fā)明不僅可以作為這種聯(lián)想辭典制作裝置來實(shí)現(xiàn),也可以作為以這種聯(lián)想辭典制作裝置所具備的特征性機(jī)構(gòu)為步驟的聯(lián)想辭典制作方法來實(shí)現(xiàn),或者作為使計(jì)算機(jī)執(zhí)行這些步驟的程序來實(shí)現(xiàn)。并且,不言而喻,這種程序能夠經(jīng)由CD-ROM等記錄介質(zhì)或因特網(wǎng)等傳送媒體發(fā)送。
下面對本發(fā)明的各實(shí)施方式分別參照附圖進(jìn)行說明。
(實(shí)施方式1)圖1是表示包括有關(guān)本發(fā)明的實(shí)施方式1的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。
該信息檢索裝置是用來制作保存有單詞相互間的關(guān)聯(lián)的聯(lián)想辭典、并且利用聯(lián)想辭典進(jìn)行信息檢索的裝置,如圖1所示,包括內(nèi)容存儲部101、聯(lián)想辭典存儲部102、聯(lián)想辭典制作部103、輸入部107、聯(lián)想檢索部108。
內(nèi)容存儲部101保存有與電視播放節(jié)目有關(guān)的信息及與儲存在硬盤錄制機(jī)等中的內(nèi)容有關(guān)的信息等。
聯(lián)想辭典存儲部102對保存在內(nèi)容存儲部101中的內(nèi)容內(nèi)的多個單詞保存有表示反映了用戶嗜好的單詞間的關(guān)系的聯(lián)想辭典。圖2是表示保存在聯(lián)想辭典存儲部102中的聯(lián)想辭典的一例的圖。在聯(lián)想辭典存儲部102中,例如如圖2所示,將有關(guān)聯(lián)的單詞設(shè)為組的關(guān)聯(lián)詞對(關(guān)聯(lián)詞1、關(guān)聯(lián)詞2)和表示關(guān)聯(lián)詞對的關(guān)聯(lián)程度的關(guān)聯(lián)度建立對應(yīng)并保存,作為(關(guān)聯(lián)詞對、關(guān)聯(lián)度),保存有((松下太郎、松下次郎)、80)、(松下太郎、松下花子)、70)、(松下次郎、松下花子)、90)、(松下次郎、松下三郎)、80)、……。
聯(lián)想辭典制作部103是聯(lián)想辭典制作裝置,該聯(lián)想辭典制作裝置對于保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算從與用戶嗜好有關(guān)的信息即簡檔(profile)提取的單詞對的關(guān)聯(lián)度,將作為計(jì)算對象的單詞對和計(jì)算出的關(guān)聯(lián)度建立對應(yīng)并保存在聯(lián)想辭典存儲部102中,具備簡檔存儲部104、單詞選擇部105、以及關(guān)聯(lián)度計(jì)算部106。
簡檔存儲部104保存有與用戶嗜好有關(guān)的信息即簡檔。作為一例,在簡檔中包含有用戶喜好的內(nèi)容所屬的類型、喜好的標(biāo)題及演出者、視聽時間等,保存有與各個數(shù)據(jù)(類型、標(biāo)題、演出者、視聽時間等)建立了對應(yīng)的表示喜好程度的權(quán)重值等。圖3是表示保存在簡檔存儲部104中的簡檔的一例的圖。在簡檔中,例如如圖3所示,將表示數(shù)據(jù)的種類的標(biāo)記、數(shù)據(jù)、和表示用戶對數(shù)據(jù)的喜好程度的權(quán)重值建立對應(yīng)并存儲,作為(標(biāo)記、數(shù)據(jù)、權(quán)重值),保存有((<演出者姓名>、松下太郎、90)、(<演出者姓名>、松下次郎、85)、(<演出者姓名>、松下三郎、80)、(<演出者姓名>、松下花子、80)、(<類型>、電視劇、90)、(<播放時間>、12:00~13:00、90)、……)。
單詞選擇部105每到規(guī)定的時間就從保存在簡檔存儲部104中的簡檔中選擇單詞,作為關(guān)聯(lián)詞探索單詞,再選擇包含在簡檔中的除關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ)。作為一例,單詞選擇部105從保存在簡檔存儲部104中的圖3的簡檔中選擇數(shù)據(jù)作為關(guān)聯(lián)詞探索單詞,再選擇包含在簡檔中的除關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ)。此外,也可以僅將權(quán)重值為規(guī)定的閾值以上的數(shù)據(jù)作為對象,設(shè)置關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)。
關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞設(shè)為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存在聯(lián)想辭典存儲部102中。這里,作為關(guān)聯(lián)度的計(jì)算方法,例如有利用相互信息量(MI)的方法。具體而言,如果設(shè)包含有單詞W1和單詞W2的內(nèi)容數(shù)為a、不包含單詞W1而包含單詞W2的內(nèi)容數(shù)為b、包含單詞W1而不包含單詞W2的內(nèi)容數(shù)為c、不包含單詞W1和單詞W2兩者的內(nèi)容數(shù)為d、總內(nèi)容數(shù)為N(=a+b+c+d),則可以通過MI=log2(aN/((a+b)(a+c))求出。此外,作為一般的關(guān)聯(lián)度的計(jì)算方法,也有利用Dice-coefficient、加權(quán)Dice-coefficient、t-score、χ平方值、對數(shù)似然比等的方法。此外,關(guān)聯(lián)度計(jì)算部106也可以參照保存在內(nèi)容存儲部101中的內(nèi)容,分別對由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞,將單詞的前后文本分解為詞素或單詞,生成以詞素或單詞的有無、出現(xiàn)次數(shù)、和將出現(xiàn)頻率(tf值)與idf(inverse document frequency逆文本頻率)值相乘后的tfi·idf值等為成分的矢量,計(jì)算關(guān)聯(lián)詞探索單詞的矢量與關(guān)聯(lián)詞候補(bǔ)的各單詞的矢量間的余弦距離或歐幾里得距離的倒數(shù)等,作為關(guān)聯(lián)度。
輸入部107包括鍵盤及鼠標(biāo)、遙控器等輸入裝置,用戶輸入包括檢索關(guān)鍵字的檢索條件及輸入數(shù)據(jù)。
聯(lián)想檢索部108是下述處理部從聯(lián)想辭典存儲部102取得從輸入部107輸入的檢索條件和與包含在檢索條件中的檢索關(guān)鍵字相關(guān)聯(lián)的關(guān)聯(lián)詞,生成檢索擴(kuò)展條件,從內(nèi)容存儲部101取得與檢索擴(kuò)展條件匹配的內(nèi)容,作為檢索結(jié)果進(jìn)行輸出,該聯(lián)想檢索部108具備檢索條件生成部109及檢索部110。
檢索條件生成部109從聯(lián)想辭典存儲部102取得以規(guī)定的閾值以上的關(guān)聯(lián)度與包含在從輸入部107輸入的檢索條件中的檢索關(guān)鍵字建立了對應(yīng)的關(guān)聯(lián)詞,根據(jù)所取得的關(guān)聯(lián)詞和檢索關(guān)鍵字生成檢索擴(kuò)展條件。
檢索部110從內(nèi)容存儲部101取得與由檢索條件生成部109生成的檢索條件匹配的內(nèi)容,作為檢索結(jié)果。
在這樣構(gòu)成的本實(shí)施方式的信息檢索裝置中,對于制作聯(lián)想辭典時的動作例進(jìn)行說明。圖4是表示制作聯(lián)想辭典時的動作的流程的流程圖。
單詞選擇部105每到規(guī)定的時間就從保存在簡檔存儲部104中的簡檔中選擇單詞,作為關(guān)聯(lián)詞探索單詞,再選擇包含在簡檔中的除關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ)(步驟S101)。作為具體的一例,單詞選擇部105每隔作為規(guī)定的時間的1周,從保存在簡檔存儲部104中的圖3的簡檔中,將單詞“松下太郎、松下次郎、……”作為關(guān)聯(lián)詞探索單詞,再對于關(guān)聯(lián)詞探索單詞“松下太郎”,將包含在圖3的簡檔中的除關(guān)聯(lián)詞探索單詞“松下太郎”以外的單詞“松下次郎、松下三郎、松下花子、電視劇、12:00~13:00、……”作為關(guān)聯(lián)詞候補(bǔ),同樣,對于其他關(guān)聯(lián)詞探索單詞“松下次郎、松下三郎、……”也選擇關(guān)聯(lián)詞候補(bǔ)。
關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度(步驟S102),判斷關(guān)聯(lián)度是否比規(guī)定的閾值大(步驟S103)。結(jié)果,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下(步驟S103中的“是”),將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將該關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中(步驟S104)。另一方面,在關(guān)聯(lián)度為規(guī)定的閾值以下的情況下(步驟S103中的“否”),什么處理都不進(jìn)行。對包含在關(guān)聯(lián)詞候補(bǔ)中的所有單詞進(jìn)行這些處理(步驟S102~步驟S104)(步驟S105),再對所有的關(guān)聯(lián)詞探索單詞進(jìn)行這些處理(步驟S102~步驟S105)(步驟S106)。在上述的例子中,關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,對于由單詞選擇部105選擇的各個關(guān)聯(lián)詞探索單詞“松下太郎、松下次郎、……”,計(jì)算與各個關(guān)聯(lián)詞候補(bǔ)“松下次郎、松下三郎、松下花子、電視劇、12:00~13:00、……”、“松下太郎、松下三郎、松下花子、電視劇、12:00~13:00、……”、……的各單詞之間的關(guān)聯(lián)度。作為一例,計(jì)算出(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)為(松下太郎、松下次郎、80)、(松下太郎、松下三郎、40)、(松下太郎、松下花子、70)、(松下太郎、電視劇、20)、(松下太郎、12:00~13:00、30)、(松下次郎、松下太郎、80)、(松下次郎、松下三郎、80)、(松下次郎、松下花子、90)、(松下次郎、電視劇、10)、(松下次郎、12:00~13:00、40)、……,將關(guān)聯(lián)度比規(guī)定的閾值(作為一例而設(shè)為50)大的(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)保存到聯(lián)想辭典存儲部102中。此時的聯(lián)想辭典存儲部102的內(nèi)容如圖2所示。
接著,說明在本實(shí)施方式的信息檢索裝置中檢索信息時的動作例。圖5是表示檢索信息時的動作的流程的流程圖。
檢索條件生成部109受理由用戶從輸入部107輸入的檢索條件(步驟S201)。在上述的例子中,作為一例,假設(shè)由用戶從輸入部107輸入了檢索條件“松下太郎的節(jié)目”。
接著,檢索條件生成部109從聯(lián)想辭典存儲部102取得以規(guī)定的閾值以上的關(guān)聯(lián)度與包含在從輸入部107輸入的檢索條件中的檢索關(guān)鍵字建立了對應(yīng)的關(guān)聯(lián)詞(步驟S202)。接著,檢索條件生成部109根據(jù)所取得的關(guān)聯(lián)詞和檢索關(guān)鍵字,生成檢索擴(kuò)展條件(步驟S203)。在上述的例子中,檢索條件生成部109從聯(lián)想辭典存儲部102取得以規(guī)定的閾值(作為一例設(shè)規(guī)定的閾值為75)以上的關(guān)聯(lián)度與包含在從輸入部107輸入的檢索條件“松下太郎的節(jié)目”中的檢索關(guān)鍵字“松下太郎”建立了對應(yīng)的關(guān)聯(lián)詞“松下次郎”,生成檢索擴(kuò)展條件“松下太郎+松下次郎”,該檢索擴(kuò)展條件“松下太郎+松下次郎”表示包含有所取得的關(guān)聯(lián)詞“松下次郎”或檢索關(guān)鍵字“松下太郎”的任一個。
檢索部110從內(nèi)容存儲部101取得與由檢索條件生成部109生成的檢索條件匹配的內(nèi)容,作為檢索結(jié)果(步驟S204)。在上述的例子中,檢索部110根據(jù)由檢索條件生成部109生成的檢索條件“松下太郎+松下次郎”,從內(nèi)容存儲部101中取得包含有“松下太郎”或“松下次郎”的任一個關(guān)鍵字的內(nèi)容,作為檢索結(jié)果。
另外,在本實(shí)施方式中,單詞選擇部105每隔規(guī)定的時間從保存在簡檔存儲部104中的簡檔中選擇關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ),但也可以不是每隔規(guī)定的時間,而是每當(dāng)更新簡檔時選擇關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)。通過這樣,能夠在用戶嗜好變化時不產(chǎn)生時間差地取得關(guān)聯(lián)詞對。
此外,在本實(shí)施方式中,關(guān)聯(lián)度計(jì)算部106對由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的所有單詞,計(jì)算關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中,但并不限于此。例如,關(guān)聯(lián)度計(jì)算部106也可以在計(jì)算由單詞選擇部105新選擇的關(guān)聯(lián)詞對和其關(guān)聯(lián)度時,在使存儲在聯(lián)想辭典存儲部102中的所有關(guān)聯(lián)度都衰減后,在聯(lián)想辭典存儲部102中已經(jīng)存在與新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對相同的關(guān)聯(lián)詞對的情況下,通過將已經(jīng)存儲在聯(lián)想辭典存儲部102中的關(guān)聯(lián)度和由關(guān)聯(lián)度計(jì)算部106新求出的關(guān)聯(lián)度相加來更新。在此情況下,在關(guān)聯(lián)度計(jì)算部106中,在作為(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)而新計(jì)算出(松下太郎、松下次郎、60)的情況下,將存儲在圖2所示的聯(lián)想辭典存儲部102中的關(guān)聯(lián)度乘以衰減參數(shù)(作為一例為0.8)而使其衰減,將已經(jīng)存在的關(guān)聯(lián)詞對(松下太郎、松下次郎)的衰減后的關(guān)聯(lián)度64與新求出的關(guān)聯(lián)度60相加后的值124作為關(guān)聯(lián)詞對(松下太郎、松下次郎)的關(guān)聯(lián)度,保存到聯(lián)想辭典存儲部102中。結(jié)果,聯(lián)想辭典存儲部102的內(nèi)容如圖6所示那樣被更新。通過這樣,能夠得到考慮到對過去的內(nèi)容的關(guān)聯(lián)度的關(guān)聯(lián)度,能夠提高關(guān)聯(lián)度的精度。
此外,例如也可以對由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的所有單詞,計(jì)算關(guān)聯(lián)度,不論關(guān)聯(lián)度是否比規(guī)定的閾值大,都將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。另外,如本實(shí)施方式那樣,如果在關(guān)聯(lián)度比規(guī)定的閾值大的情況下將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并存儲到聯(lián)想辭典存儲部102中,則能夠減小存儲容量。
如上所述,根據(jù)本實(shí)施方式,通過從表示用戶嗜好的信息即簡檔中選擇保存在聯(lián)想辭典中的單詞,能夠制作僅保存符合用戶喜好的單詞的聯(lián)想辭典。進(jìn)而,在用戶檢索內(nèi)容時,通過利用該制作的聯(lián)想辭典,能夠利用符合用戶嗜好的單詞進(jìn)行檢索條件的擴(kuò)展。由此,能夠使擴(kuò)展后的檢索結(jié)果符合用戶嗜好。
(實(shí)施方式2)圖7是表示包括有關(guān)本發(fā)明的實(shí)施方式2的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。這里,與實(shí)施方式1相同標(biāo)號的結(jié)構(gòu)要素進(jìn)行相同的動作,省略對它們的詳細(xì)的說明。
本實(shí)施方式的信息檢索裝置是用來制作保存有單詞相互間的關(guān)聯(lián)的聯(lián)想辭典、并且利用聯(lián)想辭典進(jìn)行信息檢索的裝置,如圖7所示,包括內(nèi)容存儲部101、聯(lián)想辭典存儲部102、輸入部107、聯(lián)想檢索部108、聯(lián)想辭典制作部201、顯示部204、畫面制作部205、以及廣播波接收部206。
顯示部204具有CRT顯示器、液晶顯示器(LCD)、等離子顯示器(PDP)等,是顯示所輸入的顯示畫面信息的設(shè)備。廣播波接收部206經(jīng)由天線207接收電視播放節(jié)目等內(nèi)容。
畫面制作部205將由檢索部110檢索到的檢索結(jié)果變換為顯示畫面信息,將顯示畫面信息輸出給顯示部204,并且將由廣播波接收部206接收到的電視播放節(jié)目等內(nèi)容輸出給顯示部204。進(jìn)而,畫面制作部205提取與由檢索部110檢索到的檢索結(jié)果有關(guān)的文本信息及與顯示在顯示部204上的電視播放節(jié)目等內(nèi)容有關(guān)的信息,作為與顯示有關(guān)的信息,保存到顯示內(nèi)容存儲部202中。
聯(lián)想辭典制作部201是下述聯(lián)想辭典制作裝置對于保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算從所顯示的檢索結(jié)果提取的單詞對的關(guān)聯(lián)度,將作為計(jì)算對象的單詞對和計(jì)算出的關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中,該聯(lián)想辭典制作部201具備顯示內(nèi)容存儲部202、單詞選擇部203、以及關(guān)聯(lián)度計(jì)算部106。
顯示內(nèi)容存儲部202存儲與顯示的檢索結(jié)果有關(guān)的文本信息及與顯示的內(nèi)容有關(guān)的信息、即與顯示有關(guān)的信息。單詞選擇部203每當(dāng)在顯示內(nèi)容存儲部202中保存新的文本信息時,通過對該文本信息進(jìn)行詞素解析等來提取單詞,從該提取的單詞選擇單詞,作為關(guān)聯(lián)詞探索單詞,再在提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)的多個組。
關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算由單詞選擇部203選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞做成關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。這里,作為關(guān)聯(lián)度的計(jì)算方法,采用與實(shí)施方式1同樣的方法。
說明在這樣構(gòu)成的本實(shí)施方式的信息檢索裝置中制作聯(lián)想辭典時的動作例。圖8是表示制作聯(lián)想辭典時的動作的流程的流程圖。
這里,畫面制作部205設(shè)為將由檢索部110檢索到的檢索結(jié)果變換為顯示畫面信息,將顯示畫面信息輸出給顯示部204,或者將由廣播波接收部206接收到的電視播放節(jié)目的內(nèi)容輸出給顯示部204。作為一例,在顯示檢索結(jié)果的情況下,假設(shè)由用戶輸入檢索條件“松下太郎的節(jié)目”,檢索結(jié)果為“松下太郎”演出的動畫內(nèi)容和動畫內(nèi)容的說明即文本“演出松下太郎、松下花子、松下三郎”。另一方面,在顯示電視播放節(jié)目等內(nèi)容的情況下,假設(shè)作為有關(guān)內(nèi)容的文本信息而顯示具有“演出松下次郎、松下花代”的內(nèi)容。
首先,畫面制作部205在顯示由檢索部110檢索的檢索結(jié)果的情況下,將有關(guān)檢索結(jié)果的文本信息作為與顯示有關(guān)的信息保存到顯示內(nèi)容存儲部202中,在顯示由廣播波接收部206接收到的內(nèi)容的情況下,將有關(guān)內(nèi)容的文本信息作為與顯示有關(guān)的信息保存到顯示內(nèi)容存儲部202中(步驟S301)。另外,在顯示由廣播波接收部206接收到的內(nèi)容的情況下,也可以是如果顯示了規(guī)定時間(例如10分鐘等)以上,則將有關(guān)內(nèi)容的文本信息保存到顯示內(nèi)容存儲部202中。在顯示上述例子的檢索結(jié)果的情況下,畫面制作部205將由檢索部110檢索到的“松下太郎”演出的動畫內(nèi)容的說明即文本“演出松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中。此外,在顯示上述例子的由廣播波接收部206接收到的內(nèi)容的情況下,將“演出松下次郎、松下花代”保存到顯示內(nèi)容存儲部202中。
從畫面制作部205將文本信息保存到顯示內(nèi)容存儲部202中后,單詞選擇部203通過對該文本信息進(jìn)行詞素解析等而提取單詞,從該提取的單詞中選擇單詞作為關(guān)聯(lián)詞探索單詞,再在所提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)的多個組(步驟S302)。例如,在將文本“演出松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中的情況下,單詞選擇部203通過對“演出松下太郎、松下花子、松下三郎”進(jìn)行詞素解析,提取例如表示姓名的單詞“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作為(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))。
關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,計(jì)算由單詞選擇部105選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度(步驟S303),判斷關(guān)聯(lián)度是否比規(guī)定的閾值大(步驟S304)。在其結(jié)果為關(guān)聯(lián)度比規(guī)定的閾值大的情況下(步驟S304中的“是”),將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將該關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中(步驟S305)。這里,新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對由于有1個單詞作為關(guān)聯(lián)詞探索單詞的情況和作為關(guān)聯(lián)詞候補(bǔ)的單詞的情況,所以會發(fā)生重復(fù),在省略了該重復(fù)后保存到聯(lián)想辭典存儲部102中。另一方面,在關(guān)聯(lián)度為規(guī)定的閾值以下的情況下(步驟S304中的“否”),不進(jìn)行任何處理。對包含在關(guān)聯(lián)詞候補(bǔ)中的所有單詞進(jìn)行這些處理(步驟S303~步驟S305)(步驟S306)。再對所有關(guān)聯(lián)詞探索單詞進(jìn)行這些處理(步驟S303~步驟S306)(步驟S307)。在上述的例子中,關(guān)聯(lián)度計(jì)算部106參照保存在內(nèi)容存儲部101中的內(nèi)容,對于由單詞選擇部105選擇的(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))的組即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),計(jì)算各個關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的各單詞之間的關(guān)聯(lián)度。作為一例,計(jì)算(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)為(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),將關(guān)聯(lián)度比規(guī)定的閾值(作為一例而設(shè)為50)大的(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)加到將保存在圖2所示的聯(lián)想辭典存儲部102中的關(guān)聯(lián)度乘以衰減參數(shù)(作為一例為0.8)而衰減后的聯(lián)想辭典存儲部102中。此情況的聯(lián)想辭典存儲部102的內(nèi)容成為圖9所示那樣。
另外,在本實(shí)施方式中,關(guān)聯(lián)度計(jì)算部106在更新聯(lián)想辭典存儲部102時,在將存儲在聯(lián)想辭典存儲部102中的所有關(guān)聯(lián)度衰減后,在聯(lián)想辭典存儲部102中已經(jīng)存在與新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對相同的關(guān)聯(lián)詞對的情況下,將已經(jīng)保存在聯(lián)想辭典存儲部102中的關(guān)聯(lián)度與由關(guān)聯(lián)度計(jì)算部106新求出的關(guān)聯(lián)度相加而進(jìn)行更新,但并不限于此。例如,關(guān)聯(lián)度計(jì)算部106也可以將新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對原樣與關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。
此外,在本實(shí)施方式中檢索了動畫內(nèi)容,但并不限于此,也可以是超文本或因特網(wǎng)上的WEB頁。在此情況下,畫面制作部205將由檢索部110檢索到的超文本或WEB頁的顯示文本保存到顯示內(nèi)容存儲部202中,再將檢索到的超文本或WEB頁的文本變換為顯示畫面信息,將顯示畫面信息輸出給顯示部204。作為具體的一例,在由檢索部110檢測到由圖10所示的HTML語言記述的文件“name.html”的情況下,畫面制作部205從文件“name.html”將圖11(b)所示的顯示文本“松下太郎、松下花子、松下三郎、松下次郎”保存到顯示內(nèi)容存儲部202中,再將文件“name.html”變換為顯示畫面信息,在顯示部204上如圖11(a)所示那樣輸出顯示畫面信息。進(jìn)而,在顯示部204上沒有顯示全部文本的情況下,畫面制作部205也可以僅將顯示的文本保存到顯示內(nèi)容存儲部202中。在上述的實(shí)施例中,在作為一例而如圖12(a)所示那樣顯示由圖10的HTML語言記述的文件“name.html”的情況下,畫面制作部205如圖12(b)所示那樣僅將顯示文本“松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中。通過這樣,能夠僅根據(jù)從用戶視聽到的內(nèi)容的文本提取的單詞來制作聯(lián)想辭典,能夠制作適應(yīng)于用戶的視聽行為的聯(lián)想辭典。此外,畫面制作部205也可以將在顯示部204上顯示了規(guī)定時間以上的文本作為顯示的文本來處理。由此,能夠去除僅在滾動時顯示而沒有被用戶閱覽的文本。
此外,畫面制作部205將與由檢索部110檢索的內(nèi)容有關(guān)的文本信息保存在顯示內(nèi)容存儲部202中,但在內(nèi)容為動畫內(nèi)容且存在與動畫內(nèi)容的各場景或每個幀對應(yīng)的文本的情況下,畫面制作部205也可以僅將與用戶視聽的動畫內(nèi)容的場景或幀對應(yīng)的文本保存到顯示內(nèi)容存儲部202中。通過這樣,能夠僅根據(jù)與用戶視聽的動畫內(nèi)容的場景或幀對應(yīng)的文本制作聯(lián)想辭典,能夠?qū)τ趧赢媰?nèi)容制作適應(yīng)于用戶的視聽行為的高精度的聯(lián)想辭典。
如上所述,根據(jù)本實(shí)施方式,通過從與用戶視聽的內(nèi)容有關(guān)的文本中選擇保存到聯(lián)想辭典中的單詞,能夠制作適應(yīng)于用戶的視聽行為的聯(lián)想辭典。進(jìn)而,用戶在檢索內(nèi)容時通過利用該制作的聯(lián)想辭典,能夠利用與用戶的視聽行為相匹配的單詞進(jìn)行檢索條件的擴(kuò)展。由此,能夠使擴(kuò)展后的檢索結(jié)果適應(yīng)于用戶的視聽行為。
(實(shí)施方式3)圖13是表示包括有關(guān)本發(fā)明的實(shí)施方式3的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。這里,與實(shí)施方式1相同標(biāo)號的結(jié)構(gòu)要素進(jìn)行相同的動作,省略對它們的詳細(xì)的說明。
本實(shí)施方式的信息檢索裝置是用來制作保存有單詞相互間的關(guān)聯(lián)的聯(lián)想辭典、并且利用聯(lián)想辭典進(jìn)行信息檢索的裝置,如圖13所示,包括內(nèi)容存儲部101、聯(lián)想辭典存儲部102、輸入部107、聯(lián)想檢索部108、以及聯(lián)想辭典制作部301。
聯(lián)想辭典制作部301是下述聯(lián)想辭典制作裝置從保存在內(nèi)容存儲部101中的內(nèi)容中提取嗜好符合信息作為有關(guān)與用戶嗜好匹配的內(nèi)容的文本,再對嗜好符合信息計(jì)算從嗜好符合信息提取的單詞對的相關(guān)度,將作為計(jì)算對象的單詞對和計(jì)算出的關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中,該聯(lián)想辭典制作部301具備簡檔存儲部104、嗜好內(nèi)容提取部302、嗜好符合信息存儲部303、單詞選擇部304、以及關(guān)聯(lián)度計(jì)算部305。
嗜好符合信息存儲部303保存有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息。嗜好內(nèi)容提取部302從保存在內(nèi)容存儲部101中的內(nèi)容中,利用保存在簡檔存儲部104中的與用戶嗜好有關(guān)的信息即簡檔,提取有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息,保存到嗜好符合信息存儲部303中。
單詞選擇部304對于保存在嗜好符合信息存儲部303中的嗜好符合信息,通過進(jìn)行詞素解析等提取單詞,從該提取的單詞中選擇單詞作為關(guān)聯(lián)詞探索單詞,再在所提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)的多個組。
關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,計(jì)算由單詞選擇部304選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。這里,作為關(guān)聯(lián)度的計(jì)算方法,采用與實(shí)施方式1同樣的方法。
說明在這樣構(gòu)成的本實(shí)施方式的信息檢索裝置中制作聯(lián)想辭典時的動作例。圖14是表示制作聯(lián)想辭典時的動作的流程的流程圖。
嗜好內(nèi)容提取部302從保存在內(nèi)容存儲部101中的內(nèi)容中,利用保存在簡檔存儲部104中的例如圖3所示那樣的簡檔,提取有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息,保存到嗜好符合信息存儲部303中(步驟S401)。作為具體的一例,嗜好內(nèi)容提取部302從簡檔存儲部104取得(標(biāo)記、數(shù)據(jù)、權(quán)重值),在文本中包含有數(shù)據(jù)的關(guān)鍵字的情況下,分別對有關(guān)保存在內(nèi)容存儲部101中的各內(nèi)容的各文本,加上對該關(guān)鍵字的權(quán)重,在該加法的結(jié)果超過了規(guī)定的閾值的情況下,將超過了該閾值的文本保存到嗜好符合信息存儲部303中。作為一例,嗜好內(nèi)容提取部302從內(nèi)容存儲部101中提取文本“類型電視劇,演出松下太郎、松下花子、松下三郎”,作為嗜好符合信息保存到嗜好符合信息存儲部303中。
單詞選擇部304通過對保存在嗜好符合信息存儲部303中的嗜好符合信息進(jìn)行詞素解析等而提取單詞,從該提取的單詞中選擇單詞作為關(guān)聯(lián)詞探索單詞,再在提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)的多個組(步驟S402)。在上述的例子中,單詞選擇部304通過對保存在嗜好符合信息存儲部303中的文本“類型電視劇,演出松下太郎、松下花子、松下三郎”進(jìn)行詞素解析,提取例如表示姓名的“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作為(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))。
關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,計(jì)算由單詞選擇部304選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度(步驟S403),判斷關(guān)聯(lián)度是否比規(guī)定的閾值大(步驟S404)。在其結(jié)果為關(guān)聯(lián)度比規(guī)定的閾值大的情況下(步驟S404中的“是”),將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將該關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中(步驟S405)。這里,新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對由于有1個單詞作為關(guān)聯(lián)詞探索單詞的情況和作為關(guān)聯(lián)詞候補(bǔ)的單詞的情況,所以會發(fā)生重復(fù),在省略了該重復(fù)后保存到聯(lián)想辭典存儲部102中。另一方面,在關(guān)聯(lián)度為規(guī)定的閾值以下的情況下(步驟S404中的“否”),不進(jìn)行任何處理。對包含在關(guān)聯(lián)詞候補(bǔ)中的所有單詞進(jìn)行這些處理(步驟S403~步驟S405)(步驟S406)。再對所有關(guān)聯(lián)詞探索單詞進(jìn)行這些處理(步驟S403~步驟S406)(步驟S407)。在上述的例子中,關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,對于由單詞選擇部304選擇的(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))的組即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),計(jì)算各個關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的各單詞之間的關(guān)聯(lián)度。作為一例,計(jì)算(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)為(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),將關(guān)聯(lián)度比規(guī)定的閾值(作為一例而設(shè)為50)大的(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)保存在聯(lián)想辭典存儲部102中。此情況的聯(lián)想辭典存儲部102的內(nèi)容成為圖15所示那樣。
此外,對于檢索信息時的動作,由于與實(shí)施方式1相同,所以省略它們的詳細(xì)的說明。
另外,在本實(shí)施方式中,關(guān)聯(lián)度計(jì)算部305對由單詞選擇部304選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的所有單詞計(jì)算關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中,但并不限于此。例如,關(guān)聯(lián)度計(jì)算部305也可以在新計(jì)算出由單詞選擇部304選擇的關(guān)聯(lián)詞對和其關(guān)聯(lián)度時,在使保存在聯(lián)想辭典存儲部102中的所有關(guān)聯(lián)度衰減后,在聯(lián)想辭典存儲部102中已經(jīng)存在與新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對相同的關(guān)聯(lián)詞對的情況下,通過將已經(jīng)存儲在聯(lián)想辭典存儲部102中的關(guān)聯(lián)度和由關(guān)聯(lián)度計(jì)算部106新求出的關(guān)聯(lián)度相加來更新。在此情況下,關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,對于由單詞選擇部304選擇的(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))的組即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),計(jì)算各個關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的各單詞之間的關(guān)聯(lián)度。作為一例,計(jì)算(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)為(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),將關(guān)聯(lián)度比規(guī)定的閾值(作為一例而設(shè)為50)大的(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)加到將保存在圖2所示的聯(lián)想辭典存儲部102中的關(guān)聯(lián)度乘以衰減參數(shù)(作為一例為0.8)而衰減后的聯(lián)想辭典存儲部102中。此情況下的聯(lián)想辭典存儲部102的內(nèi)容成為圖9所示那樣。通過這樣,能夠得到考慮到對過去的內(nèi)容的關(guān)聯(lián)度的關(guān)聯(lián)度,能夠提高關(guān)聯(lián)度的精度。
此外,在本實(shí)施方式中,單詞選擇部304從嗜好符合信息存儲部303中選擇關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ),但也可以例如像圖16所示那樣,與實(shí)施方式1同樣地從簡檔存儲部104選擇關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)。進(jìn)而,也可以僅以權(quán)重值為特定的閾值以上的數(shù)據(jù)為對象,作為關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)。通過這樣,由于僅將強(qiáng)烈地反映了用戶嗜好的數(shù)據(jù)保存到聯(lián)想辭典存儲部102中,所以能夠使用戶嗜好更強(qiáng)烈地反映在保存于聯(lián)想辭典存儲部102中的單詞中。
如上所述,根據(jù)本實(shí)施方式,能夠制作聯(lián)想辭典,該聯(lián)想辭典從與用戶嗜好匹配的內(nèi)容中選擇保存到聯(lián)想辭典中的單詞,并且通過也計(jì)算關(guān)聯(lián)程度,僅保存與用戶喜好相匹配的單詞,并且單詞的關(guān)聯(lián)程度也適應(yīng)于用戶。進(jìn)而,用戶在檢索內(nèi)容時,通過利用該制作的聯(lián)想辭典,能夠進(jìn)行與用戶嗜好相匹配的聯(lián)想,利用與用戶嗜好相匹配的單詞進(jìn)行檢索條件的擴(kuò)展。
(實(shí)施方式4)圖17是表示包括有關(guān)本發(fā)明的實(shí)施方式4的聯(lián)想辭典制作裝置的信息檢索裝置的結(jié)構(gòu)的框圖。這里,與實(shí)施方式1~3相同標(biāo)號的結(jié)構(gòu)要素進(jìn)行相同的動作,省略對它們的詳細(xì)的說明。
本實(shí)施方式的信息檢索裝置是用來制作保存有單詞相互間的關(guān)聯(lián)的聯(lián)想辭典、并且利用聯(lián)想辭典進(jìn)行信息檢索的裝置,如圖17所示,包括內(nèi)容存儲部101、聯(lián)想辭典存儲部102、輸入部107、聯(lián)想檢索部108、顯示部204、畫面制作部205、廣播波接收部206、以及聯(lián)想辭典制作部401。
聯(lián)想辭典制作部401是下述聯(lián)想辭典制作裝置從保存在內(nèi)容存儲部101中的內(nèi)容中提取嗜好符合信息作為有關(guān)與用戶嗜好匹配的內(nèi)容的文本,再對嗜好符合信息計(jì)算從所顯示的檢索結(jié)果中提取的單詞對的相關(guān)度,將作為計(jì)算對象的單詞對和計(jì)算出的關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中,該聯(lián)想辭典制作部401具備簡檔存儲部104、嗜好內(nèi)容提取部302、嗜好符合信息存儲部303、顯示內(nèi)容存儲部202、單詞選擇部203、以及關(guān)聯(lián)度計(jì)算部305。
嗜好符合信息存儲部303保存有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息。嗜好內(nèi)容提取部302從保存在內(nèi)容存儲部101中的內(nèi)容中,利用保存在簡檔存儲部104中的與用戶嗜好有關(guān)的信息即簡檔,提取有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息,保存到嗜好符合信息存儲部303中。
顯示內(nèi)容存儲部202存儲與所顯示的檢索結(jié)果有關(guān)的文本信息及與所顯示的內(nèi)容有關(guān)的信息、即與顯示有關(guān)的信息。單詞選擇部203每當(dāng)在顯示內(nèi)容存儲部202中新保存文本信息時,通過對該文本信息進(jìn)行詞素解析等來提取單詞,從該提取的單詞選擇單詞作為關(guān)聯(lián)詞探索單詞,再在提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞為關(guān)聯(lián)詞候補(bǔ)的多個組。
關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,計(jì)算由單詞選擇部304選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。這里,作為關(guān)聯(lián)度的計(jì)算方法,采用與實(shí)施方式1同樣的方法。
說明在這樣構(gòu)成的本實(shí)施方式的信息檢索裝置中制作聯(lián)想辭典時的動作例進(jìn)行。圖18是表示制作聯(lián)想辭典時的動作的流程的流程圖。
這里,畫面制作部205與實(shí)施方式2同樣,將由檢索部110檢索到的檢索結(jié)果變換為顯示畫面信息,將顯示畫面信息輸出給顯示部204,并且將由廣播波接收部206接收到的電視播放節(jié)目等內(nèi)容輸出給顯示部204。作為一例,在顯示檢索結(jié)果的情況下,假設(shè)由用戶輸入檢索條件“松下太郎的節(jié)目”,檢索結(jié)果為“松下太郎”演出的動畫內(nèi)容和動畫內(nèi)容的說明即文本“演出松下太郎、松下花子、松下三郎”。另一方面,在顯示電視播放節(jié)目等內(nèi)容的情況下,假設(shè)顯示具有“演出松下次郎、松下花代”的內(nèi)容,作為有關(guān)內(nèi)容的文本信息。
首先,畫面制作部205與實(shí)施方式2同樣,在顯示由檢索部110檢索的檢索結(jié)果的情況下,將有關(guān)檢索結(jié)果的文本信息作為有關(guān)顯示的信息保存到顯示內(nèi)容存儲部202中,在顯示由廣播波接收部206接收到的內(nèi)容的情況下,將有關(guān)內(nèi)容的文本信息作為有關(guān)顯示的信息保存到顯示內(nèi)容存儲部202中(步驟S501)。另外,在顯示由廣播波接收部206接收到的內(nèi)容的情況下,也可以是如果顯示了規(guī)定時間(例如10分鐘等)以上,則將有關(guān)內(nèi)容的文本信息保存到顯示內(nèi)容存儲部202中。在顯示上述例子的檢索結(jié)果的情況下,畫面制作部205將由檢索部110檢索到的“松下太郎”演出的動畫內(nèi)容的說明即文本“演出松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中。此外,在顯示上述例子的由廣播波接收部206接收到的內(nèi)容的情況下,將“演出松下次郎、松下花代”保存到顯示內(nèi)容存儲部202中。
接著,嗜好內(nèi)容提取部302與實(shí)施方式3同樣,從保存在內(nèi)容存儲部101中的內(nèi)容中,利用保存在簡檔存儲部104中的例如圖3所示那樣的簡檔,提取有關(guān)與用戶嗜好匹配的內(nèi)容的文本即嗜好符合信息,保存到嗜好符合信息存儲部303中(步驟S502)。作為具體的一例,嗜好內(nèi)容提取部302從簡檔存儲部104取得(標(biāo)記、數(shù)據(jù)、權(quán)重值),在文本中包含有數(shù)據(jù)的關(guān)鍵字的情況下,分別對與保存在內(nèi)容存儲部101中的各內(nèi)容有關(guān)的各文本加上對該關(guān)鍵字的權(quán)重,在該加法的結(jié)果超過了規(guī)定的閾值的情況下,將超過了該閾值的文本保存到嗜好符合信息存儲部303中。作為一例,嗜好內(nèi)容提取部302從內(nèi)容存儲部101中提取文本“類型電視劇,演出松下太郎、松下花子、松下三郎”,作為嗜好符合信息保存到嗜好符合信息存儲部303中。
從畫面制作部205將文本信息保存到顯示內(nèi)容存儲部202中后,單詞選擇部203通過對該文本信息進(jìn)行詞素解析等而提取單詞,從該提取的單詞中選擇單詞作為關(guān)聯(lián)詞探索單詞,再在提取的單詞中生成以除關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)的多個組(步驟S503)。例如,在將文本“演出松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中的情況下,單詞選擇部203通過對“演出松下太郎、松下花子、松下三郎”進(jìn)行詞素解析,提取例如表示姓名的單詞“松下太郎、松下花子、松下三郎”,生成(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),作為(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))。
關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,計(jì)算由單詞選擇部203選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度(步驟S504),判斷關(guān)聯(lián)度是否比規(guī)定的閾值大(步驟S505)。在其結(jié)果為關(guān)聯(lián)度比規(guī)定的閾值大的情況下(步驟S505中的“是”),將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將該關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中(步驟S506)。這里,新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對由于有1個單詞作為關(guān)聯(lián)詞探索單詞的情況和作為關(guān)聯(lián)詞候補(bǔ)的單詞的情況,所以會發(fā)生重復(fù),在省略了該重復(fù)后保存到聯(lián)想辭典存儲部102中。另一方面,在關(guān)聯(lián)度為規(guī)定的閾值以下的情況下(步驟S505中的“否”),不進(jìn)行任何處理。對包含在關(guān)聯(lián)詞候補(bǔ)中的所有單詞進(jìn)行這些處理(步驟S504~步驟S506)(步驟S507)。再對所有關(guān)聯(lián)詞探索單詞進(jìn)行這些處理(步驟S504~步驟S507)(步驟S508)。
在上述的例子中,關(guān)聯(lián)度計(jì)算部305參照保存在嗜好符合信息存儲部303中的嗜好符合信息,對于由單詞選擇部203選擇的(關(guān)聯(lián)詞探索單詞、(關(guān)聯(lián)詞候補(bǔ)))的組即(松下太郎、(松下花子、松下三郎))、(松下花子、(松下太郎、松下三郎))、(松下三郎、(松下太郎、松下花子)),計(jì)算各個關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的各單詞之間的關(guān)聯(lián)度。作為一例,計(jì)算(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)為(松下太郎、松下花子、60)、(松下太郎、松下三郎、40)、(松下花子、松下太郎、60)、(松下花子、松下三郎、70)、(松下三郎、松下太郎、40)、(松下三郎、松下花子、70),將關(guān)聯(lián)度比規(guī)定的閾值(作為一例而設(shè)為50)大的(關(guān)聯(lián)詞探索單詞、關(guān)聯(lián)詞候補(bǔ)的單詞、關(guān)聯(lián)度)加到將保存在圖2所示的聯(lián)想辭典存儲部102中的關(guān)聯(lián)度乘以衰減參數(shù)(作為一例為0.8)而衰減后的聯(lián)想辭典存儲部102中。此情況的聯(lián)想辭典存儲部102的內(nèi)容成為圖9所示那樣。
另外,在本實(shí)施方式中,關(guān)聯(lián)度計(jì)算部305在更新聯(lián)想辭典存儲部102時,在將存儲在聯(lián)想辭典存儲部102中的所有關(guān)聯(lián)度衰減后,在聯(lián)想辭典存儲部102中已經(jīng)存在與新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對相同的關(guān)聯(lián)詞對的情況下,將已經(jīng)保存在聯(lián)想辭典存儲部102中的關(guān)聯(lián)度與由關(guān)聯(lián)度計(jì)算部305新求出的關(guān)聯(lián)度相加而進(jìn)行更新,但并不限于此。例如,關(guān)聯(lián)度計(jì)算部305也可以將新計(jì)算了關(guān)聯(lián)度的關(guān)聯(lián)詞對原樣與關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部102中。
此外,在本實(shí)施方式中檢索了動畫內(nèi)容,但并不限于此,也可以是超文本或因特網(wǎng)上的WEB頁。在此情況下,畫面制作部205將由檢索部110檢索到的超文本或WEB頁的顯示文本保存到顯示內(nèi)容存儲部202中,再將檢索到的超文本或WEB頁的文本變換為顯示畫面信息,將顯示畫面信息輸出給顯示部204。作為具體的一例,在由檢索部110檢測到由圖10所示的HTML語言記述的文件“name.html”的情況下,畫面制作部205從文件“name.html”將圖11(b)所示的顯示文本“松下太郎、松下花子、松下三郎、松下次郎”保存到顯示內(nèi)容存儲部202中,再將文件“name.html”變換為顯示畫面信息,在顯示部204上如圖11(a)所示那樣輸出顯示畫面信息。進(jìn)而,在顯示部204上沒有顯示全部文本的情況下,畫面制作部205也可以僅將顯示的文本保存到顯示內(nèi)容存儲部202中。在上述的實(shí)施例中,在作為一例而如圖12(a)所示那樣顯示由圖10的HTML語言記述的文件“name.html”的情況下,畫面制作部205如圖12(b)所示那樣僅將顯示文本“松下太郎、松下花子、松下三郎”保存到顯示內(nèi)容存儲部202中。通過這樣,能夠僅根據(jù)從用戶視聽到的內(nèi)容的文本提取的單詞來制作聯(lián)想辭典,能夠制作適應(yīng)于用戶的視聽行為的聯(lián)想辭典。此外,畫面制作部205也可以將在顯示部204上顯示了推定時間以上的文本作為顯示的文本來處理。由此,能夠去除僅在滾動時顯示而沒有被用戶閱覽的文本。
此外,畫面制作部205將與由檢索部110檢索的內(nèi)容有關(guān)的文本信息保存在顯示內(nèi)容存儲部202中,但在內(nèi)容為動畫內(nèi)容且存在與動畫內(nèi)容的各場景或每個幀對應(yīng)的文本的情況下,畫面制作部205也可以僅將與用戶視聽的動畫內(nèi)容的場景或幀對應(yīng)的文本保存到顯示內(nèi)容存儲部202中。通過這樣,能夠僅根據(jù)與用戶視聽的動畫內(nèi)容的場景或幀對應(yīng)的文本制作聯(lián)想辭典,能夠?qū)τ趧赢媰?nèi)容制作適應(yīng)于用戶的視聽行為的高精度的聯(lián)想辭典。
如上所述,根據(jù)本實(shí)施方式,通過從與用戶視聽的內(nèi)容有關(guān)的文本中選擇保存到聯(lián)想辭典中的單詞,再對與用戶嗜好匹配的內(nèi)容計(jì)算關(guān)聯(lián)程度,由此,能夠僅存儲適應(yīng)于用戶的視聽行為的單詞,并且制作單詞的關(guān)聯(lián)程度適應(yīng)于用戶的視聽行為的聯(lián)想辭典。進(jìn)而,用戶在檢索內(nèi)容時,通過利用該制作的聯(lián)想辭典,能夠進(jìn)行與用戶嗜好相匹配的聯(lián)想,利用適應(yīng)于用戶的視聽行為的單詞,進(jìn)行檢索條件的擴(kuò)展。由此,能夠使擴(kuò)展后的檢索結(jié)果適應(yīng)于用戶的視聽行為,而且使聯(lián)想適應(yīng)于用戶嗜好。
另外,在上述實(shí)施方式1中,內(nèi)容存儲部101相當(dāng)于保存有作為檢索對象的信息的數(shù)據(jù)庫,單詞選擇部105相當(dāng)于單詞選擇機(jī)構(gòu),關(guān)聯(lián)度計(jì)算部106相當(dāng)于關(guān)聯(lián)詞保存機(jī)構(gòu)。
此外,在上述實(shí)施方式2中,單詞選擇部203相當(dāng)于單詞選擇機(jī)構(gòu),畫面制作部205相當(dāng)于顯示信息提取機(jī)構(gòu),關(guān)聯(lián)度計(jì)算部106相當(dāng)于關(guān)聯(lián)詞保存機(jī)構(gòu),檢索部110相當(dāng)于檢索機(jī)構(gòu)。
此外,在上述實(shí)施方式3中,嗜好內(nèi)容提取部302相當(dāng)于嗜好符合信息提取機(jī)構(gòu),單詞選擇部304相當(dāng)于單詞選擇機(jī)構(gòu),關(guān)聯(lián)度計(jì)算部305相當(dāng)于關(guān)聯(lián)詞保存機(jī)構(gòu)。
此外,在上述實(shí)施方式4中,嗜好內(nèi)容提取部302相當(dāng)于嗜好符合信息提取機(jī)構(gòu),單詞選擇部203相當(dāng)于單詞選擇機(jī)構(gòu),關(guān)聯(lián)度計(jì)算部305相當(dāng)于關(guān)聯(lián)詞保存機(jī)構(gòu),畫面制作部205相當(dāng)于顯示信息提取機(jī)構(gòu),檢索部110相當(dāng)于檢索機(jī)構(gòu)。
工業(yè)實(shí)用性有關(guān)本發(fā)明的聯(lián)想辭典制作裝置能夠制作聯(lián)想辭典,該聯(lián)想辭典能夠在利用聯(lián)想辭典進(jìn)行檢索條件的擴(kuò)展時,使為了擴(kuò)展而附加的檢索條件適應(yīng)于用戶嗜好或視聽行為,例如作為能夠訪問硬盤錄制機(jī)或DVD錄制機(jī)、TV、組合音響、因特網(wǎng)來進(jìn)行信息檢索的終端等,是具有實(shí)用性的。
權(quán)利要求
1.一種聯(lián)想辭典制作裝置,制作聯(lián)想辭典,該聯(lián)想辭典存儲多個單詞間的關(guān)系,其特征在于,具備單詞選擇機(jī)構(gòu),從表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)詞保存機(jī)構(gòu),根據(jù)保存有作為檢索對象的信息的數(shù)據(jù)庫,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞與上述關(guān)聯(lián)詞建立關(guān)聯(lián),保存到聯(lián)想辭典中。
2.如權(quán)利要求1所述的聯(lián)想辭典制作裝置,其特征在于,上述單詞選擇機(jī)構(gòu)從保存有表示用戶嗜好的信息的簡檔中取得上述表示用戶嗜好的信息。
3.如權(quán)利要求1所述的聯(lián)想辭典制作裝置,其特征在于,上述關(guān)聯(lián)詞保存機(jī)構(gòu)根據(jù)在上述數(shù)據(jù)庫中的出現(xiàn)頻率,分別計(jì)算上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞候補(bǔ)之間的關(guān)聯(lián)度,選擇計(jì)算出的關(guān)聯(lián)度為閾值以上的上述關(guān)聯(lián)詞候補(bǔ),作為與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞。
4.如權(quán)利要求1所述的聯(lián)想辭典制作裝置,其特征在于,上述聯(lián)想辭典制作裝置還具備顯示信息提取機(jī)構(gòu),該顯示信息提取機(jī)構(gòu)提取與用戶所閱覽的顯示有關(guān)的信息;上述單詞選擇機(jī)構(gòu)將由上述顯示信息提取機(jī)構(gòu)提取的與上述顯示有關(guān)的信息作為上述表示用戶嗜好的信息,從與上述顯示有關(guān)的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在與上述顯示有關(guān)的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ)。
5.如權(quán)利要求4所述的聯(lián)想辭典制作裝置,其特征在于,上述聯(lián)想辭典制作裝置還具備檢索機(jī)構(gòu),該檢索機(jī)構(gòu)從上述數(shù)據(jù)庫中檢索符合檢索條件的信息;上述用戶所閱覽的顯示是信息檢索的結(jié)果;上述顯示信息提取機(jī)構(gòu)提取與上述信息檢索的結(jié)果有關(guān)的信息,作為與上述顯示有關(guān)的信息。
6.如權(quán)利要求5所述的聯(lián)想辭典制作裝置,其特征在于,上述顯示信息提取機(jī)構(gòu)從上述信息檢索的結(jié)果中提取在顯示畫面上顯示規(guī)定時間以上的信息,作為與上述顯示有關(guān)的信息。
7.如權(quán)利要求4所述的聯(lián)想辭典制作裝置,其特征在于,上述用戶所閱覽的顯示是播放節(jié)目;上述顯示信息提取機(jī)構(gòu)提取與上述播放節(jié)目有關(guān)的信息,作為與上述顯示有關(guān)的信息。
8.如權(quán)利要求7所述的聯(lián)想辭典制作裝置,其特征在于,上述顯示信息提取機(jī)構(gòu)從上述播放節(jié)目中提取與在顯示畫面上顯示規(guī)定時間以上的播放節(jié)目有關(guān)的信息,作為與上述顯示有關(guān)的信息。
9.如權(quán)利要求1所述的聯(lián)想辭典制作裝置,其特征在于,上述聯(lián)想辭典制作裝置還具備嗜好符合信息提取機(jī)構(gòu),該嗜好符合信息提取機(jī)構(gòu)利用保存有表示用戶嗜好的信息的簡檔,從上述數(shù)據(jù)庫中提取符合用戶嗜好的信息,作為嗜好符合信息;上述關(guān)聯(lián)詞保存機(jī)構(gòu)參照從上述數(shù)據(jù)庫中提取的上述嗜好符合信息,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞建立關(guān)聯(lián)并保存到聯(lián)想辭典中。
10.如權(quán)利要求9所述的聯(lián)想辭典制作裝置,其特征在于,上述單詞選擇機(jī)構(gòu)將由上述嗜好符合信息提取機(jī)構(gòu)提取的上述嗜好符合信息作為上述表示用戶嗜好的信息,從上述嗜好符合信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述嗜好符合信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)。
11.如權(quán)利要求9所述的聯(lián)想辭典制作裝置,其特征在于,上述單詞選擇機(jī)構(gòu)從保存有表示用戶嗜好的信息的簡檔中取得上述表示用戶嗜好的信息,從上述表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ)。
12.如權(quán)利要求1所述的聯(lián)想辭典制作裝置,其特征在于,上述聯(lián)想辭典制作裝置還具備顯示信息提取機(jī)構(gòu),提取與用戶所閱覽的顯示有關(guān)的信息;嗜好符合信息提取機(jī)構(gòu),利用保存有表示用戶嗜好的信息的簡檔,從上述數(shù)據(jù)庫中提取符合用戶嗜好的信息,作為嗜好符合信息;上述單詞選擇機(jī)構(gòu)將由上述顯示信息提取機(jī)構(gòu)提取的與上述顯示有關(guān)的信息作為上述表示用戶嗜好的信息,從與上述顯示有關(guān)的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在與上述顯示有關(guān)的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);上述關(guān)聯(lián)詞保存機(jī)構(gòu)參照從上述數(shù)據(jù)庫中提取的上述嗜好符合信息,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞和上述關(guān)聯(lián)詞建立對應(yīng)并保存到聯(lián)想辭典中。
13.一種聯(lián)想辭典制作方法,制作聯(lián)想辭典,該聯(lián)想辭典存儲多個單詞間的關(guān)系,其特征在于,包括單詞選擇步驟,從表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)詞保存步驟,根據(jù)保存有作為檢索對象的信息的數(shù)據(jù)庫,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞與上述關(guān)聯(lián)詞建立關(guān)聯(lián),保存到聯(lián)想辭典中。
14.一種程序,用來制作聯(lián)想辭典,該聯(lián)想辭典存儲多個單詞間的關(guān)系,其特征在于,使計(jì)算機(jī)執(zhí)行單詞選擇步驟,從表示用戶嗜好的信息中選擇任意的單詞作為關(guān)聯(lián)詞探索單詞,選擇包含在上述表示用戶嗜好的信息中的除上述關(guān)聯(lián)詞探索單詞以外的單詞作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)詞保存步驟,根據(jù)保存有作為檢索對象的信息的數(shù)據(jù)庫,從上述關(guān)聯(lián)詞候補(bǔ)中選擇與上述關(guān)聯(lián)詞探索單詞相關(guān)聯(lián)的關(guān)聯(lián)詞,將上述關(guān)聯(lián)詞探索單詞與上述關(guān)聯(lián)詞建立關(guān)聯(lián),保存到聯(lián)想辭典中。
全文摘要
提供一種能夠簡單且有效地制作與用戶嗜好相匹配的聯(lián)想辭典的聯(lián)想辭典制作裝置。聯(lián)想辭典制作部(103)具備簡檔存儲部(104),保存有與用戶嗜好有關(guān)的信息即簡檔;單詞選擇部(105),每隔規(guī)定的時間從保存在簡檔存儲部(104)中的簡檔中選擇單詞,作為關(guān)聯(lián)詞探索單詞,再選擇包含在簡檔中的除關(guān)聯(lián)詞探索單詞以外的單詞,作為關(guān)聯(lián)詞候補(bǔ);關(guān)聯(lián)度計(jì)算部(106),參照保存在內(nèi)容存儲部(101)中的內(nèi)容,計(jì)算由單詞選擇部(105)選擇的關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞之間的關(guān)聯(lián)度,在關(guān)聯(lián)度比規(guī)定的閾值大的情況下,將關(guān)聯(lián)詞探索單詞和關(guān)聯(lián)詞候補(bǔ)的單詞作為關(guān)聯(lián)詞對,將關(guān)聯(lián)詞對和關(guān)聯(lián)度建立對應(yīng)并保存到聯(lián)想辭典存儲部(102)中。
文檔編號G06F17/28GK1930567SQ20058000814
公開日2007年3月14日 申請日期2005年12月27日 優(yōu)先權(quán)日2005年1月7日
發(fā)明者續(xù)木貴史, 九津見洋 申請人:松下電器產(chǎn)業(yè)株式會社