專利名稱:語音識別詞典制作裝置及信息檢索裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種例如對通過節(jié)目指南裝置等信息檢索裝置來制作用于進(jìn)行語音識別的語音識別詞典的語音識別詞典制作裝置及信息檢索裝置。
背景技術(shù):
以往,采用語音識別詞典制作裝置的節(jié)目指南裝置是這樣一種裝置,伴隨節(jié)目的多頻道化而使用電子節(jié)目指南(Electronic ProgramGuideEPG)和語音來進(jìn)行TV操作,在接收最新的EPG數(shù)據(jù)并采用接收數(shù)據(jù)制作出與今天或明天以后的節(jié)目對應(yīng)的語音識別詞典之后,為了不使用多余的硬資源,而刪除舊的識別詞典。
再者,當(dāng)制作詞典時(shí),分類成在EPG中已被分類的「節(jié)目名」、「類型」、「演員」等并實(shí)行詞典登錄,而對于各字詞進(jìn)行同等識別。
圖1是表示具備以往語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
節(jié)目指南裝置具備EPG接收部701、項(xiàng)目分類部702、詞典更新部703、詞典704、語音識別部705、時(shí)鐘706、登錄字刪除部707、EPG儲存部708及控制部709。
EPG接收部701用來從電視信號分離出EPG數(shù)據(jù)。項(xiàng)目分類部702用來分離語音識別不需要的「播送時(shí)間」等EPG數(shù)據(jù),并將剩余的EPG數(shù)據(jù)分類為「節(jié)目名稱」、「演員」等。詞典更新部703使EPG數(shù)據(jù)中含有的字詞不在詞典中重復(fù)地進(jìn)行登錄。詞典704將語音識別所需要的字詞與登錄日期時(shí)間一起存儲。語音識別部705用于通過由利用者發(fā)音而產(chǎn)生的語音信號,參照詞典704,識別特定的字詞。
另外,時(shí)鐘706用來向登錄字刪除部707輸出當(dāng)前的日期時(shí)間。登錄字刪除部707用來參照時(shí)鐘706的日期時(shí)間,對登錄于詞典704中的字詞之內(nèi)例如至前天為止所登錄的字詞進(jìn)行刪除。EPG儲存部708儲存有通過EPG接收部701所分離出的EPG數(shù)據(jù)。控制部709用于從EPG儲存部708中所儲存的EPG數(shù)據(jù)來檢索語音識別部705所識別出的字詞,輸出相應(yīng)的節(jié)目內(nèi)容(例如,參照特開2001-22374號公報(bào)(第7頁、圖1))。
就以往的上述那種節(jié)目指南裝置來說,為了利用最新的EPG數(shù)據(jù)來制作詞典,詞典內(nèi)的識別字詞將產(chǎn)生變化,但利用者基本上意識不到詞典內(nèi)識別字詞的變化。
在此,例如在利用者按照最新EPG數(shù)據(jù)中不包括的過去觀看的節(jié)目以及按照有趣的節(jié)目名或演員名來實(shí)行電視節(jié)目檢索及操作的場合下,節(jié)目指南裝置將詞典內(nèi)識別分?jǐn)?shù)最高的字詞作為識別結(jié)果加以輸出。原因是,采用節(jié)目指南裝置不能識別詞典中未登錄的字詞。為此,有時(shí)所輸出的識別結(jié)果和利用者所請求的節(jié)目名、演員名不一樣。這種場合下,利用者將該識別結(jié)果看成誤識別,仍舊數(shù)次發(fā)出相同的詞語。
因此,人們也考慮不只是最新的EPG數(shù)據(jù),還利用過去的EPG數(shù)據(jù)來制作詞典,但是這種場合下將使詞典中所登錄的字詞變成龐大的數(shù)量。
另外,隨著因多頻道化而產(chǎn)生的節(jié)目數(shù)量的增加,識別對象字詞也將增大。但是,以往的語音識別詞典制作裝置將新的數(shù)據(jù)作為全識別對象字詞,因此存在識別率下降等的課題。
發(fā)明內(nèi)容
因此,本發(fā)明是鑒于上述狀況而做出的,其目的為提供一種可以將識別對象字詞的增加抑制到最低限度,且使識別率得到提高的語音識別詞典制作裝置及信息檢索裝置。
為了達(dá)到上述目的,本發(fā)明所涉及的語音識別詞典制作裝置用來制作語音識別所使用的識別詞典,其特征為具備詞典制作裝置,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
在此,上述經(jīng)驗(yàn)的有無是視聽經(jīng)驗(yàn)的有無,上述詞典制作裝置也可以根據(jù)上述視聽經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
在此,上述經(jīng)驗(yàn)的有無是利用經(jīng)驗(yàn)的有無,上述詞典制作裝置也可以根據(jù)上述利用經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
在此,上述經(jīng)驗(yàn)的有無是訪問經(jīng)驗(yàn)的有無,上述詞典制作裝置也可以根據(jù)上述訪問經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
據(jù)此,例如利用者以今后播送的節(jié)目或者以前觀看(或錄制)的節(jié)目的任一方為對象進(jìn)行檢索之類的、根據(jù)對象的視聽經(jīng)驗(yàn)有無制作出多個(gè)識別詞典,因此可以按照目的制作使語音識別的識別率得以提高的識別詞典。
另外,上述語音識別詞典制作裝置進(jìn)一步具備行動(dòng)履歷字詞取得裝置,用于根據(jù)利用者的行動(dòng)取得行動(dòng)履歷字詞,該行動(dòng)履歷字詞是作為識別對象的字詞;行動(dòng)履歷字詞儲存裝置,用來儲存所取得的上述行動(dòng)履歷字詞;固定字詞儲存裝置,儲存有預(yù)先設(shè)定的指定的固定字詞;字詞提取裝置,用來從所輸入的數(shù)據(jù)提取新識別用字詞,該新識別用字詞是作為識別對象的字詞;詞典儲存裝置,用來儲存所制作出的上述識別詞典,上述詞典制作裝置也可以通過上述新識別用字詞、上述固定字詞及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞,向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,制作上述識別詞典。
據(jù)此,通過登錄所輸入的數(shù)據(jù)中不包括的行動(dòng)履歷字詞,而可以制作對語音識別的誤識別加以抑制的識別詞典。
另外,上述語音識別詞典制作裝置進(jìn)一步具備識別字詞取得裝置,用來取得過去識別字詞,該過去識別字詞是通過語音識別所識別出的字詞;過去識別字詞儲存裝置,用來儲存上述過去識別字詞,上述詞典制作裝置也可以通過上述新識別用字詞、上述固定字詞、上述行動(dòng)履歷字詞及上述過去識別字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞,向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,制作上述識別詞典。
據(jù)此,通過登錄所輸入的數(shù)據(jù)中不包括的過去識別字詞,而可以制作對語音識別的誤識別加以抑制的識別詞典。
這樣,因?yàn)椴⒉皇浅プ钚碌淖衷~之外將在過去一定期間內(nèi)所存在的全部字詞都作為識別對象進(jìn)行登錄,而只是登錄有作為行動(dòng)履歷字詞或過去識別字詞的字詞,所以也按照最低限度抑制識別對象字詞的增加,并且不只是識別率的下降不多,還可以通過更少的硬資源加以實(shí)現(xiàn)。
另外,上述詞典制作裝置也可以根據(jù)是否是上述行動(dòng)履歷字詞中含有的字詞來實(shí)行上述新登錄字詞的加權(quán),附加與上述加權(quán)有關(guān)的信息,制作上述識別詞典。
據(jù)此,根據(jù)是否是行動(dòng)履歷字詞中含有的字詞來實(shí)行新登錄字詞的加權(quán),以此可以制作使語音識別的識別率得到提高的識別詞典。
另外,上述詞典制作裝置也可以根據(jù)是否是上述過去識別字詞中含有的字詞來實(shí)行上述新登錄字詞的加權(quán),附加與上述加權(quán)有關(guān)的信息制作上述識別詞典。
據(jù)此,根據(jù)是否是過去識別字詞中含有的字詞來實(shí)行新登錄字詞的加權(quán),以此可以制作使語音識別的識別率得到提高的識別詞典。
另外,上述所輸出的數(shù)據(jù)是結(jié)構(gòu)化后的數(shù)據(jù),上述字詞提取裝置與上述新識別用字詞一起提取上述新識別用字詞的屬性,上述詞典制作裝置也可以基于上述新識別用字詞的屬性來實(shí)行上述新登錄字詞的加權(quán)并附加與上述加權(quán)有關(guān)的信息,制作上述識別詞典。
據(jù)此,根據(jù)新識別用字詞的屬性來實(shí)行新登錄字詞的加權(quán),以此可以制作使語音識別的識別率得到提高的識別詞典。
另外,上述語音識別詞典制作裝置進(jìn)一步具備利用者信息取得裝置,用來取得對上述利用者加以辨別的利用者識別信息,上述詞典制作裝置也可以對每個(gè)上述利用者識別信息制作上述識別詞典。
另外,上述語音識別詞典制作裝置進(jìn)一步具備利用者信息取得裝置,用來取得對利用者加以辨別的利用者識別信息,上述詞典制作裝置也可以對每個(gè)上述利用者識別信息分別實(shí)行上述新登錄字詞的加權(quán),來制作上述識別詞典。
據(jù)此,能夠制作適合于多名利用者的識別詞典。
另外,上述行動(dòng)履歷字詞取得裝置與上述行動(dòng)履歷字詞一起將行動(dòng)日期時(shí)間記錄到上述行動(dòng)履歷字詞儲存裝置中,上述詞典制作裝置給上述新登錄字詞之中的上述行動(dòng)履歷字詞進(jìn)一步附加上述行動(dòng)日期時(shí)間來制作上述識別詞典,上述語音識別詞典制作裝置也可以進(jìn)一步具備字詞刪除裝置,用來從上述識別詞典刪除上述登錄字詞,該登錄字詞已由上述登錄字詞的上述行動(dòng)日期時(shí)間經(jīng)過指定的期間。
據(jù)此,通過采用這種識別詞典,該識別詞典具有未被所輸入的數(shù)據(jù)所包含的字詞,來對語音識別的誤識別加以抑制,并且在登錄字詞經(jīng)過預(yù)先所設(shè)定的期間之后被從識別詞典刪除,因此可以減少語音識別詞典制作裝置的硬資源。
另外,本發(fā)明所涉及的信息檢索裝置,用來制作語音識別所使用的識別詞典,與此同時(shí)通過由利用者發(fā)音而產(chǎn)生語音信號來檢索信息,其特征為具備詞典制作裝置,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典;語音識別裝置,用于通過參照上述識別詞典從上述語音信號識別出特定的字詞;數(shù)據(jù)儲存裝置,用來儲存所輸入的數(shù)據(jù);控制裝置,用于從上述數(shù)據(jù)來檢索由上述語音識別裝置所識別出的字詞,輸出相應(yīng)的信息。
另外,上述信息檢索裝置進(jìn)一步具備行動(dòng)履歷字詞取得裝置,用于根據(jù)利用者的行動(dòng)來取得行動(dòng)履歷字詞,該行動(dòng)履歷字詞是作為識別對象的字詞;行動(dòng)履歷字詞儲存裝置,用來儲存所取得的上述行動(dòng)履歷字詞;固定字詞儲存裝置,儲存有預(yù)先設(shè)定的指定的固定字詞;字詞提取裝置,用來從所輸入的數(shù)據(jù)提取新識別用字詞,該新識別用字詞是作為識別對象的字詞;詞典儲存裝置,用來儲存所制作出的上述識別詞典,上述詞典制作裝置也可以通過上述新識別用字詞、上述固定字詞及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞,給上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,制作上述識別詞典。
據(jù)此,通過采用這種識別詞典,該識別詞典具有未被所輸入的數(shù)據(jù)所包含的字詞,而可以抑制語音識別的誤識別,辨別語音識別的錯(cuò)誤和檢索數(shù)據(jù)的有無。
例如,若以信息檢索裝置作為電視播送節(jié)目的節(jié)目指南裝置加以使用,則即使是有關(guān)未被最新EPG數(shù)據(jù)所包含的過去視聽的節(jié)目而發(fā)出語音的情形,字詞也被正確識別。據(jù)此,在實(shí)行節(jié)目檢索的場合下,可以做出「演員C演出的節(jié)目目前及在1周之內(nèi)不予播送」、「電影K目前不予播送」的這種回答,并可以根據(jù)利用者的不同來實(shí)現(xiàn)使用方便的良好語音接口。
另外,上述所輸入的數(shù)據(jù)是結(jié)構(gòu)化后的數(shù)據(jù),上述字詞提取裝置與上述新識別用字詞一起提取上述新識別用字詞的屬性,上述詞典制作裝置基于上述新識別用字詞的屬性來實(shí)行上述新登錄字詞的加權(quán),附加與上述加權(quán)有關(guān)的信息制作上述識別詞典,與此同時(shí)按照目的制作基于上述新識別用字詞的屬性并且上述新登錄字詞的加權(quán)不同的多個(gè)上述識別詞典,上述信息檢索裝置進(jìn)一步具備詞典選擇受理裝置,用來受理由利用者從上述詞典儲存裝置中所儲存的多個(gè)上述識別詞典所選擇的詞典,上述語音識別裝置也可以通過參照由上述詞典選擇受理裝置所受理的識別詞典,從語音信號識別出特定的字詞,該語音信號是由利用者發(fā)音而產(chǎn)生的。
據(jù)此,通過認(rèn)為語音識別的識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而可以提高語音識別的識別率,實(shí)現(xiàn)易于使用的接口。
再者,本發(fā)明不只可以作為這種裝置來實(shí)現(xiàn),而也可以作為下述方法來實(shí)現(xiàn)或者作為使計(jì)算機(jī)實(shí)行那些步驟的程序來實(shí)現(xiàn),上述方法是以這種語音識別詞典制作裝置所含有的特征性裝置作為步驟而包括的方法。而且,不言而喻,這種程序可以通過CD-ROM等記錄媒體和因特網(wǎng)等傳送媒體加以傳輸。
如上所述,根據(jù)本發(fā)明所涉及的語音識別詞典制作裝置,可以將未被最新的EPG數(shù)據(jù)所包含的字詞作為識別對象字詞進(jìn)行處理,在實(shí)行節(jié)目檢索的場合下能夠?qū)φZ音識別的錯(cuò)誤和檢索數(shù)據(jù)的有無進(jìn)行辨別,并可以針對利用者的不同來實(shí)現(xiàn)使用方便的良好語音接口。
再者,因?yàn)橹谱鞫鄠€(gè)識別詞典以利用者的指定進(jìn)行轉(zhuǎn)換,所以通過認(rèn)為識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而可以提高識別率,實(shí)現(xiàn)易于使用的接口。
圖1是表示具備以往語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
圖2是表示包含本發(fā)明實(shí)施方式1所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
圖3表示的是識別字詞儲存部中所儲存的數(shù)據(jù)示例。
圖4表示的是視聽履歷字詞儲存部中所儲存的數(shù)據(jù)示例。
圖5表示的是基本識別詞典的數(shù)據(jù)示例。
圖6表示的是利用者自適應(yīng)式識別詞典的數(shù)據(jù)示例。
圖7表示的是對在各自的發(fā)音條件中字詞種類被發(fā)出的頻率進(jìn)行調(diào)查的結(jié)果。
圖8表示的是加權(quán)利用者自適應(yīng)式識別詞典的數(shù)據(jù)示例。
圖9是表示在節(jié)目指南裝置中脫機(jī)處理過程動(dòng)作的流程圖。
圖10表示的是EPG數(shù)據(jù)的一個(gè)示例。
圖11是表示在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。
圖12表示的是從多個(gè)識別詞典之中選擇1個(gè)識別詞典的畫面一個(gè)示例。
圖13(a)是從圖8所示的加權(quán)利用者自適應(yīng)式識別詞典摘錄出一部分的附圖,(b)表示的是識別結(jié)果的示例。
圖14表示的是未對「種類」是節(jié)目名的字詞加以登錄的利用者自適應(yīng)式識別詞典的數(shù)據(jù)示例。
圖15是表示包含本發(fā)明實(shí)施方式2所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
圖16表示的是錄制信息儲存部中所儲存的數(shù)據(jù)示例。
圖17表示的是實(shí)施方式2加權(quán)利用者自適應(yīng)式識別詞典的數(shù)據(jù)示例。
圖18是表示實(shí)施方式2在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。
圖19是表示包含本發(fā)明實(shí)施方式3所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
圖20是表示實(shí)施方式3在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。
圖21是表示包含本發(fā)明實(shí)施方式4所涉及語音識別詞典制作裝置的音樂指南裝置結(jié)構(gòu)的框圖。
圖22表示的是在音樂數(shù)據(jù)·音樂信息·視聽履歷儲存部中所儲存的音樂信息的數(shù)據(jù)示例。
圖23表示的是在音樂數(shù)據(jù)·音樂信息·視聽履歷儲存部中所儲存的視聽履歷的數(shù)據(jù)示例。
圖24表示的是在實(shí)施方式4中每一「種類」的「對象權(quán)重系數(shù)」的一個(gè)示例。
圖25是表示包含本發(fā)明實(shí)施方式5所涉及語音識別詞典制作裝置的信息檢索裝置結(jié)構(gòu)的框圖。
圖26表示的是在餐廳數(shù)據(jù)儲存部中所儲存的數(shù)據(jù)示例。
圖27表示的是在利用信息保存部中所儲存的數(shù)據(jù)示例。
圖28表示的是在實(shí)施方式5中每一「種類」的「對象權(quán)重系數(shù)」的一個(gè)示例。
具體實(shí)施例方式
下面,有關(guān)本發(fā)明的實(shí)施方式,采用附加予以說明。
(實(shí)施方式1)在本實(shí)施方式1中,主要有關(guān)制作利用者以今后播送的節(jié)目為對象進(jìn)行檢索所用的識別詞典并實(shí)行檢索的情形,予以說明。
圖2是表示包含本發(fā)明實(shí)施方式1所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。
節(jié)目指南裝置具備EPG接收部101、字詞提取部102、詞典制作部103、固定字詞儲存部104、識別字詞儲存部105、視聽履歷字詞儲存部106、詞典儲存部107、詞典選擇部108、語音識別部109、EPG儲存部110、時(shí)鐘111及控制部112。
EPG接收部101用來從所輸入的電視信號分離出EPG數(shù)據(jù)。字詞提取部102用來從EPG數(shù)據(jù)提取新識別用字詞,該新識別用字詞是「節(jié)目名稱」、「演員」、「類型」等作為識別對象的字詞。固定字詞儲存部104儲存有表明時(shí)間、播送臺的字詞和一般的語音識別所需要的字詞,例如「早晨」、「6點(diǎn)」、「的」、「新聞」、「想看」等的固定字詞。
識別字詞儲存部105用來存儲過去識別字詞,該過去識別字詞是過去通過語音識別所識別出的字詞。在此,例如如圖3所示記錄有「記述」,表示被語音識別后的字詞記述;「讀音」,表示該字詞的讀音假名;「種類」,表示該字詞例如相當(dāng)于節(jié)目名、類型及演員等的任一個(gè);「語音識別日期時(shí)間」,表示被語音識別的日期時(shí)間;「頻率」,表示被語音識別的次數(shù)。還有,在識別出相同記述的字詞的場合下,按照最新的日期時(shí)間對「語音識別日期時(shí)間」加以更新,使「頻率」增加1。
視聽履歷字詞儲存部106用來存儲作為所視聽的節(jié)目信息的視聽履歷字詞。在此,作為所視聽的節(jié)目信息記錄有節(jié)目名及演員,例如如圖4所示記錄有「記述」;「視聽日期時(shí)間」,表示該節(jié)目被視聽的日期時(shí)間;「種類」;「頻率」。還有,在記錄相同記述的字詞的場合下,按照最新的日期時(shí)間對「視聽日期時(shí)間」加以更新,使「頻率」增加1。
詞典制作部103用來在通過字詞提取部102所提取的新識別用字詞及固定字詞儲存部104中所存儲的固定字詞中,添加語音識別所需要的讀音假名、詞類等的信息,與以往的語音識別詞典相同地制作如圖5所示的那種基本識別詞典。另外,詞典制作部103對識別字詞儲存部105中所存儲的過去識別字詞及視聽履歷字詞儲存部106中所存儲的視聽履歷字詞進(jìn)行參照,如果存在基本識別詞典中所登錄的字詞之外的字詞,就對登錄于基本識別中的字詞追加該字詞,制作如圖6所示的那種利用者自適應(yīng)式識別詞典。
利用者為了使用節(jié)目指南裝置進(jìn)行檢索而發(fā)出的字詞種類(屬性),利用者以今后播送的節(jié)目為對象進(jìn)行檢索的情形(發(fā)音條件1),及以從前觀看或錄制的節(jié)目為對象進(jìn)行檢索的情形(發(fā)音條件2),在發(fā)聲的頻率上有所不同。
圖7表示的是對在各自的發(fā)音條件中字詞種類被發(fā)出的頻率進(jìn)行調(diào)查的結(jié)果。如圖7所示,若除去「日期時(shí)間」的字詞,則在發(fā)音條件1的場合下,「類型」(44.8%)最多,接著是「節(jié)目內(nèi)容」(9.5%)較多,與此相對在發(fā)音條件2的場合下,「節(jié)目名」(26.7%)最多,接著則變成「類型」(23.3%)的順序。
由此,詞典制作部103根據(jù)字詞的種類來實(shí)行加權(quán),以決定「對象權(quán)重系數(shù)」。
再者,詞典制作部103根據(jù)是在識別字詞儲存部105中作為過去識別字詞被存儲,還是在視聽履歷字詞儲存部106中作為視聽履歷字詞被存儲,來實(shí)行加權(quán),以決定「履歷權(quán)重系數(shù)」。隨后,詞典制作部103例如如圖8所示制作加權(quán)利用者自適應(yīng)式識別詞典,該識別詞典除去「記述」、「讀音」及「種類」之外還存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」。
在此,作為「對象權(quán)重系數(shù)」,對「種類」是節(jié)目名的字詞賦予[1.11 」,對「種類」是日期時(shí)間的字詞賦予[1.27」,對「種類」是播送臺·頻道的字詞賦予[1.06」,對「種類」是類型的字詞賦予「1.49」,對「種類」是演員的字詞賦予[1.07」。
另外,作為「履歷權(quán)重系數(shù)」,對在識別字詞儲存部105中作為過去識別字詞所存儲的字詞賦予「1.2」,對在視聽履歷字詞儲存部106中作為視聽履歷字詞所存儲的字詞賦予[1.1」,對在識別字詞儲存部105及視聽履歷字詞儲存部106的雙方中都存儲的字詞賦予[1.3」。
詞典儲存部107用來存儲由詞典制作部103所制作出的語音識別所使用的多個(gè)詞典。詞典選擇部108用來受理由利用者認(rèn)為最合適而從多個(gè)詞典所選擇出的詞典。語音識別部109通過參照由詞典選擇部108所受理的詞典,從語音信號識別出特定的字詞,該語音信號是由利用者發(fā)音而產(chǎn)生的。時(shí)鐘111用來向控制部112輸出當(dāng)前的日期時(shí)間。EPG儲存部110用來存儲EPG數(shù)據(jù)。
控制部112通過由語音識別部109所識別出的字詞對EPG儲存部110中所儲存的EPG數(shù)據(jù)進(jìn)行檢索,輸出與相應(yīng)的節(jié)目有關(guān)的信息。另外,控制部112還向識別字詞儲存部105輸出與通過語音識別部109所識別出的字詞有關(guān)的信息及語音識別日期時(shí)間等。再者,控制部112在由利用者視聽節(jié)目達(dá)到預(yù)先所設(shè)定的時(shí)間以上時(shí),取得作為該節(jié)目信息的視聽履歷字詞,輸出到視聽履歷字詞儲存部106中。另外,控制部112在識別字詞儲存部105內(nèi)所存儲的過去識別字詞之中,刪除從語音識別日期時(shí)間經(jīng)過了指定時(shí)間的過去識別字詞。同樣地,控制部112在視聽履歷字詞儲存部106內(nèi)所存儲的視聽履歷字詞之中,刪除從視聽日期時(shí)間經(jīng)過指定時(shí)間的視聽履歷字詞。
如上所構(gòu)成的節(jié)目指南裝置的動(dòng)作可以大致分成制作詞典的脫機(jī)處理過程,以及采用所制作出的詞典來識別所輸入的語音以對節(jié)目進(jìn)行指南的聯(lián)機(jī)處理過程。
首先,有關(guān)脫機(jī)處理過程的動(dòng)作予以說明。圖9是表示在節(jié)目指南裝置中脫機(jī)處理過程動(dòng)作的流程圖。
輸入電視信號的EPG接收部101從電視信號取出EPG數(shù)據(jù),輸出到字詞提取部102及EPG儲存部110中(步驟S101)。
接著,字詞提取部102從EPG數(shù)據(jù)作為新識別用字詞而提取「節(jié)目名」、「演員」及「類型」(步驟S102),該新識別用字詞為語音識別的關(guān)鍵字。
圖10表示的是EPG數(shù)據(jù)的一個(gè)示例。在EPG數(shù)據(jù)中對每1個(gè)節(jié)目分類成下述項(xiàng)目,該項(xiàng)目包括「服務(wù)ID」,用來辨別播送臺;「事件ID」,用來辨別各節(jié)目;「開始日」,表示節(jié)目開始的年月日;「開始時(shí)間」,表示節(jié)目開始的時(shí)間;「持續(xù)時(shí)間」,表示節(jié)目的播送時(shí)間;「事件名」,表示節(jié)目名;「正文」,表示演員及節(jié)目內(nèi)容;「類型」,表示節(jié)目的類型。
另外,與「服務(wù)ID」、「事件ID」、「開始日」、「開始時(shí)間」及「持續(xù)時(shí)間」的項(xiàng)目有關(guān)的固定字詞,預(yù)先存儲于固定字詞儲存部104中。
接著,詞典制作部103采用從字詞提取部102所輸入的新識別字詞、固定字詞儲存部104所儲存的固定字詞及固定字詞儲存部104所儲存的語音識別需要的讀音假名和詞類等的信息,與以往的識別詞典相同地制作基本識別詞典(步驟S103)。
接著,詞典制作部103參照從視聽履歷字詞儲存部106所輸入的視聽履歷字詞以及從識別字詞儲存部105所輸入的過去識別字詞,如果存在基本識別詞典中所登錄的字詞以外的字詞,則對登錄于基本識別詞典中的字詞追加該字詞,制作如圖6所示的那種利用者自適應(yīng)式識別詞典。再者,詞典制作部103實(shí)行加權(quán),該加權(quán)包括與字詞種類相應(yīng)的加權(quán)、以及對應(yīng)于是在識別字詞儲存部105中作為過去識別字詞被存儲、還是在視聽履歷字詞儲存部106中作為視聽履歷字詞被存儲的加權(quán),例如如圖8所示制作加權(quán)利用者自適應(yīng)式識別詞典(步驟S104),該識別詞典除去「記述」、「讀音」及「種類」之外還存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」。
接著,詞典制作部103將所制作出的基本識別詞典、利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典存儲在詞典儲存部107中(步驟S105)。此時(shí),詞典制作部103通過與詞典儲存部107中所存儲的以前制作出的各個(gè)識別詞典進(jìn)行更換,予以更新。
還有,在本實(shí)施方式中雖然作為加權(quán)利用者自適應(yīng)式識別詞典制作出存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」的詞典,但是并不限定于此。例如,也可以是只附加「對象權(quán)重系數(shù)」或「履歷權(quán)重系數(shù)」任一方的詞典。另外,「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」的值并不限定于上述示例,而也可以是其他的值。
另外,有關(guān)「履歷權(quán)重系數(shù)」雖然是根據(jù)過去識別字詞及視聽履歷字詞來實(shí)行加權(quán)的,但是也可以根據(jù)任一方來實(shí)行加權(quán)。再者,也可以對詞典附加對于過去識別字詞及視聽履歷字詞各自的「權(quán)重系數(shù)」。另外,也可以根據(jù)識別次數(shù)或視聽次數(shù)和時(shí)刻等來變更「權(quán)重系數(shù)」。
另外,利用者自適應(yīng)式識別詞典即使采用視聽履歷字詞、過去識別字詞的任一方進(jìn)行制作,也可以得到相同的效果。
另外,在硬資源缺乏的場合下,也可以取代實(shí)行加權(quán),例如刪除利用者使用頻率低的節(jié)目被分類的類型的新識別用字詞。
另外,在利用者以今后播送的節(jié)目為對象進(jìn)行檢索時(shí),也可以假定關(guān)于節(jié)目名不發(fā)音的狀況,例如如圖14所示不登錄「種類」是節(jié)目名的字詞。
另外,加權(quán)利用者自適應(yīng)式識別詞典也可以制作成多個(gè)加權(quán)不同的詞典,該加權(quán)與字詞種類相應(yīng)。另外,也可以通過向詞典制作部103輸入對利用者加以識別的利用者識別信號,對不同利用者制作識別詞典,制作出多個(gè)利用者自適應(yīng)式識別詞典。
在此,例如在制作易于識別「演員」字詞的利用者自適應(yīng)式識別詞典的場合下,可以使語音識別中的優(yōu)先次序比「類型」、「節(jié)目名」的字詞更高,以此實(shí)行加權(quán)。
另外,即使在「演員」的字詞中,也可以對視聽履歷字詞、過去識別字詞的使用頻率進(jìn)行參照,使之與利用者的喜好相適來決定語音識別中的優(yōu)先次序。
另外,在視聽履歷字詞、過去識別字詞之中對于基本識別詞典中已包含的字詞,因?yàn)橛衫谜咴俅问褂玫目赡苄暂^高,所以通過設(shè)定使語音識別中的優(yōu)先次序提高的權(quán)重系數(shù),也可以制作與利用者的使用狀況相適的加權(quán)利用者自適應(yīng)式識別詞典。
另外,在本實(shí)施方式中雖然詞典制作部103制作出基本識別詞典、利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典的3種識別詞典,但是并不限定于此。例如,也可以制作2種識別詞典,這2種識別詞典一是基本識別詞典,二是利用者自適應(yīng)式識別詞典或者加權(quán)利用者自適應(yīng)式識別詞典的任1種識別詞典。另外,也可以分別制作多個(gè)利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典,制作出4種以上的識別詞典。
另外,雖然制作詞典的脫機(jī)處理過程的動(dòng)作例如按照1天1次的方式在每個(gè)指定期間予以實(shí)行,但是也可以根據(jù)視聽履歷來決定該實(shí)行的時(shí)間。
下面,有關(guān)聯(lián)機(jī)處理過程的動(dòng)作予以說明。圖11是表示在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。
詞典選擇部108例如依照圖12所示的那種畫面,對詞典儲存部107中所存儲的多個(gè)識別詞典加以顯示,受理由利用者做出的識別詞典選擇(步驟S201)。
接著,詞典選擇部108將由利用者所選擇的識別詞典輸出到語音識別部109(步驟S202)。還有,作為初始設(shè)定也可以將基本識別詞典輸出到語音識別部109。
在此,也可以通過將利用者所選擇的識別詞典的種類顯示于電視畫面的一部分上,促進(jìn)利用者輸入與識別詞典內(nèi)容相應(yīng)的語音內(nèi)容。
接著,語音識別部109參照由利用者所選擇的識別詞典,從所輸入的語音識別出特定的字詞(步驟S203)。在此,將有關(guān)在下述狀態(tài)下利用者發(fā)出「想觀看體育」時(shí)的識別結(jié)果予以說明,該狀態(tài)是由利用者選擇出圖8所示的那種加權(quán)利用者自適應(yīng)式識別詞典的狀態(tài)。圖13(a)是從圖8所示的加權(quán)利用者自適應(yīng)式識別詞典摘錄出一部分的附圖,圖13(b)表示的是識別結(jié)果的示例。語音識別部109首先與一般的語音識別同樣地計(jì)算出分?jǐn)?shù)。在此,分?jǐn)?shù)如圖13(b)所示設(shè)為,「體育樂園」是500,「體育」是300,「體育大全」是200。語音識別部109將加權(quán)利用者自適應(yīng)式識別詞典中所登錄的「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」與計(jì)算出的分?jǐn)?shù)進(jìn)行乘法運(yùn)算,計(jì)算出最終分?jǐn)?shù)。其結(jié)果,語音識別部109根據(jù)最終分?jǐn)?shù)作為最終識別結(jié)果而識別出「體育」。
接著,控制部112對由語音識別部109所識別出的字詞(下面,稱為識別字詞)和EPG儲存部110中所儲存的EPG數(shù)據(jù)進(jìn)行參照,來檢索節(jié)目(步驟S204)。也就是說,控制部112通過識別字詞對EPG儲存部110中所儲存的EPG數(shù)據(jù)進(jìn)行檢索。隨后,控制部112判定在EPG數(shù)據(jù)中是否存在識別字詞(步驟S205)。
該結(jié)果為,在EPG數(shù)據(jù)中包含識別字詞的場合(在步驟S205中為YES)下,控制部112對相應(yīng)的節(jié)目進(jìn)行指南(步驟S206)。
另一方面,在EPG數(shù)據(jù)中未包含識別字詞的場合(在步驟S205中為NO)下,控制部112因不存在相應(yīng)的節(jié)目,而做出例如「演員C演出的節(jié)目目前及在1周之內(nèi)不予播送」、「電影K目前不予播送」之類的回答(步驟S207)。
在此,因?yàn)橐巡捎美谜叩囊暵犅臍v和識別履歷制作出識別詞典,所以被語音識別出的字詞包含在識別詞典中,但是在未被EPG數(shù)據(jù)所包含的場合下,控制部112判斷出不是語音識別的錯(cuò)誤,可以回答有無相應(yīng)的節(jié)目。
根據(jù)上面的結(jié)構(gòu),通過對EPG數(shù)據(jù)、利用者的視聽履歷及語音識別履歷進(jìn)行參照來制作識別詞典,而可以將未被最新的EPG數(shù)據(jù)所包含的字詞作為識別對象字詞加以處理,在實(shí)行節(jié)目檢索的場合下,能夠?qū)φZ音識別的錯(cuò)誤和檢索數(shù)據(jù)的有無加以識別,可以根據(jù)利用者的不同來實(shí)現(xiàn)使用方便的良好語音接口。
另外,由于對登錄字詞實(shí)行加權(quán)并附加「對象權(quán)重系數(shù)」和「履歷權(quán)重系數(shù)」等制作出識別詞典,因而可以提高語音識別的識別率。
再者,由于制作多個(gè)識別詞典并從利用者接受所使用識別詞典的選擇,因而通過由認(rèn)為語音識別部109識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而能夠提高識別率,可以實(shí)現(xiàn)易于使用的接口。
(實(shí)施方式2)在本實(shí)施方式2中,將有關(guān)下述情形予以說明,即除去在實(shí)施方式1中所說明的利用者以今后播送的節(jié)目為對象進(jìn)行檢索所用的識別詞典之外,還制作以從前錄制(或觀看)的節(jié)目為對象進(jìn)行檢索所用的識別詞典,并且按照目的實(shí)行檢索。
圖15是表示包含本發(fā)明實(shí)施方式2所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。還有,對于與實(shí)施方式1相同的部分附加同樣的符號,以省略詳細(xì)的說明。
該節(jié)目指南裝置如圖15所示,代替實(shí)施方式1的EPG接收部101及EPG儲存部110,而具備節(jié)目·EPG接收部201、節(jié)目·EPG儲存部202及錄制信息儲存部203。另外,詞典制作部204、詞典選擇部205及控制部206的動(dòng)作與實(shí)施方式1有所差異。
節(jié)目·EPG接收部201用來從所輸入的電視信號分離出EPG數(shù)據(jù)及節(jié)目數(shù)據(jù)。節(jié)目·EPG儲存部202用來存儲EPG數(shù)據(jù)及節(jié)目數(shù)據(jù)。錄制信息儲存部203用來存儲與正被錄制的節(jié)目有關(guān)的信息。在此,例如如圖16所示記錄有「記述」,表示正被錄制的節(jié)目;「視聽日期時(shí)間」,表示該節(jié)目被錄制的日期時(shí)間;「種類」,表示該節(jié)目的類型;「預(yù)約·儲存」,表示利用者進(jìn)行了或者系統(tǒng)進(jìn)行了該節(jié)目的錄制預(yù)約。還有,系統(tǒng)實(shí)行錄制預(yù)約指的是,例如對所有包括關(guān)鍵字的節(jié)目進(jìn)行錄制的情形等,該關(guān)鍵字是由利用者所指定的。
控制部206將與進(jìn)行錄制的節(jié)目有關(guān)的信息輸出到錄制信息儲存部203中。
詞典制作部204制作如圖17所示的那種加權(quán)利用者自適應(yīng)式識別詞典,該識別詞典作為以從前錄制(或觀看)的節(jié)目為對象進(jìn)行檢索所用的識別詞典,例如根據(jù)圖7所示的發(fā)音頻率調(diào)查結(jié)果等,對已在實(shí)施方式1中所說明的加權(quán)利用者自適應(yīng)式識別詞典的「對象權(quán)重系數(shù)」進(jìn)行變更。在此,作為「對象權(quán)重系數(shù)」,對「種類」是節(jié)目名(未視聽節(jié)目)的字詞賦予「1.11」,對「種類」是節(jié)目名(已視聽節(jié)目)的字詞賦予「1.30」,對「種類」是日期時(shí)間的字詞賦予「1.30」,對「種類」是播送臺·頻道的字詞賦予「1.03」,對「種類」是類型的字詞賦予「1.49 」,對「種類」是演員的字詞賦予「1.07」。此時(shí),詞典制作部204對于有關(guān)節(jié)目名是未視聽節(jié)目還是已視聽節(jié)目,是根據(jù)錄制信息儲存部203中所存儲的「預(yù)約·儲存」信息進(jìn)行判定的。也就是說,在系統(tǒng)進(jìn)行了節(jié)目的錄制預(yù)約的場合下,判定出是未視聽節(jié)目,在利用者進(jìn)行了節(jié)目的錄制預(yù)約的場合下,判定出是已視聽節(jié)目。
詞典選擇部205從利用者接受檢索對象是今后播送的節(jié)目還是從前錄制(或觀看)的節(jié)目的指令,按照檢索對象來選擇識別詞典。也就是說,在檢索對象是今后播送的節(jié)目的場合下,選擇實(shí)施方式1中所說明的如圖8所示的那種類型加權(quán)大的加權(quán)利用者自適應(yīng)式識別詞典,在檢索對象是從前觀看或錄制的節(jié)目的場合下,選擇如圖7所示的那種節(jié)目名加權(quán)大的加權(quán)利用者自適應(yīng)式識別詞典。
下面,有關(guān)如上所構(gòu)成的節(jié)目指南裝置的聯(lián)機(jī)處理過程的動(dòng)作,予以說明。圖18是表示在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。還有,有關(guān)脫機(jī)處理過程的動(dòng)作因與實(shí)施方式1相同,而省略說明。
詞典選擇部205從利用者接受檢索對象是今后播送的節(jié)目還是從前觀看或錄制的節(jié)目的指令(步驟S301)。在此,在檢索對象是今后播送的節(jié)目的場合下,將類型加權(quán)大的加權(quán)利用者自適應(yīng)式識別詞典作為由語音識別部109所使用的識別詞典進(jìn)行選擇(步驟S302)。另一方面,在檢索對象是從前觀看或錄制的節(jié)目的場合下,將節(jié)目名加權(quán)大的加權(quán)利用者自適應(yīng)式識別詞典作為由語音識別部109所使用的識別詞典進(jìn)行選擇(步驟S303)。
此后的動(dòng)作(步驟S203~步驟S207)與實(shí)施方式1相同。
如上所述,由于按照檢索對象是今后播送的節(jié)目還是從前錄制(或觀看)的節(jié)目,來制作多個(gè)識別詞典并選擇出由語音識別部109所使用的識別詞典,因而能夠提高識別率,可以實(shí)現(xiàn)易于使用的接口。
還有,在本實(shí)施方式中雖然作為在錄制信息儲存部203中所存儲的錄制信息而記錄有表示利用者進(jìn)行了或者系統(tǒng)進(jìn)行了該節(jié)目錄制預(yù)約的「預(yù)約·儲存」,但是并不限定于此。例如,也可以是表示已預(yù)約節(jié)目實(shí)行錄制或者利用者直接進(jìn)行了錄制操作的信息、表示實(shí)際上利用者已進(jìn)行視聽或未進(jìn)行視聽的信息以及表示已利用EPG進(jìn)行節(jié)目錄制預(yù)約或者已指定日期時(shí)間予以實(shí)行的信息等。另外,也可以使用多個(gè)那些信息。
(實(shí)施方式3)在實(shí)施方式1中,在識別詞典進(jìn)行更新時(shí)對新制作出的識別詞典和舊的識別詞典進(jìn)行更換,而在本實(shí)施方式3中,將說明在對識別詞典進(jìn)行部分更新的同時(shí),刪除識別詞典內(nèi)所登錄的字詞之中于指定期間之前登錄的字詞的情況。
圖19是表示包含本發(fā)明實(shí)施方式3所涉及語音識別詞典制作裝置的節(jié)目指南裝置結(jié)構(gòu)的框圖。還有,對于與實(shí)施方式1相同的部分附加同樣的符號,以省略詳細(xì)說明。
該節(jié)目指南裝置如圖15所示,除實(shí)施方式1的結(jié)構(gòu)之外還具備字詞刪除部301。另外,詞典制作部303及控制部302的動(dòng)作與實(shí)施方式1有所差異。
詞典制作部303與實(shí)施方式1相同,在制作出基本識別詞典、利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典之后,對與詞典儲存部107內(nèi)所儲存的基本識別詞典、利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典的不同的部分加以部分更新。
字詞刪除部503對時(shí)鐘111的日期時(shí)間、從控制部112所輸出的節(jié)目內(nèi)容及從識別字詞儲存部105所輸出的過去識別字詞進(jìn)行參照,刪除識別詞典內(nèi)所登錄的字詞之中于指定期間(例如一星期)之前登錄的字詞。
下面,有關(guān)如上所構(gòu)成的節(jié)目指南裝置脫機(jī)處理過程的動(dòng)作,予以說明。圖20是表示在節(jié)目指南裝置中聯(lián)機(jī)處理過程動(dòng)作的流程圖。還有,有關(guān)聯(lián)機(jī)處理過程的動(dòng)作因與實(shí)施方式1相同,而省略說明。
輸入電視信號的EPG接收部101從電視信號取出EPG數(shù)據(jù),輸出到字詞提取部102及EPG儲存部110(步驟S401)。
接著,字詞提取部102從EPG數(shù)據(jù)作為新識別用字詞提取「節(jié)目名」、「演員」及「類型」(步驟S402),該新識別用字詞為語音識別的關(guān)鍵字。
接著,詞典制作部103采用從字詞提取部102所輸入的新識別字詞、固定字詞儲存部104所儲存的固定字詞及固定字詞儲存部104所儲存的語音識別所需要的讀音假名和詞類等的信息,與以往的識別詞典同樣制作基本識別詞典(步驟S403)。
接著,詞典制作部103參照從視聽履歷字詞儲存部106所輸入的視聽履歷字詞及從識別字詞儲存部105所輸入的過去識別字詞,如果存在基本識別詞典中所登錄的字詞以外的字詞,則對登錄于基本識別詞典中的字詞追加該字詞,制作如圖6所示的那種利用者自適應(yīng)式識別詞典。再者,詞典制作部103實(shí)行加權(quán),該加權(quán)包括與字詞種類相應(yīng)的加權(quán)、以及與是在識別字詞儲存部105中作為過去識別字詞被存儲還是在視聽履歷字詞儲存部106中作為視聽履歷字詞被存儲相應(yīng)的加權(quán),例如如圖8所示制作加權(quán)利用者自適應(yīng)式識別詞典(步驟S404),該識別詞典除去「記述」、「讀音」及「種類」之外還存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」。
接著,詞典制作部103求出詞典儲存部502中所儲存的識別詞典(基本識別詞典、利用者自適應(yīng)式識別詞典及加權(quán)利用者自適應(yīng)式識別詞典)和新制作出的識別詞典之間的差分,根據(jù)新制作出的識別詞典將未被已儲存的識別詞典所包含的字詞登錄于詞典儲存部107中,以此對識別詞典進(jìn)行部分更換予以更新(步驟S405)。
接著,字詞刪除部301采用時(shí)鐘111的日期時(shí)間和給識別詞典的字詞所添加的日期時(shí)間,從識別詞典刪除在指定期間(例如一星期)之前所更新的字詞。但是,實(shí)行刪除的期間也可以由利用者加以設(shè)定。另外,利用者自適應(yīng)式識別詞典中所包含的字詞與基本識別詞典相比可以進(jìn)一步延長實(shí)行刪除的期間,進(jìn)而采用利用者的視聽履歷,也可以將與過去觀看的節(jié)目有關(guān)的字詞設(shè)為不在刪除對象內(nèi)。再者,也可以按照字詞的種類或類型等對實(shí)行刪除的期間加以變更。
還有,在硬資源缺乏的場合下,也可以取代實(shí)行加權(quán),例如刪除利用者使用頻率低的節(jié)目已被分類的類型的新識別用字詞。
另外,利用者自適應(yīng)式識別詞典即使采用視聽履歷字詞、過去識別字詞的任一方進(jìn)行制作,也可以得到相同的效果。
另外,在給更新后的字詞添加更新日期時(shí)間并且舊的識別詞典中存在相同字詞的場合下,再次添加更新時(shí)的日期時(shí)間。
根據(jù)上面的結(jié)構(gòu),通過對EPG數(shù)據(jù)、利用者的視聽履歷及語音識別履歷進(jìn)行參照來新制作識別詞典并對上次制作出的識別詞典進(jìn)行部分更換,而可以將未被最新的EPG數(shù)據(jù)所包含的字詞作為識別對象字詞進(jìn)行處理,在實(shí)行節(jié)目檢索的場合下,能夠?qū)φZ音識別的錯(cuò)誤和檢索數(shù)據(jù)的有無進(jìn)行識別,可以根據(jù)利用者的不同來實(shí)現(xiàn)使用方便的良好語音接口。
再者,由于制作多個(gè)識別詞典并從利用者接受所使用識別詞典的選擇,因而通過認(rèn)為語音識別部109識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而能夠提高識別率,可以實(shí)現(xiàn)易于使用的接口。
(實(shí)施方式4)
在實(shí)施方式1~3中,有關(guān)檢索電視播送節(jié)目的情形已做出說明,而在本實(shí)施方式4中將有關(guān)對音樂內(nèi)容進(jìn)行檢索的情形予以說明。
圖21是表示包含本發(fā)明實(shí)施方式4所涉及語音識別詞典制作裝置的音樂指南裝置結(jié)構(gòu)的框圖。還有,對于與實(shí)施方式1相同的部分附加同樣的符號,以省略詳細(xì)說明。
該音樂指南裝置如圖21所示,代替實(shí)施方式1的EPG接收部101、視聽履歷字詞儲存部106及EPG儲存部110,而具備音樂數(shù)據(jù).音樂信息·視聽履歷儲存部401。另外,字詞提取部402、詞典制作部403及控制部404的動(dòng)作與實(shí)施方式1有所差異。
音樂數(shù)據(jù)·音樂信息·視聽履歷儲存部401用來存儲音樂數(shù)據(jù)、音樂信息及視聽履歷。在此,作為音樂信息如圖22所示記錄有「音樂名稱」,表示音樂的名稱;「藝術(shù)家」,表示該音樂的演奏者;「唱片集」,表示已收錄該音樂的唱片集名;「類型」,表示該音樂的類型;「詳細(xì)」,表示該音樂的演奏時(shí)間和發(fā)售日等。
另外,作為視聽履歷如圖23所示記錄有「音樂名稱」,是音樂的名稱;「視聽期間」,表示視聽該音樂的期間;「視聽次數(shù)」,表示視聽該音樂的次數(shù);「儲存源」,表示是從何處儲存該音樂的。
字詞提取部402用來從音樂信息提取新識別用字詞,該新識別用字詞是「音樂名稱」、「藝術(shù)家」、「唱片集」及「類型」等作為識別對象的字詞。
詞典制作部403用來給通過字詞提取部402所提取的新識別用字詞及在固定字詞儲存部104中所存儲的固定字詞,添加語音識別所需要的讀音假名、詞類等的信息,并與上述實(shí)施方式1相同制作基本識別詞典。另外,詞典制作部403參照識別字詞儲存部105中所存儲的過去識別字詞,如果存在基本識別詞典中所登錄的字詞之外的字詞,則對登錄于基本識別詞典中的字詞追加該字詞,來制作利用者自適應(yīng)式識別詞典。
另外,詞典制作部403根據(jù)字詞是「音樂名稱」、「藝術(shù)家」、「唱片集」及「類型」等的哪種來實(shí)行加權(quán),決定「對象權(quán)重系數(shù)」。此時(shí),詞典制作部403根據(jù)該音樂是未視聽還是已視聽,使對各種種類的加權(quán)產(chǎn)生差異,來決定「對象權(quán)重系數(shù)」。
再者,詞典制作部403根據(jù)字詞是否在識別字詞儲存部105中作為過去識別字詞被存儲、是否是與具有視聽履歷的音樂有關(guān)的字詞以及儲存該音樂的是利用者還是系統(tǒng),來實(shí)行加權(quán)并決定「履歷權(quán)重系數(shù)」。隨后,詞典制作部403制作加權(quán)利用者自適應(yīng)式識別詞典,該識別詞典除去「記述」、「讀音」及「種類」之外還存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」。
在此,在該音樂是未視聽的場合下,作為「對象權(quán)重系數(shù)」如圖24所示,對「種類」是音樂名稱的字詞賦予「1.1 」,對「種類」是藝術(shù)家的字詞賦予「1.2 」,對「種類」是唱片集的字詞賦予「1.1」,對「種類」是類型的字詞賦予「1.3」。另一方面,在該音樂是未視聽的場合下作為「對象權(quán)重系數(shù)」,對「種類」是音樂名稱的字詞賦予「1.3」,對「種類」是藝術(shù)家的字詞賦予「1.3」,對「種類」是唱片集的字詞賦予「1.2」,對「種類」是類型的字詞賦予「1.3」。
另外,作為「履歷權(quán)重系數(shù)」,對在識別字詞儲存部105中作為過去識別字詞所存儲的字詞賦予「1.2」,對與具有視聽履歷的音樂有關(guān)的字詞賦予「1.1」,對與儲存的是利用者的音樂有關(guān)的字詞賦予「1.2」。此時(shí),在相應(yīng)有多個(gè)的場合下,添加系數(shù)設(shè)為「履歷權(quán)重系數(shù)」。
還有,有關(guān)在如上所構(gòu)成的音樂指南裝置中制作詞典的聯(lián)機(jī)處理過程以及采用所制作出的詞典來識別所輸入的語音并檢索音樂的脫機(jī)處理過程的動(dòng)作,因與實(shí)施方式1相同,而省略說明。
根據(jù)上面的結(jié)構(gòu),通過對音樂信息、利用者的視聽履歷及語音識別履歷進(jìn)行參照來制作識別詞典,而可以將未被最新的音樂信息所包含的字詞作為識別對象字詞加以處理,在實(shí)行節(jié)目檢索的場合下,能夠?qū)β曇糇R別的錯(cuò)誤和檢索數(shù)據(jù)的有無進(jìn)行識別,可以根據(jù)利用者的不同來實(shí)現(xiàn)使用方便的良好聲音接口。
另外,由于對登錄字詞實(shí)行加權(quán)并附加「對象權(quán)重系數(shù)」和「履歷權(quán)重系數(shù)」等制作出識別詞典,因而可以提高語音識別的識別率。
再者,由于制作多個(gè)識別詞典并從利用者接受所使用識別詞典的選擇,因而通過由認(rèn)為語音識別部109識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而能夠提高識別率,可以實(shí)現(xiàn)易于使用的接口。
還有,在本實(shí)施方式中雖然有關(guān)「履歷權(quán)重系數(shù)」是根據(jù)字詞是否在識別字詞儲存部105中作為過去識別字詞被存儲、是否是與具有視聽履歷的音樂有關(guān)的字詞以及儲存該音樂的是利用者還是系統(tǒng)來實(shí)行加權(quán)的,但是也可以只根據(jù)任1個(gè)來實(shí)行加權(quán)。另外,也可以分別給詞典各自添加「權(quán)重系數(shù)」。另外,也可以按照視聽次數(shù)和時(shí)刻等來變更「權(quán)重系數(shù)」。
另外,在本實(shí)施方式中雖然假定不將檢索對象分成未視聽還是已視聽進(jìn)行檢索,但是并不限定于此。例如,在將檢索對象分成未視聽或者已視聽進(jìn)行檢索的場合下,也可以按照分開檢索對象進(jìn)行檢索的情形和不分開檢索對象進(jìn)行檢索的情形,采用不同的「對象權(quán)重系數(shù)」。
(實(shí)施方式5)在實(shí)施方式4中有關(guān)檢索音樂內(nèi)容的情形已做出說明,而在本實(shí)施方式5中將有關(guān)對商店(餐廳)數(shù)據(jù)進(jìn)行檢索的情形予以說明。
圖25是表示包含本發(fā)明實(shí)施方式5所涉及語音識別詞典制作裝置的信息檢索裝置結(jié)構(gòu)的框圖。還有,對于與實(shí)施方式1相同的部分附加同樣的符號,以省略詳細(xì)說明。
該信息查詢裝置如圖21所示,代替實(shí)施方式1的EPG接收部101、視聽履歷字詞儲存部106及EPG儲存部110,而具備餐廳數(shù)據(jù)儲存部501及利用信息保存部504。另外,字詞提取部502、詞典制作部503及控制部505的動(dòng)作與實(shí)施方式1有所差異。
餐廳數(shù)據(jù)儲存部501用來存儲餐廳數(shù)據(jù)。在此,例如如圖26所示記錄有「店名」,表示餐廳的名稱;「類型1」,表示該餐廳的大致類型;「類型2」,表示該餐廳的詳細(xì)類型;「主菜單」,表示該餐廳經(jīng)營中的菜單;「營業(yè)時(shí)間」,表示該餐廳的營業(yè)時(shí)間。
利用信息保存部504用來存儲利用者所利用的餐廳利用信息。在此,例如如圖27所示記錄有「店名」,是餐廳的名稱;「利用期間」,表示利用者利用該餐廳的期間、「利用次數(shù)」,表示利用者利用該餐廳的次數(shù);「利用時(shí)間段」,表示利用者利用該餐廳的時(shí)間段。
字詞提取部502用來從餐廳數(shù)據(jù)提取新識別用字詞,該新識別用字詞是「店名」、「類型1」、「類型2」及「主菜單」等作為識別對象的字詞。
詞典制作部503用來向通過字詞提取部502所提取的新識別用字詞及在固定字詞儲存部104中所存儲的固定字詞,添加語音識別所需要的讀音假名、詞類等的信息,與上述實(shí)施方式1相同制作基本識別詞典。另外,詞典制作部503對識別字詞儲存部105中所存儲的過去識別字詞進(jìn)行參照,如果存在基本識別詞典中所登錄的字詞之外的字詞,則對登錄于基本識別詞典中的字詞追加該字詞,制作利用者自適應(yīng)式識別詞典。
另外,詞典制作部503根據(jù)字詞是「店名」、「類型1」、「類型2」及「主菜單」等的哪種來實(shí)行加權(quán),決定「對象權(quán)重系數(shù)」。此時(shí),詞典制作部503根據(jù)利用者是否利用過該餐廳,使對各個(gè)種類的加權(quán)產(chǎn)生差異來決定「對象權(quán)重系數(shù)」。
再者,詞典制作部503根據(jù)字詞是否在識別字詞儲存部105中作為過去識別字詞被存儲,來實(shí)行加權(quán)并決定「履歷權(quán)重系數(shù)」。隨后,詞典制作部503制作加權(quán)利用者自適應(yīng)式識別詞典,該識別詞典除去「記述」、「讀音」及「種類」之外還存儲有「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」。
在此,在該餐廳未被利用者加以利用的場合下,作為「對象權(quán)重系數(shù)」如圖28所示,對「種類」是店名的字詞賦予「1.1 」,對「種類」是類型1的字詞賦予「1.4」,對「種類」是類型2的字詞賦予[1.3」,對「種類」是主菜單的字詞賦予「1.3」。另一方面,在該餐廳被利用者利用過的場合下,作為「對象權(quán)重系數(shù)」,對「種類」是店名的字詞賦予「1.4」,對「種類」是類型1的字詞賦予「1.3 」,對「種類」是類型2的字詞賦予「1.4」,對「種類」是主菜單的字詞賦予「1.2」。
另外,作為「履歷權(quán)重系數(shù)」,對在識別字詞儲存部105中作為過去識別字詞所存儲的字詞賦予「1.5」。
還有,有關(guān)在如上所構(gòu)成的信息查詢裝置中制作詞典的聯(lián)機(jī)處理過程以及采用所制作出的詞典來識別所輸入的語音并檢索餐廳的脫機(jī)處理過程的動(dòng)作,因與實(shí)施方式1相同,而省略說明。
根據(jù)上面的結(jié)構(gòu),通過對利用者的利用信息及語音識別履歷進(jìn)行參照來制作識別詞典,而可以將未被最新的餐廳數(shù)據(jù)所包含的字詞作為識別對象字詞加以處理,在實(shí)行餐廳檢索的場合下,能夠?qū)φZ音識別的錯(cuò)誤和檢索數(shù)據(jù)的有無加以識別,可以根據(jù)利用者的不同來實(shí)現(xiàn)使用方便的良好語音接口。
另外,由于對登錄字詞實(shí)行加權(quán)并附加「對象權(quán)重系數(shù)」和「履歷權(quán)重系數(shù)」等來制作出識別詞典,因而可以提高語音識別的識別率。
再者,由于制作多個(gè)識別詞典并從利用者接受所使用識別詞典的選擇,因而通過由認(rèn)為語音識別部109識別率低的利用者從多個(gè)詞典選擇被認(rèn)為最合適的詞典,而可以提高識別率,能夠?qū)崿F(xiàn)易于使用的接口。
還有,在本實(shí)施方式中雖然有關(guān)「履歷權(quán)重系數(shù)」是根據(jù)字詞是否在識別字詞儲存部105中作為過去識別字詞被存儲來實(shí)行加權(quán)的,但是例如也可以按照識別次數(shù)或利用次數(shù)和利用時(shí)間段等予以變更。
另外,在本實(shí)施方式中雖然假定不分利用經(jīng)驗(yàn)的有無對檢索對象進(jìn)行檢索,但是并不限定于此。例如,在分成利用經(jīng)驗(yàn)的有無而對檢索對象進(jìn)行檢索的場合下,也可以按照分開檢索對象進(jìn)行檢索的情形和不分開檢索對象進(jìn)行檢索的情形,采用不同的「對象權(quán)重系數(shù)」。
產(chǎn)業(yè)上的可利用性如上所述,本發(fā)明所涉及的語音識別詞典制作裝置及信息檢索裝置能夠制作使語音識別的識別率得以提高的識別詞典,例如是節(jié)目指南裝置、音樂指南裝置及汽車導(dǎo)航系統(tǒng)等的信息檢索裝置,并且應(yīng)用于按照語音信號來檢索信息的裝置中。
權(quán)利要求
1.一種語音識別詞典制作裝置,制作在語音識別中使用的識別詞典,其特征為具備詞典制作裝置,根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
2.根據(jù)權(quán)利要求1記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置根據(jù)上述識別詞典中所登錄的字詞屬性,來制作多個(gè)內(nèi)容不同的上述識別詞典。
3.根據(jù)權(quán)利要求1記載的語音識別詞典制作裝置,其特征為上述經(jīng)驗(yàn)的有無是視聽經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述視聽經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
4.根據(jù)權(quán)利要求1記載的語音識別詞典制作裝置,其特征為上述經(jīng)驗(yàn)的有無是利用經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述利用經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
5.根據(jù)權(quán)利要求1記載的語音識別詞典制作裝置,其特征為上述經(jīng)驗(yàn)的有無是訪問經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述訪問經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
6.根據(jù)權(quán)利要求1記載的語音識別詞典制作裝置,其特征為上述語音識別詞典制作裝置,進(jìn)一步具備行動(dòng)履歷字詞取得裝置,用于根據(jù)利用者的行動(dòng)取得行動(dòng)履歷字詞,該行動(dòng)履歷字詞是作為識別對象的字詞;行動(dòng)履歷字詞儲存裝置,用來儲存所取得的上述行動(dòng)履歷字詞;固定字詞儲存裝置,儲存有預(yù)先設(shè)定的指定的固定字詞;字詞提取裝置,用來從所輸入的數(shù)據(jù)提取新識別用字詞,該新識別用字詞是作為識別對象的字詞;詞典儲存裝置,用來儲存所制作出的上述識別詞典,上述詞典制作裝置通過上述新識別用字詞、上述固定字詞以及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞;向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,來制作上述識別詞典。
7.根據(jù)權(quán)利要求6記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置將上述新識別用字詞、上述固定字詞和在上述行動(dòng)履歷字詞之中未被上述新識別用字詞及上述固定字詞包含的字詞確定為上述新登錄字詞。
8.根據(jù)權(quán)利要求6記載的語音識別詞典制作裝置,其特征為上述語音識別詞典制作裝置,進(jìn)一步具備識別字詞取得裝置,用來取得過去識別字詞,該過去識別字詞是通過語音識別所識別出的字詞;過去識別字詞儲存裝置,用來儲存上述過去識別字詞,上述詞典制作裝置通過上述新識別用字詞、上述固定字詞以及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞;向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,來制作上述識別詞典。
9.根據(jù)權(quán)利要求6記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置將上述新識別用字詞、上述固定字詞和在上述行動(dòng)履歷字詞及上述過去識別字詞之中未被上述新識別用字詞及上述固定字詞包含的字詞確定為上述新登錄字詞。
10.根據(jù)權(quán)利要求6或權(quán)利要求8記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置根據(jù)是否是上述行動(dòng)履歷字詞中含有的字詞,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,制作上述識別詞典。
11.根據(jù)權(quán)利要求8記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置根據(jù)是否是上述過去識別字詞中含有的字詞,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,制作上述識別詞典。
12.根據(jù)權(quán)利要求8記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置根據(jù)是否是上述行動(dòng)履歷字詞及上述過去識別字詞中含有的字詞,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,來制作上述識別詞典。
13.根據(jù)權(quán)利要求6或權(quán)利要求8記載的語音識別詞典制作裝置,其特征為上述所輸入的數(shù)據(jù)是結(jié)構(gòu)化后的數(shù)據(jù),上述字詞提取裝置與上述新識別用字詞一起提取上述新識別用字詞的屬性,上述詞典制作裝置基于上述新識別用字詞的屬性,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,來制作上述識別詞典。
14.根據(jù)權(quán)利要求13記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置按照目的,來制作多個(gè)基于上述新識別用字詞的屬性并且上述新登錄字詞的加權(quán)不同的上述識別詞典。
15.根據(jù)權(quán)利要求13記載的語音識別詞典制作裝置,其特征為具備指令受理裝置,用來從上述利用者受理與上述識別詞典的利用目的有關(guān)的指令,上述詞典制作裝置按照由上述指令受理裝置所受理的與上述利用目的有關(guān)的指令,來實(shí)行根據(jù)上述新識別用字詞屬性的上述新登錄字詞的加權(quán),制作上述識別詞典。
16.根據(jù)權(quán)利要求6或權(quán)利要求8記載的語音識別詞典制作裝置,其特征為上述語音識別詞典制作裝置,進(jìn)一步具備利用者信息取得裝置,用來取得對上述利用者加以辨別的利用者識別信息,上述詞典制作裝置對上述每個(gè)利用者識別信息制作上述識別詞典。
17.根據(jù)權(quán)利要求13記載的語音識別詞典制作裝置,其特征為上述語音識別詞典制作裝置,進(jìn)一步具備利用者信息取得裝置,用來取得對利用者加以辨別的利用者識別信息,上述詞典制作裝置對上述每個(gè)利用者識別信息分別實(shí)行上述新登錄字詞的加權(quán),制作上述識別詞典。
18.根據(jù)權(quán)利要求6記載的語音識別詞典制作裝置,其特征為上述行動(dòng)履歷字詞取得裝置與上述行動(dòng)履歷字詞一起將行動(dòng)日期時(shí)間記錄到上述行動(dòng)履歷字詞儲存裝置中,上述詞典制作裝置向上述新登錄字詞之中的上述行動(dòng)履歷字詞進(jìn)一步附加上述行動(dòng)日期時(shí)間,制作上述識別詞典,上述語音識別詞典制作裝置,進(jìn)一步具備字詞刪除裝置,用來從上述識別詞典刪除由上述登錄字詞的上述行動(dòng)日期時(shí)間經(jīng)過指定期間后的上述登錄字詞。
19.根據(jù)權(quán)利要求6記載的語音識別詞典制作裝置,其特征為上述語音識別詞典制作裝置,進(jìn)一步具備EPG接收裝置,用來從電視信號分離出作為電子節(jié)目指南的EPG數(shù)據(jù),上述利用者的行動(dòng)是節(jié)目的視聽,上述行動(dòng)履歷字詞取得裝置根據(jù)上述利用者的視聽來取得上述行動(dòng)履歷字詞,上述字詞提取裝置從上述EPG數(shù)據(jù)對作為上述屬性的每個(gè)項(xiàng)目提取上述新識別用字詞。
20.根據(jù)權(quán)利要求19記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置根據(jù)上述EPG數(shù)據(jù)的上述項(xiàng)目,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,制作上述識別詞典。
21.根據(jù)權(quán)利要求20記載的語音識別詞典制作裝置,其特征為上述詞典制作裝置用來制作今后節(jié)目用識別詞典以及錄制節(jié)目用識別詞典,該今后節(jié)目用識別詞典使對上述項(xiàng)目為類型的上述登錄字詞的權(quán)重,比對上述項(xiàng)目為名稱的上述登錄字詞權(quán)重大地進(jìn)行加權(quán),該錄制節(jié)目用識別詞典使對上述項(xiàng)目為名稱的上述登錄字詞權(quán)重,比對上述項(xiàng)目為類型的上述登錄字詞權(quán)重大地進(jìn)行加權(quán)。
22.一種信息檢索裝置,用來制作語音識別所使用的識別詞典,并通過由利用者發(fā)音而產(chǎn)生的語音信號來檢索信息,其特征為具備詞典制作裝置,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典;語音識別裝置,用于通過參照上述識別詞典,從上述語音信號識別出特定的字詞;數(shù)據(jù)儲存裝置,用來儲存所輸入的數(shù)據(jù);控制裝置,用來從上述數(shù)據(jù)檢索由上述語音識別裝置所識別出的字詞,輸出相應(yīng)的信息。
23.根據(jù)權(quán)利要求22記載的信息檢索裝置,其特征為上述詞典制作裝置根據(jù)上述識別詞典中所登錄的字詞屬性,來制作多個(gè)內(nèi)容不同的上述識別詞典。
24.根據(jù)權(quán)利要求22記載的信息檢索裝置,其特征為上述經(jīng)驗(yàn)的有無是視聽經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述視聽經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
25.根據(jù)權(quán)利要求22記載的信息檢索裝置,其特征為上述經(jīng)驗(yàn)的有無是利用經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述利用經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
26.根據(jù)權(quán)利要求22記載的信息檢索裝置,其特征為上述經(jīng)驗(yàn)的有無是訪問經(jīng)驗(yàn)的有無,上述詞典制作裝置根據(jù)上述訪問經(jīng)驗(yàn)的有無,來制作多個(gè)內(nèi)容不同的上述識別詞典。
27.根據(jù)權(quán)利要求22記載的信息檢索裝置,其特征為上述信息檢索裝置,進(jìn)一步具備行動(dòng)履歷字詞取得裝置,用于根據(jù)利用者的行動(dòng)來取得行動(dòng)履歷字詞,該行動(dòng)履歷字詞是作為識別對象的字詞;行動(dòng)履歷字詞儲存裝置,用來儲存所取得的上述行動(dòng)履歷字詞;固定字詞儲存裝置,儲存有預(yù)先設(shè)定的指定的固定字詞;字詞提取裝置,用來從所輸入的數(shù)據(jù)提取新識別用字詞,該新識別用字詞是作為識別對象的字詞;詞典儲存裝置,用來儲存制作出的上述識別詞典,上述詞典制作裝置通過上述新識別用字詞、上述固定字詞以及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞,向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,來制作上述識別詞典。
28.根據(jù)權(quán)利要求27記載的信息檢索裝置,其特征為上述所輸入的數(shù)據(jù)是結(jié)構(gòu)化后的數(shù)據(jù),上述字詞提取裝置與上述新識別用字詞一起提取上述新識別用字詞的屬性,上述詞典制作裝置基于上述新識別用字詞的屬性,來實(shí)行上述新登錄字詞的加權(quán),并附加與上述加權(quán)有關(guān)的信息,來制作上述識別詞典,并按照目的,來制作多個(gè)基于上述新識別用字詞的屬性并且上述新登錄字詞的加權(quán)不同的上述識別詞典,上述信息檢索裝置,進(jìn)一步具備詞典選擇受理裝置,用來受理由利用者從上述詞典儲存裝置中儲存的多個(gè)上述識別詞典所選擇的詞典,上述語音識別裝置通過參照由上述詞典選擇受理裝置所受理的識別詞典,而從語音信號識別出特定的字詞,該語音信號是由利用者發(fā)音而產(chǎn)生的。
29.根據(jù)權(quán)利要求27記載的信息檢索裝置,其特征為上述信息檢索裝置,進(jìn)一步具備EPG接收裝置,用來從電視信號分離出作為電子節(jié)目指南的EPG數(shù)據(jù),上述利用者的行動(dòng)是節(jié)目的視聽,上述行動(dòng)履歷字詞取得裝置根據(jù)上述利用者的視聽來取得上述行動(dòng)履歷字詞,上述字詞提取裝置從上述EPG數(shù)據(jù)對作為上述屬性的每個(gè)項(xiàng)目提取上述新識別用字詞,上述數(shù)據(jù)儲存裝置用來儲存上述EPG數(shù)據(jù),上述控制裝置用來從上述EPG數(shù)據(jù)檢索由上述語音識別裝置所識別出的字詞,輸出與相應(yīng)的節(jié)目有關(guān)的信息。
30.一種語音識別詞典制作裝置,用來制作語音識別所使用的識別詞典,其特征為具備行動(dòng)履歷字詞取得裝置,用于根據(jù)利用者的行動(dòng)來取得行動(dòng)履歷字詞,該行動(dòng)履歷字詞是作為識別對象的字詞;行動(dòng)履歷字詞儲存裝置,用來儲存所取得的上述行動(dòng)履歷字詞;固定字詞儲存裝置,儲存預(yù)先設(shè)定的指定的固定字詞;字詞提取裝置,用來從所輸入的數(shù)據(jù)提取新識別用字詞,該新識別用字詞是作為識別對象的字詞;詞典制作裝置,用于通過上述新識別用字詞、上述固定字詞以及上述行動(dòng)履歷字詞來決定新登錄字詞,該新登錄字詞是向上述識別詞典登錄的字詞,向上述新登錄字詞附加表示上述新登錄字詞讀音假名及詞類的信息,制作上述識別詞典;詞典儲存裝置,用來儲存所制作出的上述識別詞典。
31.一種語音識別詞典制作方法,用來制作語音識別所使用的識別詞典,其特征為包含詞典制作步驟,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
32.一種信息檢索方法,用來制作語音識別所使用的識別詞典,并通過由利用者發(fā)音而產(chǎn)生的語音信號來檢索信息,其特征為包含詞典制作步驟,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典;語音識別步驟,用于通過參照上述識別詞典,從上述語音信號識別出特定的字詞;控制步驟,用來從上述所輸入的數(shù)據(jù)檢索由上述語音識別裝置所識別出的字詞,輸出相應(yīng)的信息。
33.一種程序,用來制作語音識別所使用的識別詞典,其特征為使計(jì)算機(jī),實(shí)行詞典制作步驟,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典。
34.一種程序,用來制作語音識別所使用的識別詞典,并通過由利用者發(fā)音而產(chǎn)生的語音信號來檢索信息,其特征為使計(jì)算機(jī),實(shí)行詞典制作步驟,用于根據(jù)利用者經(jīng)驗(yàn)的有無來制作多個(gè)內(nèi)容不同的上述識別詞典;語音識別步驟,用于通過參照上述識別詞典,從上述語音信號識別出特定的字詞;控制步驟,用來從上述所輸入的數(shù)據(jù)檢索由上述語音識別裝置所識別出的字詞,輸出相應(yīng)的信息。
全文摘要
節(jié)目指南裝置具備識別字詞儲存部(105),用來存儲過去識別字詞,該過去識別字詞是過去通過語音識別所識別出的字詞;視聽履歷字詞儲存部(106),用來存儲視聽履歷字詞,該視聽履歷字詞是所視聽的節(jié)目信息;詞典制作部(103),用來制作利用者自適應(yīng)式識別詞典和加權(quán)利用者自適應(yīng)式識別詞典,該利用者自適應(yīng)式識別詞典已在基本識別詞典中添加基本識別詞典中不存在的過去識別字詞及視聽履歷字詞,該加權(quán)利用者自適應(yīng)式識別詞典已按照「對象權(quán)重系數(shù)」及「履歷權(quán)重系數(shù)」實(shí)行加權(quán),該「對象權(quán)重系數(shù)」與字詞的種類相應(yīng),該「履歷權(quán)重系數(shù)」與是否作為過去識別字詞及視聽履歷字詞被存儲相應(yīng)。
文檔編號G06F17/21GK1530926SQ20041003041
公開日2004年9月22日 申請日期2004年3月15日 優(yōu)先權(quán)日2003年3月13日
發(fā)明者井上剛, 西崎誠, 小沼知浩, 浩 申請人:松下電器產(chǎn)業(yè)株式會社