專利名稱:信息終端、服務(wù)器裝置、檢索系統(tǒng)及其檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息終端的技術(shù)。
背景技術(shù):
以往,在導(dǎo)航裝置等信息終端中,使用通過麥克風(fēng)等接收聲音輸入,檢索可能是目的地或經(jīng)過地點(diǎn)的地理名稱的技術(shù)。專利文獻(xiàn)I中,記載了關(guān)于這樣的導(dǎo)航裝置的技術(shù)。專利文獻(xiàn)1:日本特開2006-349427號(hào)公報(bào)
發(fā)明內(nèi)容
在上述這樣的導(dǎo)航裝置中,實(shí)施在導(dǎo)航裝置中識(shí)別聲音,對(duì)作為候選的設(shè)施等進(jìn)行詞典檢索的處理,為了提供更高的檢索功能,考慮到導(dǎo)航裝置的處理負(fù)荷需要使用非常高性能的設(shè)備。本發(fā)明的目的在于提供能夠更輕松地使用高級(jí)的檢索功能的信息終端的技術(shù)。為了解決上述課題,本發(fā)明的信息終端的特征在于,包括接收聲音的輸入的聲音輸入接收單元;通過網(wǎng)絡(luò)與規(guī)定的服務(wù)器裝置進(jìn)行通信的通信單元;輸出單元;將由上述聲音輸入接收單元接收到的聲音的信息發(fā)送至上述服務(wù)器裝置,并接收確定與上述聲音的信息相關(guān)的POI (興趣點(diǎn))的候選的信息的POI確定單元;將由上述POI確定單元接收到的確定POI的候選的信息輸出至上述輸出單元的POI候選輸出單元;和接收確定上述POI的候選的信息的選擇輸入并搜索到達(dá)該P(yáng)OI的路徑的路徑搜索單元。此外,本發(fā)明的服務(wù)器裝置的特征在于,包括通過網(wǎng)絡(luò)從規(guī)定的信息終端接收聲音信息的聲音信息接收單元;從上述聲音信息中除去噪聲信息的噪聲除去單元;將除去噪聲后的上述聲音信息通過上述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送單元;通過上述網(wǎng)絡(luò)接收與上述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的POI信息接收單元;和將上述POI的信息發(fā)送至上述信息終端的POI信息發(fā)送單元。此外,本發(fā)明的檢索系統(tǒng)是具有信息終端和通過網(wǎng)絡(luò)與上述信息終端進(jìn)行通信的服務(wù)器裝置的檢索系統(tǒng),其特征在于上述信息終端包括接收聲音的輸入的聲音輸入接收單元;通過網(wǎng)絡(luò)與上述服務(wù)器裝置進(jìn)行通信的通信單元;輸出單元;將由上述聲音輸入接收單元接收到的聲音的信息發(fā)送至上述服務(wù)器裝置并接收確定與上述聲音的信息相關(guān)的POI (興趣點(diǎn))的候選的信息的POI確定單元;將由上述POI確定單元接收到的確定POI的候選的信息輸出至上述輸出單元的POI候選輸出單元;和接收(受理)確定上述POI的候選的信息的選擇輸入并搜索到達(dá)該P(yáng)OI的路徑的路徑搜索單元,上述服務(wù)器裝置包括通過網(wǎng)絡(luò)從上述信息終端接收聲音信息的聲音信息接收單元;從上述聲音信息中除去噪聲信息的噪聲除去單元;將除去噪聲后的上述聲音信息通過上述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送單元;通過上述網(wǎng)絡(luò)接收與上述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的POI信息接收單元;和將上述POI的信息發(fā)送至上述信息終端的POI信息發(fā)送單元。
此外,本發(fā)明的檢索方法是具有信息終端和通過網(wǎng)絡(luò)與上述信息終端進(jìn)行通信的服務(wù)器裝置的檢索系統(tǒng)的檢索方法,該檢索方法的特征在于上述檢索系統(tǒng)包括接收聲音的輸入的聲音輸入接收單元;和輸出單元,上述檢索方法實(shí)施以下步驟將由上述聲音輸入接收單元接收到的聲音的信息發(fā)送至上述服務(wù)器裝置的發(fā)送步驟;通過上述網(wǎng)絡(luò)從上述信息終端接收聲音信息的聲音信息接收步驟;從上述聲音信息中除去噪聲信息的噪聲除去步驟;將除去噪聲后的上述聲音信息通過上述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送步驟;通過上述網(wǎng)絡(luò)從上述聲音識(shí)別裝置接收與上述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的POI信息接收步驟;將上述POI的信息發(fā)送至上述信息終端的POI信息發(fā)送步驟;接收上述POI的信息的POI確定步驟;將通過上述POI確定步驟接收到的POI信息輸出至上述輸出單元的POI候選輸出步驟。根據(jù)本發(fā)明,能夠提供能夠更容易地使用高級(jí)的檢索功能的信息終端的技術(shù)。
圖1是檢索系統(tǒng)的概要圖。
圖2是中轉(zhuǎn)服務(wù)器裝置的硬件結(jié)構(gòu)圖。
圖3是導(dǎo)航裝置的概要結(jié)構(gòu)圖。
圖4是表不鏈接表的結(jié)構(gòu)的圖。
圖5是運(yùn)算處理部的功能結(jié)構(gòu)圖。
圖6是表示信息檢索處理的流程的圖。
圖7是信息檢索處理中的順序圖。
圖8是POI檢索結(jié)果整合處理的流程圖。
圖9是麥克風(fēng)選擇處理的流程圖。
圖10是說話時(shí)麥克風(fēng)選擇處理的流程圖。
圖11是表示信息檢索處理的變形例的流程的圖。
圖12是信息檢索處理的其他變形例的順序圖。
符號(hào)說明
I……運(yùn)算處理部,2……顯示器,3……存儲(chǔ)裝置,4……聲音輸出輸入裝置,5……
輸入裝置,6……ROM裝置,7……車速傳感器,8……回轉(zhuǎn)儀傳感器,9……GPS接收裝置,10……FM多路播放接收裝置,11……指向標(biāo)接收裝置,12……通信裝置,21……CPU,22……RAM, 23……ROM, 24……I/F,25……總線,30……網(wǎng)絡(luò),41……麥克風(fēng),42……揚(yáng)聲器,43……擴(kuò)展麥克風(fēng),51……觸摸面板,52……撥盤開關(guān),100……導(dǎo)航裝置,101……基本控 制部,102……輸入接收部,103……輸出處理部,104……噪聲水平判定部,105……中轉(zhuǎn)服務(wù)器通信部,106……POI提示信息生成部,107……麥克風(fēng)識(shí)別部,200……鏈接表,500……中轉(zhuǎn)服務(wù)器裝置,510……存儲(chǔ)部,520……控制部,530……發(fā)送接收部,1000……檢索系統(tǒng)
具體實(shí)施例方式以下,參照
應(yīng)用了本發(fā)明的第一實(shí)施方式的導(dǎo)航裝置和檢索系統(tǒng)。圖1是表示檢索系統(tǒng)1000的整體結(jié)構(gòu)的圖。檢索系統(tǒng)1000構(gòu)成為能夠通過互聯(lián)網(wǎng)等遠(yuǎn)程網(wǎng)或 LAN (Local Area Network :局域網(wǎng))、WAN (Wide Area Network :廣域網(wǎng))、移動(dòng)電話網(wǎng)等網(wǎng)絡(luò)30,與車輛上搭載的導(dǎo)航裝置100、中轉(zhuǎn)服務(wù)器裝置500、聲音確定服務(wù)器裝置900、POI提供服務(wù)器裝置950連接。此處,聲音確定服務(wù)器裝置900是實(shí)現(xiàn)規(guī)定的運(yùn)營(yíng)商等通過網(wǎng)絡(luò)30提供的聲音識(shí)別服務(wù)的裝置。本實(shí)施方式中,聲音確定服務(wù)器裝置900接收到發(fā)送的聲音信息(確定聲音的特性的波形信息)時(shí),進(jìn)行聲音識(shí)別,將識(shí)別出的語(yǔ)言作為字符串發(fā)送。其中,由于識(shí)別出的語(yǔ)言通常具有模糊性,因此進(jìn)行N-best檢索等允許模糊度的識(shí)別,根據(jù)識(shí)別的準(zhǔn)確度發(fā)·送存在相應(yīng)的可能性的一個(gè)或多個(gè)字符串。此外,POI提供服務(wù)器裝置950是實(shí)現(xiàn)規(guī)定的運(yùn)營(yíng)商等通過網(wǎng)絡(luò)30提供的POI(Point Of Interest :興趣點(diǎn))的檢索服務(wù)的裝置。本實(shí)施方式中,POI提供服務(wù)器裝置950接收到發(fā)送的字符串時(shí),檢索并確定與該字符串對(duì)應(yīng)的Ρ0Ι,即包括該字符串、或包括與該字符串類似的字符串的一個(gè)或多個(gè)Ρ0Ι,根據(jù)其相應(yīng)的準(zhǔn)確度發(fā)送POI的列表。其中,POI的列表中,對(duì)于發(fā)送的每個(gè)字符串,按照準(zhǔn)確度從高到低的順序關(guān)聯(lián)一個(gè)或多個(gè)POI,各POI包括POI的名稱、確定POI的位置的緯度經(jīng)度等坐標(biāo)信息、POI的地址、POI的電話號(hào)碼等。導(dǎo)航裝置100是能夠顯示地圖信息,表示指示導(dǎo)航裝置100的當(dāng)前位置的地點(diǎn)和引導(dǎo)到設(shè)定的目的地的路徑的信息的所謂的導(dǎo)航裝置。中轉(zhuǎn)服務(wù)器裝置500從導(dǎo)航裝置100接收到POI的檢索請(qǐng)求和聲音信息時(shí),對(duì)于聲音信息進(jìn)行噪聲除去,向聲音確定服務(wù)器裝置900發(fā)送,將從聲音確定服務(wù)器裝置900發(fā)送的字符串發(fā)送至POI提供服務(wù)器裝置950,將接收到的POI列表發(fā)送至導(dǎo)航裝置100。此處,對(duì)于中轉(zhuǎn)服務(wù)器裝置500的結(jié)構(gòu),進(jìn)一步詳細(xì)地說明。中轉(zhuǎn)服務(wù)器裝置500包括存儲(chǔ)部510、控制部520、發(fā)送接收部530。在存儲(chǔ)部510中,保存有服務(wù)器信息表511,保存了為了確定用于進(jìn)行聲音確定的聲音確定服務(wù)器裝置900和用于進(jìn)行POI提供的POI提供服務(wù)器裝置950的設(shè)定信息??刂撇?20中包括噪聲除去處理部521和POI提示部522。噪聲除去處理部521對(duì)于從導(dǎo)航裝置100接收到的聲音信息,使用一種或多種噪聲除去算法,進(jìn)行與各算法相應(yīng)的噪聲除去。即,噪聲除去處理部521例如能夠執(zhí)行4種噪聲除去算法的情況下,對(duì)于從導(dǎo)航裝置100接收到的聲音信息,應(yīng)用各算法,輸出4種已除去噪聲的聲音信息。其中,這樣的算法有通過自適應(yīng)濾波除去噪聲的算法、在頻域中除去噪聲的頻譜的譜減、在頻域中對(duì)于按時(shí)間變化的短時(shí)譜(Running Spectrum)按每個(gè)頻率使在時(shí)間軸方向上通過數(shù)字濾波器而除去噪聲的運(yùn)行頻譜濾波(Running Spectrum Filter)等算法。POI提示部522,從導(dǎo)航裝置100接收聲音信息,使噪聲除去處理部521實(shí)施噪聲除去,將除去噪聲后的一個(gè)或多個(gè)聲音信息,基于服務(wù)器信息表511中保存的設(shè)定信息發(fā)送至聲音確定服務(wù)器裝置900。然后,接收到從聲音確定服務(wù)器裝置900發(fā)送的一個(gè)或多個(gè)識(shí)別字符串時(shí),POI提示部522將接收到的識(shí)別字符串發(fā)送至導(dǎo)航裝置100,接收到由導(dǎo)航裝置100的使用者選擇的字符串時(shí),向POI提供服務(wù)器裝置950發(fā)送包括該字符串的POI檢索請(qǐng)求。然后,將從POI提供服務(wù)器裝置950發(fā)送的POI列表,發(fā)送至導(dǎo)航裝置100。發(fā)送接收部530通過網(wǎng)絡(luò)30向其他裝置發(fā)送信息,從其他裝置接收信息。本實(shí)施方式中,發(fā)送接收部530與導(dǎo)航裝置100、聲音確定服務(wù)器裝置900、P0I提供服務(wù)器裝置950之間進(jìn)行通信。圖2是中轉(zhuǎn)服務(wù)器裝置500的硬件結(jié)構(gòu)圖。中轉(zhuǎn)服務(wù)器裝置500具有輸入裝置551、輸出裝置552、通信裝置553、運(yùn)算裝置554、主存儲(chǔ)裝置555和外部存儲(chǔ)裝置556。各裝置通過總線557連接。其中,輸入裝置551和輸出裝置552不是必需的結(jié)構(gòu),也可以根據(jù)需要而設(shè)置。輸入裝置551是鍵盤和鼠標(biāo)、或觸控筆、以及其他點(diǎn)擊設(shè)備等接收輸入的裝置。輸出裝置552是顯示器等進(jìn)行顯示的裝置。通信裝置553是通過網(wǎng)絡(luò)30等網(wǎng)絡(luò)與其他裝置進(jìn)行通信的裝置。中轉(zhuǎn)服務(wù)器裝置500的通信裝置553能夠通過網(wǎng)絡(luò)30與聲音確定服務(wù)器裝置900、POI提供服務(wù)器裝置950和導(dǎo)航裝置100的通信裝置12等進(jìn)行通信。運(yùn)算裝置554例如是CPU (Central Processing Unit :中央處理單元)等運(yùn)算裝置。主存儲(chǔ)裝置555例如是RAM (Random Access Memory :隨機(jī)存儲(chǔ)器)等存儲(chǔ)裝置。外部存儲(chǔ)裝置556例如是硬盤裝置或SSD (Solid State Drive :固態(tài)硬盤)等非易失性存儲(chǔ)裝置。此外,在主存儲(chǔ)裝置555展開的命令代碼可以是外部存儲(chǔ)裝置556中存儲(chǔ)的,此外,也可以是通過通信裝置553從網(wǎng)絡(luò)30上的未圖示的其他裝置或互聯(lián)網(wǎng)等網(wǎng)絡(luò)上的裝置取得的。主存儲(chǔ)裝置555具有進(jìn)行運(yùn)算裝置554執(zhí)行的命令代碼的展開的區(qū)域。外部存儲(chǔ)裝置556是所謂的通常的存儲(chǔ)裝置,預(yù)先記錄有使中轉(zhuǎn)服務(wù)器裝置500動(dòng)作的軟件、該軟件所需的數(shù)據(jù)的初始值、其他數(shù)據(jù)等。上述中轉(zhuǎn)服務(wù)器裝置500的控制部520的噪聲除去處理部521、POI提示部522,通過運(yùn)算裝置554讀取執(zhí)行規(guī)定的程序而構(gòu)建。所以,在主存儲(chǔ)裝置555中,存儲(chǔ)有用于實(shí)現(xiàn)各功能部的處理的程序。其中,上述中轉(zhuǎn)服務(wù)器裝置500的結(jié)構(gòu)要素是為了便于理解結(jié)構(gòu)而根據(jù)主要的處理內(nèi)容進(jìn)行分類的。因此,本發(fā)明不受結(jié)構(gòu)要素的分類方法及其名稱的限定。中轉(zhuǎn)服務(wù)器裝置500的結(jié)構(gòu)也能夠根據(jù)處理內(nèi)容分類為更多的結(jié)構(gòu)要素。另外,還能夠使一個(gè)結(jié)構(gòu)要素執(zhí)行更多處理。此外,中轉(zhuǎn)服務(wù)器裝置500的控制部520也可以用硬件(ASIC、GPU等)構(gòu)建。此外,各功能部的處理可以用一個(gè)硬件執(zhí)行,也可以用多個(gè)硬件執(zhí)行。圖3表示導(dǎo)航裝置100的整體結(jié)構(gòu)圖。導(dǎo)航裝置100包括運(yùn)算處理部1、顯示器2、存儲(chǔ)裝置3、聲音輸入輸出裝置4 (具備麥克風(fēng)41作為聲音輸入裝置,具備揚(yáng)聲器42作為聲音輸出裝置)、輸入裝置5、ROM裝置6、車速傳感器7、回轉(zhuǎn)儀傳感器8、GPS (GlobalPositioning System :全球定位系統(tǒng))接收裝置9、FM多路播放接收裝置10、指向標(biāo)(beacon)接收裝置11、通信裝置12。運(yùn)算處理部I是進(jìn)行各種處理的中心單元。例如基于從各種傳感器7、8和GPS接收裝置9、FM多路播放接收裝置10等輸出的信息算出當(dāng)前位置。此外,基于獲得的當(dāng)前位置信息,從存儲(chǔ)裝置3或ROM裝置6讀出顯示所需的地圖數(shù)據(jù)。此外,運(yùn)算處理部I將讀出的地圖數(shù)據(jù)圖形展開,在該處重疊表示當(dāng)前位置的標(biāo)記并向顯示器2顯示。此外,使用存儲(chǔ)裝置3或ROM裝置6中存儲(chǔ)的地圖數(shù)據(jù)等,搜索連接用戶指示的出發(fā)地點(diǎn)或當(dāng)前位置與目的地(或經(jīng)過地點(diǎn)、中途停留地點(diǎn))的最佳路徑(推薦路徑)。此外,使用揚(yáng)聲器42、顯示器2引導(dǎo)用戶。導(dǎo)航裝置100的運(yùn)算處理部I是用總線25將各設(shè)備之間連接的結(jié)構(gòu)。運(yùn)算處理部I具有執(zhí)行數(shù)值運(yùn)算和控制各設(shè)備這樣的各種處理的CPlXCentral Processing Unit)21 ;保存從存儲(chǔ)裝置3讀出的地圖數(shù)據(jù)、運(yùn)算數(shù)據(jù)等的RAM (RandomAccess Memory) 22 ;保存程序和數(shù)據(jù)的R0M(Read Only Memory)23 ;和用于將各種硬件與運(yùn)算處理部I連接的I/F (接口 ) 24。顯示器2是顯示運(yùn)算處理部I等生成的圖形信息的單元。顯示器2由液晶顯示器、有機(jī)EL顯示器等構(gòu)成。存儲(chǔ)裝置3由HDD (Hard Disk Drive :硬盤驅(qū)動(dòng)器)或非易失性存儲(chǔ)卡這樣的至少可讀寫的存儲(chǔ)介質(zhì)構(gòu)成。該存儲(chǔ)介質(zhì)中,存儲(chǔ)有通常的路徑搜索裝置所需的地圖數(shù)據(jù)(構(gòu)成地圖上的道路的鏈接的鏈接數(shù)據(jù))即鏈接表200。
圖4是表示鏈接表200的結(jié)構(gòu)的圖。鏈接表200,按每個(gè)作為地圖上劃分的區(qū)域的網(wǎng)格的識(shí)別代碼(網(wǎng)格ID) 201,包括構(gòu)成該網(wǎng)格區(qū)域中包含的道路的各鏈接的鏈接數(shù)據(jù)202。鏈接數(shù)據(jù)202,按每個(gè)作為鏈接的標(biāo)識(shí)符的鏈接ID211,包括構(gòu)成鏈接的兩個(gè)節(jié)點(diǎn)(開始節(jié)點(diǎn)、結(jié)束節(jié)點(diǎn))的坐標(biāo)信息222 ;表示包括鏈接的道路的類別的道路類別223 ;表示鏈接的長(zhǎng)度的鏈接長(zhǎng)度224 ;預(yù)先存儲(chǔ)的鏈接旅行時(shí)間225 ;確定與該鏈接的開始節(jié)點(diǎn)連接的鏈接即開始連接鏈接和與該鏈接的結(jié)束節(jié)點(diǎn)連接的鏈接即結(jié)束連接鏈接的開始連接鏈接、結(jié)束連接鏈接226 ;表示包括鏈接的道路的限制速度的限制速度227等。其中,此處,通過對(duì)于構(gòu)成鏈接的兩個(gè)節(jié)點(diǎn)區(qū)分開始節(jié)點(diǎn)和結(jié)束節(jié)點(diǎn),對(duì)同一道路的上行方向和下行方向分別作為不同的鏈接管理。返回圖3說明。聲音輸入輸出裝置4具備內(nèi)置的麥克風(fēng)41作為聲音輸入裝置,具備揚(yáng)聲器42作為聲音輸出裝置。麥克風(fēng)41取得用戶或其他乘客發(fā)出的聲音等的導(dǎo)航裝置100外部的聲音。此外,聲音輸入輸出裝置4具有接受擴(kuò)展麥克風(fēng)43的連接的連接部。即,聲音輸入輸出裝置4能夠接受具有比普通情況下更高的拾音性能的耳機(jī)等擴(kuò)展麥克風(fēng)43的連接,所以能夠更高精度地接收聲音信息。揚(yáng)聲器42將運(yùn)算處理部I生成的給用戶的消息作為聲音輸出。麥克風(fēng)41與揚(yáng)聲器42分別配置在車輛的規(guī)定的部位。但是,也可以收納在一體的框體中。導(dǎo)航裝置100能夠分別具備多個(gè)麥克風(fēng)41和揚(yáng)聲器42。輸入裝置5是通過基于用戶的操作接收來自用戶的指示的裝置。輸入裝置5由觸摸面板51、撥盤(dial)開關(guān)52、作為其他硬開關(guān)(未圖示)的滾動(dòng)按鍵和比例尺變更按鍵等構(gòu)成。此外,輸入裝置5中,包括能夠?qū)?dǎo)航裝置100遠(yuǎn)距離地進(jìn)行操作指示的遙控器。遙控器具備撥盤開關(guān)和滾動(dòng)按鍵、比例尺變更按鍵等,能夠?qū)⒏靼存I和開關(guān)被操作的信息傳送至導(dǎo)航裝置100。觸摸面板51搭載在顯不器2的顯7]^面一側(cè),能夠透視顯畫面。觸摸面板51確定與在顯示器2顯示的圖像的XY坐標(biāo)對(duì)應(yīng)的觸摸位置,將觸摸位置變換為坐標(biāo)輸出。觸摸面板51由壓敏式或靜電式的輸入檢測(cè)元件等構(gòu)成。撥盤開關(guān)52構(gòu)成為能夠順時(shí)針和逆時(shí)針地旋轉(zhuǎn),每旋轉(zhuǎn)規(guī)定的角度產(chǎn)生脈沖信號(hào),輸出至運(yùn)算處理部I。在運(yùn)算處理部I中,根據(jù)脈沖信號(hào)的數(shù)量,求出旋轉(zhuǎn)角度。ROM 裝置 6 由 CD-ROM 和 DVD-ROM 等 ROM (Read Only Memory :只讀存儲(chǔ)器)、IC(Integrated Circuit :集成電路)卡這樣的至少能夠讀取的存儲(chǔ)介質(zhì)構(gòu)成。該存儲(chǔ)介質(zhì)中,例如存儲(chǔ)有動(dòng)畫數(shù)據(jù)、聲音數(shù)據(jù)等。 車速傳感器7、回轉(zhuǎn)儀傳感器8和GPS接收裝置9是為了用導(dǎo)航裝置100檢測(cè)當(dāng)前位置(本車位置)而使用的部件。車速傳感器7是輸出用于計(jì)算車速的值的傳感器。回轉(zhuǎn)儀傳感器8由光纖回轉(zhuǎn)儀、振動(dòng)回轉(zhuǎn)儀等構(gòu)成,檢測(cè)運(yùn)動(dòng)物體的旋轉(zhuǎn)產(chǎn)生的角速度。GPS接收裝置9接收來自GPS衛(wèi)星的信號(hào)并相對(duì)于3個(gè)以上的衛(wèi)星測(cè)定運(yùn)動(dòng)物體與GPS衛(wèi)星之間的距離和距離的變化率從而測(cè)定運(yùn)動(dòng)物體的當(dāng)前位置、前進(jìn)速度和前進(jìn)方位。FM多路播放接收裝置10接收從FM播送臺(tái)傳送的FM多路播放信號(hào)。FM多路播放中,有 VICS (Vehicle Information Communication System :注冊(cè)商標(biāo))信息的概要現(xiàn)況交通信息、管制信息、SA/PA (服務(wù)區(qū)域/停車區(qū)域)信息、停車場(chǎng)信息、天氣信息等和作為FM多路播放一般信息的由廣播臺(tái)提供的文字信息等。指向標(biāo)接收裝置11接收VICS信息等的概要現(xiàn)況交通信息、管制信息、SA/PA (服務(wù)區(qū)域/停車區(qū)域)信息、停車場(chǎng)信息、天氣信息和緊急警報(bào)等。例如是通過光進(jìn)行通信的光指向標(biāo)、通過電波進(jìn)行通信的電波指向標(biāo)等的接收裝置。通信裝置12是使導(dǎo)航裝置100與網(wǎng)絡(luò)30等連接,與網(wǎng)絡(luò)上連接的中轉(zhuǎn)服務(wù)器裝置500等其他裝置進(jìn)行通信的裝置。此外,通信裝置12可以內(nèi)置在導(dǎo)航裝置100中,也可以是使用例如移動(dòng)電話網(wǎng)的通信模塊或移動(dòng)電話等,能夠作為外部機(jī)器安裝搭載。此外,導(dǎo)航裝置100與通信裝置12之間根據(jù)USB (Universal Serial Bus :通用串行總線)和Bluetooth (注冊(cè)商標(biāo))等規(guī)定的通指向標(biāo)準(zhǔn)進(jìn)行信息的發(fā)送接收。圖5是運(yùn)算處理部I的功能框圖。如圖所示,運(yùn)算處理部I具有基本控制部101、輸入接收部102、輸出處理部103、噪聲水平判定部104、中轉(zhuǎn)服務(wù)器通信部105、P0I提示信息生成部106和麥克風(fēng)識(shí)別部107。基本控制部101是進(jìn)行各種處理的中心功能部,與處理內(nèi)容相應(yīng)地控制其他處理部。此外,取得各種傳感器、GPS接收裝置9等的信息,進(jìn)行地圖匹配處理等,確定當(dāng)前位置。此外,隨時(shí)使行駛的日期和時(shí)刻與位置相關(guān)聯(lián),按每個(gè)鏈接將行駛歷史記錄存儲(chǔ)到存儲(chǔ)裝置3。進(jìn)而,根據(jù)來自各處理部的請(qǐng)求輸出當(dāng)前時(shí)刻。輸入接收部102接收通過輸入裝置5或麥克風(fēng)41輸入的來自使用者的指示,控制運(yùn)算處理部I的各部執(zhí)行與其請(qǐng)求內(nèi)容對(duì)應(yīng)的處理。例如,使用者請(qǐng)求搜索推薦路徑時(shí),為了設(shè)定目的地,對(duì)輸出處理部103請(qǐng)求在顯示器2上顯示地圖的處理。輸出處理部103接收例如顯示折線圖(polygon)信息等的畫面信息,變換為用于在顯示器2進(jìn)行描繪的信號(hào)并對(duì)顯示器2指示進(jìn)行描繪。噪聲水平判定部104關(guān)于從聲音輸入輸出裝置4的麥克風(fēng)41或擴(kuò)展麥克風(fēng)43輸入的聲音信息,判定噪聲水平。具體而言,噪聲水平判定部104抽出接收到的聲音信息的規(guī)定的無聲部分的波形、優(yōu)選相當(dāng)于聲音信息最初的IOOms的無聲部分的波形中包含的噪聲成分,根據(jù)該噪聲量的多少判定噪聲水平是否為規(guī)定的水平以上。中轉(zhuǎn)服務(wù)器通信部105將輸入的聲音信息發(fā)送至中轉(zhuǎn)服務(wù)器裝置500。此外,中轉(zhuǎn)服務(wù)器通信部105從中轉(zhuǎn)服務(wù)器裝置500接收聲音識(shí)別的結(jié)果得到的字符串。此外,中轉(zhuǎn)服務(wù)器通信部105將選擇的POI的信息發(fā)送至中轉(zhuǎn)服務(wù)器裝置500,接收POI列表信息。POI提示信息生成部106將接收到的POI列表信息整合,生成可選擇的用于對(duì)使用者提示的畫面信息等作為POI列表,請(qǐng)求輸出處理部103輸出。
麥克風(fēng)識(shí)別部107進(jìn)行與導(dǎo)航裝置100連接的麥克風(fēng)的識(shí)別。具體而言,麥克風(fēng)識(shí)別部107檢測(cè)出擴(kuò)展麥克風(fēng)43已連接,關(guān)于在內(nèi)置的麥克風(fēng)41與上述擴(kuò)展麥克風(fēng)43之間要使用哪一個(gè)麥克風(fēng),根據(jù)使用者的選擇來確定所要使用的麥克風(fēng)。上述運(yùn)算處理部I的各功能部,即基本控制部101、輸入接收部102、輸出處理部103、噪聲水平判定部104、中轉(zhuǎn)服務(wù)器通信部105、POI提示信息生成部106、麥克風(fēng)識(shí)別部107,通過CPU21讀取執(zhí)行規(guī)定的程序而構(gòu)建。因此,在RAM22中,存儲(chǔ)有用于實(shí)現(xiàn)各功能部的處理的程序。此外,上述各結(jié)構(gòu)要素是為了便于理解導(dǎo)航裝置100的結(jié)構(gòu)而根據(jù)主要的處理內(nèi)容進(jìn)行分類的。因此,本發(fā)明不受結(jié)構(gòu)要素的分類方法及其名稱的限制。導(dǎo)航裝置100的結(jié)構(gòu)也能夠根據(jù)處理內(nèi)容分類為更多的結(jié)構(gòu)要素。此外,還能夠以一個(gè)結(jié)構(gòu)要素執(zhí)行更多的處理的方式分類。此外,各功能部也可以通過硬件(ASIC、GPU等)構(gòu)建。此外,各功能部的處理可以用一個(gè)硬件執(zhí)行,也可以用多個(gè)硬件執(zhí)行。
[動(dòng)作的說明]接著,說明包括導(dǎo)航裝置100、中轉(zhuǎn)服務(wù)器裝置500、聲音確定服務(wù)器裝置900和POI提供服務(wù)器裝置950的檢索系統(tǒng)1000中實(shí)施的POI檢索處理的動(dòng)作。圖6是表示POI檢索處理的流程圖。該流程,在導(dǎo)航裝置100已啟動(dòng)的狀態(tài)下,通過接收規(guī)定的PTT (PushTo Talk)按鈕等發(fā)出的聲音輸入的開始指示而開始。首先,輸入接收部102開始等待聲音輸入(步驟SOOl )。然后,輸入接收部102檢測(cè)聲音區(qū)間,將輸入的聲音信息壓縮生成聲音信息(步驟S002),直至因PTT按鈕的松開等而結(jié)束聲音等待(步驟S003)。其中,此處,噪聲水平判定部104判定輸入的聲音信息的噪聲水平。噪聲水平高于規(guī)定的情況下,即噪聲較多的環(huán)境中,輸入接收部102也可以將壓縮率設(shè)定得較低進(jìn)行壓縮,使壓縮弓I起的音質(zhì)劣化止于最小限度。此外,噪聲水平更高而超過規(guī)定閾值的情況下,即噪聲過大,無論如何也不能正常地進(jìn)行聲音識(shí)別的程度的環(huán)境下,也可以使輸入接收部102不進(jìn)行聲音信息的生成,不實(shí)施之后的處理。然后,輸入接收部102通過中轉(zhuǎn)服務(wù)器通信部105向中轉(zhuǎn)服務(wù)器裝置500發(fā)送聲音信息。然后,中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理部521對(duì)接收到的聲音信息實(shí)施實(shí)現(xiàn)規(guī)定的算法的噪聲除去處理(步驟S004)。具體而言,噪聲除去處理部521通過預(yù)先規(guī)定應(yīng)用于噪聲除去處理的一種或多種算法,對(duì)于接收到的聲音信息實(shí)施噪聲除去處理,生成除去噪聲后的一個(gè)或多個(gè)聲音信息。然后,POI提不部522將除去噪聲后的一個(gè)或多個(gè)聲音信息發(fā)送至聲音確定服務(wù)器裝置900。然后,聲音確定服務(wù)器裝置900將對(duì)各聲音信息實(shí)施規(guī)定的聲音識(shí)別處理而識(shí)別的結(jié)果即候選的一個(gè)或多個(gè)字符串信息發(fā)送至中轉(zhuǎn)服務(wù)器裝置500 (步驟S005)。其中,該聲音識(shí)別處理中,進(jìn)行現(xiàn)有的聲音識(shí)別等處理,通過N-best檢索等將作為一個(gè)或多個(gè)識(shí)別結(jié)果的候選的字符串與其準(zhǔn)確度一同輸出。例如,使用者發(fā)出的聲音信息是“批薩”的情況下,按每個(gè)聲音信息輸出“批薩(匕。開' (piZa))”、“PiZZa”、“hiZa (膝)”、“ika ( ^分),,等作為候選的字符串。然后,POI提示部522接收到輸出的識(shí)別結(jié)果的字符串信息時(shí),對(duì)于識(shí)別結(jié)果進(jìn)行加權(quán)(步驟S006)。具體而言,輸出的識(shí)別結(jié)果的字符串信息,根據(jù)噪聲除去的算法列舉一個(gè)或多個(gè)候選,其中如果有重復(fù)的候選則整合為一個(gè),對(duì)于整合后的候選將其準(zhǔn)確度修正為更高(例如,對(duì)準(zhǔn)確度追加規(guī)定的比例),按準(zhǔn)確度的順序?qū)蜻x的字符串排序。其中,POI提示部522在該加權(quán)處理中,也可以根據(jù)應(yīng)用于聲音信息的噪聲除去的算法進(jìn)行加權(quán)。SP,由于認(rèn)為應(yīng)用了適當(dāng)?shù)脑肼暢サ乃惴ǖ穆曇粜畔⑹亲R(shí)別精度較高的聲音信息,因此可以重視被認(rèn)為是識(shí)別精度較高的候選。此外,如果有關(guān)于與設(shè)施不相符的可能性高的POI的候選,則也可以將其除去。POI提示部522將排序后的候選的字符串發(fā)送至導(dǎo)航裝置100。然后,導(dǎo)航裝置100的POI提示信息生成部106將接收到的排序后的識(shí)別結(jié)果的候選的字符串,生成可選擇的列表輸出的畫面信息,指示輸出處理部103向顯示器2顯示(步驟S007)。其中,此處,排序后的字符串的候選的數(shù)量不足規(guī)定數(shù)量的情況下,或步驟S002中接收到的聲音信息中 包括的噪聲的水平低于規(guī)定的情況下,即聲音的識(shí)別結(jié)果中模糊較少的情況下,也可以省略后述的步驟S008的處理,實(shí)施步驟S009的發(fā)送POI的檢索請(qǐng)求的處理。然后,輸入接收部102接收使用者在顯示的畫面中指定的候選的選擇輸入,通過中轉(zhuǎn)服務(wù)器通信部105發(fā)送至中轉(zhuǎn)服務(wù)器裝置500 (步驟S008)。POI提示部522關(guān)于被發(fā)送的候選的字符串,向POI提供服務(wù)器裝置950發(fā)送,發(fā)送POI的檢索請(qǐng)求(S009)。POI提供服務(wù)器裝置950模糊檢索該設(shè)施名稱或地址等中包括被發(fā)送的候選的字符串、或該設(shè)施名稱或地址等中包括與被發(fā)送的候選的字符串類似的字符串的Ρ0Ι,按準(zhǔn)確度分別檢索多個(gè)POI的候選,將包括含有該P(yáng)OI的名稱、坐標(biāo)、電話號(hào)碼、地址等的信息的POI列表發(fā)送至中轉(zhuǎn)服務(wù)器裝置500 (步驟S010)。POI提示部522對(duì)于發(fā)送的POI列表,實(shí)施后述的POI檢索結(jié)果整合處理進(jìn)行整合(步驟S011)。然后,POI提示部522對(duì)于導(dǎo)航裝置100發(fā)送整合后的POI檢索結(jié)果。POI提示信息生成部106使用接收到的POI檢索結(jié)果,生成將各POI可選擇地顯示的顯示畫面,指示輸出處理部103在顯示器2進(jìn)行顯示(步驟S012)。例如,POI提示信息生成部106,在選擇的候選為“批薩”的情況下,可選擇地顯示提供批薩(烤點(diǎn)心)的餐廳的列表等,并且根據(jù)該餐廳的坐標(biāo)位置,生成在地圖上的相應(yīng)位置顯示有該餐廳的圖標(biāo)的畫面。然后,基本控制部101通過輸入接收部102接收顯示的POI的選擇,進(jìn)行以所選擇的POI為目的地或經(jīng)過地點(diǎn)的路徑搜索(步驟S013)。在該路徑搜索時(shí),基本控制部101顯示包括所選擇的POI的名稱的路線搜索消息。例如,如果所選擇的POI的名稱為“東京批薩”,則基本控制部101顯示“搜索去東京批薩的路線”這樣的消息,實(shí)施到該P(yáng)OI的路徑搜索。以上是POI檢索處理的流程。根據(jù)POI檢索處理,能夠更輕松地使用高級(jí)的檢索功能。具體而言,可以認(rèn)為即使導(dǎo)航裝置的處理能力不是特別高,也能夠使用高精度的聲音識(shí)別和高性能的POI的檢索功能。圖7是表示圖6中所示的POI檢索處理中步驟S002 步驟S007的處理之間的關(guān)聯(lián)的順序圖。首先,導(dǎo)航裝置100的中轉(zhuǎn)服務(wù)器通信部105對(duì)于中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理(通過POI提示部522控制)開始發(fā)送聲音信息(步驟SlOl )。然后,中轉(zhuǎn)服務(wù)器通信部105繼續(xù)發(fā)送聲音信息,直至結(jié)束所有的聲音信息的發(fā)送(步驟S102)。等待來自中轉(zhuǎn)服務(wù)器通信部105的聲音信息的發(fā)送結(jié)束,在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,開始對(duì)由噪聲除去處理部521控制的噪聲除去處理發(fā)送聲音信息(步驟S103)。然后,所有的聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,對(duì)噪聲除去處理的聲音信息的發(fā)送結(jié)束(步驟S104)。噪聲除去處理中,通過噪聲除去處理部521對(duì)所發(fā)送的聲音信息進(jìn)行規(guī)定的噪聲除去處理(步驟S105)。中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理部521開始對(duì)由POI提示部522控制的服務(wù)器通信處理發(fā)送除去噪聲后的聲音信息(步驟S106)。然后,除去噪聲后的聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理中,對(duì)服務(wù)器通信處理的聲音信息的發(fā)送結(jié)束(步驟S107)。將除去噪聲后的聲音信息全部接收到時(shí),在服務(wù)器通信處理中,通過POI提示部522,對(duì)從噪聲除去處理傳輸?shù)某ピ肼暫蟮穆曇粜畔?開始向聲音確定服務(wù)器裝置900發(fā)送(步驟S108)。其中,此處,按不同噪聲除去的算法存在聲音信息的情況下,將多個(gè)聲音信息全部發(fā)送。然后,除去噪聲后的聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,對(duì)聲音確定服務(wù)器裝置900的聲音信息的發(fā)送結(jié)束(步驟S109)。然后,聲音確定服務(wù)器裝置900對(duì)接收到的除去噪聲后的聲音信息進(jìn)行規(guī)定的聲音識(shí)別處理,對(duì)識(shí)別的結(jié)果得到的作為候選的字符串通過N-best檢索確定一個(gè)或多個(gè)(步驟 S110)。然后,在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,POI提示部522接收所有從聲音確定服務(wù)器裝置900發(fā)送的作為候選的字符串(步驟S111)。在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,POI提示部522將發(fā)送接收處理中接收到的字符串全部發(fā)送至發(fā)送接收處理(步驟S112)。在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,通過POI提示部522,將識(shí)別結(jié)果的字符串發(fā)送至導(dǎo)航裝置100的中轉(zhuǎn)服務(wù)器通信部105 (步驟S113)。以上是圖6所示的POI檢索處理中步驟S002 步驟S007的處理之間的關(guān)聯(lián)。其中,關(guān)于噪聲除去(步驟S004)和識(shí)別結(jié)果的加權(quán)(步驟S006)等處理,在該處理之間的關(guān)系的說明中省略詳細(xì)的說明。圖8是表示POI檢索結(jié)果整合處理的流程的圖。POI檢索結(jié)果整合處理在圖6的POI檢索處理的步驟SOll中,由中轉(zhuǎn)服務(wù)器裝置500執(zhí)行。首先,如果識(shí)別字符串之間存在POI列表相同的,則POI提示部522刪除準(zhǔn)確度較低的識(shí)別字符串和POI列表(步驟S201)。具體而言,POI提示部522關(guān)于從POI提供服務(wù)器裝置950接收到的一個(gè)或多個(gè)識(shí)別字符串及其準(zhǔn)確度、以及對(duì)應(yīng)的POI列表,對(duì)各POI列表之間進(jìn)行比較,存在構(gòu)成POI列表的POI完全一致的POI列表的情況下,刪除準(zhǔn)確度較低的識(shí)別字符串的POI列表,同時(shí)也刪除該識(shí)別字符串和準(zhǔn)確度的信息。將該步驟反復(fù)直至所有POI列表之間不再重復(fù)。然后,POI列表內(nèi)存在重復(fù)的POI的情況下,POI提示部522從該列表內(nèi)刪除準(zhǔn)確度較低的POI(步驟S202)。此處,POI列表中,包括POI的信息、和相對(duì)識(shí)別字符串的該P(yáng)OI的準(zhǔn)確度的信息。關(guān)于一個(gè)識(shí)別字符串的POI列表內(nèi)存在多個(gè)具有相同的POI名稱的POI的情況下,POI提示部522從POI列表中刪除準(zhǔn)確度較低的Ρ0Ι,排除重復(fù)。然后,如果識(shí)別字符串之間存在共同的POIJU POI提示部522刪除準(zhǔn)確度較低的識(shí)別字符串的POI (步驟S203)。具體而言,POI提示部522,在識(shí)別字符串之間對(duì)與識(shí)別字符串對(duì)應(yīng)的POI列表進(jìn)行比較,在彼此的POI列表中包括具有相同的POI名稱的POI的情況下,將與準(zhǔn)確度較低的識(shí)別字符串關(guān)聯(lián)的POI列表中包括的POI從POI列表中刪除,排除重復(fù)。接著,POI提示部522在類似的識(shí)別字符串之間,使準(zhǔn)確度較低的識(shí)別字符串的POI移動(dòng)至準(zhǔn)確度較高的識(shí)別字符串的POI列表(步驟S204)。具體而言,POI提示部522在 識(shí)別字符串之間,確定字符串之間的相似度為規(guī)定以上的組合,在該組合中,使與準(zhǔn)確度較低的識(shí)別字符串關(guān)聯(lián)的POI列表中包括的POI的信息,移動(dòng)至與準(zhǔn)確度較高的識(shí)別字符串關(guān)聯(lián)的POI列表的下位,將POI列表整合。
以上是POI檢索結(jié)果整合處理的流程。根據(jù)POI檢索結(jié)果整合處理,能夠通過識(shí)別出的字符串具有相似關(guān)系的檢索字符串將所檢索出的POI列表整合,同時(shí)排除了重復(fù)后的POI列表。圖9是在導(dǎo)航裝置100中實(shí)施的麥克風(fēng)選擇處理的處理流程。在導(dǎo)航裝置100中,麥克風(fēng)選擇處理,這基本控制部101等新檢測(cè)到擴(kuò)展麥克風(fēng)43的連接的情況下實(shí)施。首先,麥克風(fēng)識(shí)別部107判定新連接的麥克風(fēng)(以下,稱為新麥克風(fēng))是否比已連接的麥克風(fēng)更接近(步驟S301)。具體而言,如果新麥克風(fēng)假定為位于說話人口部附近的耳麥,則麥克風(fēng)識(shí)別部107判定該新麥克風(fēng)最“接近”。如果新麥克風(fēng)是外置麥克風(fēng),則判定比內(nèi)置的麥克風(fēng)41更“接近”。然而,如果耳麥已連接,新麥克風(fēng)為外置麥克風(fēng)的情況下,麥克風(fēng)識(shí)別部107不將新麥克風(fēng)判定為“接近”。新麥克風(fēng)不比已連接的麥克風(fēng)接近的情況下(步驟S301中為“否”的情況),麥克風(fēng)識(shí)別部107結(jié)束麥克風(fēng)選擇處理。新麥克風(fēng)比已連接的麥克風(fēng)更接近的情況下(步驟S301中為“是”的情況),麥克風(fēng)識(shí)別部107進(jìn)行詢問使用的麥克風(fēng)的變更的顯示(步驟S302)。具體而言,麥克風(fēng)識(shí)別部107指示輸出處理部103輸出“是否將新麥克風(fēng)設(shè)定為通常使用的麥克風(fēng)? ”并且輸出接受作為對(duì)消息的肯定/否定等的響應(yīng)的變更指示的對(duì)話框等。麥克風(fēng)識(shí)別部107接收到作為對(duì)所顯示的詢問的肯定/否定等響應(yīng)的變更指示時(shí),判定接收到的指示是否為肯定的內(nèi)容(步驟S303)。不是肯定的內(nèi)容的情況下,麥克風(fēng)識(shí)別部107結(jié)束麥克風(fēng)選擇處理。接收到肯定的內(nèi)容的情況下(步驟S303中為“是”的情況),麥克風(fēng)識(shí)別部107將用于聲音識(shí)別的麥克風(fēng)變更為新麥克風(fēng)(步驟S304)。具體而言,麥克風(fēng)識(shí)別部107將聲音識(shí)別處理時(shí)接收輸入的麥克風(fēng)的設(shè)定與新麥克風(fēng)關(guān)聯(lián)。以上是麥克風(fēng)選擇處理的流程。根據(jù)麥克風(fēng)選擇處理,當(dāng)識(shí)別出新麥克風(fēng)時(shí),在該麥克風(fēng)比已連接的麥克風(fēng)更靠近的情況下,能夠根據(jù)使用者的指示設(shè)定是否將該麥克風(fēng)用于聲音識(shí)別。其中,上述麥克風(fēng)選擇處理,當(dāng)存在接受使用者預(yù)先指定的麥克風(fēng)的情況下,也可以優(yōu)選設(shè)定該麥克風(fēng)。此外,在麥克風(fēng)選擇處理中被識(shí)別為新麥克風(fēng)的麥克風(fēng),不限于耳麥等麥克風(fēng),例如移動(dòng)電話等和藍(lán)牙(Bluetooth :注冊(cè)商標(biāo))連接的麥克風(fēng)、通過FM發(fā)射器等與導(dǎo)航裝置100進(jìn)行通信的麥克風(fēng)等,只要是能夠接收聲音輸入的設(shè)備即可。接著,使用圖10說明使用者說話時(shí)麥克風(fēng)識(shí)別部107實(shí)施的說話時(shí)麥克風(fēng)選擇處理。說話時(shí)麥克風(fēng)選擇處理是能夠通過多個(gè)麥克風(fēng)接收輸入的情況下,選擇性地使用來自音質(zhì)良好的麥克風(fēng)的輸入而使輸入音質(zhì)維持為較高的處理。首先,基本控制部101在被輸入的所有麥克風(fēng)中接收聲音(步驟S401 )。其中,接收聲音的麥克風(fēng)也可以不是所有麥克風(fēng),而是預(yù)先指定的多個(gè)麥克風(fēng),或按照增益從大到小的順序選擇的規(guī)定數(shù)量的麥克風(fēng)。接著,麥克風(fēng)識(shí)別部107確定每個(gè)麥克風(fēng)的噪聲水平,采用低水平的麥克風(fēng)接收到的聲音(步驟S402)。具體而言,麥克風(fēng)識(shí)別部107按每一個(gè)麥克風(fēng),對(duì)于輸入的聲音信息通過噪聲水平判定部104確定噪聲的水平(S/N比),使用噪聲比最低的聲音信息確定為被輸入的聲音。以上是說話時(shí)麥克風(fēng)選擇處理的處理流程。根據(jù)說話時(shí)麥克風(fēng)選擇處理,能夠在實(shí)際說話的聲音信息中采用音質(zhì)良好的聲音信息,因此可以認(rèn)為在車輛等音響環(huán)境隨時(shí)變化等的情況下,能夠在每次說話時(shí)以最佳音質(zhì)進(jìn)行聲音輸入。以上,說明了本發(fā)明的第一實(shí)施方式。根據(jù)本發(fā)明的第一實(shí)施方式,導(dǎo)航裝置100能夠更輕松地使用較高的檢索功能。其中,上述說話時(shí)麥克風(fēng)選擇處理,當(dāng)存在接收了基于使用者的指定的麥克風(fēng)的情況下,也可以優(yōu)先使用該麥克風(fēng)。本發(fā)明不限于上述實(shí)施方式。上述實(shí)施方式能夠在本發(fā)明的技術(shù)思想范圍內(nèi)進(jìn)行各種變形。例如,如圖11所示,也可以是為了關(guān)于聲音識(shí)別的結(jié)果的字符串,不等待使用者的指示而進(jìn)行POI檢索,變更了 POI檢索處理的流程的第二實(shí)施方式。以下說明第二實(shí)施方式。第二實(shí)施方式是具備基本上與第一實(shí)施方式大致相同的結(jié)構(gòu)的檢索系統(tǒng),在POI檢索處理存在不同。以該不同為中心在以下進(jìn)行說明。首先,輸入接收部102開始等待聲音輸入(步驟S501)。然后,輸入接收部102檢測(cè)聲音區(qū)間,將輸入的聲音信息壓縮生成聲音信息(步驟S502),直至因PTT按鈕的松開等而結(jié)束聲音等待(步驟S503)。其中,此處,噪聲水平判定部104判定輸入的聲音信息的噪聲水平。并且,在噪聲水平高于規(guī)定水平的情況下,即噪聲較多的環(huán)境中,輸入接收部102也可以將壓縮率設(shè)定得較低進(jìn)行壓縮,使壓縮引起的音質(zhì)劣化抑制為最小限度。此外,噪聲水平更高而超過規(guī)定閾值的情況下,即噪聲過大,無論如何也不能正常地進(jìn)行聲音識(shí)別的程度的環(huán)境下,也可以使輸入接收部102不進(jìn)行聲音信息的生成,不實(shí)施之后的處理。然后,輸入接收部102通過中轉(zhuǎn)服務(wù)器通信部105向中轉(zhuǎn)服務(wù)器裝置500發(fā)送聲音信息。然后,中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理部521對(duì)于接收到的聲音信息實(shí)施實(shí)現(xiàn)規(guī)定的算法的噪聲除去處理(步驟S504)。具體而言,噪聲除去處理部521通過預(yù)先規(guī)定的應(yīng)用于噪聲除去處理的一種或多種算法,對(duì)于接收到的聲音信息實(shí)施噪聲除去處理,生成除去噪聲后的一個(gè)或多個(gè)聲音信息。然后,POI提示部522將除去噪聲后的一個(gè)或多個(gè)聲音信息發(fā)送至聲音確定服務(wù)器裝置900。聲音確定服務(wù)器裝置900將對(duì)各聲音信息實(shí)施規(guī)定的聲音識(shí)別處理而將識(shí)別的結(jié)果即作為候選的一個(gè)或多個(gè)字符串信息發(fā)送至中轉(zhuǎn)服務(wù)器裝置500(步驟S505)。其中,該聲音識(shí)別處理中,進(jìn)行現(xiàn)有的聲音識(shí)別等處理,通過N-best檢索等將作為一個(gè)或多個(gè)識(shí)別結(jié)果的候選的字符串與其準(zhǔn)確度一同輸出。例如,使用者發(fā)出的聲音信息是“批薩”的情況下,按每個(gè)聲音信息輸出“批薩(匕。開' (piza)),,、“PiZZa,,、“hiZa (膝)”、“ika ( ^分),,等作為候選的字符串。然后,POI提示部522接收到輸出的識(shí)別結(jié)果的字符串信息時(shí),對(duì)識(shí)別結(jié)果進(jìn)行加權(quán)(步驟S506)。具體而言,輸出的識(shí)別結(jié)果的字符串信息,對(duì)應(yīng)于噪聲除去的算法列舉一個(gè)或多個(gè)候選,其中如果有重復(fù)的候選,則POI提示部522將其整合為一個(gè),對(duì)于整合后的候選將其準(zhǔn)確度補(bǔ)正為更高(例如,對(duì)準(zhǔn)確度追加規(guī)定的比例),按準(zhǔn)確度的順序?qū)蜻x的字符串排序。POI提示部522將排序后的候選的字符串(多個(gè)),發(fā)送至POI提供服務(wù)器裝置950,發(fā)送POI的檢索請(qǐng)求(S0507)。POI提供服務(wù)器裝置950關(guān)于被發(fā)送的各候選的字符串,模糊檢索在設(shè)施名稱或 地址等中包括的、或該設(shè)施名稱或地址等中包括與被發(fā)送的各候選的字符串類似的字符串的Ρ0Ι,按準(zhǔn)確度分別檢索一個(gè)或多個(gè)POI的候選,將包括含有該P(yáng)OI的名稱、坐標(biāo)、電話號(hào)碼、地址等的信息的POI列表與候選的字符串關(guān)聯(lián),并發(fā)送至中轉(zhuǎn)服務(wù)器裝置500 (步驟S508)。POI提示部522將被發(fā)送的每個(gè)候選的字符串的POI列表,向?qū)Ш窖b置100發(fā)送(步驟 S509)。POI提示信息生成部106使用接收到的POI檢索結(jié)果,按每個(gè)候選的字符串,生成將各POI可選擇地進(jìn)行顯示的顯示畫面,指示輸出處理部103在顯示器2上顯示(步驟S510)。例如,POI提示信息生成部106,在候選的字符串為“批薩(匕。廿(piZa)),,、“PiZZa,,、“hiza (膝)”、的情況下,按每個(gè)候選的字符串可選擇地顯示提供批薩的餐廳的列表等,并且根據(jù)該餐廳的坐標(biāo)位置生成在地圖上的相應(yīng)位置顯示該餐廳的圖標(biāo)的畫面。然后,基本控制部101通過輸入接收部102接收顯示的POI的選擇,進(jìn)行以所選擇的POI為目的地或經(jīng)過地點(diǎn)的路徑搜索(步驟S511)。該路徑搜索時(shí),基本控制部101顯示包括所選擇的POI的名稱的路線搜索消息。例如,如果選擇的POI的名稱為“東京批薩”,則基本控制部101顯示“搜索到東京批薩的路線”的消息,實(shí)施到該P(yáng)OI的路徑搜索。以上是第二實(shí)施方式的POI檢索處理的流程。根據(jù)第二實(shí)施方式的POI檢索處理,能夠關(guān)于基于聲音信息識(shí)別的字符串的一個(gè)或多個(gè)候選分別檢索POI并提示,因此能夠進(jìn)一步減少使用者的輸入操作,輕松地使用高級(jí)的檢索功能。具體而言,可以認(rèn)為即使導(dǎo)航裝置的處理能力不特別高,也能夠使用高精度的聲音識(shí)別和高性能的POI的檢索功能。此外,例如,在第一實(shí)施方式中,如圖7中表示處理之間的關(guān)聯(lián)所示,將聲音信息在說話結(jié)束后匯總從導(dǎo)航裝置100向中轉(zhuǎn)服務(wù)器裝置500等發(fā)送,但不限于此。S卩,也可以將聲音信息在說話過程中從導(dǎo)航裝置100向中轉(zhuǎn)服務(wù)器裝置500等發(fā)送,依次實(shí)施噪聲除去。使用圖12說明這樣的變形處理。首先,導(dǎo)航裝置100的中轉(zhuǎn)服務(wù)器通信部105對(duì)于中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理(由POI提示部522控制)開始發(fā)送聲音信息(步驟S601)。其中,中轉(zhuǎn)服務(wù)器通信部105繼續(xù)發(fā)送聲音信息,直至所有的聲音信息的發(fā)送結(jié)束(步驟S607)。在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,POI提示部522,在聲音信息的發(fā)送開始時(shí),不等待來自中轉(zhuǎn)服務(wù)器通信部105的聲音信息的發(fā)送結(jié)束,就開始對(duì)由噪聲除去處理部521控制的噪聲除去處理發(fā)送聲音信息(步驟S602)。其中,所有的聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,對(duì)噪聲除去處理的聲音信息的發(fā)送結(jié)束(步驟 S608)。在噪聲除去處理中,通過噪聲除去處理部521對(duì)被發(fā)送的聲音信息進(jìn)行規(guī)定的噪聲除去處理。中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理部521,首先對(duì)接收到的聲音信息開頭的規(guī)定的時(shí)間(例如100微秒期間)的無聲部分進(jìn)行噪聲水平的判定,根據(jù)噪聲水平?jīng)Q定一個(gè)或多個(gè)適當(dāng)?shù)脑肼暢ニ惴?步驟S603)。然后,中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理部521應(yīng)用已決定的噪聲除去算法,對(duì)接收到的聲音信息進(jìn)行噪聲除去(步驟S604),從除去噪聲后的部分起依次向由POI提示部522控制的服務(wù)器通信處理開始發(fā)送(步驟S605)。其中,當(dāng)除去噪聲后的所有聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的噪聲除去處理中,對(duì)服務(wù)器通信處理的聲音信息的發(fā)送結(jié)束(步驟S609)。當(dāng)接收到除去噪聲后的聲音信息時(shí),在服務(wù)器通信處理中,POI提示部522將從噪聲除去處理傳送的除去噪聲后的聲音信息依次向聲音確定服務(wù)器裝置900開始發(fā)送(步驟S606)。其中,此處,按噪聲除去的算法分別存在聲音信息的情況下,POI提示部522將應(yīng)用了不同的噪聲除去的算法的多個(gè)聲音信息全部發(fā)送。然后,除去噪聲后的聲音信息的發(fā)送結(jié)束時(shí),在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,對(duì)聲音確定服務(wù)器裝置900的聲音信息的發(fā)送結(jié)束(步驟S610)。然后,聲音確定服務(wù)器裝置900對(duì)所接收到的除去噪聲后的一個(gè)或多個(gè)聲音信息進(jìn)行規(guī)定的聲音識(shí)別處理,對(duì)識(shí)別的結(jié)果得到的作為候選的字符串通過N-best檢索確定一個(gè)或多個(gè)(步驟S611)。然后,在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,POI提示部522接收從聲音確定服務(wù)器裝置900發(fā)送的作為候選的全部字符串(步驟S612)。在中轉(zhuǎn)服務(wù)器裝置500的服務(wù)器通信處理中,POI提示部522對(duì)于發(fā)送接收處理傳送所有接收到的字符串(步驟S613)。在中轉(zhuǎn)服務(wù)器裝置500的發(fā)送接收處理中,通過POI提示部522,對(duì)導(dǎo)航裝置100的中轉(zhuǎn)服務(wù)器通信部105發(fā)送識(shí)別結(jié)果的字符串(步驟S614)。以上是POI檢索處理中步驟S002 S007的處理之間的關(guān)聯(lián)的變形例。其中,關(guān)于噪聲除去(步驟S004)、識(shí)別結(jié)果的加權(quán)(步驟S006)等處理,在該處理之間的關(guān)系的說明中省略詳細(xì)的說明。通過這樣變形,能夠?qū)崟r(shí)進(jìn)行從聲音信息的發(fā)聲至聲音識(shí)別的開始,因此能夠使聲音識(shí)別處理的開始時(shí)刻提前,提高響應(yīng)性。以上,以實(shí)施方式為中心說明了本發(fā)明。其中,上述各實(shí)施方式中,說明了將本發(fā)明應(yīng)用于導(dǎo)航裝置等的例子,而本發(fā)明不限于應(yīng)用于導(dǎo)航裝置,能夠應(yīng)用于所有信息終端。此外,各實(shí)施方式中導(dǎo)航裝置100中實(shí)施的處理以及實(shí)施該處理的處理部,也可以設(shè)置在其他終端裝置(例如,利用通信裝置12的移動(dòng)電話、智能手機(jī)等),使該處理的一部分分布在導(dǎo)航裝置100與其他終端裝置之間進(jìn)行處理。
權(quán)利要求
1.一種信息終端,其特征在于,包括 接收聲音的輸入的聲音輸入接收單元; 通過網(wǎng)絡(luò)與規(guī)定的服務(wù)器裝置進(jìn)行通信的通信單元; 輸出單兀; 將由所述聲音輸入接收單元接收到的聲音的信息發(fā)送至所述服務(wù)器裝置,并接收確定與所述聲音的信息相關(guān)的POI (興趣點(diǎn))的候選的信息的POI確定單元; 將由所述POI確定單元接收到的確定POI的候選的信息輸出至所述輸出單元的POI候選輸出單元;和 接收確定所述POI的候選的信息的選擇輸入并搜索到達(dá)該P(yáng)OI的路徑的路徑搜索單元, 所述POI確定單元, 是對(duì)通過所述聲音輸入接收單元接收到的聲音以規(guī)定的壓縮率進(jìn)行信息壓縮并發(fā)送至所述服務(wù)器裝置的單元, 在由所述聲音輸入接收單元接收到的聲音的質(zhì)量為規(guī)定以下的情況下,以使劣化減少的方式設(shè)定所述規(guī)定的壓縮率。
2.如權(quán)利要求1所述的信息終端,其特征在于 所述POI確定單元,進(jìn)一步, 在從所述服務(wù)器裝置接收到多個(gè)識(shí)別所述聲音的信息的結(jié)果得到的字符串的候選時(shí),可選擇地向所述輸出單元輸出所接收到的字符串并接收所述字符串的候選的一個(gè)選擇輸入。
3.如權(quán)利要求1所述的信息終端,其特征在于 所述POI確定單元,在由所述聲音輸入接收單元接收到的聲音的質(zhì)量為規(guī)定以下的情況下,不向所述服務(wù)器裝置發(fā)送所述聲音信息。
4.如權(quán)利要求1所述的信息終端,其特征在于 所述POI確定單元,將所述聲音輸入接收單元接收到的聲音依次發(fā)送至所述服務(wù)器裝置。
5.如權(quán)利要求1所述的信息終端,其特征在于 所述POI候選輸出單元,在將由所述POI確定單元接收到的確定POI的候選的信息輸出至所述輸出單元的處理中,在識(shí)別所述聲音的信息的結(jié)果得到的字符串存在多個(gè)的情況下,將所述POI的候選與每個(gè)相應(yīng)字符串關(guān)聯(lián)并輸出至所述輸出單元。
6.一種信息終端,其特征在于 包括接收一個(gè)或多個(gè)聲音的輸入的聲音輸入接收單元, 所述聲音輸入接收單兀在接收到多個(gè)聲音輸入的情況下,確定并米用音質(zhì)更好的聲音輸入。
7.一種信息終端,其特征在于,包括 控制單兀;和 一個(gè)或多個(gè)聲音輸入接收單元, 所述聲音輸入接收單元接收一個(gè)或多個(gè)聲音的輸入, 所述控制單元,在具備多個(gè)所述聲音輸入接收單元的情況下,采用靠近使用者的聲音輸入接收單元。
8.一種信息終端,其特征在于,包括 控制單兀;和 一個(gè)或多個(gè)聲音輸入接收單元, 所述聲音輸入接收單元接收一個(gè)或多個(gè)聲音的輸入, 所述控制單元,在具備多個(gè)所述聲音輸入接收單元的情況下,如果存在使用者預(yù)先指定的聲音輸入接收單元,則采用該指定的聲音輸入接收單元。
9.一種服務(wù)器裝置,其特征在于,包括 通過網(wǎng)絡(luò)從規(guī)定的信息終端接收聲音信息的聲音信息接收單元; 從所述聲音信息中除去噪聲信息的噪聲除去單元; 將除去噪聲后的所述聲音信息通過所述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送單元; 通過所述網(wǎng)絡(luò)接收作為所述聲音識(shí)別裝置對(duì)所述聲音信息的識(shí)別結(jié)果的字符串的字符串接收單元; 通過所述網(wǎng)絡(luò)將所述字符串發(fā)送至提供與所述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的規(guī)定的POI提供裝置的字符串發(fā)送單元; 通過所述網(wǎng)絡(luò)接收與所述字符串關(guān)聯(lián)的POI的信息的POI信息接收單元;和 將所述POI的信息發(fā)送至所述信息終端的POI信息發(fā)送單元。
10.如權(quán)利要求9所述的服務(wù)器裝置,其特征在于,還包括 由所述字符串接收單元接收到的字符串中包括多個(gè)字符串的候選的情況下,將所述字符串的候選發(fā)送至所述信息終端的字符串候選發(fā)送單元;和 從所述信息終端接收從所述字符串候選中選擇的一個(gè)候選的字符串的選擇字符串接收單元, 所述字符串發(fā)送單元,在由所述選擇字符串接收單元接收到一個(gè)候選的字符串的情況下,通過所述網(wǎng)絡(luò)將所述一個(gè)候選的字符串發(fā)送至所述POI提供裝置。
11.如權(quán)利要求9所述的服務(wù)器裝置,其特征在于 進(jìn)一步,所述字符串發(fā)送單元,在由所述字符串接收單元接收到的字符串中包括多個(gè)字符串的候選的情況下,通過所述網(wǎng)絡(luò)將所述多個(gè)字符串發(fā)送至所述POI提供裝置, 所述POI信息接收單元接收與所述多個(gè)字符串的每一個(gè)關(guān)聯(lián)的多個(gè)POI的信息。
12.如權(quán)利要求9所述的服務(wù)器裝置,其特征在于 還包括在由所述POI信息接收單元接收到的POI的信息中包括多個(gè)POI的情況下,排除重復(fù)的POI的POI重復(fù)排除單元。
13.如權(quán)利要求9所述的服務(wù)器裝置,其特征在于 所述噪聲除去單元,使用多種噪聲除去算法生成多個(gè)除去噪聲后的聲音信息。
14.如權(quán)利要求9所述的服務(wù)器裝置,其特征在于 所述噪聲除去單元,在所述聲音信息接收單元通過網(wǎng)絡(luò)從規(guī)定的信息終端開始接收聲音信息時(shí),從所接收到的信息中依次除去噪聲信息, 所述聲音發(fā)送單元,將通過所述噪聲除去單元除去噪聲后的聲音信息依次通過所述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置。
15.一種具有信息終端和通過網(wǎng)絡(luò)與所述信息終端進(jìn)行通信的服務(wù)器裝置的檢索系統(tǒng),其特征在于 所述信息終端包括 接收聲音的輸入的聲音輸入接收單元; 通過網(wǎng)絡(luò)與所述服務(wù)器裝置進(jìn)行通信的通信單元; 輸出單兀; 將由所述聲音輸入接收單元接收到的聲音的信息發(fā)送至所述服務(wù)器裝置并接收確定與所述聲音的信息相關(guān)的POI (興趣點(diǎn))的候選的信息的POI確定單元; 將由所述POI確定單元接收到的確定POI的候選的信息輸出至所述輸出單元的POI候選輸出單元;和 接收確定所述POI的候選的信息的選擇輸入并搜索到達(dá)該P(yáng)OI的路徑的路徑搜索單元, 所述服務(wù)器裝置包括 通過網(wǎng)絡(luò)從所述信息終端接收聲音信息的聲音信息接收單元; 從所述聲音信息中除去噪聲信息的噪聲除去單元; 將除去噪聲后的所述聲音信息通過所述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送單元; 通過所述網(wǎng)絡(luò)接收與所述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的POI信息接收單元;和 將所述POI的信息發(fā)送至所述信息終端的POI信息發(fā)送單元。
16.一種檢索系統(tǒng)的檢索方法,該檢索系統(tǒng)具有信息終端和通過網(wǎng)絡(luò)與所述信息終端進(jìn)行通信的服務(wù)器裝置,所述檢索方法的特征在于 所述檢索系統(tǒng)包括 接收聲音的輸入的聲音輸入接收單兀;和 輸出單元, 所述檢索方法實(shí)施以下步驟 將由所述聲音輸入接收單元接收到的聲音的信息發(fā)送至所述服務(wù)器裝置的發(fā)送步驟; 通過所述網(wǎng)絡(luò)從所述信息終端接收聲音信息的聲音信息接收步驟; 從所述聲音信息中除去噪聲信息的噪聲除去步驟; 將除去噪聲后的所述聲音信息通過所述網(wǎng)絡(luò)發(fā)送至規(guī)定的聲音識(shí)別裝置的聲音發(fā)送步驟; 通過所述網(wǎng)絡(luò)從所述聲音識(shí)別裝置接收與所述字符串關(guān)聯(lián)的POI (興趣點(diǎn))的信息的POI信息接收步驟; 將所述POI的信息發(fā)送至所述信息終端的POI信息發(fā)送步驟; 接收所述POI的信息的POI確定步驟; 將通過所述POI確定步驟接收到的POI信息輸出至所述輸出單元的POI候選輸出步驟。
全文摘要
本發(fā)明提供一種信息終端、服務(wù)器裝置、檢索系統(tǒng)及其檢索方法,提供能夠更容易地利用高檢索功能的信息終端的技術(shù)。本發(fā)明的信息終端的特征在于,包括接收聲音的輸入的聲音輸入接收單元;通過網(wǎng)絡(luò)與規(guī)定的服務(wù)器裝置進(jìn)行通信的通信單元;輸出單元;將上述聲音輸入接收單元接收到的聲音的信息發(fā)送至上述服務(wù)器裝置并接收確定與上述聲音的信息相關(guān)的POI(興趣點(diǎn))的候選的信息的POI確定單元;將上述POI確定單元接收到的確定POI的候選的信息輸出至上述輸出單元的POI候選輸出單元;接收確定上述POI的候選的信息的選擇輸入并搜索到達(dá)該P(yáng)OI的路徑的路徑搜索單元。
文檔編號(hào)H04L29/08GK103020102SQ20121035921
公開日2013年4月3日 申請(qǐng)日期2012年9月24日 優(yōu)先權(quán)日2011年9月22日
發(fā)明者本間健, 福永功一郎, 度會(huì)則男, 本橋?qū)⒕? 大淵康成 申請(qǐng)人:歌樂株式會(huì)社