專利名稱:信息處理裝置和數(shù)據(jù)輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及并用按鍵/按鈕操作和語音識別功能的數(shù)據(jù)輸入技術(shù)。
背景技術(shù):
數(shù)據(jù)輸入是使用現(xiàn)行的許多信息設(shè)備時所希望的操作。
在我們?nèi)粘K玫男畔⒃O(shè)備中可能輸入最多的數(shù)據(jù)就是字符,字符輸入一般會伴隨鍵盤操作等繁瑣的輸入操作。特別地,按鍵與按鈕數(shù)目有限的移動電話、PDA等小型便攜終端裝置的字符輸入與具備很多按鍵的個人計算機相比,按鍵或按鈕輸入操作的次數(shù)變多。
為了提高這樣的繁瑣的字符串輸入的效率,實現(xiàn)了具有輸入預(yù)測功能(也稱作自動完成功能或自動輸入補足功能)的字符輸入方法,該輸入預(yù)測功能是將字符串輸入至中途后,預(yù)測并提示(present)所輸入的字符串后續(xù)的字符串的候選。
在使用輸入預(yù)測功能時,如果在所提示的字符串的候選中有所希望的字符串,那么通過選擇該字符串就能夠完成字符串的輸入。如果預(yù)測性能較高,那么無須輸入整個字符串就能夠完成字符串輸入。另外,通過提示作為候選的字符串的假名-漢字轉(zhuǎn)換后的候選字符串,還可以省略假名-漢字轉(zhuǎn)換的操作。
目前提出了很多涉及用于這樣的支持字符輸入的字符串的輸入預(yù)測的技術(shù)(例如,參考下面的專利文獻1、2以及非專利文獻1)。
日本特開平08-235318號公報[專利文獻2]日本特開平08-2551558號公報[非專利文獻1]《POBox(Predictive Operation Based On eXample基于實例的預(yù)測操作)》,URLhttp://www.csl.sony.co.jp/person/masui/OpenPOBox/index.html
另一方面,作為與上述輸入預(yù)測不同的字符串輸入的支持技術(shù),有語音識別。若使用語音識別,就可以省去輸入基本字符串的按鍵操作步驟,因此按鍵操作不熟練的人就可以以較快的速度輸入字符串。而且,語音識別還可以提高按鍵數(shù)目有限的機器中的字符串輸入效率。
輸入預(yù)測技術(shù)是在近年來正在高性能化的移動電話、PDA等小型便攜終端上實現(xiàn)的技術(shù),雖然這是很便利的功能,但在所提示的字符串候選有多個時,就有用于選擇所希望的字符串的操作將變得復(fù)雜的情況。特別是僅靠光標移動操作或滾動操作來選擇字符串的情況下,要找到所希望的字符串必須反復(fù)進行光標位置移動的操作,在有多個候選提示的情況下,操作次數(shù)將變多。
另一方面,語音識別技術(shù)隨著近年性能的改善,已經(jīng)可以利用具有數(shù)萬單詞的語音輸入軟件,在辦公室等比較安靜的環(huán)境中用高性能的計算機合適地輸入字符串了。然而,由于具有數(shù)萬單詞的語音識別需要大量計算機資源(CPU、存儲器),因此即使在已經(jīng)提高了性能的目前的小型便攜終端也無法寄望于適當?shù)牟僮鳌A硗?,現(xiàn)有的語音輸入軟件在背景雜音比較大的場所中還不能說具備充分的識別功能,所以在經(jīng)常用于戶外的小型便攜終端上便不能夠發(fā)揮其應(yīng)有的性能。
如果考慮便攜信息終端的使用環(huán)境及資源,要實現(xiàn)使用者沒有給予重讀的應(yīng)答速度,最佳方法就是盡量減少識別單詞數(shù)目,但簡單地減少單詞數(shù)目將會使識別率降低、沒有校正操作便無法輸入所希望的字符串。以現(xiàn)有這樣的技術(shù)在小型便攜終端上僅使用語音識別,想要輸入適當?shù)淖址€比較困難。
另外,還有其他問題,即,僅用語音的話,還不能識別同音不同書寫的單詞。例如有以下的問題對于語音輸入“s∧n”,選擇“son”和“sun”,這兩者中的哪一個的書寫(讀音相同),僅用該語音輸入就不能夠做出判斷。
發(fā)明內(nèi)容
本發(fā)明的目的在于,通過并用字符串的預(yù)測功能和語音識別功能,來實現(xiàn)適當?shù)臄?shù)據(jù)輸入。
本發(fā)明的一個方面的信息處理裝置通過具有以下結(jié)構(gòu)解決上述問題。該信息處理裝置,包括預(yù)測已輸入的字符串的后續(xù)的字符串候選的預(yù)測裝置;對由上述預(yù)測裝置預(yù)測出的上述字符串候選的顯示進行控制的顯示控制裝置;以上述所顯示的上述字符串候選作為識別對象詞,對所輸入的語音進行語音識別的語音識別裝置;以及將成為由上述語音識別裝置獲得的識別結(jié)果的字符串確認為使用字符串的確認裝置。
本發(fā)明的另一方面的信息處理裝置的數(shù)據(jù)輸入方法,包括預(yù)測由字符串輸入裝置所輸入的字符串的后續(xù)的字符串候選的預(yù)測步驟;控制將由上述預(yù)測步驟預(yù)測的字符串候選顯示在顯示裝置的顯示控制步驟;將在上述顯示裝置上所顯示上述字符串候選作為識別對象詞、對由語音輸入裝置所輸入的語音進行語音識別的語音識別步驟;以及將成為由上述語音識別步驟獲得的識別結(jié)果的字符串作為使用字符串來確認的確認步驟。
本發(fā)明的其他目的、特征和優(yōu)點,可以通過下面的參照附圖進行的說明而得到明確。在這些附圖中,相同的標號表示相同或類似的部分。
附圖包括在說明書中并結(jié)構(gòu)說明書的一部分,用于說明本發(fā)明的實施例,并與說明書一起用于說明本發(fā)明的原理。
圖1是表示在實施方式中的移動電話結(jié)構(gòu)的框圖。
圖2是表示關(guān)于在實施方式中的移動電話的字符串輸入的處理的功能結(jié)構(gòu)的框圖。
圖3表示的是實施方式中的輸入裝置的按鈕配置圖例。
圖4是表示在實施方式中的字符串輸入處理的流程的流程圖。
圖5表示的是在字符串輸入處理中的顯示裝置的顯示內(nèi)容的轉(zhuǎn)移的圖。
圖6是表示確認識別結(jié)果之后確認字符串時的處理的流程的流程圖。
圖7是說明選擇字符串時的語音識別產(chǎn)生了識別錯誤時的處理的圖。
圖8是表示提示在第3實施方式中的字符串候選的處理的流程的流程圖。
圖9是說明在第3實施方式中的字符串候選的提示例子的圖。
圖10是表示提示字符串候選與讀法的例子。
具體實施例方式
下面將參照附圖,詳細說明本發(fā)明的優(yōu)選實施方式。
(第1實施方式)下面是表示將本發(fā)明的數(shù)據(jù)輸入裝置應(yīng)用在移動電話的例子。但是,本發(fā)明不僅僅限于移動電話,對于PDA等便攜式終端、個人計算機等的所有需要用戶輸入字符的信息處理裝置,本發(fā)明都可以適用。
圖1是表示本實施方式的移動電話的結(jié)構(gòu)的框圖。
在圖1中,101是控制存儲器(ROM)、102是中央處理裝置(CPU)、103是存儲器(RAM)、104是外部存儲裝置、105是按鍵或按鈕等輸入裝置、106是液晶監(jiān)視器等顯示裝置、107是聲音輸入裝置(麥克風(fēng))、108是語音輸出裝置(揚聲器)、109是總線。如圖所示,在外部存儲裝置104中存儲有用于實現(xiàn)本實施方式的移動電話的控制程序110、用于字符串預(yù)測的字符串預(yù)測數(shù)據(jù)209、以及以聲音樣式為代表的、實施語音識別時所需要的語音識別用數(shù)據(jù)210等。例如,字符串預(yù)測數(shù)據(jù)209就是由假名漢字轉(zhuǎn)換辭典、使用者的字符輸入經(jīng)歷等構(gòu)成。這些控制程序110、數(shù)據(jù)209、210在CPU102的控制下,經(jīng)由總線109存儲到RAM103,由CPU102執(zhí)行。不言而喻,這些不僅可以存儲在外部存儲裝置104,也可以存儲在ROM101。
圖2是表示關(guān)于本實施方式的移動電話的字符串輸入的處理的功能結(jié)構(gòu)的框圖。
操作輸入部201檢測以使用者用輸入裝置105進行的字符輸入為代表的按鍵等的操作。
字符串候選預(yù)測部202參照字符串預(yù)測用數(shù)據(jù)209,對使用者已輸入的字符串所后續(xù)的字符串的候選進行預(yù)測。
提示方法確定部203確定所預(yù)測的字符串的候選的提示方法。
候選分類部204按照所確定的提示方法,將所預(yù)測的字符串的候選分類為多個組。
字符串候選提示部205按照所確定的提示方法,將字符串的候選顯示在顯示裝置106。
其他候選通知部206在提示候選字符串被分成多個組的情況下,通知使用者除了所提示的字符串候選以外還有其他候選。
候選切換部207在將候選字符串分成多個組來進行提示的情況下,檢測使用者將所提示的字符串的候選切換成其他字符組的操作,并切換所提示的候選字符組。
語音識別部208進行將由候選字符串提示部205所提示的字符串的候選作為識別對象詞的語音識別。識別對象詞的讀法參照字符串預(yù)測用數(shù)據(jù)209來確定。
語音合成部211在以語音進行向使用者的數(shù)據(jù)的提示或各種通知的情況下,來生成合成音。
字符串選擇方法提示部212向使用者提示從所提示的字符串候選中選擇所希望的字符串的方法。
選擇方法確定部213檢測使用者選擇字符串的選擇方法的操作,并確定字符串的選擇方法。
控制部200對以上的各模塊進行控制,并總括涉及字符輸入的所有的處理。
圖3是表示在輸入裝置105中的按鈕配置例子的圖。
301、302是配置于同心圓上的2個按鈕,外圈301主要用于以上下左右指示光標移動的移動方向的操作。在以下的說明中用“↑”、“↓”、“←”、“→”來標記。內(nèi)圈中央按鈕302主要用于確認字符選擇時所選擇的候選的操作。以下用“●”來表示。303~306是隨字符串處理的處理過程的狀態(tài)轉(zhuǎn)移而改變作用的按鈕,以下分別用 “★”、“*”、“#”來表示。
下面用圖4和圖5對本實施方式的字符串輸入處理進行說明。圖4是表示本實施方式的字符串輸入處理的流程的流程圖;圖5是表示該字符串輸入處理中的顯示裝置106的顯示內(nèi)容的轉(zhuǎn)移的圖。此外,由于運用現(xiàn)有的技術(shù)能夠作到字符串的候選的預(yù)測及語音識別,所以這里就省略詳細的說明。
這里對使用者輸入“Thank you so much.”這樣的字符串的情況進行說明,假定使用者已經(jīng)輸入“Thank you”,接著將要輸入“so”。
在已經(jīng)輸入了“Thank you”的階段,顯示裝置106的顯示內(nèi)容如圖5的510所示。
使用者輸入用于輸入“so”的第一個字符“s”(步驟S401)。輸入操作部201若檢測出該“s”的輸入,字符串候選預(yù)測部202就參照字符串預(yù)測用數(shù)據(jù)209,預(yù)測接著“s”的字符串的候選(步驟S402)。字符串預(yù)測用數(shù)據(jù)209如上述的那樣,例如,是利用了表示平假名與漢字的對應(yīng)關(guān)系的假名漢字轉(zhuǎn)換辭典及使用者過去的字符輸入經(jīng)歷等的數(shù)據(jù)。另外,由于在移動電話中,通常一個按鈕分擔著多個字符,所以,在按一次“PQRS”按鈕的階段,可以將以字符“p”、“q”、“r”、“s”開始的字符串作為字符串候選來進行預(yù)測。
所預(yù)測的字符串候選由字符串候選提示部205提示給輸出裝置106(步驟S403)。這時,提示方法確定部203可以對字符串的提示順序進行規(guī)定。例如,在作為字符串預(yù)測用數(shù)據(jù)209使用使用者過去的字符輸入經(jīng)歷的情況下,可以參照此經(jīng)歷,按字符串的使用頻率的順序進行顯示,或者,從最近所輸入的字符串開始依次進行顯示。另外,在所預(yù)測的字符串的候選數(shù)目比較多的情況下,可以用上述的標準確定提示順序,只是顯示預(yù)定數(shù)目的字符串候選。另外,作為其他方法,從提示候選字符串的畫面區(qū)域推斷出可以提示的字符串候選數(shù)目,可以只按該數(shù)目顯示字符串候選。另外,在步驟S403中,提示了字符串候選的選擇方法的同時,還由字符串選擇方法提示部212提示字符串選擇的方法。
在此,在步驟402中,繼續(xù)說明以下情況對于“s”的輸入,預(yù)測作為字符串候選的“safe”、“save”、“say”、“see”、“so”、“show”、“step”。另外,在本實施方式中,說明能夠?qū)νㄟ^語音識別選擇字符串和通過按鍵操作選擇字符串進行并用的情況。
圖5的502表示已提示所預(yù)測的字符串候選的情形。在該例子中,將畫面分成2部分,在字符輸入畫面521顯示正在輸入的字符串,在字符串選擇畫面522顯示字符串候選。另外,伴隨字符串的候選的顯示,顯示用于指定字符串選擇方法提示部212的字符串的選擇方法的操作按鈕引導(dǎo)523。此外,為了表示目前的操作對象是正在進行字符輸入的畫面,就對字符輸入畫面增強亮度,例如變換背景顏色等。以上的字符串候選的提示及操作按鈕引導(dǎo)的附加顯示由提示方法確定部203來控制。
在步驟S404中,在所提示的字符串候選中沒有使用者所希望的字符串時,就返回步驟S401,繼續(xù)輸入字符串;在出現(xiàn)所希望的字符串時,就進入步驟S405。
在步驟S405中,轉(zhuǎn)移至使用者選擇所希望的字符串的操作。在使用者利用語音識別的情況下,就進入步驟S409;在利用按鈕操作的情況下,就進入步驟S406。
首先,說明以按鈕操作進行選擇的情況。使用者進行用于通過按鈕操作來選擇字符串的操作(步驟S406)。該操作可以由選擇方法確定部213檢測,并通過按鈕操作來實施以下的字符串的選擇。在本實施方式中,通過按壓圖3的304所示的“★”來選擇按鈕操作。圖5的530表示選擇了按鈕選擇時的顯示內(nèi)容。在530中,為了表示操作對象向顯示了字符串候選的畫面轉(zhuǎn)移,畫面的高亮度區(qū)域由字符輸入畫面向字符串選擇畫面轉(zhuǎn)移,在字符選擇畫面的第一個字符串候選“safe”的位置上顯示光標。另外,這時將“★”按鈕的功能變更為“返回(將操作對象返回到字符輸入畫面)”。
接下來,使用者通過按鈕操作選擇所希望的字符串(步驟S408)。在圖5中,為了選擇目標字符串“so”,使用者按壓圖3的301的“↓”、“→”按鈕來將光標的位置移到“so”。540、550所顯示的就是此期間的畫面的轉(zhuǎn)移。
下面,在步驟S408中,將進行使用者確認使用字符串的操作。在顯示550的狀態(tài)下,使用者按壓302的“●”按鈕后,處于備選字符串的“so”就作為使用字符串確認。560顯示的是字符串“so”被確認后的畫面。以上是通過按鈕操作來選擇所預(yù)測的字符串候選的情況的處理。
下面,說明在步驟S405中使用者選擇了使用語音識別的情況。進行使用者選擇語音識別的字符串選擇的操作(步驟S409)。該操作由選擇方法確定部213檢測,通過語音識別進行后續(xù)的字符串的選擇。
在本實施方式中,通過按壓 按鈕303,來選擇語音識別。在圖5的520中,使用者按壓 按鈕后,畫面的高亮度區(qū)域就從字符輸入畫面轉(zhuǎn)移到字符選擇畫面。另外,在選擇了語音識別的情況下,由于不通過光標移動來進行字符選擇,所以在字符選擇畫面中不顯示光標。下面,使用者對所希望的字符串“so”進行發(fā)聲(步驟S410)。語音識別部208對該使用者的發(fā)聲進行語音識別(步驟S411),所得到的識別結(jié)果將作為使用字符串被確認(步驟S412)。在步驟S412中的語音識別只是將由字符串候選提示部205所提示的字符串作為識別對象詞。此外,這些識別對象詞的讀法將參照字符串預(yù)測用數(shù)據(jù)209,由語音識別部205來確定。用從圖5的570到560的轉(zhuǎn)移來表示通過語音識別選擇字符串的情況的顯示畫面的轉(zhuǎn)移。
這樣,依照本實施方式,能夠顯示采用輸入裝置105所輸入的字符的后續(xù)的字符串候選,通過語音識別,從該候選字符串中選擇出使用字符串,這就可以大大簡化繁瑣的按鈕操作。另外,由于這里所進行的語音識別僅僅把所顯示的字符串候選作為識別對象詞,所以該語音識別處理只需要很少的運算量就可完成。因此,即使在將這種語音識別以例如小型便攜終端等來實現(xiàn)的情況下,也可以保持很高的識別率、并以很快的速度完成操作。
(第2實施方式)在上述的第1實施方式中,在步驟S412中,表示了用戶沒有檢查步驟S411的語音識別結(jié)果,而確認使用字符串的例子,但是,在這種情況下,如果錯誤地語音識別了與所希望的字符串不一樣的字符串,錯誤字符串就會作為使用字符串被確認。為了避免這種情況,就必須具備檢查識別結(jié)果的步驟。因此,在本實施方式中,用圖6說明檢查識別結(jié)果之后確認使用字符串的例子。
圖6是表示進行識別結(jié)果檢查之后確認使用字符串的情況的處理的流程的流程圖,它僅表示的是代替圖4的流程圖中的D~E之間所進行的S410~S412的處理塊。其他處理塊與第1實施方式一樣,所以省略說明,這里僅對與圖4不同的D~E之間的處理部分進行說明。
與第1實施方式中的說明同樣,使用者對發(fā)出所希望的字符串“so”進行發(fā)聲之后(步驟S601),語音識別部208就會對此進行識別(步驟S602),并提示識別結(jié)果(步驟S603)。由此,使用者就能夠判斷結(jié)果的正誤(步驟S604)。在識別結(jié)果錯誤的情況下,就返回步驟S601、再次對所希望的詞“so”進行發(fā)聲(步驟S601)。只要得不到正確的結(jié)果,就反復(fù)進行步驟S601~S604,直到得到正確的識別結(jié)果為止。在步驟S604中,在得到了正確識別結(jié)果的情況下,不進行使用者確認字符串的操作,而是用得到的識別結(jié)果確認字符串(步驟S605)。
圖7表示采用了本實施方式情況的畫面顯示的轉(zhuǎn)移。
圖7表示在輸入與第1實施方式同樣的“Thank you so much.”的“so”的情況下,字符串選擇時的語音識別產(chǎn)生了識別錯誤的情況。
710是確認了到“Thank you”為止的狀態(tài),在此,使用者輸入“s”后,就與第1實施方式一樣、提示從“s”預(yù)測出的字符串的候選(720)。在這里,使用者為了用語音識別來進行字符串選擇,就按壓 按鈕,開始進行語音識別(730)。對于使用者的“so”的發(fā)聲,錯誤地識別成“show”的情況的步驟S603中的顯示是704。該顯示例子是通過光標在提示的字符串候選中與識別結(jié)果對應(yīng)的字符串上移動(對字符串畫出下劃線)來提示識別結(jié)果的例子。識別結(jié)果的提示方法不限于此,例如也可以在識別結(jié)果中對該字符串進行反向顯示來提示識別結(jié)果。由于所提示的結(jié)果“show”不是目標“so”,所以使用者再次對“so”進行發(fā)聲(步驟S604、否→S601)。第二次發(fā)聲被正確識別、就將提示作為識別結(jié)果“so”的情形表示在750(S602、S603)。因為識別結(jié)果正確,所以使用者按壓“●”按鈕確認字符串(S604、是→S605)。確認該字符串后,就與第1實施方式一樣,取消顯示已預(yù)測字符串候選的畫面,返回輸入字符的畫面(760)。
這樣,依據(jù)本實施方式,能夠做到,在字符串選擇時的語音識別產(chǎn)生識別錯誤時,使用者將再次發(fā)聲,直到正確地識別為止,并能夠使識別錯誤的糾正操作簡單易行。
(第3實施方式)在上述的實施方式中,只是提示所有預(yù)測的字符串候選,或在字符串候選數(shù)目很多的情況下提示預(yù)定數(shù)目的字符串候選,而沒有特別考慮在所預(yù)測的字符串候選中具有相同讀法的字符串候選數(shù)目較多時的提示方法。在本實施方式中,對考慮了該問題的字符串候選的提示進行說明。
本實施方式的特征在于,在預(yù)測的字符串候選數(shù)目較多、或者字符串候選中具有相同讀法的字符串候選時,將字符串候選分成多個組,分多次提示字符串候選。下面,就用圖8對其處理進行詳細說明。
圖8是表示本實施方式中的提示字符串候選的處理的流程的流程圖。該流程圖表示的是圖4的一部分,所以圖8只表示代替圖4的流程圖中的A~B之間的步驟S403、S404的處理塊。其他的處理塊的內(nèi)容與第1實施方式一樣,所以在此省去說明,在此僅說明與圖4不同的A~B之間的處理部分。不言而喻,本實施方式將組合第2實施方式中說明的處理。
首先,在步驟S801中判斷在圖4的步驟S402中所預(yù)測的字符串候選的個數(shù)是否多于預(yù)定數(shù)目N。如果字符串候選比N多,就進行要將字符串候選分成多個組來提示的步驟S803的處理。在這里,N是一次提示的候選數(shù)目,該數(shù)目可以預(yù)先確定,或者可以在每次提示字符串的時候根據(jù)所預(yù)測的字符串候選的字符數(shù)以及可以提示的顯示區(qū)域的大小來求出可以提示的候選數(shù)目。
候選數(shù)目在小于或等于N的情況下,進入步驟S802。在這里判斷是否存在音同而書寫不同的字符串。例如在字符串候選中存在“stake”和“steak”這樣的讀法相同的字符串候選時,由于語音識別不能夠按一個意思選擇字符串,因此在步驟S803以后的處理中將進行把字符串候選分成多個來提示的處理。以上的字符串候選的提示方法由提示方法確定部203來確定。另外,在候選數(shù)目小于或等于N、且字符串候選中不存在具有相同讀法的字符串的情況下,就進入步驟S808、S809,但是,由于這些處理分別與圖4的S403、S404的處理相同,故在此省略說明。上述的步驟S801和S802的判斷處理由提示方法確定部203進行。
在步驟S808中,通過候選分類部204將字符串候選分成多個組。分類時,例如,可以從使用頻率高的字符串候選中按順序平均抽出N個來分成多個組,或者可以按字母序列順序排列、把字符串候選按該順序平均抽出N個來分組。但是,這種分類是為了使同一組中不包含相同讀法的字符串候選。另外,作為其他方法,優(yōu)選的是,為了提高后段處理進行的語音識別的精確度,而使用將各組內(nèi)的候選字符串的聲音分離度變高的分類標準。
下面,在步驟S804中,就對使用者選擇提示組。這時,如果是按照使用頻率分類的情況,就選擇使用頻率最高的組。如果是按字母序列順序分類的情況,同樣,選擇按字母序列順序的第一組。在以聲音的分離度為標準的情況,就選擇聲音的分離度最高的組。
接下來進入步驟S805,將字符串候選提示部205所選擇的組的字符串候選提示在顯示裝置106上,并且,其他候選通知部206將在所提示的字符串候選以外還存在字符串候選的情形通知給使用者。另外,與第1實施方式一樣,字符串的選擇方法由字符串選擇方法提示部212來提示。
在步驟S806中,使用者判斷在所提示的字符串候選中是否存在所希望的字符串。這里,如果所提示的字符串候選中存在使用者所希望的字符串,就進入圖4的S405,與第1實施方式一樣,從所提示的字符串候選中選擇所希望的字符串。另一方面,如果所提示的字符串候選中沒有使用者所希望的字符串,那么在步驟S807中,如果使用者未選擇其他組,就返回圖4的步驟S401,進行之后的字符的輸入。在此,如果使用者選擇了其他組,候選切換部207就檢測使用者的組選擇的操作,將提示的候選切換到使用者所選擇的組,返回S805反復(fù)進行同樣的步驟。
將伴隨以上的實施方式所述的步驟,在所預(yù)測的字符串候選中存在具有相同讀法的字符串候選的情況的字符串候選的提示例子和切換提示的候選情形表示在圖9。
圖9表示使用者要輸入“I want to have steak”,為了接著“I want tohave”輸入“steak”,而輸入了“st”時的字符串候選的提示例子。在這里,一次提示的字符串的候選數(shù)目為N,并設(shè)定N=8。
910表示確認了到“I want to have”為止的情形。接著,使用者輸入“st”后,得到了5個字符串候選“stack”、“stadium”、“stake”、“star”、“steak”(S401~S402)。因為設(shè)定N=8,所以轉(zhuǎn)移到步驟S802。由于所預(yù)測的字符串候選中有讀法相同的“stake”和“steak”這2個候選字符串(步驟S802),所以,按字母序列順序?qū)⒆址蜻x分成“stack、stadium、stake、star”和“steak”這兩個組,以使“stake”和“steak”位于不同的組(步驟S803)。
按字母序列的順序?qū)偛诺慕M“stack、stadium、stake、star”作為提示組選出(步驟S804),并將所選擇的字符串候選提示給使用者(步驟S805)。同時,由其他候選通知部206通知除了所提示的字符串候選之外還有其他候選(步驟S805)。920表示該情形。921的“#下一個”就是由其他候選通知部206做出通知的例子。
此時,由于沒有提示出所希望的字符串“steak”,所以使用者為了看見其他的候選,就按壓“#”按鈕,來選擇其他的候選(步驟S806)。候選切換部207檢測使用者所進行的候選切換的操作,提示使用者所選擇的下一個候選、即下一個組(“steak”),并選擇該字符串候選(步驟S804)。向使用者提示“steak”的例子是930。由于提示的“steak”之外還有最初提示的組的候選字符串,所以在921所表示的“#下一個”之外,922表示“*返回”,這樣就提示出還有其他的字符串候選(步驟S805)。下面,通過第1實施方式或第2實施方式所表示的步驟,從所提示的字符串候選中進行字符串的選擇和確認處理。
這樣,依照本實施方式,在所預(yù)測的字符串候選中含有同音不同書寫的單詞的情況下,由于將字符串候選分組,使得同音不同書寫的單詞被分別分成不同的組,對每個組提示字符串候選,所以,能夠按每個組將識別結(jié)果規(guī)定為一個意思,并能夠省去使用者的選擇操作。
除此之外,在上述的實施方式中,在提示所預(yù)測的字符串候選時,在預(yù)測的字符串候選中存在多個如“read(/ri:d/)”和“read(/red/)”這樣的讀法不同的同一字符串的情況下,可以在提示方法確定部203中只選擇一個來提示。此時,也可以選擇具有比其他字符串候選的讀法的聲音分離度高的字符串候選。例如“read(/ri:d/)”、“read(/red/)”、“red(/red/)”存在于所預(yù)測的字符串候選中的情況下,由于“read(/red/)”與“red(/red/)”讀法相同(由于聲音上完全相同,所以聲音分離度為0),所以從“read(/red/)”和“read(/ri:d/)”中選擇“read(/ri:d/)”,來提示作為字符串候選的“read(/ri:d/)”和“red(/red/)”。
通過進行這樣的處理,能夠省去使用者的選擇操作。
(其他實施方式)在以上的實施方式中,在提示預(yù)測的字符串候選時,僅僅提示了字符串,但是,不限于此,例如像日語那樣,在字符串有讀法的時候,可以將字符串候選與各字符串候選的讀法一并地提示。另外,也可以在只有假名的字符串候選的書寫與讀法不同的情況下,對該字符串候選提示讀音。此外,也可以將字符串候選和把其翻譯成其他語言的譯文一并提示。
圖10表示提示日語的字符串候選及其讀法的例子。1001是對所有的字符串候選提示了讀法時的例子。1002是在字符串候選中只對含有平假名和漢字的字符串候選提示了讀法而對含有片假名的字符串候選不提示讀法的例子。例如字符串“アイデイア”全是由片假名字符構(gòu)成的,所以不提示讀法。不過也有例外。1003是在只有平假名/片假名的字符串候選的書寫與讀法不同的情況下,對該字符串候選提示讀音的例子。例如字符串“キヤノン”僅由片假名構(gòu)成,但由于讀法為“/kyanon/”,所以提示該讀法。
在以上說明的實施方式中,對在顯示裝置106中顯示字符串候選的提示、識別結(jié)果提示以及存在其他候選的通知的情況進行說明,但是,不僅限于此,也可以利用語音合成部211合成語音,從語音輸出裝置使用語音提示字符串候選。
另外,在以上說明的實施方式中,作為本發(fā)明的一個實施方式,對字符串輸入進行了說明,但是,不限于此,例如,也可以在用圖像上所添加的名稱來輸入圖像數(shù)據(jù)時等,在輸入其他方式的數(shù)據(jù)的裝置上進行實施。
如上所述,本發(fā)明的數(shù)據(jù)輸入裝置綜合了可輸入的數(shù)據(jù)的預(yù)測和語音識別這兩個功能,利用語音識別從所預(yù)測的數(shù)據(jù)候選選擇所希望的數(shù)據(jù),由此,可以進行比只使用數(shù)據(jù)預(yù)測或只使用語音識別的數(shù)據(jù)輸入大大提高了效率的數(shù)據(jù)輸入。
此外,在所預(yù)測的數(shù)據(jù)候選中存在多個相同讀法的數(shù)據(jù)的情況下,通過將這些數(shù)據(jù)分成多個組來提示、使一次提示的候選數(shù)據(jù)中不再具有讀法相同的數(shù)據(jù),由此,就能夠利用語音識別按一個意思選擇出所希望的數(shù)據(jù),這樣就提高了對數(shù)據(jù)輸入采用語音識別時的便利性。
另外,在上述的實施方式中,僅說明了將所顯示的字符串候選作為識別對象詞的例子,但是,本發(fā)明不限于此,在所預(yù)測的字符串候選中,也可以將沒有顯示的字符串作為識別對象詞。
在不脫離本發(fā)明的精神和范圍的前提下,可以有許多明顯不同的實施方式,因此,可以理解為,本發(fā)明不限于上述具體實施方式
,而是用下面的權(quán)利要求中來限定。
權(quán)利要求
1.一種信息處理裝置,包括預(yù)測已輸入的字符串的后續(xù)的字符串候選的預(yù)測裝置;對由上述預(yù)測裝置預(yù)測出的上述字符串候選的顯示進行控制的顯示控制裝置;以上述所顯示的上述字符串候選作為識別對象詞,對所輸入的語音進行語音識別的語音識別裝置;以及將成為由上述語音識別裝置獲得的識別結(jié)果的字符串確認為使用字符串的確認裝置。
2.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于還具有控制裝置,控制上述顯示控制裝置和上述語音識別裝置,以便為了讓使用者確認識別結(jié)果的正誤,在由上述顯示控制裝置顯示的字符串候選中,突出顯示成為由上述語音識別裝置獲得的識別結(jié)果的字符串,在這種狀態(tài)下對再次輸入的發(fā)聲進行語音識別。上述確認裝置在上述控制裝置的控制下,將檢測出已按壓了預(yù)定的按鈕的時刻的識別結(jié)果,確認為使用字符串。
3.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于還具有分類裝置,在由上述預(yù)測裝置預(yù)測出的字符串候選中含有同音不同書寫的單詞時,將上述字符串候選分成多個組,使得該各個同音不同書寫的單詞被分到不同的組;上述顯示控制裝置,控制按由上述分類裝置所分類的每個組顯示上述字符串候選。
4.根據(jù)權(quán)利要求1所述的信息處理裝置,其特征在于上述語音識別裝置,根據(jù)在上述預(yù)測裝置中所使用的字符串預(yù)測用數(shù)據(jù),來確定識別對象詞的讀法。
5.一種信息處理裝置的數(shù)據(jù)輸入方法,包括預(yù)測由字符串輸入裝置所輸入的字符串的后續(xù)的字符串候選的預(yù)測步驟;控制將由上述預(yù)測步驟預(yù)測的字符串候選顯示在顯示裝置的顯示控制步驟;將在上述顯示裝置上所顯示上述字符串候選作為識別對象詞、對由語音輸入裝置所輸入的語音進行語音識別的語音識別步驟;以及將成為由上述語音識別步驟獲得的識別結(jié)果的字符串作為使用字符串來確認的確認步驟。
6.根據(jù)權(quán)利要求5所述的數(shù)據(jù)輸入方法,其特征在于還具有控制步驟,控制上述顯示控制步驟和上述語音識別步驟,以便為了讓使用者確認識別結(jié)果的正誤,在由上述顯示裝置所顯示的字符串候選中,突出顯示在上述語音識別步驟中成為識別結(jié)果的字符串,在這種狀態(tài)下對再次輸入的發(fā)聲進行語音識別。上述確認步驟在上述控制步驟的控制下,將檢測出已按壓了預(yù)定的按鈕的時刻的識別結(jié)果作為使用字符串來確認。
7.根據(jù)權(quán)利要求5所述的數(shù)據(jù)輸入方法,其特征在于還具有分類步驟,在由上述預(yù)測步驟所預(yù)測的字符串候選中含有同音不同書寫的單詞時,將上述字符串候選分成多個組,使得將該同音不同書寫的單詞分別分成不同的組;上述顯示控制步驟控制按由上述分類步驟所分類的每個組將上述字符串候選顯示在上述顯示裝置。
8.根據(jù)權(quán)利要求5所述的數(shù)據(jù)輸入方法,其特征在于上述語音識別步驟,根據(jù)在上述預(yù)測步驟中所使用的字符串預(yù)測用數(shù)據(jù),來確定識別對象詞的讀法。
全文摘要
本發(fā)明提供一種信息處理裝置和數(shù)據(jù)輸入方法。通過并用字符串的預(yù)測功能與語音識別實現(xiàn)合適的數(shù)據(jù)輸入。例如,依據(jù)本發(fā)明的數(shù)據(jù)輸入方法,預(yù)測由字符串輸入裝置所輸入的字符串后續(xù)的字符串候選(S402),將所預(yù)測的字符串候選顯示在顯示裝置上(S403),將在顯示裝置上所顯示的字符串候選作為識別對象詞,對由語音輸入裝置所輸入的語音進行語音識別(S411),將成為該識別結(jié)果的字符串作為使用字符串來確認(S412)。
文檔編號G06F17/22GK1629789SQ200410102278
公開日2005年6月22日 申請日期2004年12月15日 優(yōu)先權(quán)日2003年12月16日
發(fā)明者山本寬樹, 小森康弘 申請人:佳能株式會社