專利名稱:具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種輸入方法及其系統(tǒng),特別涉及一種利用語音辨識技術(shù)來輔助使用者進行輸入時對于候選詞句和候選類別的選取,進而提高使用者整體輸入速度的輸入方法和系統(tǒng)。
背景技術(shù):
輸入法,一直以來最為人們所不希望有的也是最難有效解決的問題,不外乎就是輸入速度和使用便利這兩個。一般大部分的輸入法都是偏重在輸入速度的解決問題上,利用其自行開發(fā)的獨特拆字輸入方式來達到增加輸入速度的目的,面對這些輸入法使用者往往必須經(jīng)過一段不算短的時間來自我訓練及背誦其特殊的拆字輸入方式,才能夠真正的享受到輸入速度增加的成就感,但是這對于一般大多數(shù)的普通使用者來說進入使用的門檻相當高,而且在輸入使用上也顯得相當不便利,無法吸引一般使用者使用。
有些輸入法便通過提供內(nèi)建詞庫的方式,希望能夠同時解決輸入速度和使用便利上的問題,利用這種方式使用者在進行輸入的時候遇到內(nèi)建詞庫中所具有的文句時,便可以省去再輸入的時間直接通過選取的方式來達到快速輸入的目的,但是由于這些輸入法的實際運作方式大多都是在接受使用者的輸入之后,由詞庫中找出可能的詞句并且利用候選清單的方式將項目一一條列出來讓使用者進行選擇,而選擇的方式往往都必須要使用者通過手動的方式以鍵盤輸入或者是鼠標點選之后才能夠完成最后選取輸入的動作,這對于那些必須經(jīng)常使用詞庫中詞句的使用者來說,頻繁的手動選取輸入動作造成他們在使用詞庫意愿上的一大阻礙,同時利用手動的方式來進行候選詞句的選取還可能會很容易因為一時的不專心或者是疏忽而發(fā)生選取上的錯誤,到頭來用來刪除錯誤輸入詞句的時間可能更多,反而可能會影響到整體輸入的速度效率。
目前語音辨識科技已經(jīng)發(fā)展的相當發(fā)達,雖然全面性的語音辨識仍有某些技術(shù)上暫時無法克服的困難點,距離實現(xiàn)全語音的辨識上似乎還有一段差距,但是對于應(yīng)用在少數(shù)固定的基本元素上的語音辨識技術(shù)卻早已不成問題,因此要如何通過計算機程序的設(shè)計與執(zhí)行,發(fā)展出一種可以在輸入法系統(tǒng)中結(jié)合語音辨識技術(shù)的優(yōu)點,輔助使用者進行候選詞句的選取輸入,用以減少使用者反復手動輸入的程序,降低手動輸入的錯誤發(fā)生率,進而提高使用者在整體詞句輸入上的速度,這才是目前許多輸入法使用者所極為期盼的。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明為解決上述問題而提出一種具有語音辨識輔助功能的中文輸入方法及其系統(tǒng),主要目的在于運用語音辨識技術(shù),在使用者進行候選詞句或者是候選類別的選取動作上,提供以語音輸入的方式來達到減少手動輸入的次數(shù)、避免錯誤的發(fā)生以及提高整體輸入速度的目的。
所以為達上述目的,本發(fā)明所提供的具有語音辨識輔助功能的中文輸入系統(tǒng),包含詞句數(shù)據(jù)庫、接收辨識模塊、數(shù)據(jù)擷取模塊、及輸出顯示模塊。
另外,本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法,包含下列步驟先在可編輯文檔中激活輸入法起始界面,然后顯示分類類別清單,利用語音輸入候選詞句編號進行分類類別的選取動作,顯示其中的類別項目詞句,利用語音選擇候選詞句編號并擷取對應(yīng)的類別項目詞句,及將類別項目詞句輸出到可編輯文檔中。
有關(guān)本發(fā)明的詳細內(nèi)容及技術(shù),現(xiàn)結(jié)合
如下
圖1為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖;圖2為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的語音輸入流程圖;圖3為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的數(shù)據(jù)擷取流程圖;及圖4a、圖4b、圖4c為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的語音輸入畫面示意圖。
具體實施例方式
本發(fā)明涉及一種具有語音辨識輔助功能的中文輸入方法及其系統(tǒng),通過圖1來說明本發(fā)明的系統(tǒng)結(jié)構(gòu),該圖為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的系統(tǒng)結(jié)構(gòu)圖,說明如下(1)詞句數(shù)據(jù)庫210,負責儲存所有的分類類別內(nèi)容以及類別項目詞句。該詞句數(shù)據(jù)庫210為一種關(guān)系型數(shù)據(jù)庫,建立各個分類類別與各個類別項目詞句之間的關(guān)聯(lián)索引,在數(shù)據(jù)查找上可以更加精確而快速。
(2)數(shù)據(jù)擷取模塊220,主要根據(jù)接收辨識模塊230所傳送過來的語音轉(zhuǎn)換結(jié)果,在詞句數(shù)據(jù)庫210中將對應(yīng)的數(shù)據(jù)項給擷取出來。在該數(shù)據(jù)擷取模塊220中會記錄目前所顯示的分類類別清單的狀態(tài),當取得語音轉(zhuǎn)換結(jié)果時,該模塊220會對比出數(shù)據(jù)庫中實際的對應(yīng)數(shù)據(jù)項,然后再到詞句數(shù)據(jù)庫210中擷取。
(3)接收辨識模塊230,通過語音輸入外圍裝置(如麥克風、收音機…)接收使用者所輸入的語音,然后進行辨識以及轉(zhuǎn)換的工作。其中辨識的程序主要在于找出使用者輸入語音所代表的實際候選詞句編號是什么?是否為合理范圍內(nèi)可以辨識的實際候選詞句編號?若使用者的輸入語音超出候選詞句編號的范圍,或者是因為語音模糊不清導致無法進行辨識的話,則該接收辨識模塊230會進行錯誤信息的提示,并且要求使用者再重新進行語音的輸入。至于轉(zhuǎn)換的部分,則是在確認使用者的輸入語音為合理范圍可辨識的實際候選詞句編號后,將模擬信號內(nèi)容通過轉(zhuǎn)換使之成為計算機可處理的數(shù)字信號。
(4)輸出顯示模塊240,主要用來顯示分類類別清單(其中分類類別清單包含語音輸入?yún)^(qū)以及項目顯示區(qū)兩部分),另外,當使用者已經(jīng)選定最后所要輸入的類別項目詞句時,該輸出顯示模塊240將會自動把對應(yīng)的詞句輸出到使用者所正在使用的文檔中,可以減少使用者真正的輸入時間。
圖2的部分,則說明本發(fā)明的語音輸入流程,該圖為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的語音輸入流程圖,說明如下首先,使用者可以在所使用的可編輯文檔(如WORD、Notepad…)中,將本發(fā)明的輸入法起始界面100開啟(步驟300);之后本發(fā)明輸入法系統(tǒng)200會顯示出一個分類類別清單的畫面(步驟310),此畫面中包含一個語音輸入?yún)^(qū)以及一個項目顯示區(qū),可供使用者開始進行語音輸入的動作;此時使用者可以利用語音依照分類類別清單上所顯示的候選詞句編號來進行類別的選取動作(步驟320);然后本發(fā)明輸入法系統(tǒng)便會判斷在使用者所選取的項目之外是否仍有其它的分類類別?(步驟330)如果有的話,則流程再度回到步驟310的地方,繼續(xù)顯示更進一步的分類類別清單,否則的話,表示已經(jīng)進入到了該類別最后的類別項目詞句的部分,便接著進行類別項目詞句的顯示工作(步驟340);此時使用者可以再通過語音來選擇自己想要輸入的類別項目詞句的候選詞句編號(步驟350);最后,本發(fā)明便將該類別項目詞句給自動輸出到使用者所使用的可編輯文檔中(步驟360),完成利用語音輸入來選取詞句的流程。
接著,以圖3來說明本發(fā)明如何利用語音的輸入來進行數(shù)據(jù)的擷取,該圖為本發(fā)明所提供的具有語音辨識輔助功能的中文輸入方法及其系統(tǒng)的數(shù)據(jù)擷取流程圖,進一步說明如下首先,本發(fā)明輸入法系統(tǒng)200必須先通過語音輸入外圍裝置來接收使用者所輸入的語音內(nèi)容(步驟400);接著開始進行語音辨識的程序(步驟410),其中辨識的程序主要在于找出使用者輸入的語音是否為合理范圍內(nèi)可以辨識的實際候選詞句編號?(步驟420)若使用者的輸入語音超出候選詞句編號的范圍,或者是因為語音模糊不清導致無法進行辨識的話,則進行錯誤信息的提示(步驟470),并且回到步驟400的部分,要求使用者再重新進行語音的輸入,否則的話便繼續(xù)進行語音轉(zhuǎn)換的動作,將模擬信號內(nèi)容通過轉(zhuǎn)換使之成為計算機可處理的數(shù)字信號;產(chǎn)生出計算機可執(zhí)行處理的數(shù)字信號(步驟430),之后便根據(jù)數(shù)字信號所表示的內(nèi)容將對應(yīng)到分類類別清單上的數(shù)據(jù)項自詞句數(shù)據(jù)庫210中擷取出來(步驟440);然后通過輸出顯示模塊240進行顯示動作(步驟450);此時,本發(fā)明的輸入法系統(tǒng)200會判斷如果顯示的內(nèi)容已到達最后的類別項目詞句時,使用者是否已經(jīng)選定其中一項并且將該類別項目詞句輸出?(步驟460)如果不是的話,表示所顯示的分類類別清單還有更進一步的分類類別存在,則流程會再度回到步驟400的部分,繼續(xù)接收使用者的語音輸入,否則的話,表示已經(jīng)完成這次的數(shù)據(jù)擷取流程,結(jié)束整個流程。
最后,下面通過圖4a、圖4b及圖4c來進行本發(fā)明的具體實施例的說明開始時,使用者會見到如圖4a所呈現(xiàn)的分類類別清單,其中在項目顯示區(qū)的部分顯示出詞句數(shù)據(jù)庫210中所有詞句的最基本分類項目(如生活、自然、人生、生命…),此時使用者可以利用語音的方式進行輸入,舉例來說,若使用者想要輸入有關(guān)“生活”類別下的詞句時,使用者可以以語音的方式來輸入“生活”類別的候選詞句編號(即“1”);接著出現(xiàn)的畫面將如圖4b所示,在項目顯示區(qū)中會顯示出所有“生活”類別下的各個類別項目(包括飲食、工作、家庭、娛樂、愛情…),而在語音輸入?yún)^(qū)中則顯示出目前使用者所處的詞句分類類別狀態(tài);此時,若使用者希望能夠輸入的是“工作”方面的詞句時,使用者可以通過語音的方式輸入代表“工作”類別的候選詞句編號(即“2”);同樣地,系統(tǒng)會將在“工作”類別下的各個類別項目給顯示出來,假使在“工作”類別下并沒有其它更細部的分類類別時,系統(tǒng)便會將“工作”類別下所有的類別項目詞句給顯示出來(如圖4c中所示),這時候使用者同樣可以利用語音輸入對應(yīng)的候選詞句編號把自己所想要的詞句給選取出來,系統(tǒng)會自動將對應(yīng)的類別項目詞句給擷取出來,然后自動輸出到使用者所正在使用編輯的文檔中。
雖然本發(fā)明的較佳實施例揭露如上,然而并非用以限制本發(fā)明的范圍,任何熟悉該技藝的技術(shù)人員,在不脫離本發(fā)明的精神和范圍內(nèi),所作的些許更改和修飾,均應(yīng)包含在本發(fā)明的權(quán)利要求書所保護的范圍之內(nèi)。
權(quán)利要求
1.一種具有語音辨識輔助功能的中文輸入系統(tǒng),提供語音辨識技術(shù)來輔助使用者在候選詞句關(guān)鍵詞上的輸入以減少錯誤發(fā)生及提高輸入效率,其特征在于,該系統(tǒng)包含詞句數(shù)據(jù)庫,儲存所有的分類類別內(nèi)容以及類別項目詞句;接收辨識模塊,通過語音輸入外圍裝置接收使用者的候選詞句編號的語音,加以辨識并且進行語音轉(zhuǎn)換;數(shù)據(jù)擷取模塊,根據(jù)該語音轉(zhuǎn)換的結(jié)果,擷取分類類別清單中對應(yīng)的數(shù)據(jù)項;及輸出顯示模塊,顯示該分類類別清單及將類別項目詞句輸出到可編輯文檔中。
2.如權(quán)利要求1所述的具有語音辨識輔助功能的中文輸入系統(tǒng),其特征在于,該詞句數(shù)據(jù)庫為一種關(guān)系型數(shù)據(jù)庫,提供該分類類別及該類別項目詞句間的關(guān)聯(lián)索引。
3.如權(quán)利要求1所述的具有語音辨識輔助功能的中文輸入系統(tǒng),其特征在于,該接收辨識模塊還包含提示錯誤信息的功能。
4.如權(quán)利要求1所述的具有語音辨識輔助功能的中文輸入系統(tǒng),其特征在于,該語音轉(zhuǎn)換是將模擬信號轉(zhuǎn)換成為計算機可處理的數(shù)字信號。
5.如權(quán)利要求1所述的具有語音辨識輔助功能的中文輸入系統(tǒng),其特征在于,該分類類別清單包含語音輸入?yún)^(qū)及項目顯示區(qū)。
6.一種具有語音辨識輔助功能的中文輸入方法,提供語音辨識技術(shù)來輔助使用者在候選詞句關(guān)鍵詞上的輸入以減少錯誤發(fā)生及提高輸入效率,其特征在于,該方法包含下列步驟在可編輯文檔中激活輸入法起始界面;顯示分類類別清單;利用語音輸入一候選詞句編號進行該分類類別的選取動作;顯示類別項目詞句;利用語音選擇該候選詞句編號并擷取對應(yīng)的該類別項目詞句;及將該類別項目詞句輸出到該可編輯文檔中。
7.如權(quán)利要求6所述的具有語音辨識輔助功能的中文輸入方法,其特征在于,該分類類別清單包含語音輸入?yún)^(qū)及項目顯示區(qū)。
8.如權(quán)利要求6所述的具有語音辨識輔助功能的中文輸入方法,其特征在于,該利用語音輸入該候選詞句編號進行該分類類別的選取動作及利用語音選擇該候選詞句編號并擷取對應(yīng)的該類別項目詞句的步驟,還包含下列步驟通過語音輸入外圍裝置接收語音;進行語音辨識程序;將語音模擬信號轉(zhuǎn)換成為計算機可處理的數(shù)字信號;及進行對應(yīng)的數(shù)據(jù)項顯示。
9.如權(quán)利要求8所述的具有語音辨識輔助功能的中文輸入方法,其特征在于,該進行語音辨識程序還包含進行提示錯誤信息的步驟。
全文摘要
一種具有語音辨識輔助功能的中文輸入方法及其系統(tǒng),運用語音辨識技術(shù)供使用者進行候選詞句及類別的選取輸入上的輔助,讓使用者可以利用語音的方式去選取要輸入的候選詞句,以減少手動輸入的次數(shù)和錯誤的發(fā)生,提高整體輸入的速度。
文檔編號G06F17/30GK1494026SQ0214818
公開日2004年5月5日 申請日期2002年10月31日 優(yōu)先權(quán)日2002年10月31日
發(fā)明者溫世仁, 張東華, 吳儉, 張紅兵 申請人:英業(yè)達股份有限公司