專利名稱:帶朗讀功能的手機(jī)及其實(shí)現(xiàn)方法
技術(shù)領(lǐng)域:
本發(fā)明屬于便攜式終端的技術(shù)領(lǐng)域,更具體的說(shuō),就是涉及到能將文字朗讀出來(lái)的手機(jī)、PDA等便攜式電子產(chǎn)品。
背景技術(shù):
目前具備攝像頭和錄音功能的手機(jī)很普遍,手機(jī)攝像頭一般只用于拍照和錄像,由于目前手機(jī)存儲(chǔ)量的增加并能夠支持多種存儲(chǔ)卡,因此手機(jī)可以用于錄制音頻文件并進(jìn)行播放,但是手機(jī)所播放的音頻文件是前期所錄制的聲音或者是從計(jì)算機(jī)上下載的已經(jīng)完成編碼的文件?,F(xiàn)有的手機(jī)既可以照相又可以錄音,但是無(wú)法對(duì)外部的文字信息進(jìn)行處理,手機(jī)的用途受到了一定的局限。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了增加手機(jī)的多種功能,利用手機(jī)攝像頭對(duì)外部的文字信息進(jìn)行取像,然后通過(guò)聲音輸出裝置對(duì)文字信息進(jìn)行閱讀,并可以在手機(jī)顯示屏上把文字信息用大號(hào)字體進(jìn)行放大顯示。
為了達(dá)到上述目的,本發(fā)明即帶朗讀功能的手機(jī)終端,包括攝像頭、微處理器和聲音輸出設(shè)備,進(jìn)一步包括把外部文字拍照為圖片的攝像頭,接收?qǐng)D片并從中提取出每個(gè)文字信息的文字識(shí)別單元,把文字信息轉(zhuǎn)換成語(yǔ)音信息的語(yǔ)音數(shù)據(jù)庫(kù),語(yǔ)音信息傳送到聲音輸出設(shè)備并播放出來(lái)。
本發(fā)明還包括與所述的文字識(shí)別單元連接的顯示屏,把每個(gè)文字信息以大號(hào)字體在顯示屏上進(jìn)行顯示。
所述的攝像頭包括自動(dòng)調(diào)節(jié)攝像頭的水平線與外部文字內(nèi)容的行保持平行的水平調(diào)節(jié)單元,以及對(duì)攝像頭移動(dòng)過(guò)程進(jìn)行平穩(wěn)化的抖動(dòng)處理單元。
所述的文字識(shí)別單元包括對(duì)所獲得的圖片進(jìn)行清晰化的背景處理單元和文字圖形邊緣處理單元。從而更有效地對(duì)外部各種文字進(jìn)行信息處理。
所述的聲音輸出設(shè)備包括揚(yáng)聲器、有線耳機(jī)和藍(lán)牙耳機(jī),進(jìn)行文字的有聲朗讀。
本發(fā)明中手機(jī)終端實(shí)現(xiàn)朗讀功能的方法,包括以下步驟
選擇手機(jī)明讀模塊,手機(jī)對(duì)攝像頭和語(yǔ)音單元進(jìn)行初始化的步驟;按住選字功能鍵,把手機(jī)攝像頭移動(dòng)到文字閱讀區(qū)完成選字拍照步驟;文字識(shí)別單元接收?qǐng)D片并從中提取出文字信息,語(yǔ)音數(shù)據(jù)庫(kù)把文字信息轉(zhuǎn)換成語(yǔ)音信息的步驟;按住開(kāi)始朗讀鍵,聲音輸出設(shè)備把文字對(duì)應(yīng)的語(yǔ)音信息播放出來(lái)的步驟。
本發(fā)明還包括在手機(jī)顯示屏上把文字信息以大號(hào)字體顯示出來(lái)的步驟。
本發(fā)明還可以進(jìn)一步包括朗讀后沒(méi)有繼續(xù)選字拍照的步驟,則經(jīng)過(guò)10秒后再次對(duì)上次的語(yǔ)音信息進(jìn)行播放。
所述的手機(jī)攝像頭選字拍照的尺寸大小可調(diào)節(jié),由于外部文字可以是書(shū)本、報(bào)紙等各種媒介,相應(yīng)的排版方式也是多種多樣,手機(jī)攝像頭可以根據(jù)文字閱讀區(qū)的排版來(lái)調(diào)節(jié)合適的拍照區(qū)域范圍。而且手機(jī)攝像頭的焦距可微調(diào),保證圖片的清晰度。
本發(fā)明充分利用了手機(jī)上的攝像頭和語(yǔ)音輸出設(shè)備,將已有的硬件設(shè)備結(jié)合起來(lái),增加了手機(jī)的朗讀功能,使用具有微距調(diào)節(jié)的攝像頭手機(jī),可直接進(jìn)行讀報(bào)并可以對(duì)報(bào)紙上小號(hào)的文字在手機(jī)屏幕上進(jìn)行放大顯示,手機(jī)上附加的朗讀功能對(duì)于老年人和有視力障礙的人是很有用處的,而手機(jī)是目前大眾經(jīng)常隨身攜帶的電子產(chǎn)品,用戶拿手機(jī)對(duì)身邊的報(bào)紙期刊上的文字進(jìn)行閱讀朗讀,非常方便實(shí)用,本發(fā)明可以推廣應(yīng)用在具有攝像頭的便攜式終端,包括手機(jī)和PDA產(chǎn)品。
圖1是帶朗讀功能的便攜式終端的原理方框圖;圖2是便攜式終端實(shí)現(xiàn)朗讀方法的流程圖。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
如圖1所示,帶朗讀功能的手機(jī),包括射頻單元,供電單元,存儲(chǔ)器和聲音輸出設(shè)備,LCD顯示屏以及作為手機(jī)主控制的微處理器,本發(fā)明還包括具有焦距微調(diào)功能的攝像頭以及與攝像頭連接的圖形數(shù)字信息處理器,為了平穩(wěn)地取像拍照,圖形數(shù)字信息處理器中包括水平調(diào)節(jié)單元和抖動(dòng)處理單元,其中水平調(diào)節(jié)單元自動(dòng)調(diào)節(jié)攝像頭的水平線與外部文字內(nèi)容的行保持平行,抖動(dòng)處理單元可以對(duì)攝像頭移動(dòng)過(guò)程進(jìn)行平穩(wěn)化。
拍照后形成的清晰圖片文件,比如BMP格式的圖形文件傳送到手機(jī)內(nèi)的文字識(shí)別單元,文字識(shí)別單元接收?qǐng)D片并從中提取出每個(gè)文字信息,文字識(shí)別單元包括對(duì)所獲得的圖片進(jìn)行清晰化的背景處理單元和文字圖形邊緣處理單元,從而更有效地對(duì)外部各種文字進(jìn)行信息處理,并具有高的文字識(shí)別率。
文字識(shí)別單元把文字信息傳送到語(yǔ)音數(shù)據(jù)庫(kù),語(yǔ)音數(shù)據(jù)庫(kù)中包含每個(gè)文字的發(fā)音數(shù)據(jù),并包含常用詞語(yǔ)和常用短句的發(fā)音數(shù)據(jù),語(yǔ)音數(shù)據(jù)庫(kù)把文字信息轉(zhuǎn)換成語(yǔ)音信息通過(guò)聲音輸出設(shè)備播放出來(lái),聲音輸出設(shè)備可以選用揚(yáng)聲器、有線耳機(jī)和藍(lán)牙耳機(jī),完成對(duì)外部文字的有聲朗讀。同時(shí)與文字識(shí)別單元連接的顯示屏,把每個(gè)文字信息以大號(hào)字體在顯示屏上進(jìn)行顯示,用戶可以輕松閱讀。
手機(jī)也可以將相應(yīng)的文字信息文件和語(yǔ)音信息文件存儲(chǔ)在手機(jī)大容量的Memory和T-Flash卡中,供以后使用。
如圖2所示,手機(jī)實(shí)現(xiàn)朗讀功能的方法步驟如下第一步用戶在手機(jī)鍵盤(pán)上長(zhǎng)按朗讀功能鍵進(jìn)入朗讀菜單,手機(jī)對(duì)攝像頭和語(yǔ)音模塊進(jìn)行初始化;第二步按住選字功能鍵,把手機(jī)攝像頭移動(dòng)到閱讀區(qū),進(jìn)行選字拍照,對(duì)所獲得的圖片進(jìn)行清晰化處理,如背景處理、文字圖形邊緣處理,手機(jī)屏幕上放大顯示文字信息;第三步釋放選字功能鍵,并按開(kāi)始朗讀鍵,手機(jī)把文字轉(zhuǎn)換為語(yǔ)音信息并通過(guò)聲音輸出設(shè)備把顯示的字讀出來(lái),然后重復(fù)第二個(gè)步驟繼續(xù)選字拍照,如果沒(méi)有繼續(xù)選字,則過(guò)10秒鐘后再次讀上次的信息;第四步按停止鍵退出手機(jī)朗讀菜單,進(jìn)入待機(jī)狀態(tài)。
經(jīng)過(guò)以上步驟,用戶可以使用手機(jī)對(duì)書(shū)籍報(bào)紙進(jìn)行連續(xù)的朗讀,只需用耳朵來(lái)聽(tīng)信息。手機(jī)攝像頭選字拍照的尺寸大小可調(diào)節(jié),由于外部文字可以是書(shū)本、報(bào)紙等各種媒介,相應(yīng)的排版方式也是多種多樣,手機(jī)攝像頭可以根據(jù)文字閱讀區(qū)的排版來(lái)調(diào)節(jié)合適的拍照區(qū)域范圍。
本發(fā)明可廣泛應(yīng)用于各種拍照手機(jī)和帶有攝像頭的PDA產(chǎn)品上,手機(jī)的使用者利用手機(jī)可輕松地聽(tīng)各種文字信息,增加了手機(jī)多樣性功能,方便了老人的使用。
以上所述僅為本發(fā)明的較佳實(shí)施方式而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換或者改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.帶朗讀功能的手機(jī),包括攝像頭、微處理器和聲音輸出設(shè)備,其特征在于進(jìn)一步包括把外部文字拍照為圖片的攝像頭,接收?qǐng)D片并從中提取出每個(gè)文字信息的文字識(shí)別單元,把文字信息轉(zhuǎn)換成語(yǔ)音信息的語(yǔ)音數(shù)據(jù)庫(kù),語(yǔ)音信息傳送到聲音輸出設(shè)備并播放出來(lái)。
2.根據(jù)權(quán)利要求1所述的帶朗讀功能的手機(jī),其特征在于還包括與所述的文字識(shí)別單元連接的顯示屏,把每個(gè)文字信息以大號(hào)字體在顯示屏上進(jìn)行顯示。
3.根據(jù)權(quán)利要求1或者2所述的帶朗讀功能的手機(jī),其特征在于所述的攝像頭包括自動(dòng)調(diào)節(jié)攝像頭的水平線與外部文字內(nèi)容的行保持平行的水平調(diào)節(jié)單元,以及對(duì)攝像頭移動(dòng)過(guò)程進(jìn)行平穩(wěn)化的抖動(dòng)處理單元。
4.根據(jù)權(quán)利要求1或者2所述的帶朗讀功能的手機(jī),其特征在于所述的文字識(shí)別單元包括對(duì)所獲得的圖片進(jìn)行清晰化的背景處理單元和文字圖形邊緣處理單元。
5.根據(jù)權(quán)利要求1所述的帶朗讀功能的手機(jī),其特征在于所述的聲音輸出設(shè)備包括揚(yáng)聲器、有線耳機(jī)和藍(lán)牙耳機(jī)。
6.一種手機(jī)實(shí)現(xiàn)朗讀功能的方法,其特征在于包括以下步驟選擇手機(jī)朗讀模塊,手機(jī)對(duì)攝像頭和語(yǔ)音單元進(jìn)行初始化的步驟;按住選字功能鍵,把手機(jī)攝像頭移動(dòng)到文字閱讀區(qū)完成選字拍照步驟;文字識(shí)別單元接收?qǐng)D片并從中提取出文字信息,語(yǔ)音數(shù)據(jù)庫(kù)把文字信息轉(zhuǎn)換成語(yǔ)音信息的步驟;按住開(kāi)始朗讀鍵,聲音輸出設(shè)備把文字對(duì)應(yīng)的語(yǔ)音信息播放出來(lái)的步驟。
7.根據(jù)權(quán)利要求6所述的手機(jī)實(shí)現(xiàn)朗讀功能的方法,其特征在于還包括在手機(jī)顯示屏上把文字信息以大號(hào)字體顯示出來(lái)的步驟。
8.根據(jù)權(quán)利要求6或者7所述的手機(jī)實(shí)現(xiàn)朗讀功能的方法,其特征在于還包括朗讀后沒(méi)有繼續(xù)選字拍照的步驟,則經(jīng)過(guò)10秒后再次對(duì)上次的語(yǔ)音信息進(jìn)行播放。
9.根據(jù)權(quán)利要求6所述的手機(jī)實(shí)現(xiàn)朗讀功能的方法,其特征在于所述的手機(jī)攝像頭選字拍照的尺寸大小可選擇。
10.根據(jù)權(quán)利要求6或者9所述的手機(jī)實(shí)現(xiàn)朗讀功能的方法,其特征在于所述的手機(jī)攝像頭的焦距可微調(diào)。
全文摘要
本發(fā)明公開(kāi)了一種帶朗讀功能的手機(jī)及其方法,包括攝像頭、微處理器和聲音輸出設(shè)備,進(jìn)一步包括把外部文字拍照為圖片的攝像頭,接收?qǐng)D片并從中提取出每個(gè)文字信息的文字識(shí)別單元,把文字信息轉(zhuǎn)換成語(yǔ)音信息的語(yǔ)音數(shù)據(jù)庫(kù),語(yǔ)音信息傳送到聲音輸出設(shè)備并播放出來(lái),可用手機(jī)直接進(jìn)行聽(tīng)報(bào)并可以對(duì)報(bào)紙上小號(hào)的文字在手機(jī)屏幕上進(jìn)行放大顯示,方便了老年人和有視力障礙的人日常使用。
文檔編號(hào)H04M1/725GK1960532SQ200610070118
公開(kāi)日2007年5月9日 申請(qǐng)日期2006年11月8日 優(yōu)先權(quán)日2006年11月8日
發(fā)明者楊文琳 申請(qǐng)人:青島海信移動(dòng)通信技術(shù)股份有限公司