專利名稱:影像識別翻譯裝置及方法
技術領域:
本發(fā)明涉及一種翻譯裝置,尤其涉及一種將所見物體中的文字翻譯為指 定語言的裝置。
背景技術:
目前翻譯機的操作都是由使用者以輸入按鍵的方式,將所要查詢的文 字鍵入翻譯機內(nèi),再由翻譯機在其內(nèi)建的資料庫中搜尋對應的翻譯,并將 查詢結果顯示在屏幕上供使用者査看。隨著電子科技的快速發(fā)展,市場上 的消費類電子產(chǎn)品都整合了多項功能以提升其競爭力,除了一般的拍照、 通話、上網(wǎng)等功能之外,現(xiàn)在連翻譯功能都可整合在手機或個人數(shù)字助理 等便攜式電子裝置上,而傳統(tǒng)翻譯機輸入文字的方式也從按鍵輸入發(fā)展為 手寫、語音輸入等方式,如此不僅可以方便使用者快速輸入文字,也提供 給使用者多樣化的選擇。然而,以按鍵逐字輸入或是以手寫輸入的方式非常耗費時間,無法應 付隨時而來的需要。此外,在現(xiàn)在的電子產(chǎn)品講究輕、薄、短、小的潮流 下,在電子產(chǎn)品上裝設鍵盤可能會因為按鍵太小而造成使用上的不方便, 若改為較大型的鍵盤或手寫板則會增加電子產(chǎn)品的體積,而降低產(chǎn)品的便 攜性及競爭力。此外,使用傳統(tǒng)翻譯機査詢文字的功能是建立在使用者了解所見文 字的字母或者發(fā)音的前提下,且需配合適用的輸入法或麥克風,才能順 利地輸入,查找文字的翻譯。然而當使用者到國外出差或者旅游時,則 有可能會因為連所見文字的字母都看不懂,而無從査詢其翻譯,相當?shù)?不方便。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種影像識別和翻譯裝置,包括以相機等影像獲 取裝置拍攝圖片,再利用內(nèi)建的文字識別模塊及翻譯模塊將圖片中的文字 翻譯,并將翻譯結果顯示在屏幕上。
本發(fā)明的另一個目的是提供一種影像識別及翻譯方法,首先拍攝想要 翻譯的圖片或看到的文字,在識別出其中的文字后,對照翻譯為合適的語 言,從而讓使用者了解圖片中的文字內(nèi)容。
為了達到上述目的,根據(jù)本發(fā)明的一個方面,提供一種影像識別和翻譯裝 置,包括影像獲取單元、文字識別模塊、翻譯模塊及顯示單元。其中所述影像獲取單元用于拍攝影像,所述影像中包括屬于第一語言中的至少一個文字;文 字識別模塊則用于識別影像中的文字。此外,翻譯模塊用于將識別出的文字翻譯為第二語言;顯示單元用于顯示所述翻譯為第二語言的文字。
根據(jù)本發(fā)明的另一個方面,還提供了一種用于便攜式電子裝置中的影像識別翻譯方法,該方法包括以下步驟首先拍攝一個影像,此影像中包括 屬于第一語言的至少一個文字,接著識別影像中的文字,然后將識別出的 文字翻譯為第二語言,最后顯示翻譯為第二語言的文字。
本發(fā)明因采用結合影像獲取單元、文字識別及翻譯模塊的結構,因 此當使用者看到想要翻譯的文字時,只要將包括這些文字的影像拍攝下 來,即可識別及翻譯為指定的語言,而達到方便使用者了解文字內(nèi)容的 目的。
本發(fā)明的影像識別和翻譯裝置及方法至少具有下列優(yōu)點1. 支持各國文字,避免使用者因看不懂文字,無法鍵入文字或念出文字 以查詢其翻譯所造成的困擾。2. 使用相機拍攝,可達到隨拍即用,快速翻譯的功效,縮短使用者輸入 文字的時間。3. 不需使用鍵盤輸入,因此可以縮小裝置的體積,提供使用者隨身攜帶 的便利性。4. 可整合在現(xiàn)有的手機、個人數(shù)字助理上,不會額外增加裝置的生產(chǎn)成 本。
下面結合附圖對本發(fā)明作進一步描述圖1為根據(jù)本發(fā)明的一個具體實施方式
的影像識別和翻譯裝置框圖; 圖2為根據(jù)本發(fā)明的一個具體實施方式
的影像識別和翻譯方法流程圖。
具體實施方式
為了使本發(fā)明的內(nèi)容更為明了,下面特舉實施例作為本發(fā)明確實能 夠據(jù)以實施的范例。圖1為根據(jù)本發(fā)明的一個較佳實施例的影像識別和翻譯裝置框圖。 參照圖1,本實施例的影像識別和翻譯裝置IOO例如是一個手機、個人數(shù) 字助理、智能電話或翻譯機,而其內(nèi)部則包括有影像獲取單元110、文字 識別模塊120、翻譯模塊130、顯示單元140、存儲單元150、語音播放 單元160,從而能夠為使用者即時翻譯所見圖案中的文字。影像獲取單元110用于拍攝影像,文字識別模塊120用于識別所拍 影像中的文字,翻譯模塊130則接著將識別出的文字翻譯為指定的語言, 最后顯示單元140則將翻譯出的文字顯示出來。此外,存儲單元150可 用于記錄所翻譯出的文字,讓使用者能夠隨時査詢,而語音播放單元160 則可將翻譯完成之文字以語音播放的形式告知使用者。圖2是根據(jù)本發(fā)明的較佳實施例的影像識別和翻譯方法流程圖。同 時參照圖1和圖2,本實施例詳細介紹如何將物體上的文字通過本發(fā)明之 影像識別和翻譯裝置IOO翻譯成使用者所指定的語言。在步驟S110中,首先,當使用者看到想要翻譯的圖片或者文字,例 如海報、標示牌或者是餐廳的菜單等,即可以先用影像獲取單元110將 此物體拍攝為影像,此影像包括屬于第一語言(例如是英文)的至少一 個文字。其中,此影像獲取單元110例如是一個電荷耦合器件 (Charge-Coupled Device, CCD)相機或者是一個互補金屬氧化物半導體 Complementary Metal Oxide Semiconductor, CMOS)相機,但不限于此。在步驟S120中,在拍攝完成之后,影像識別和翻譯裝置100中內(nèi)建 的文字識別模塊120即會開始識別影像中的文字。其中,使用者可以根
據(jù)其需要,在影像中圈選一個范圍,而文字識別模塊120就可只識別此 范圍內(nèi)的文字,因此能夠縮短文字識別的時間,提高文字識別的正確率。在步驟S130中,接著由影像識別和翻譯裝置100中內(nèi)建之翻譯模塊 130將文字識別模塊120所識別出的文字翻譯為指定的第二語言(例如中 文)。其中,使用者可以在影像識別和翻譯裝置IOO選取或設定所要翻 譯的語言,所述語言可包括有中文、英文、法文、西班牙文等各國語言, 可視翻譯模塊130所能支持的語言種類及數(shù)目而定,并不限制其范圍。在步驟S140中,在翻譯完成后,即可將翻譯完成的文字顯示在影像 識別和翻譯裝置100的顯示單元140上。其中,此顯示140可以是一個 液晶顯示(Liquid Crystal Display, LCD)屏幕,而其顯示方式可以是僅單 純地顯示文字,或者是顯示出原影像,并將翻譯文字覆蓋在原影像中所 翻譯文字之上等方式,亦不限制其范圍。此外,在本發(fā)明的另一個較佳實施例中,還可以將翻譯完成的文字 以語音播放方式播放,讓使用者了解其發(fā)音是與他人溝通,而此翻譯完 成的文字也可以存儲,作為將來學習或參考用,相當方便。以上對本發(fā)明的具體實施例進行了描述。需要理解的是,本發(fā)明并不 局限于上述特定的實施方式,本領域技術人員可以在所附權利要求的范圍 內(nèi)做出各種變形或修改。因此本發(fā)明的保護范圍以權利要求書所界定的范 圍為準。
權利要求
1.一種影像識別翻譯裝置,包括-影像獲取單元,用于拍攝一個影像,所述影像中包括屬于第一語言的至少一個文字;-文字識別模塊,用于識別所述影像中的所述至少一個文字;-翻譯模塊,用于將識別出的所述影像中的所述至少一個文字翻譯為第二語言;以及-顯示單元,用于顯示所述翻譯為第二語言的至少一個文字。
2. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,還包括-語音播放單元,用于語音播放所述翻譯為第二語言的至少一個文字。
3. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,還包括..-存儲單元,用于存儲所述翻譯為第二語言的至少一個文字。
4. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,該裝 置包括手機、個人數(shù)字助理、智能電話或翻譯機。
5. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,所述 影像獲取單元包括電荷藕合器件(Charge-Coupled Device, CCD)相機或 互補金屬氧化物半導體(Complementary Metal Oxide Semiconductor, CMOS)相機。
6. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,其中 所述顯示單元包括液晶顯示(Liquid Crystal Display, LCD)屏幕。
7. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,其中 所述顯示單元顯示所述翻譯為第二語言的至少一個文字的方式為單純地 顯示文字。
8. 根據(jù)權利要求1中所述的影像識別翻譯裝置,其特征在于,其中 所述顯示單元顯示所述翻譯為第二語言的至少一個文字的方式為顯示所 述影像,并將所述翻譯為第二語言的至少一個文字分別覆蓋在所述影像中 與之對應的屬于第一語言的至少一個文字上。
9. 一種在便攜式電子裝置中用于影像識別和翻譯的方法,包括以下拍攝影像,所述影像中包括屬于第一語言的至少一個文字; b.識別所述影像中的屬于第一語言的至少一個文字;c. 將識別出的所述影像中的屬于第一語言的至少一個文字翻譯為第 ~^語曰;d. 顯示所述翻譯為第二語言的至少一個文字。
10. 根據(jù)權利要求9中所述方法,其特征在于,還包括-播放所述翻譯為第二語言的至少一個文字。
11. 根據(jù)權利要求9中所述方法,其特征在于,還包括 -存儲所述翻譯為第二語言的至少一個文字。
12. 根據(jù)權利要求9中所述方法,其特征在于,其中識別該屬于第一 語言的至少一個文字的步驟還包括bl.從所述影像中圈選出所要翻譯的至少一個文字; b2.識別所述圈選出的至少一個文字。
13. 根據(jù)權利要求9中所述的方法,其特征在于,所述便攜式電子裝 置包括手機、個人數(shù)字助理、智能電話或翻譯機。
14. 根據(jù)權利要求9中所述的方法,其特征在于,所述便攜式電子裝 置中的影像獲取單元包括電荷藕合器件(Charge-Coupled Device, CCD) 相機或互補金屬氧化物半導體(Complementary Metal Oxide Semiconductor, CMOS )相機。
15.根據(jù)權利要求9中所述的方法,其特征在于,所述便攜式電子裝置 中的顯示單元包括液晶顯示(Liquid Crystal Display, LCD)屏幕。
全文摘要
一種影像識別及翻譯裝置和方法,所述方法是籍由一個影像獲取單元拍攝一個影像,并用一個文字識別模塊識別所述影像中的文字,接著用一個翻譯模塊將識別出的文字翻譯為指定的語言,最后用顯示單元顯示出所翻譯出文字。本發(fā)明不僅可避免使用者因看不懂文字而無法查詢的困擾,還能夠方便使用者輸入文字,而達到隨拍即用,快速翻譯的目的。
文檔編號G06K9/20GK101127036SQ20061011557
公開日2008年2月20日 申請日期2006年8月14日 優(yōu)先權日2006年8月14日
發(fā)明者吳炯憲, 李明倫, 王斌銓 申請人:英華達股份有限公司