匹配目標試題答案的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種匹配目標試題答案的方法和裝置,其中,方法包括:獲取包含目標試題的圖像;根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合識別要求;如果包含目標試題的圖像滿足識別要求,對圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息;根據(jù)預處理后的圖像查找對應的試題答案并顯示。根據(jù)該方案,實時地獲取符合識別要求的圖像,對圖像的預處理提高了識別的準確率和效率,能夠及時為用戶查找到答案,并保證答案的準確性。
【專利說明】匹配目標試題答案的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及終端應用領(lǐng)域,具體涉及一種匹配目標試題答案的方法和裝置。
【背景技術(shù)】
[0002]在中小學生寫作業(yè)或者家長輔導學生的時候,常遇到不會做的試題或題目。這時用戶常常通過互聯(lián)網(wǎng)尋求試題的答案。
[0003]當前,已有多種服務于學生或家長的中小學生試題解析網(wǎng)站或網(wǎng)絡應用,幫助用戶獲取答案,順利完成作業(yè),例如,作業(yè)幫,問他,作業(yè)寶等網(wǎng)站。用戶輸入試題內(nèi)容或上傳試題圖片等待他人解答。
[0004]現(xiàn)有的作業(yè)解析網(wǎng)站,app等都是通過人工回答,網(wǎng)站的其他用戶,或在線教師查看試題后給出參考答案。從用戶提問到獲取到答案,存在時間成本的問題,用戶的即時需求無法得到滿足。在用戶提問高峰期,或是對于難度較大的問題,有時會出現(xiàn)較長時間,如幾個小時或一天內(nèi)無人作答的情況,效率十分低下。長時間的等待也影響用戶體驗。并且,不同的作答可能多種不同的答案,令用戶難以分辨。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的匹配目標試題答案的方法和裝置。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種匹配目標試題答案的方法,包括:獲取包含目標試題的圖像;根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合識別要求;如果包含目標試題的圖像滿足識別要求,對圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息;根據(jù)預處理后的圖像查找對應的試題答案并顯示。
[0007]可選地,所述一個或多個圖像指標包括以下指標中的一項或多項:拍攝角度、圖像分辨率、亮度、對比度。
[0008]可選地,所述根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合識別要求具體包括:
[0009]對所述包含目標試題的圖像進行質(zhì)量分析,得到該圖像的拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎担?br>
[0010]分別將所述拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎蹬c對應的預設閾值范圍進行比對;
[0011]根據(jù)比對結(jié)果判斷所述包含目標試題的圖像是否符合識別要求。
[0012]可選地,所述根據(jù)比對結(jié)果判斷目標試題的圖像是否符合識別要求具體為:
[0013]如果包含目標試題的圖像的拍攝角度值和/或圖像分辨率值不在對應的預設閾值范圍內(nèi),判斷所述包含目標試題的圖像不符合識別要求。
[0014]可選地,所述對所述圖像做預處理具體為:如果亮度值和/或?qū)Ρ榷戎挡辉趯念A設閾值范圍內(nèi),調(diào)整所述圖像的亮度值和/或?qū)Ρ榷戎抵翆念A設閾值范圍內(nèi)。[0015]可選地,所述包含目標試題的圖像由用戶拍攝獲得,所述方法還包括:向用戶提供拍攝引導信息,獲取用戶拍攝的包含目標試題的初始圖像;
[0016]所述判斷包含目標試題的圖像是否符合識別要求具體為:判斷所述初始圖像是否符合OCR識別要求。
[0017]可選地,所述預處理還包括:
[0018]根據(jù)用戶選擇的聚焦區(qū)域,對所述包含目標試題的初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界;
[0019]根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像;
[0020]所述對預處理后的圖像進行識別具體為:對截取到的所述包含目標試題的圖像進行OCR識別。
[0021]可選地,所述對包含目標試題的初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界包括:根據(jù)用戶選擇的聚焦區(qū)域,自動檢測所述目標試題在所述初始圖像中的邊界,或
[0022]提供用戶接口,將用戶選定的邊界作為述目標試題在所述初始圖像中的邊界。
[0023]可選地,所述拍攝引導信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
[0024]可選地,所述根據(jù)預處理后的信息查找對應的答案并顯示具體包括:
[0025]對預處理后的圖像進行識別,獲取所述目標試題的文字內(nèi)容;
[0026]利用所述目標試題的文字內(nèi)容與試題庫中的試題進行匹配;
[0027]將匹配通過的試題作為候選試題,獲取候選試題的答案。
[0028]根據(jù)本發(fā)明的另一方面,提供了一種匹配目標試題答案的裝置,包括:獲取模塊,用于獲取包含目標試題的圖像;判斷模塊,用于根據(jù)一個或多個圖像指標判斷所述包含目標試題的圖像是否符合識別要求;預處理模塊,用于當所述包含目標試題的圖像滿足所述識別要求時,對所述圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息;查找模塊,用于根據(jù)預處理后的圖像查找對應的試題答案。
[0029]可選地,所述一個或多個圖像指標包括以下指標中的一項或多項:拍攝角度、圖像分辨率、亮度、對比度。
[0030]可選地,所述判斷模塊包括:
[0031]分析單元,用于對所述包含目標試題的圖像進行質(zhì)量分析,得到該圖像的拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎担?br>
[0032]比對單元,用于分別將所述拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎蹬c對應的預設閾值范圍進行比對;
[0033]判斷單元,用于根據(jù)比對結(jié)果判斷所述包含目標試題的圖像是否符合識別要求。
[0034]可選地,所述判斷單元具體用于:如果包含目標試題的圖像的拍攝角度值和/或圖像分辨率值不在對應的預設閾值范圍內(nèi),判斷所述包含目標試題的圖像不符合識別要求。
[0035]可選地,所述預處理模塊進一步包括:調(diào)整單元,用于亮度值和/或?qū)Ρ榷戎挡辉趯念A設閾值范圍內(nèi)時,調(diào)整所述圖像的亮度值和/或?qū)Ρ榷戎抵翆念A設閾值范圍內(nèi)。[0036]可選地,所述獲取模塊進一步包括:
[0037]拍照單元,向用戶提供拍攝引導信息,獲取用戶拍攝的包含目標試題的初始圖像;
[0038]所述判斷模塊具體用于:判斷所述初始圖像是否符合OCR識別要求。
[0039]可選地,所述預處理模塊還包括:
[0040]邊緣檢測單元,用于對所述初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界;
[0041]圖像截取單元,用于根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像;
[0042]所述識別模塊具體用于:對截取到的所述包含目標試題的圖像進行OCR識別。
[0043]可選地,所述邊緣檢測單元具體用于:根據(jù)用戶選擇的聚焦區(qū)域,自動檢測所述目標試題在所述初始圖像中的邊界,或
[0044]提供用戶接口,將用戶選定的邊界作為述目標試題在所述初始圖像中的邊界。
[0045]可選地,所述拍攝引導信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
[0046]可選地,所述查找模塊進一步包括:
[0047]識別單元,用于對預處理后的圖像進行識別,獲取所述目標試題的文字內(nèi)容;
[0048]匹配單元,用于利用所述目標試題的文字內(nèi)容與試題庫中的試題進行匹配;
[0049]獲取單元,用于將匹配通過的試題作為候選試題,獲取候選試題的答案。
[0050]根據(jù)本發(fā)明的匹配目標試題答案的方法和裝置,獲取包含目標試題的圖像,判斷該圖像是否符合識別要求,對符合識別要求的圖像做預處理,根據(jù)預處理后的圖像查找對應的試題答案。根據(jù)該方案,實時地獲取符合識別要求的圖像,對圖像的預處理提高了識別的準確率和效率,能夠及時為用戶查找到答案,并保證答案的準確性。
[0051]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0052]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0053]圖1示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的方法的流程圖;
[0054]圖2示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖;
[0055]圖3示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖;
[0056]圖4示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0057]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0058]圖1示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的方法的流程圖,如圖1所示,方法包括如下步驟:
[0059]步驟S110,獲取包含目標試題的圖像。
[0060]包含目標試題的圖像可來自用戶的現(xiàn)場拍攝,或選自本地文件,例如,手機相冊,對電子文檔的截圖等。圖像可以為bmp,jpg, jpeg等常見格式,也可以包括其它適于進行圖像識別的電子文件格式,例如Pdf文件。
[0061]步驟S120,根據(jù)一個或多個圖像指標,判斷包含目標試題的圖像是否符合識別要求。
[0062]一個或多個圖像指標可以包括拍攝角度、圖像分辨率、亮度、對比度,以及圖像等信噪比等。圖像指標的具體要求可能與圖像類別相關(guān),例如,對于手寫題目,則對圖像分辨率等參數(shù)有更高的要求。另一方面,判斷圖像是否符合識別要求需要綜合評價上述指標中的一個或多個是否在可接受的范圍內(nèi),各指標在評價中可能占有不同的權(quán)重及優(yōu)先次序,本領(lǐng)域技術(shù)人員可根據(jù)實際需要進行調(diào)整。
[0063]步驟S130,如果包含目標試題的圖像符合識別要求,對圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息。
[0064]預處理包括對部分可調(diào)節(jié)指標進行調(diào)整,包括但不僅限于:調(diào)整亮度、對比度至最佳范圍,去除噪音,對彩色圖像的二值化處理等。圖像預處理還可以包括邊緣檢測等內(nèi)容,詳見后續(xù)實施例描述。
[0065]如果不滿足識別要求,顯示提示信息,通知用戶重新進行拍攝或重新選取圖像。
[0066]步驟S140,根據(jù)預處理后的圖像查找對應的試題答案并顯示。
[0067]將預處理后的包含目標試題的圖像轉(zhuǎn)換成目標試題的文字內(nèi)容,利用文字內(nèi)容查找答案,或者進一步地,從文字內(nèi)容中提取出包含目標試題至少部分有效信息的特征信息,根據(jù)特征信息查找試題答案,例如,特征信息可以是從文字內(nèi)容中截取的一個或多個預設長度的文字片段,或者,以對文字內(nèi)容進行拋詞處理后的剩余文字內(nèi)容作為特征信息。
[0068]具體地,根據(jù)文字內(nèi)容或特征信息查找答案的一種方式是,在試題庫中匹配特征信息。試題庫中有大量預先收集的試題及相應的答案。試題庫可以是一個或多個,例如,試題庫可根據(jù)學科,年級等進行分類。匹配時提醒用戶在相應的類別中查找,或根據(jù)的關(guān)鍵詞對目標題目進行自動分類,以提高查找效率。
[0069]根據(jù)本發(fā)明上述實施例提供的方法,獲取包含目標試題的圖像,判斷該圖像是否符合識別要求,對符合識別要求的圖像做預處理,根據(jù)預處理后的圖像查找對應的試題答案。根據(jù)該方案,實時地獲取符合識別要求的圖像,通過對圖像進行預處理提高了識別的準確率和效率,能夠及時為用戶查找到答案,并保證答案的準確性。
[0070]圖2示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖,如圖2所示,方法包括如下步驟:
[0071]步驟S210,向用戶提供拍攝引導信息,獲取用戶拍攝的包含目標試題的初始圖像;
[0072]拍攝引導信息包括拍攝方向,拍攝角度,光線,距離,以及提醒用戶對目標試題所在區(qū)域進行聚焦等,通過引導信息對用戶做適當?shù)闹甘荆褂脩襞臄z出的圖像符合識別的質(zhì)量要求。
[0073]本發(fā)明中的方法可實現(xiàn)為智能手機平臺上的app,則該步驟可通過調(diào)用智能手機的攝像頭或系統(tǒng)提供的攝像程序?qū)崿F(xiàn)。
[0074]具體地,在用戶拍照前給出文字說明及示例圖片等作為引導信息,例如,提示用戶采用垂直角度進行拍攝,選擇良好光線,橫向拍攝,顯示一個用戶可調(diào)的聚焦框等,以及在題目過長時,只拍攝一部分有效內(nèi)容等。
[0075]步驟S220,對包含目標試題的圖像進行質(zhì)量分析,得到該圖像的多個圖像指標。
[0076]質(zhì)量分析依照預設的圖像指標進行。作為示例,本實施例中選取拍攝角度、圖像分辨率、亮度、對比度作為圖像指標進行說明,但需要說明的是本發(fā)明實施例不僅限于此。上述質(zhì)量分析具體為:計算圖像的拍攝角度、分辨率值、亮度值以及對比度值。
[0077]步驟S230,將多個圖像指標分別與對應的預設閾值范圍進行比對。
[0078]不同的圖像類別可能對應不同的閾值,例如,字體較小或手寫題目可能對分辨率的要求較高。多個圖像指標的比對過程可能按照一定的優(yōu)先次序進行,并且,步驟S220中的質(zhì)量分析結(jié)果也可能影響預設閾值范圍的選取,例如,質(zhì)量分析及比對結(jié)果表明,圖像具有較高的分辨率并且接近垂直拍攝,則相應地,可以接受較大的亮度、對比度閾值范圍。
[0079]步驟S240,根據(jù)比對結(jié)果判斷包含目標試題的圖像是否符合識別要求,如果符合要求,執(zhí)行步驟S260,否則,執(zhí)行步驟S250。
[0080]下面示例性地說明判斷規(guī)則,定義拍攝角度的預設閾值范圍為20°以下,分辨率的閾值范圍為150-600dpi之間,由于對比度和亮度易于調(diào)節(jié),可選擇較大的閾值范圍,例如,可為亮度和對比度分別設置第一、第二閾值范圍,則具體地,判斷方法可以包括:
[0081]分辨率不在上述范圍內(nèi)(150-600dpi)時,判斷圖像不符合識別要求;拍攝角度不在20°范圍內(nèi)時,判斷圖像不符合識別要求;當分辨率和拍攝角度符合要求,對比度和/或亮度在各自的第一閾值范圍外,第二閾值范圍內(nèi)時,判斷圖像符合識別要求,而當對比度或亮度在第二閾值范圍外時,判斷圖像不符合識別要求。上述判斷規(guī)則僅為示例,可根據(jù)實際情況適用其他規(guī)則。
[0082]步驟S250,發(fā)出重新獲取包含目標試題的圖像的提示信息,轉(zhuǎn)到步驟S210。
[0083]通過文字或圖片提示用戶重新拍攝或重新選取圖片,具體地,根據(jù)上述比對結(jié)果給出相應提示信息,例如,分辨率過低,則可提示用戶圖片過于模糊。
[0084]步驟S260,判斷亮度值和/或?qū)Ρ榷戎凳欠裨趯念A設閾值范圍內(nèi),如果是,執(zhí)行步驟S280,否則執(zhí)行步驟S270。
[0085]如同在步驟S240中所述的,分辨率在150_600dpi之間,而拍攝角度在20°以下時,如果亮度和/或?qū)Ρ榷戎性趯牡谝婚撝捣秶?,第二閾值范圍?nèi)時,或在第一閾值范圍內(nèi)時,都判斷該圖像符合識別要求,該步驟中的預設閾值范圍指第一閾值范圍。
[0086]步驟S270,調(diào)整圖像的亮度值和/或?qū)Ρ榷戎抵翆念A設閾值范圍內(nèi);之后,執(zhí)行步驟S280。
[0087]若圖像符合識別要求而亮度值和/或?qū)Ρ榷戎挡辉诘谝婚撝捣秶鷥?nèi),將亮度值和/或?qū)Ρ榷戎嫡{(diào)整至較佳的第一閾值范圍內(nèi),以利于識別。
[0088]步驟S280,根據(jù)預處理后的圖像查找對應的試題答案并顯示。[0089]例如,可以采用OCR等文字識別方法,得到試題文字內(nèi)容,根據(jù)文字內(nèi)容自動匹配試題答案,詳見下一實施例。
[0090]根據(jù)本發(fā)明上述實施例提供的方法,對用戶進行拍照引導,并在識別圖像之前,通過質(zhì)量分析和預處理等步驟保證了圖像滿足識別要求,使用戶免于圖像質(zhì)量原因引起的重復操作,也避免了圖像質(zhì)量問題導致的識別準確率低下,獲取答案失敗等情況,使答案查找獲得較高的召回率和準確性。
[0091]圖3示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的方法的流程圖,如圖3所示,方法包括如下步驟:
[0092]步驟S310,獲取包含目標試題的圖像。
[0093]步驟S320,根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合OCR識別要求,如果是,執(zhí)行步驟S340,否則執(zhí)行步驟S330。
[0094]步驟S330,發(fā)出重新獲取包含目標試題的圖像的提示信息,轉(zhuǎn)到步驟S310。
[0095]步驟S310-S330的具體實現(xiàn)方式可參照上一實施例,此處不再重復敘述。
[0096]步驟S340,對包含目標試題的初始圖像進行邊緣檢測,得到目標試題在初始圖像中的邊界。
[0097]步驟S340之前也可以進行亮度、對比度調(diào)整等預處理行為,具體過程可參見上一實施例。在本實施例中,對圖像的預處理還包括邊緣檢測。
[0098]具體地,邊緣檢測可根據(jù)用戶選擇的聚焦區(qū)域自動完成,例如,智能手機的拍照程序通常會給出一個位于手機屏幕中間位置的聚焦框,通過拍照引導信息指示客戶調(diào)整手機攝像頭與實體之間的距離,使聚焦框內(nèi)只包含目標試題的部分或全部內(nèi)容,利用邊緣檢測算法自動檢測目標試題在用戶拍攝的初始圖像中的邊界。
[0099]或者,提供用戶接口,例如,顯示一個大小、位置可調(diào)的矩形聚焦框,由用戶通過手動拖拽等方式調(diào)整其大小、位置,以用戶選擇的聚焦框的邊框作為目標試題在初始圖像中的邊界。
[0100]步驟S350,根據(jù)目標試題在初始圖像中的邊界,截取包含目標試題的圖像。
[0101]截取邊界內(nèi)的圖像作為待識別圖像。如上所述,如果用戶按照引導信息進行了正確操作,則截取的圖像中只包含目標試題的文字內(nèi)容,這有效避免了由于相鄰試題的部分文字在后續(xù)匹配過程中可能造成的干擾,而導致找不到候選試題的情況。
[0102]上述步驟S340和步驟S350為本實施例的可選步驟。
[0103]步驟S360,對截取的圖像進行OCR識別,獲取目標試題的文字內(nèi)容。
[0104]該實施例中,采用OCR (光學字符識別)技術(shù)對截取圖像進行識別。OCR具有較高的識別速度和準確率。OCR中包括二值化,噪聲去除,傾斜校正,字符切割等過程,當然,二值化及噪聲去除也可以在預處理步驟中完成。然后,通過特定的OCR算法得到目標試題的文字內(nèi)容,現(xiàn)有技術(shù)中有多種OCR算法,例如基于模板匹配,特征提取或神經(jīng)網(wǎng)絡訓練等方法,可根據(jù)需要進行選擇。另外,OCR技術(shù)還包括版面分析及恢復過程,當未進行可選的邊緣檢測及圖片截取步驟時,可通過版面分析僅提取出目標試題的文字內(nèi)容,防止不相關(guān)文字內(nèi)容的干擾。
[0105]可選地,本實施例中的OCR識別還可以包括:在識別后,從識別出的文字內(nèi)容中提取出包含目標試題至少部分有效信息的特征信息,根據(jù)特征信息查找試題答案,例如,特征信息可以是從文字內(nèi)容中截取的一個或多個預設長度的文字片段,或者,以對文字內(nèi)容進行拋詞處理后的剩余文字內(nèi)容作為特征信息。當試題過長時,基于特征信息的匹配有助于提聞匹配效率和召回率。
[0106]步驟S370,判斷試題庫中是否有至少一個試題包含與目標試題的文字內(nèi)容或特征信息相匹配的信息,如果是,執(zhí)行步驟S380,否則執(zhí)行步驟S390。
[0107]題庫中可能存在大量相似度較高的試題,這些相似度較高的試題中包含同樣的文字片段,因此,與特征信息相匹配的試題的數(shù)量可能為多個。
[0108]步驟S380,將匹配通過的試題作為候選試題,獲取候選試題的答案。
[0109]獲取全部的候選試題的答案和題目并顯示,進一步,還可以找到與目標試題相似度較高的試題及答案,作為相關(guān)試題給出,計算相關(guān)試題與目標試題之間的相似度,按相似度排序后顯示,供用戶查看。
[0110]步驟S390,返回提示信息,顯示相關(guān)試題及答案。
[0111]如果匹配失敗,提示未找到候選試題。進一步查詢試題庫中是否存在一些試題,其中包含了與目標試題文字內(nèi)容或特征信息相似度較高的內(nèi)容。例如,可以對截取的多個片段進行進一步地截取,得到多個子片段,利用這些子片段或子片段的組合進行匹配,如果匹配出的題目與目標試題之間具有較高的相似度,可作為相關(guān)試題記錄。由于試題的表達形式多變,這些相似度較高的相關(guān)試題可能對用戶有提示作用。
[0112]根據(jù)本發(fā)明上述實施例提供的方法,對初始圖像進行邊緣處理,提高了試題的召回率和查找效率,利用OCR識別技術(shù)準確的獲取目標試題的文字內(nèi)容或特征信息,在試題庫中匹配特征信息獲取候選試題,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
[0113]圖4示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的裝置的結(jié)構(gòu)框圖,如圖4所示,裝置包括:
[0114]獲取模塊410,用于獲取包含目標試題的圖像。
[0115]包含目標試題的圖像可來自用戶的現(xiàn)場拍攝,或選自本地文件,例如,手機相冊,對電子文檔的截圖等。圖像可以為bmp,jpg, jpeg等常見格式,也可以包括其它適于進行圖像識別的電子文件格式,例如Pdf文件。
[0116]可選地,圖像來自用戶拍攝,則圖像獲取模塊410進一步包括:拍照單元4101,用于向用戶提供拍攝引導信息,獲取用戶拍攝的包含目標試題的初始圖像;拍攝引導信息包括拍攝方向,拍攝角度,光線,距離,以及提醒用戶對目標試題所在區(qū)域進行聚焦等,通過引導信息對用戶做適當?shù)闹甘?,使用戶拍攝出的圖像符合識別的質(zhì)量要求。
[0117]判斷模塊420,用于根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合識別要求。
[0118]一個或多個圖像指標包括以下指標中的一項或多項:拍攝角度、圖像分辨率、亮度、對比度。
[0119]可選地,判斷模塊420進一步包括:分析單元4201,用于對包含目標試題的圖像進行質(zhì)量分析,得到該圖像的拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎怠?br>
[0120]比對單元4202,用于分別將拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎蹬c對應的預設閾值范圍進行比對。[0121]判斷單元4203,用于根據(jù)比對結(jié)果判斷包含目標試題的圖像是否符合識別要求。
[0122]例如,預定義拍攝角度的預設閾值范圍為20°以下,分辨率的閾值范圍為150-600dpi之間,由于對比度和亮度易于調(diào)節(jié),可選擇較大的閾值范圍,例如,可為亮度和對比度分別設置第一、第二閾值范圍,則判斷單元4203具體用于:
[0123]比對單元4202的比對結(jié)果表明分辨率不在上述范圍內(nèi)(150-600dpi)時,判斷單元4203判斷圖像不符合識別要求;拍攝角度不在20°范圍內(nèi)時,判斷圖像不符合識別要求;當分辨率和拍攝角度符合要求,對比度和/或亮度在各自的第一閾值范圍外,第二閾值范圍內(nèi)時,判斷圖像符合識別要求,而當對比度或亮度在第二閾值外時,判斷圖像不符合識別要求。上述判斷規(guī)則僅為示例,可根據(jù)實際情況適用其他規(guī)則。
[0124]預處理模塊430,用于當包含目標試題的圖像滿足識別要求時,對圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息。
[0125]預處理模塊430可用于調(diào)整亮度、對比度至最佳范圍,去除噪音,對彩色圖像的二值化處理等。
[0126]可選地,所述預處理模塊430進一步包括:調(diào)整單元4301,用于亮度值和/或?qū)Ρ榷戎挡辉趯念A設閾值范圍內(nèi)時,調(diào)整圖像的亮度值和/或?qū)Ρ榷戎抵翆念A設閾值范圍內(nèi)。
[0127]例如,分辨率在150_600dpi之間,而拍攝角度在20°以下時,如果亮度和/或?qū)Ρ榷戎性趯牡谝婚撝捣秶?,而在第二閾值范圍?nèi)時,判斷單元4203判斷該圖像符合識別要求,這時,調(diào)整單元4301將亮度和/或?qū)Ρ榷日{(diào)整至較佳的第一閾值范圍內(nèi),也即這里的預設閾值范圍指第一閾值范圍。
[0128]可選地,預處理模塊430還包括:
[0129]邊緣檢測單元4302,用于對初始圖像進行邊緣檢測,得到目標試題在初始圖像中的邊界;
[0130]邊緣檢測單元4302可根據(jù)用戶選擇的聚焦區(qū)域自動完成檢測,例如,在智能手機中,拍照程序通常會給出一個位于手機屏幕中間位置的聚焦框,通過拍照引導信息指示客戶調(diào)整手機攝像頭與實體之間的距離,使聚焦框內(nèi)只包含目標試題的部分或全部內(nèi)容,邊緣檢測單元4302利用邊緣檢測算法自動檢測目標試題在用戶拍攝的初始圖像中的邊界。
[0131]或者,邊緣檢測單元4302提供用戶接口,將用戶選定的邊界作為述目標試題在初始圖像中的邊界。例如,邊緣檢測單元4302顯示一個大小、位置可調(diào)的矩形聚焦框,由用戶通過手動拖拽等方式調(diào)整其大小、位置,以用戶選擇的聚焦框的邊框作為目標試題在初始圖像中的邊界。
[0132]圖像截取單元4303,用于根據(jù)所述目標試題在初始圖像中的邊界,截取包含目標試題的圖像。
[0133]截取邊界內(nèi)的圖像作為待識別圖像。如上所述,如果用戶按照引導信息進行了正確操作,則圖像截取單元4303截取的圖像中只包含目標試題的文字內(nèi)容,這有效避免了由于相鄰試題的部分文字在后續(xù)匹配過程中可能造成的干擾,而導致找不到候選試題的情況。
[0134]查找模塊440,用于根據(jù)預處理后的圖像查找對應的試題答案。
[0135]可選地,查找模塊440進一步包括識別單元4401,用于對預處理后的圖像進行識另|J,獲取目標試題的文字內(nèi)容。
[0136]可選地,該實施例中,識別單元4401采用0CR(光學字符識別)技術(shù)對截取圖像進行識別。OCR具有較高的識別速度和準確率。識別單元4401在OCR中可以執(zhí)行二值化,噪聲去除,傾斜校正,字符切割等過程,當然,二值化及噪聲去除也可以由預處理模塊430在預處理步驟中完成。然后,識別單元4401通過特定的OCR算法得到目標試題的文字內(nèi)容,現(xiàn)有技術(shù)中有多種OCR算法,例如基于模板匹配,特征提取或神經(jīng)網(wǎng)絡訓練等方法,可根據(jù)需要進行選擇。另外,OCR技術(shù)還包括版面分析及恢復過程,當未進行可選的邊緣檢測及圖片截取時,可通過版面分析僅提取出目標試題的文字內(nèi)容,防止不相關(guān)文字內(nèi)容的干擾。
[0137]可選地,本實施例中識別單元4401還可用于--從OCR識別出的文字內(nèi)容中提取出包含目標試題至少部分有效信息的特征信息,根據(jù)特征信息查找試題答案,例如,特征信息可以是從文字內(nèi)容中截取的一個或多個預設長度的文字片段,或者,以對文字內(nèi)容進行拋詞處理后的剩余文字內(nèi)容作為特征信息。當試題過長時,基于特征信息的匹配有助于提高匹配效率和召回率。
[0138]匹配單元4402,用于利用目標試題的文字內(nèi)容與試題庫中的試題進行匹配。
[0139]具體地,匹配單元4402將識別單元4401識別出的目標試題文字內(nèi)容,或得到的特征信息在試題庫中匹配。
[0140]試題庫中可能存在大量相似度較高的試題,這些相似度較高的試題中包含同樣的文字片段,則與特征信息相匹配的試題的數(shù)量可能為多個。
[0141]如果匹配失敗,匹配模塊4402進一步查詢試題庫中是否存在一些試題,其中包含了目標試題文字內(nèi)容或特征信息相似度較高的內(nèi)容。例如,可以對截取的多個片段進行進一步地截取,得到多個子片段,利用這些子片段或子片段的組合進行匹配,如果匹配出的題目與目標試題之間具有較高的相似度,可作為相關(guān)試題記錄。由于試題的表達形式多變,這些相似度較高的相關(guān)試題可能對用戶有提示作用。
[0142]獲取單元4403,用于將匹配通過的試題作為候選試題,獲取候選試題的答案。
[0143]根據(jù)本發(fā)明上述實施例提供的裝置,獲取包含目標試題的圖像,判斷該圖像是否符合識別要求,對符合識別要求的圖像做預處理,根據(jù)預處理后的圖像查找對應的試題答案。根據(jù)該裝置,實時地獲取符合識別要求的圖像,通過對圖像進行預處理提高了識別的準確率和效率。而且,該裝置可以對用戶進行拍照引導,并在識別圖像之前,通過質(zhì)量分析和預處理等步驟保證了圖像滿足識別要求,使用戶免于圖像質(zhì)量原因引起的重復操作,也避免了圖像質(zhì)量問題導致的識別準確率低下,獲取答案失敗等情況,使答案查找獲得較高的召回率和準確性。該裝置還可以對初始圖像進行邊緣處理,利用OCR識別技術(shù)準確的獲取目標試題的文字內(nèi)容或特征信息,在試題庫中匹配特征信息獲取候選試題,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
[0144]在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0145]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0146]類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0147]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設備中的模塊進行自適應性地改變并且把它們設置在與該實施例不同的一個或多個設備中。可以把實施例中的模塊或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0148]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0149]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的匹配目標試題答案的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0150]應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設計出替換實施例。在權(quán)利要求中,不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種匹配目標試題答案的方法,包括: 獲取包含目標試題的圖像; 根據(jù)一個或多個圖像指標判斷所述包含目標試題的圖像是否符合識別要求; 如果所述包含目標試題的圖像符合所述識別要求,對所述圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息; 根據(jù)預處理后的圖像查找對應的試題答案并顯示。
2.根據(jù)權(quán)利要求1所述的方法,所述一個或多個圖像指標包括以下指標中的一項或多項:拍攝角度、圖像分辨率、亮度、對比度。
3.根據(jù)權(quán)利要求1-2任一項所述的方法,所述根據(jù)一個或多個圖像指標判斷包含目標試題的圖像是否符合識別要求具體包括: 對所述包含目標試題的圖像進行質(zhì)量分析,得到該圖像的拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎担? 分別將所述拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎蹬c對應的預設閾值范圍進行比對; 根據(jù)比對結(jié)果判斷所述包含目標試題的圖像是否符合識別要求。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,所述根據(jù)比對結(jié)果判斷目標試題的圖像是否符合識別要求具體為: 如果包含目標試題的圖像的拍攝角度值和/或圖像分辨率值不在對應的預設閾值范圍內(nèi),判斷所述包含目標試題的圖像不符合識別要求。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,所述對所述圖像做預處理具體為:如果亮度值和/或?qū)Ρ榷戎挡辉趯念A設閾值范圍內(nèi),調(diào)整所述圖像的亮度值和/或?qū)Ρ榷戎抵翆念A設閾值范圍內(nèi)。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,所述包含目標試題的圖像由用戶拍攝獲得,所述方法還包括:向用戶提供拍攝引導信息,獲取用戶拍攝的包含目標試題的初始圖像; 所述判斷包含目標試題的圖像是否符合識別要求具體為:判斷所述初始圖像是否符合OCR識別要求。
7.根據(jù)權(quán)利要求1-6任一項所述的方法,所述預處理還包括: 對所述包含目標試題的初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界; 根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像; 所述對預處理后的圖像進行識別具體為:對截取到的所述包含目標試題的圖像進行OCR識別。
8.根據(jù)權(quán)利要求1-7任一項所述的方法,所述拍攝引導信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
9.一種匹配目標試題答案的裝置,包括: 獲取模塊,用于 獲取包含目標試題的圖像; 判斷模塊,用于根據(jù)一個或多個圖像指標判斷所述包含目標試題的圖像是否符合識別要求; 預處理模塊,用于當所述包含目標試題的圖像滿足所述識別要求時,對所述圖像做預處理,否則,發(fā)出重新獲取包含目標試題的圖像的提示信息; 查找模塊,用于根據(jù)預處理后的圖像查找對應的試題答案。
10.根據(jù)權(quán)利要求9所述的裝置,所述判斷模塊進一步包括: 分析單元,用于對所述包含目標試題的圖像進行質(zhì)量分析,得到該圖像的拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎担? 比對單元,用于分別將所述拍攝角度值、圖像分辨率值、亮度值、和/或?qū)Ρ榷戎蹬c對應的預設閾值范圍進行比對; 判斷單元,用于根據(jù)比對結(jié)果判斷所述包含目標試題的圖像是否符合識別要求。
【文檔編號】G06T7/00GK103927552SQ201410166705
【公開日】2014年7月16日 申請日期:2014年4月23日 優(yōu)先權(quán)日:2014年4月23日
【發(fā)明者】王艷麗, 吳凱 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司