匹配目標試題答案的方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種匹配目標試題答案的方法和裝置,其中,方法包括:獲取包含目標試題的圖像;對包含目標試題的圖像進行識別,提取目標試題的文字內(nèi)容;根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到目標試題的特征信息;利用目標試題的特征信息與試題庫中的試題進行匹配;如果試題庫中的至少一個試題包含與所述目標試題的特征信息相匹配的信息,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。根據(jù)該方案,試題的輸入、匹配,以及答案的獲取均自動完成,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
【專利說明】匹配目標試題答案的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及終端應(yīng)用領(lǐng)域,具體涉及一種匹配目標試題答案的方法和裝置。
【背景技術(shù)】
[0002]在中小學(xué)生寫作業(yè)或者家長輔導(dǎo)學(xué)生的時候,常遇到不會做的試題或題目。這時用戶常常通過互聯(lián)網(wǎng)尋求試題的答案。
[0003]當前,已有多種服務(wù)于學(xué)生或家長的中小學(xué)生試題解析網(wǎng)站或網(wǎng)絡(luò)應(yīng)用,幫助用戶獲取答案,順利完成作業(yè),例如,作業(yè)幫,問他,作業(yè)寶等網(wǎng)站。用戶通過手動輸入試題內(nèi)容進行檢索,獲取試題答案。
[0004]但現(xiàn)有的作業(yè)解析網(wǎng)站,app等都是通過人工回答,網(wǎng)站的其他用戶,或在線教師查看試題后給出答案。從用戶提問到獲取到答案,存在時間成本的問題,不能快速滿足用戶的即時需求。在用戶提問高峰期,或是對于難度較大的問題,有時會出現(xiàn)較長時間,如幾個小時或一天內(nèi)無人作答的情況,效率十分低下。長時間的等待也影響用戶體驗。并且,不同的作答可能多種不同的答案,令用戶難以分辨。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的匹配目標試題答案的方法和裝置。
[0006]根據(jù)本發(fā)明的一個方面,提供了一種匹配目標試題答案的方法,包括:獲取包含目標試題的圖像;對包含目標試題的圖像進行識別,提取目標試題的文字內(nèi)容;根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到目標試題的特征信息;利用目標試題的特征信息與試題庫中的試題進行匹配;如果試題庫中的至少一個試題包含與所述目標試題的特征信息相匹配的信息,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。
[0007]可選地,所述根據(jù)預(yù)設(shè)策略對提取的文字內(nèi)容進行處理,得到所述目標試題的特征信息具體為:從所述目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為所述目標試題的特征信息;
[0008]所述利用所述目標試題的特征信息與試題庫中的試題進行匹配具體為:在所述試題庫中匹配截取的一個或多個具有預(yù)設(shè)長度的文字片段。
[0009]可選地,所述根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到所述目標試題的特征信息具體為:根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理,保留剩余文字內(nèi)容作為所述目標試題的特征信息;
[0010]所述利用所述目標試題的特征信息與試題庫中的試題進行匹配具體為:在所述試題庫中匹配所述拋詞處理后保留的剩余文字內(nèi)容。
[0011]可選地,所述根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理具體為:從所述目標試題的文字內(nèi)容的頭部或尾部開始,每隔預(yù)設(shè)的文字數(shù),拋去一個詞,保留剩余文字內(nèi)容。[0012]可選地,所述根據(jù)預(yù)設(shè)的拋詞方法從所述目標試題的文字內(nèi)容進行拋詞處理之前還包括:
[0013]根據(jù)詞與詞之間的固定組合,保留所述目標試題的文字內(nèi)容中有固定組合的詞;
[0014]所述根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理具體為:對所述固定組合之外的目標試題的文字內(nèi)容進行拋詞處理;
[0015]所述固定組合通過分析所述試題庫中試題的題目內(nèi)容獲得。
[0016]可選地,所述獲取包含目標試題的圖像包括:向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像;
[0017]所述對包含目標試題的圖像進行識別具體為:對所述用戶拍攝的包含目標試題的圖像進行OCR識別。
[0018]可選地,所述獲取包含目標試題的圖像包括:
[0019]向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的初始圖像;
[0020]根據(jù)用戶選擇的聚焦區(qū)域,對所述初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界;
[0021 ] 根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像;
[0022]所述對包含目標試題的圖像進行識別具體為:對截取到的所述包含目標試題的圖像進行OCR識別。
[0023]可選地,所述拍攝引導(dǎo)信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
[0024]根據(jù)本發(fā)明的另一方面,提供了一種匹配目標試題答案的裝置,包括:圖像獲取模塊,用于獲取包含目標試題的圖像;識別模塊,用于對包含目標試題的圖像進行識別,提取目標試題的文字內(nèi)容;處理模塊,用于根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到目標試題的特征信息;匹配模塊,用于利用目標試題的特征信息與試題庫中的試題進行匹配;答案獲取模塊,用于在試題庫中的至少一個試題包含與所述目標試題的特征信息相匹配的信息時,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。
[0025]可選地,所述處理模塊包括:文字截取單元,用于從所述目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為所述目標試題的特征信息;
[0026]所述匹配模塊具體用于:在所述試題庫中匹配截取的一個或多個具有預(yù)設(shè)長度的文字片段。
[0027]可選地,所述處理模塊進一步包括:拋詞單元,用于根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理,保留剩余文字內(nèi)容作為所述目標試題的特征信息;
[0028]所述匹配模塊具體用于:在所述試題庫中匹配所述拋詞處理后保留的剩余文字內(nèi)容。
[0029]可選地,所述拋詞單元具體用于:從所述目標試題的文字內(nèi)容的頭部或尾部開始,每隔預(yù)設(shè)的文字數(shù),拋去一個詞,保留剩余文字內(nèi)容。
[0030]可選地,所述處理模塊還包括:分析單元,用于分析所述試題庫中試題的題目內(nèi)容獲得詞與詞之間的固定組合;
[0031]所述拋詞單元具體用于:根據(jù)詞與詞之間的固定組合,保留所述目標試題的文字內(nèi)容中有固定組合的詞,對所述固定組合之外的目標試題的文字內(nèi)容進行拋詞處理。[0032]可選地,所述圖像獲取模塊包括:拍照單元,用于向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像;
[0033]所述識別模塊具體用于:對所述用戶拍攝的包含目標試題的圖像進行OCR識別。
[0034]可選地,所述圖像獲取模塊進一步包括:
[0035]拍照單元,用于向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的初始圖像;
[0036]邊緣檢測單元,用于根據(jù)用戶選擇的聚焦區(qū)域,對所述初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界;
[0037]圖像截取單元,用于根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像;
[0038]所述識別模塊具體用于:對截取到的所述包含目標試題的圖像進行OCR識別。
[0039]可選地,所述拍攝引導(dǎo)信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
[0040]根據(jù)本發(fā)明的匹配目標試題答案的方法和裝置,對獲取包含目標試題的圖像進行文字識別將圖像轉(zhuǎn)化為試題文字內(nèi)容,之后,對文字內(nèi)容進行處理得到特征信息,利用該特征信息在試題庫中進行匹配,獲取匹配通過的候選試題及答案。根據(jù)該方案,試題的輸入、匹配,以及答案的獲取均為自動完成,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
[0041]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
【專利附圖】
【附圖說明】
[0042]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0043]圖1示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的方法的流程圖;
[0044]圖2示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖;
[0045]圖3示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖;
[0046]圖4示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的裝置的結(jié)構(gòu)框圖。
【具體實施方式】
[0047]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0048]圖1示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的方法的流程圖,如圖1所示,該方法包括如下步驟:
[0049]步驟S110,獲取包含目標試題的圖像。[0050]包含目標試題的圖像可來自用戶的現(xiàn)場拍攝,或選自本地文件,例如,手機相冊,對電子文檔的截圖等。圖像可以為bmp,jpg, jpeg等常見格式,也可以包括其它適于進行圖像識別的電子文件格式,例如Pdf文件。
[0051]步驟S120,對包含目標試題的圖像進行識別,提取目標試題的文字內(nèi)容。
[0052]該步驟將包含目標試題的圖像轉(zhuǎn)換成計算機文字。
[0053]步驟S130,根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到目標試題的特征信
肩、O
[0054]本步驟可以包括從初始識別的文字內(nèi)容中截取一個或多個文字片段,作為特征信息,或者是拋詞處理,即以一定策略從初始文字內(nèi)容中去除部分文字內(nèi)容,將剩余文字內(nèi)容作為特征信息。對文字內(nèi)容的處理可避免試題過長而導(dǎo)致的匹配效率下降等問題。本步驟還可以包括對文字內(nèi)容的檢測,具體的處理方法依檢測結(jié)果而定。例如,當檢測到文字長度大于匹配閾值時,去除以部分文字;當文字包含亂碼時,通過拋詞處理去除亂碼。
[0055]步驟S140,利用目標試題的特征信息與試題庫中的試題進行匹配。
[0056]試題庫中有大量與預(yù)先收集的試題及相應(yīng)的答案。試題庫可以是一個或多個,例如,根據(jù)學(xué)科,年級對試題庫進行分類。匹配時提醒用戶在相應(yīng)的類別中查找,或根據(jù)的關(guān)鍵詞對目標題目進行自動分類,以提高查找效率。
[0057]步驟S150,如果試題庫中的至少一個試題包含與目標試題的特征信息相匹配的信息,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的答案并顯示。
[0058]候選試題即是匹配通過的試題。由于特征信息可能只反映試題的部分內(nèi)容,因此,匹配通過的可能是多個相似的試題。獲取全部候選試題題目及答案并顯示,供用戶查看。進一步地,由于試題的表述方式靈活多樣,為提高召回率,該匹配可以是指僅部分特征信息的匹配,例如,通過相似度計算,將相似度在某一閾值以上的試題作為候選試題并返回題目和答案,給出相似度數(shù)據(jù)。
[0059]根據(jù)本發(fā)明上述實施例提供的方法,對獲取包含目標試題的圖像進行文字識別將圖像轉(zhuǎn)化為試題文字內(nèi)容,無需用戶手動輸入,之后,對文字內(nèi)容進行處理得到特征信息,利用該特征信息在試題庫中進行匹配,獲取匹配通過的候選試題及其答案。根據(jù)該方案,試題的輸入、匹配,以及答案的獲取都是自動完成,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
[0060]圖2示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法的流程圖,如圖2所示,該方法包括如下步驟:
[0061]步驟S210,向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像。
[0062]拍攝引導(dǎo)信息包括拍攝方向,拍攝角度,光線,距離,以及提醒用戶對目標試題所在區(qū)域進行聚焦等,通過引導(dǎo)信息對用戶做適當?shù)闹甘?,使用戶拍攝出的圖像符合識別的質(zhì)量要求。
[0063]本發(fā)明中的方法可實現(xiàn)為智能手機平臺上的app,則具體地,該步驟可通過調(diào)用智能手機的攝像頭或系統(tǒng)提供的攝像程序?qū)崿F(xiàn)。
[0064]具體地,在用戶拍照前給出文字說明及示例圖片等作為引導(dǎo)信息,例如,提示用戶采用垂直角度進行拍攝,選擇良好光線,橫向拍攝,顯示一個用戶可調(diào)的聚焦框等,在題目過長時,只拍攝一部分有效內(nèi)容等。[0065]步驟S220,根據(jù)用戶選擇的聚焦區(qū)域,對初始圖像進行邊緣檢測。
[0066]以步驟S210中用戶拍攝的圖像作為初始圖像,通過邊緣檢測得到目標試題在初始圖像中的邊界。例如,智能手機的拍照程序通常會給出一個位于手機屏幕中間位置的聚焦框,由用戶通過手動拖拽等方式調(diào)整其大小、位置,理想的情況是,用戶按拍照引導(dǎo)信息進行調(diào)整后,聚焦框內(nèi)包含目標試題的一部分有效內(nèi)容,以該部分有效內(nèi)容為基礎(chǔ),在整個初始圖像上進行邊緣檢測,確定目標試題的邊界,則邊界中包含了并且只包含了目標試題的全部或部分內(nèi)容。
[0067]步驟S230,根據(jù)目標試題在初始圖像中的邊界,截取包含目標試題的圖像。
[0068]截取邊界內(nèi)的圖像作為待識別圖像。如上所述,如果用戶按照引導(dǎo)信息進行了正確操作,則截取的圖像中只包含目標試題的文字內(nèi)容,這有效避免了由于相鄰試題的部分文字在后續(xù)匹配過程中可能造成的干擾,而導(dǎo)致找不到候選試題的情況。
[0069]上述步驟S220和步驟S230為本實施例的可選步驟。
[0070]步驟S240,對截取的包含目標試題的圖像進行OCR識別。
[0071]該實施例中,采用OCR (光學(xué)字符識別)技術(shù)對截取圖像進行識別。OCR具有較高的識別速度和準確率。OCR中包括二值化,噪聲去除,傾斜校正,字符切割等過程,當然,二值化及噪聲去除也可以在預(yù)處理階段完成。然后,通過特定的OCR算法得到目標試題的文字內(nèi)容,現(xiàn)有技術(shù)中有多種OCR算法,例如基于模板匹配,特征提取或神經(jīng)網(wǎng)絡(luò)訓(xùn)練等方法,可根據(jù)需要進行選擇。另外,OCR技術(shù)還包括版面分析及恢復(fù)過程,當未進行邊緣檢測及圖片截取時,可通過版面分析僅提取出目標試題的文字內(nèi)容。
[0072]步驟S250,從目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為目標試題的特征信息。
[0073]如果OCR識別后的文字內(nèi)容過長,則可能無法進行有效率的匹配。這時,可以從識別的目標試題的文字內(nèi)容的前部、中部、后部截取分別適當長度的內(nèi)容,截取的長度可根據(jù)試題長度以及匹配要求而定。
[0074]步驟S260,在試題庫中匹配截取的一個或多個具有預(yù)設(shè)長度的文字片段。
[0075]將截取的一個或多個文字片段作為目標試題的特征信息,分別在試題庫中匹配,或者將片段組合后進行匹配。
[0076]步驟S270,判斷試題庫中是否有至少一個試題包含與截取的文字片段相匹配的信息,如果是,執(zhí)行步驟S280。
[0077]題庫中可能存在大量相似度較高的試題,這些相似度較高的試題中包含同樣的文字片段,則與截取的文字片段相匹配的試題的數(shù)量可能為多個。
[0078]如果匹配失敗,還可以進一步查詢試題庫中是否存在一些試題,其中包含了與截取的文字片段或文字片段的組合相似度較高的內(nèi)容。例如,可以對截取的多個片段進行進一步地截取,得到多個子片段,利用這些子片段或子片段的組合進行匹配,如果匹配出的題目與目標試題之間具有較高的相似度,可作為相關(guān)試題記錄。由于試題的表達形式多變,這些相似度較高的相關(guān)試題可能對用戶有提示作用。
[0079]步驟S280,將匹配通過的試題作為候選試題,獲取答案并顯示。
[0080]獲取全部的候選試題的答案和題目并顯示,進一步,可以給出與目標試題相似度較高的相關(guān)試題及答案,計算與目標試題之間的相似度,按相似度排序后顯示,供用戶查看。
[0081]根據(jù)本發(fā)明上述實施例提供的方法,向用戶提供拍照引導(dǎo)信息,使用戶易于拍出符合OCR識別要求的圖像;通過對初始圖像的邊緣檢測,截取到只包含目標試題文字內(nèi)容的圖像,這消除了不相關(guān)內(nèi)容可能對識別及匹配造成的影響;對于識別出的過長文字內(nèi)容,用截取的文字片段進行匹配,提高了匹配的效率。
[0082]圖3示出了根據(jù)本發(fā)明另一個實施例的匹配目標試題答案的方法,如圖3所示,該方法包括如下步驟:
[0083]步驟S310,向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像。
[0084]步驟S320,對用戶拍攝的包含目標試題的圖像進行OCR識別。
[0085]步驟S310和S320的【具體實施方式】可參照上一實施例,當然,該實施例中也可以包括對拍攝的圖像進行邊緣檢測及圖片截取的步驟,此處不再重復(fù)敘述。
[0086]步驟S330,根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理。
[0087]拋詞是指以一定策略從初始文字內(nèi)容中去除部分文字內(nèi)容,將剩余文字內(nèi)容作為特征信息。
[0088]具體地,拋詞方法可以是:從OCR識別出的目標試題的文字內(nèi)容的頭部或尾部開始,每隔預(yù)設(shè)的文字數(shù),拋去一個詞,或固定數(shù)量的文字,所間隔的文字數(shù)根據(jù)試題長度和匹配要求而定。與上一實施例類似地,剩余文字內(nèi)容包含試題的部分有效信息,可作為用于匹配的特征信息,用剩余內(nèi)容的匹配也可能返回多個候選試題。
[0089]還可以在拋詞之前對文字內(nèi)容進行預(yù)處理,例如,由于圖像質(zhì)量和識別能力的原因,OCR識別得到的文字內(nèi)容中可能包含一些亂碼,并且,題目中經(jīng)常包含一些提供有效信息的字詞,例如“的”,“所”等,可以先拋去這些亂碼和無意義的詞,如果剩余文字內(nèi)容仍不能滿足匹配要求,再執(zhí)行上述拋詞過程。
[0090]作為示例,拋詞之前的預(yù)處理可按如下方式進行:
[0091]根據(jù)詞與詞之間的固定組合,保留目標試題的文字內(nèi)容中有固定組合的詞。其中,固定組合通過分析試題庫中大量試題的題目內(nèi)容獲得,包括學(xué)科術(shù)語,或是某一學(xué)科類別中的多個詞語的慣用組合等,例如“摩擦力…大小..方向”等。
[0092]根據(jù)預(yù)設(shè)的拋詞方法對目標試題的文字內(nèi)容進行拋詞處理具體為:在拋詞過程中,保留這些固定組合,對固定組合之外的目標試題的文字內(nèi)容進行拋詞處理。這樣,拋詞處理更具有針對性,特征信息中保留了更多的有效信息。
[0093]步驟S340,在試題庫中匹配拋詞處理后保留的剩余文字內(nèi)容。
[0094]步驟S350,獲取匹配通過的候選試題的答案并顯示。
[0095]與上一實施例類似地,候選試題可能有多個,還可以進一步給出與目標試題有較高相似度的試題及答案,此處不再贅述。
[0096]根據(jù)本發(fā)明上述實施例提供的方法,采用拋詞的方法對OCR識別獲得的文字內(nèi)容進行處理,得到特征信息,通過拋詞獲得 的特征信息中保留了更多的有效信息,有利于提高匹配效率。
[0097]圖4示出了根據(jù)本發(fā)明一個實施例的匹配目標試題答案的裝置的結(jié)構(gòu)框圖,如圖4所示,該裝置包括:
[0098]圖像獲取模塊410,用于獲取包含目標試題的圖像。[0099]包含目標試題的圖像可來自用戶的現(xiàn)場拍攝,或選自本地文件,例如,手機相冊,對電子文檔的截圖等。圖像可以為bmp,jpg, jpeg等常見格式,也可以包括其它適于進行圖像識別的電子文件格式,例如Pdf文件。
[0100]可選地,圖像來自用戶拍攝,則圖像獲取模塊410進一步包括:拍照單元4101,用于向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像。
[0101]拍攝引導(dǎo)信息包括拍攝方向,拍攝角度,光線,距離,以及提醒用戶對目標試題所在區(qū)域進行聚焦等。通過引導(dǎo)信息對用戶做適當?shù)闹甘?,使用戶拍攝出的圖像識別的質(zhì)量要求。
[0102]本發(fā)明中的匹配試題答案的裝置可實現(xiàn)為智能手機平臺上的app,具體地,拍照單元4101可通過調(diào)用智能手機的攝像頭或系統(tǒng)提供的攝像程序獲取圖像。
[0103]可選地,圖像獲取模塊410進一步包括:邊緣檢測單元4102,用于根據(jù)用戶選擇的聚焦區(qū)域,對用戶拍攝的初始圖像進行邊緣檢測,得到目標試題在初始圖像中的邊界;以及
[0104]圖像截取單元4103,用于根據(jù)目標試題在初始圖像中的邊界,截取包含目標試題的圖像。
[0105]圖像截取單元4103截取邊界內(nèi)的圖像作為待識別圖像。如果用戶操作正確,截取的圖像中只包含目標試題的文字內(nèi)容,這有效避免了由于相鄰試題的部分文字在后續(xù)匹配過程中可能造成的干擾,而導(dǎo)致找不到候選試題的情況。
[0106]邊緣檢測單元4102和圖像截取單元4103也可適用于圖像獲取模塊410以其他方式獲取的包含目標試題的圖像。
[0107]識別模塊420,用于對包含目標試題的圖像進行識別,提取目標試題的文字內(nèi)容。
[0108]識別模塊420將包含目標試題的圖像轉(zhuǎn)換成計算機文字。
[0109]可選地,識別模塊420用于:對獲取到的包含目標試題的圖像進行OCR識別。OCR識別具有較高的速度和準確率。具體地,識別模塊420對圖像可執(zhí)行二值化,噪聲去除,傾斜校正,字符切割等處理,然后,通過特定的OCR算法得到目標試題的文字內(nèi)容,現(xiàn)有技術(shù)中有多種OCR算法,可根據(jù)需要進行選擇。
[0110]可選地,包含目標試題的圖像來自用戶拍攝,則識別模塊420具體用于:對用戶拍攝的包含目標試題的圖像進行OCR識別;
[0111]若圖像經(jīng)過了邊緣檢測單元4102和圖像截取單元4103的處理,則識別模塊420具體用于:對截取到的包含目標試題的圖像進行OCR識別。
[0112]處理模塊430,用于根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到目標試題的特征信息。
[0113]具體地,處理模塊430可用于從初始識別的文字內(nèi)容中截取多個文字片段,作為特征信息,或者用于對文字內(nèi)容做拋詞處理,即以一定策略從初始文字內(nèi)容中去除部分文字內(nèi)容,將剩余文字內(nèi)容作為特征信息。對文字內(nèi)容的處理可避免試題過長而導(dǎo)致的匹配效率下降等問題。
[0114]可選地,處理模塊430進一步包括:文字截取單元4303,用于從目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為目標試題的特征信息。具體地,文字截取單元4303可以從識別的目標試題的文字內(nèi)容的前部、中部、后部截取分別適當長度的內(nèi)容,截取的長度可根據(jù)試題長度以及匹配要求而定;或者[0115]處理模塊430對文字內(nèi)容做拋詞處理,則處理模塊430進一步包括:拋詞單元4302,用于根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理,保留剩余文字內(nèi)容作為目標試題的特征信息。
[0116]拋詞單元4302具體用于:從目標試題的文字內(nèi)容的頭部或尾部開始,每隔預(yù)設(shè)的文字數(shù),拋去一個詞,保留剩余文字內(nèi)容。
[0117]可選地,處理模塊進一步包括:分析單元4301,用于分析試題庫中試題的題目內(nèi)容獲得詞與詞之間的固定組合;固定組合包括學(xué)科術(shù)語,或是某一學(xué)科類別中的多個詞語的慣用組合等,例如“摩擦力…大小..方向”;則拋詞單元4302具體用于:根據(jù)詞與詞之間的固定組合,保留目標試題的文字內(nèi)容中有固定組合的詞,對固定組合之外的目標試題的文字內(nèi)容進行拋詞處理。這樣,拋詞處理更具有針對性,特征信息中保留了更多的有效信肩、O
[0118]匹配模塊440,用于利用目標試題的特征信息與試題庫中的試題進行匹配;
[0119]可選地,若特征信息是文字截取單元4303截取的多個文字片段,則匹配模塊440具體用于:將截取的一個或多個文字片段分別在試題庫中匹配,或者將多個片段進行組合后進行匹配;
[0120]若特征信息是拋詞單元4302獲取的剩余文字內(nèi)容,則匹配模塊440具體用于:在試題庫中匹配剩余文字內(nèi)容。
[0121]答案獲取模塊450,用于在試題庫中的至少一個試題包含與目標試題的特征信息相匹配的信息時,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。
[0122]題庫中可能存在大量相似度較高的試題,這些相似度較高的試題中包含同樣的文字片段,則答案獲取模塊450得到的候選試題的數(shù)量可能為一個以上,這時,可選地,答案獲取模塊450獲取全部的候選試題的答案和題目并顯示,進一步,可以給出與目標相似度較高的相關(guān)試題及答案,計算與目標試題之間的相似度,按相似度排序后顯示,供用戶查看。
[0123]根據(jù)本發(fā)明上述實施例提供的裝置,圖像獲取模塊獲取包含目標試題的圖像,識別模塊對圖像進行文字識別,將圖像轉(zhuǎn)化為試題的文字內(nèi)容,之后,處理模塊對文字內(nèi)容進行處理得到特征信息,匹配模塊利用該特征信息在試題庫中進行匹配,答案獲取模塊獲取匹配通過的候選試題及答案。根據(jù)該方案,試題的輸入、匹配,以及答案的獲取均為自動完成,大量減少了作答時間和用戶操作,能夠及時為用戶提供答案,并保證答案的準確性。
[0124]在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應(yīng)當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。
[0125]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0126] 類似地,應(yīng)當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0127]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0128]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在下面的權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0129]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的匹配目標試題答案的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0130]應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
【權(quán)利要求】
1.一種匹配目標試題答案的方法,包括: 獲取包含目標試題的圖像; 對所述包含目標試題的圖像進行識別,提取所述目標試題的文字內(nèi)容; 根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到所述目標試題的特征信息; 利用所述目標試題的特征信息與試題庫中的試題進行匹配; 如果試題庫中的至少一個試題包含與所述目標試題的特征信息相匹配的信息,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。
2.根據(jù)權(quán)利要求1所述的方法,所述根據(jù)預(yù)設(shè)策略對提取的文字內(nèi)容進行處理,得到所述目標試題的特征信息具體為:從所述目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為所述目標試題的特征信息; 所述利用所述目標試題的特征信息與試題庫中的試題進行匹配具體為:在所述試題庫中匹配截取的一個或多個具有預(yù)設(shè)長度的文字片段。
3.根據(jù)權(quán)利要求1-2任一項所述的方法,所述根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到所述目標試題的特征信息具體為:根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理,保留剩余文字內(nèi)容作為所述目標試題的特征信息; 所述利用所述目標試題的特征信息與試題庫中的試題進行匹配具體為:在所述試題庫中匹配所述拋詞處理后保留的剩余文字內(nèi)容。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,所述根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理具體為:從所述目標試題的文字內(nèi)容的頭部或尾部開始,每隔預(yù)設(shè)的文字數(shù),拋去一個詞,保留剩余文字內(nèi)容。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,所述根據(jù)預(yù)設(shè)的拋詞方法從所述目標試題的文字內(nèi)容進行拋詞處理之前還包括: 根據(jù)詞與詞之間的固定組合,保留所述目標試題的文字內(nèi)容中有固定組合的詞; 所述根據(jù)預(yù)設(shè)的拋詞方法對所述目標試題的文字內(nèi)容進行拋詞處理具體為:對所述固定組合之外的目標試題的文字內(nèi)容進行拋詞處理; 所述固定組合通過分析所述試題庫中試題的題目內(nèi)容獲得。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,所述獲取包含目標試題的圖像包括:向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的圖像; 所述對包含目標試題的圖像進行識別具體為:對所述用戶拍攝的包含目標試題的圖像進行OCR識別。
7.根據(jù)權(quán)利要求1-6任一項所述的方法,所述獲取包含目標試題的圖像包括: 向用戶提供拍攝引導(dǎo)信息,獲取用戶拍攝的包含目標試題的初始圖像; 根據(jù)用戶選擇的聚焦區(qū)域,對所述初始圖像進行邊緣檢測,得到所述目標試題在所述初始圖像中的邊界; 根據(jù)所述目標試題在所述初始圖像中的邊界,截取所述包含目標試題的圖像; 所述對包含目標試題的圖像進行識別具體為:對截取到的所述包含目標試題的圖像進行OCR識別。
8.根據(jù)權(quán)利要求1-7任一項所述的方法,所述拍攝引導(dǎo)信息包括以下信息的一項或多項的組合:拍攝方向,拍攝角度,光線,提醒用戶對目標試題所在區(qū)域進行聚焦。
9.一種匹配目標試題答案的裝置,包括: 圖像獲取模塊,用于獲取包含目標試題的圖像; 識別模塊,用于對所述包含目標試題的圖像進行識別,提取所述目標試題的文字內(nèi)容; 處理模塊,用于根據(jù)預(yù)設(shè)策略對所獲取的文字內(nèi)容進行處理,得到所述目標試題的特征信息; 匹配模塊,用于利用所述目標試題的特征信息與試題庫中的試題進行匹配; 答案獲取模塊,用于在試題庫中的至少一個試題包含與所述目標試題的特征信息相匹配的信息時,將該至少一個試題作為候選試題,獲取候選試題對應(yīng)的試題答案并顯示。
10.根據(jù)權(quán)利要求9所述的裝置,所述處理模塊包括:文字截取單元,用于從所述目標試題的文字內(nèi)容中截取一個或多個具有預(yù)設(shè)長度的文字片段作為所述目標試題的特征信息; 所述匹配模塊進一步用于:在所述試題庫中匹配截取的一個或多個具有預(yù)設(shè)長度的文字片段。
【文檔編號】G06F17/30GK103914567SQ201410165812
【公開日】2014年7月9日 申請日期:2014年4月23日 優(yōu)先權(quán)日:2014年4月23日
【發(fā)明者】王艷麗, 吳凱 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司