国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于圖像識(shí)別的作業(yè)批改方法及裝置與流程

      文檔序號(hào):40396592發(fā)布日期:2024-12-20 12:20閱讀:11來(lái)源:國(guó)知局
      一種基于圖像識(shí)別的作業(yè)批改方法及裝置與流程

      本發(fā)明屬于圖像處理,尤其涉及一種基于圖像識(shí)別的作業(yè)批改方法及裝置。


      背景技術(shù):

      1、目前作業(yè)批改方式中,一般是學(xué)生提交的作業(yè)需要教師手工進(jìn)行批改,這樣手工批改作業(yè),會(huì)給教師帶來(lái)了比較大的工作量,給教師的教學(xué)工作帶來(lái)負(fù)擔(dān);尤其是當(dāng)班級(jí)上的學(xué)生較多時(shí),需要教師額外抽出大量的時(shí)間來(lái)手工批改作業(yè),效率非常低下。

      2、相關(guān)技術(shù)中,隨著人工智能的快速發(fā)展,也有部分研究人員采用圖像識(shí)別的技術(shù),來(lái)識(shí)別學(xué)生的作業(yè)內(nèi)容,以供教師采用計(jì)算機(jī)進(jìn)行作業(yè)批改;這種方式本質(zhì)上是對(duì)學(xué)生上傳的作業(yè)圖像進(jìn)行文本識(shí)別,生成一份線上的作業(yè)文本,教師在線上對(duì)該文本進(jìn)行批改。

      3、然而,在實(shí)際的場(chǎng)景中,學(xué)生的作業(yè)本由于作業(yè)本紙張的形變,以及學(xué)生用手機(jī)等終端拍攝作業(yè)本圖像的拍攝場(chǎng)景的干擾及拍攝角度不理想導(dǎo)致的透視失真,導(dǎo)致針對(duì)學(xué)生上傳的作業(yè)圖像進(jìn)行文本識(shí)別受到很大挑戰(zhàn)。


      技術(shù)實(shí)現(xiàn)思路

      1、本發(fā)明實(shí)施例的目的在于提供一種基于圖像識(shí)別的作業(yè)批改方法及裝置,旨在解決上述背景技術(shù)中所提出的技術(shù)問(wèn)題。

      2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下的技術(shù)方案。

      3、本發(fā)明一實(shí)施例提供了一種基于圖像識(shí)別的作業(yè)批改方法,包括以下步驟:

      4、獲取來(lái)自學(xué)生端的學(xué)生作業(yè)圖像,對(duì)學(xué)生作業(yè)圖像進(jìn)行預(yù)處理,得到多個(gè)目標(biāo)區(qū)域圖像,其中,所述目標(biāo)區(qū)域圖像包括標(biāo)識(shí)信息,標(biāo)識(shí)信息用于表征與該目標(biāo)區(qū)域圖像對(duì)應(yīng)的題目信息,利用標(biāo)識(shí)信息調(diào)取所述題目信息的預(yù)設(shè)答案內(nèi)容;

      5、構(gòu)建圖像文本識(shí)別模型,所述圖像文本識(shí)別模型包括編碼器和解碼器,所述編碼器中融合有非對(duì)稱卷積殘差塊和空洞卷積殘差塊,非對(duì)稱卷積殘差塊用于提取特征,空洞卷積殘差塊用于增加感受野;所述解碼器采用基于transformer網(wǎng)絡(luò)模型的結(jié)構(gòu),該結(jié)構(gòu)采用多頭注意力層和前饋神經(jīng)網(wǎng)絡(luò)fnn堆疊而成;

      6、依次將多個(gè)目標(biāo)區(qū)域圖像作為圖像文本識(shí)別模型的輸入,利用圖像文本識(shí)別模型對(duì)多個(gè)目標(biāo)區(qū)域圖像進(jìn)行文本檢測(cè)識(shí)別,輸出各個(gè)目標(biāo)區(qū)域圖像的識(shí)別信息,將識(shí)別信息作為該目標(biāo)區(qū)域圖像的作答內(nèi)容;

      7、將目標(biāo)區(qū)域圖像的作答內(nèi)容與利用該目標(biāo)區(qū)域圖像標(biāo)識(shí)信息所調(diào)取的預(yù)設(shè)答案內(nèi)容進(jìn)行比較,對(duì)比較結(jié)果中的差異部分進(jìn)行標(biāo)注,將帶有標(biāo)注信息的作答內(nèi)容在教師端進(jìn)行輸出。

      8、進(jìn)一步的,所述對(duì)學(xué)生作業(yè)圖像進(jìn)行預(yù)處理的步驟,包括:

      9、對(duì)學(xué)生作業(yè)圖像進(jìn)行區(qū)域分割處理,得到多個(gè)區(qū)域圖像,多個(gè)區(qū)域圖像中包含題目區(qū)域以及與所述題目區(qū)域一一對(duì)應(yīng)的作答區(qū)域;

      10、對(duì)作答區(qū)域的區(qū)域圖像進(jìn)行校正處理,得到多個(gè)目標(biāo)區(qū)域圖像。

      11、進(jìn)一步的,所述對(duì)作答區(qū)域的區(qū)域圖像進(jìn)行校正處理,得到多個(gè)目標(biāo)區(qū)域圖像的步驟,包括:

      12、利用區(qū)域圖像中給定的四個(gè)頂點(diǎn)坐標(biāo)和目標(biāo)坐標(biāo)計(jì)算得到透視變換矩陣,表示為:;式中,(x,y)表示為區(qū)域圖像的坐標(biāo)點(diǎn);a表示透視變換矩陣的元素;

      13、變換的目標(biāo)坐標(biāo)為展開(kāi)表示為:

      14、;通過(guò)文本行的頂點(diǎn)得到變換后的目標(biāo)坐標(biāo)點(diǎn),其中,先對(duì)文本行進(jìn)行傾斜角度的計(jì)算:

      15、;式中,θ表示傾斜角度,、分別表示文本行的左上和右上頂點(diǎn)坐標(biāo);然后,根據(jù)得到的傾斜角度θ變換至水平位置的目標(biāo)坐標(biāo)點(diǎn),利用變換前后的八個(gè)坐標(biāo)點(diǎn)計(jì)算得到變換矩陣,通過(guò)矩陣對(duì)文本行變換至水平方向,得到校正處理的目標(biāo)區(qū)域圖像。

      16、進(jìn)一步的,在所述非對(duì)稱卷積殘差塊中,輸入特征通過(guò)兩個(gè)通道的卷積結(jié)果相加得到輸出特征,其中,一個(gè)通道為7×5的非對(duì)稱下采樣卷積層和3×3卷積層,另一個(gè)通道為7×5的非對(duì)稱下采樣卷積層;

      17、在所述空洞卷積殘差塊中,空洞卷積殘差塊的感受野的計(jì)算式表示為:

      18、;;式中,表示第l層空洞卷積殘差塊的感受野值;表示第l-1層空洞卷積殘差塊的感受野值;l表示層數(shù),且l≥2;表示第l-1層空洞卷積殘差塊的步長(zhǎng);表示第l層空洞卷積殘差塊的卷積核尺寸;為2d表示的感受野值;和分別表示橫向感受野值和縱向感受野值。

      19、進(jìn)一步的,所述解碼器的結(jié)構(gòu)還包括對(duì)編碼器的輸出數(shù)據(jù)進(jìn)行處理的位置編碼和詞嵌入層結(jié)構(gòu),對(duì)來(lái)自編碼器的輸出數(shù)據(jù)進(jìn)行處理;以及還包括對(duì)解碼器的待輸出數(shù)據(jù)進(jìn)行處理的線性化層和softmax層,對(duì)解碼之后的特征向量經(jīng)過(guò)softmax激活函數(shù)的全連接層之后,輸出目標(biāo)區(qū)域圖像的識(shí)別信息。

      20、進(jìn)一步的,在基于transformer網(wǎng)絡(luò)模型的解碼器結(jié)構(gòu)中,采用多頭注意力層的輸入包括查詢向量q、鍵向量k和數(shù)值向量v,,,d=512,d表示維度,表示q的個(gè)數(shù);,,,t是鍵向量k和數(shù)值向量v的個(gè)數(shù);t表示向量的轉(zhuǎn)置操作;r表示實(shí)數(shù)集;多頭注意力表示為:;式中,,,,α表示注意力權(quán)重;

      21、對(duì)多頭注意力機(jī)制的多次點(diǎn)積注意力結(jié)果進(jìn)行拼接,然后在進(jìn)行線性變換得到的值作為多頭注意力層的輸出,表示為:

      22、;;式中,表示多頭注意力操作;表示拼接操作;其中,參數(shù),,,;d表示維度,h表示頭數(shù);表示將多個(gè)頭的注意力結(jié)果拼接后進(jìn)行線性變換的權(quán)重矩陣;表示多頭注意力機(jī)制中第i個(gè)頭的查詢向量q的線性變換權(quán)重矩陣;表示多頭注意力機(jī)制中第i個(gè)頭的鍵向量k的線性變換權(quán)重矩陣;表示多頭注意力機(jī)制中第i個(gè)頭的數(shù)值向量v的線性變換權(quán)重矩陣。

      23、進(jìn)一步的,所述前饋神經(jīng)網(wǎng)絡(luò)fnn包括兩個(gè)線性變換,表示為:

      24、;其中,第一個(gè)線性變換表示為:;

      25、表示relu激活函數(shù),用于將第一個(gè)線性變換的輸出中所有負(fù)值置為0;

      26、第二個(gè)線性變換表示為:;

      27、式中,表示第一個(gè)線性變換的權(quán)重矩陣;表示第二個(gè)線性變換的權(quán)重矩陣,表示第一個(gè)線性變換的偏置;表示第二個(gè)線性變換的偏置;x表示輸入向量。

      28、進(jìn)一步的,所述基于圖像識(shí)別的作?業(yè)批改方法的步驟,還包括以下步驟:

      29、獲取教師端對(duì)帶有標(biāo)注信息的作答內(nèi)容的批改結(jié)果,所述批改結(jié)果包括批改信息和批改標(biāo)記;

      30、根據(jù)所述批改信息進(jìn)行數(shù)據(jù)統(tǒng)計(jì)得到對(duì)應(yīng)的統(tǒng)計(jì)結(jié)果,并將所述統(tǒng)計(jì)結(jié)果和所述批改標(biāo)記在教師端的可視化界面進(jìn)行展示;

      31、響應(yīng)于教師端的推送指令,將所述統(tǒng)計(jì)結(jié)果和所述批改標(biāo)記推送至所述學(xué)生端中進(jìn)行顯示。

      32、本發(fā)明另一實(shí)施例提供了一種基于圖像識(shí)別的作業(yè)批改裝置,包括以下模塊:

      33、圖像處理模塊,用于獲取來(lái)自學(xué)生端的學(xué)生作業(yè)圖像,對(duì)學(xué)生作業(yè)圖像進(jìn)行預(yù)處理,得到多個(gè)目標(biāo)區(qū)域圖像,其中,所述目標(biāo)區(qū)域圖像包括標(biāo)識(shí)信息,標(biāo)識(shí)信息用于表征與該目標(biāo)區(qū)域圖像對(duì)應(yīng)的題目信息,利用標(biāo)識(shí)信息調(diào)取所述題目信息的預(yù)設(shè)答案內(nèi)容;

      34、模型構(gòu)建模塊,用于構(gòu)建圖像文本識(shí)別模型,所述圖像文本識(shí)別模型包括編碼器和解碼器,所述編碼器中融合有非對(duì)稱卷積殘差塊和空洞卷積殘差塊,非對(duì)稱卷積殘差塊用于提取特征,空洞卷積殘差塊用于增加感受野;所述解碼器采用基于transformer網(wǎng)絡(luò)模型的結(jié)構(gòu),該結(jié)構(gòu)采用多頭注意力層和前饋神經(jīng)網(wǎng)絡(luò)fnn堆疊而成;

      35、圖像識(shí)別模塊,用于依次將多個(gè)目標(biāo)區(qū)域圖像作為圖像文本識(shí)別模型的輸入,利用圖像文本識(shí)別模型對(duì)多個(gè)目標(biāo)區(qū)域圖像進(jìn)行文本檢測(cè)識(shí)別,輸出各個(gè)目標(biāo)區(qū)域圖像的識(shí)別信息,將識(shí)別信息作為該目標(biāo)區(qū)域圖像的作答內(nèi)容;

      36、作業(yè)批改模塊,用于將目標(biāo)區(qū)域圖像的作答內(nèi)容與利用該目標(biāo)區(qū)域圖像標(biāo)識(shí)信息所調(diào)取的預(yù)設(shè)答案內(nèi)容進(jìn)行比較,對(duì)比較結(jié)果中的差異部分進(jìn)行標(biāo)注,將帶有標(biāo)注信息的作答內(nèi)容在教師端進(jìn)行輸出。

      37、與現(xiàn)有技術(shù)相比,本發(fā)明基于圖像識(shí)別的作業(yè)批改方法及裝置的有益效果是:

      38、第一,本發(fā)明利用圖像文本識(shí)別模型對(duì)學(xué)生作業(yè)圖像中的作答區(qū)域進(jìn)行識(shí)別,能夠得到學(xué)生作業(yè)的作答內(nèi)容,將目標(biāo)區(qū)域圖像的作答內(nèi)容與利用該目標(biāo)區(qū)域圖像標(biāo)識(shí)信息所調(diào)取的預(yù)設(shè)答案內(nèi)容進(jìn)行比較,對(duì)比較結(jié)果中的差異部分進(jìn)行標(biāo)注,將帶有標(biāo)注信息的作答內(nèi)容在教師端進(jìn)行輸出,差異標(biāo)注幫助教師快速定位學(xué)生的錯(cuò)誤,便于教師進(jìn)行作業(yè)批改,可以減少教師的工作量,提高批改效率;

      39、第二,本發(fā)明構(gòu)建的圖像文本識(shí)別模型中,結(jié)合了非對(duì)稱卷積殘差塊和空洞卷積殘差塊,可以提取圖像中的特征,非對(duì)稱卷積能夠捕獲圖像中的方向性信息,解決了圖像方向和形狀的變化導(dǎo)致文本識(shí)別準(zhǔn)確性低的問(wèn)題;空洞卷積殘差塊通過(guò)增加感受野,可以捕捉到圖像中更大范圍的特征,有助于識(shí)別圖像中的文本;

      40、第三,本發(fā)明圖像文本識(shí)別模型解碼器基于transformer網(wǎng)絡(luò)模型構(gòu)建,通過(guò)多頭注意力層和前饋神經(jīng)網(wǎng)絡(luò)fnn的結(jié)構(gòu),能夠在圖像文本識(shí)別中,更好地理解文本的上下文關(guān)系,提高識(shí)別的準(zhǔn)確性。

      當(dāng)前第1頁(yè)1 2 
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1