本發(fā)明涉及計(jì)算機(jī)視覺(jué),尤其涉及一種計(jì)算機(jī)視覺(jué)輔助的執(zhí)法卷宗采集系統(tǒng)。
背景技術(shù):
1、計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域涉及圖像數(shù)據(jù)的采集、圖像處理以及圖像分析等多個(gè)環(huán)節(jié),旨在模仿和執(zhí)行人眼的視覺(jué)感知功能,廣泛應(yīng)用于各種場(chǎng)景,如自動(dòng)駕駛汽車(chē)、機(jī)器人導(dǎo)航、安全監(jiān)控、交互式游戲、智能視頻分析、健康診斷和工業(yè)自動(dòng)化等,依賴(lài)于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)來(lái)提高其識(shí)別和解釋能力,特別是在處理復(fù)雜或動(dòng)態(tài)視覺(jué)環(huán)境中。
2、其中,計(jì)算機(jī)視覺(jué)輔助的執(zhí)法卷宗采集系統(tǒng)是一個(gè)專(zhuān)門(mén)設(shè)計(jì)來(lái)支持執(zhí)法機(jī)關(guān)自動(dòng)化和優(yōu)化采集,存儲(chǔ)及分析卷宗資料的系統(tǒng),利用計(jì)算機(jī)視覺(jué)技術(shù),該系統(tǒng)能夠識(shí)別和分類(lèi)圖像內(nèi)容,例如場(chǎng)景照片、文件圖像及其他視覺(jué)證據(jù),進(jìn)而自動(dòng)化處理和整理信息,其主要用途包括減少人工輸入錯(cuò)誤、加快信息處理速度、提高執(zhí)法效率和文檔管理的精確性,此外,該系統(tǒng)還可用于提升案件分析的質(zhì)量,輔助決策過(guò)程,從而在提高公共安全和司法透明度方面發(fā)揮關(guān)鍵作用。
3、在自動(dòng)化處理法律文檔方面,傳統(tǒng)技術(shù)依賴(lài)于簡(jiǎn)單的圖像處理工具和基本的數(shù)據(jù)管理,缺乏高級(jí)的圖像識(shí)別和數(shù)據(jù)校驗(yàn)功能,導(dǎo)致處理速度慢且容易出錯(cuò),使得數(shù)據(jù)處理經(jīng)常需要人工干預(yù),增加了操作成本并延長(zhǎng)了工作周期,在數(shù)據(jù)安全性方面,缺乏有效的數(shù)據(jù)完整性驗(yàn)證措施,使得執(zhí)法卷宗容易在存儲(chǔ)或傳輸過(guò)程中被篡改,影響法律程序的公正性和透明度。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明的目的是解決現(xiàn)有技術(shù)中存在的缺點(diǎn),而提出的一種計(jì)算機(jī)視覺(jué)輔助的執(zhí)法卷宗采集系統(tǒng)。
2、為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案:一種計(jì)算機(jī)視覺(jué)輔助的執(zhí)法卷宗采集系統(tǒng),所述系統(tǒng)包括:
3、卷宗圖像采集模塊基于文件掃描設(shè)備,掃描執(zhí)法卷宗文件,對(duì)每頁(yè)文檔進(jìn)行自動(dòng)邊緣檢測(cè),調(diào)整對(duì)比度和亮度,并進(jìn)行時(shí)間戳和來(lái)源地點(diǎn)標(biāo)注,獲取執(zhí)法卷宗原始圖像集;
4、卷宗圖像驗(yàn)證模塊基于所述執(zhí)法卷宗原始圖像集,對(duì)圖像進(jìn)行數(shù)字水印嵌入和數(shù)字簽名生成,驗(yàn)證圖像原始性,并應(yīng)用哈希算法對(duì)圖像文件進(jìn)行完整性校驗(yàn),生成執(zhí)法卷宗完整圖像集;
5、卷宗特征融合模塊基于所述執(zhí)法卷宗完整圖像集,采用生成對(duì)抗網(wǎng)絡(luò),對(duì)圖像集進(jìn)行像素級(jí)分析,識(shí)別和分類(lèi)文本與非文本區(qū)域,并對(duì)文本區(qū)域執(zhí)行光學(xué)字符識(shí)別,提取和整合文檔中的關(guān)鍵信息,形成執(zhí)法文檔關(guān)鍵特征集;
6、卷宗決策支持模塊基于所述執(zhí)法文檔關(guān)鍵特征集,應(yīng)用支持向量機(jī),通過(guò)比較文檔內(nèi)容的關(guān)鍵詞與法律數(shù)據(jù)庫(kù)中的條款,自動(dòng)分類(lèi)和歸檔執(zhí)法卷宗,得到執(zhí)法卷宗分類(lèi)存檔。
7、本發(fā)明改進(jìn)有,所述對(duì)每頁(yè)文檔進(jìn)行自動(dòng)邊緣檢測(cè)的步驟具體為:
8、基于文件掃描設(shè)備,對(duì)執(zhí)法卷宗文件進(jìn)行掃描,采用公式:
9、is=α·f(s)+β·g(s,γ,δ)
10、得到掃描結(jié)果圖像is,其中,s是執(zhí)法卷宗文件,f是掃描函數(shù),α和β是調(diào)整掃描靈敏度和噪聲抑制的權(quán)重系數(shù),g是輔助函數(shù),γ和δ是g函數(shù)的參數(shù),分別用于控制圖像銳化和對(duì)比度;
11、對(duì)掃描結(jié)果圖像is執(zhí)行自動(dòng)邊緣檢測(cè),采用公式:
12、
13、得到邊緣檢測(cè)圖像ie,其中,e代表邊緣檢測(cè)算法,k用于控制曲線的陡峭程度,x代表邊緣檢測(cè)閾值,x0為閾值的中點(diǎn)。
14、本發(fā)明改進(jìn)有,所述執(zhí)法卷宗原始圖像集的獲取步驟具體為:
15、對(duì)邊緣檢測(cè)后的掃描圖像,進(jìn)行對(duì)比度和亮度調(diào)整,采用公式:
16、
17、生成對(duì)比度和亮度調(diào)整后的圖像iadj,其中,α和β分別是對(duì)比度和亮度的調(diào)整系數(shù),γ是對(duì)比度的非線性控制系數(shù),δ是亮度調(diào)整的敏感性因子,ie為邊緣檢測(cè)圖像;
18、基于對(duì)比度和亮度調(diào)整后的圖像iadj,添加時(shí)間戳和標(biāo)注來(lái)源地點(diǎn),使用公式:
19、
20、獲得執(zhí)法卷宗原始圖像集ifinal,其中,t代表標(biāo)注操作函數(shù),t是標(biāo)注的時(shí)間戳信息,l是來(lái)源地點(diǎn)信息,k是時(shí)間調(diào)節(jié)參數(shù),t0是時(shí)間閾值。
21、本發(fā)明改進(jìn)有,所述數(shù)字水印嵌入和數(shù)字簽名生成的步驟具體為:
22、基于所述執(zhí)法卷宗原始圖像集,對(duì)原始圖像集進(jìn)行處理,并優(yōu)化水印和簽名嵌入,采用公式:
23、
24、得到處理后的圖像iprep,其中,i代表選擇的原始圖像,norm為標(biāo)準(zhǔn)化處理函數(shù),∈是噪聲容忍度參數(shù);
25、根據(jù)處理后的圖像iprep,進(jìn)行數(shù)字水印的生成,并進(jìn)行水印嵌入操作,采用公式:
26、iwater=iprep+α·w·e-λ·∥w∥
27、得到水印嵌入圖像iwater,其中,w為生成的數(shù)字水印,a為嵌入強(qiáng)度參數(shù),λ是調(diào)節(jié)水印的衰減系數(shù);
28、基于水印嵌入圖像iwater,進(jìn)行數(shù)字簽名的生成,并與圖像進(jìn)行關(guān)聯(lián),使用公式:
29、isigned=sign(iwater,k)÷(1+μ·d(iwater))
30、得到帶有數(shù)字簽名的圖像isigned,其中,k是用于簽名的私鑰,sign是用于生成數(shù)字簽名的函數(shù),μ是控制簽名強(qiáng)度的動(dòng)態(tài)調(diào)整參數(shù),d是圖像的密度檢測(cè)函數(shù)。
31、本發(fā)明改進(jìn)有,所述對(duì)圖像文件進(jìn)行完整性校驗(yàn)的步驟具體為:
32、從數(shù)字簽名圖像中提取關(guān)鍵信息,采用公式:
33、
34、得到關(guān)鍵信息摘要d,其中,h是哈希函數(shù),用于生成圖像的唯一摘要,κ是標(biāo)準(zhǔn)化系數(shù),isigmed代表帶數(shù)字簽名的圖像;
35、將得到的關(guān)鍵信息摘要d與存儲(chǔ)的參考摘要進(jìn)行比較,使用公式:
36、
37、得到完整性驗(yàn)證結(jié)果validity,其中,d代表當(dāng)前的圖像摘要,dref代表參考摘要。
38、本發(fā)明改進(jìn)有,所述對(duì)圖像集進(jìn)行像素級(jí)的分析步驟具體為:
39、使用生成對(duì)抗網(wǎng)絡(luò)初始化圖像數(shù)據(jù)集,從所述執(zhí)法卷宗完整圖像集中選擇圖像進(jìn)行訓(xùn)練,采用公式:
40、
41、生成初始模型狀態(tài)minit,其中,g表示生成對(duì)抗網(wǎng)絡(luò)的生成器部分,θ表示初始化時(shí)的網(wǎng)絡(luò)參數(shù),α和β是調(diào)整因子,ifull代表輸入的完整圖像集;
42、對(duì)minit進(jìn)行訓(xùn)練,識(shí)別和分類(lèi)圖像中的文本與非文本區(qū)域,采用公式:
43、
44、得到訓(xùn)練后的模型mtrained,其中,t是訓(xùn)練過(guò)程,η表示學(xué)習(xí)率,λ和γ是正則化參數(shù)和損失權(quán)重;
45、應(yīng)用訓(xùn)練后的模型mtrained,對(duì)圖像進(jìn)行像素級(jí)分析,標(biāo)注文本區(qū)域,采用公式:
46、itagged=a(mtrained,iselected)÷(1+δ·||mtrained||)
47、得到標(biāo)注后的圖像itagged,其中,a是模型的分析函數(shù),iselected是用于分析的圖像,δ是調(diào)整分析準(zhǔn)度的參數(shù)。
48、本發(fā)明改進(jìn)有,所述執(zhí)法文檔關(guān)鍵特征集的獲取步驟具體為:
49、使用模型識(shí)別并定位圖像中的文本區(qū)域,采用公式:
50、
51、得到文本區(qū)域坐標(biāo)c,其中,l是定位函數(shù),用于從標(biāo)注后的圖像中確定文本區(qū)域的位置,λ1和λ2是調(diào)整因子,κ是敏感度參數(shù),用于調(diào)整定位準(zhǔn)度,mtrained是訓(xùn)練后的模型,itagged是標(biāo)注過(guò)文本區(qū)域的圖像;
52、對(duì)定位到的文本區(qū)域c進(jìn)行光學(xué)字符識(shí)別,采用公式:
53、t=ocr(c,itagged)÷(1+ρ·σ(||c||))
54、得到提取的文本內(nèi)容t,其中,ocr是光學(xué)字符識(shí)別功能,ρ是調(diào)節(jié)參數(shù),σ是用于調(diào)整字符提取準(zhǔn)度的sigmoid函數(shù);
55、對(duì)提取的文本內(nèi)容進(jìn)行整合,使用公式:
56、
57、建立執(zhí)法文檔關(guān)鍵特征集f,其中,integrate是整合函數(shù),用于將分散的文本數(shù)據(jù)組織成結(jié)構(gòu)化的信息集,ω和δ是調(diào)整文本整合過(guò)程中的權(quán)重和縮放因子。
58、本發(fā)明改進(jìn)有,所述執(zhí)法卷宗分類(lèi)存檔的獲取步驟具體為:
59、基于所述執(zhí)法文檔關(guān)鍵特征集,進(jìn)行關(guān)鍵詞集k提取,采用公式:
60、k=extract(f,θ1)·log(1+∈·|f|)
61、其中,extract是提取關(guān)鍵詞的函數(shù),θ1是提取參數(shù),控制關(guān)鍵詞的選擇敏感度和精度,∈是優(yōu)化關(guān)鍵詞提取的非線性因子,用于調(diào)節(jié)提取過(guò)程中特征集大小的影響,f代表執(zhí)法文檔的關(guān)鍵特征集;
62、將提取的關(guān)鍵詞k,與法律數(shù)據(jù)庫(kù)中的條款進(jìn)行匹配,使用公式:
63、
64、確定相關(guān)性得分s,其中,match是匹配函數(shù),d是法律數(shù)據(jù)庫(kù)中的條款集,α和β是匹配敏感度和權(quán)重調(diào)節(jié)參數(shù),σ是調(diào)節(jié)匹配敏感度的非線性參數(shù),用于優(yōu)化匹配結(jié)果的相關(guān)性;
65、根據(jù)得到的相關(guān)性得分s,對(duì)執(zhí)法卷宗進(jìn)行分類(lèi)和存檔,使用公式:
66、
67、獲得執(zhí)法卷宗分類(lèi)存檔結(jié)果r,其中,classify是分類(lèi)函數(shù),γ和δ是分類(lèi)閾值與決策參數(shù),用于決定卷宗的歸檔類(lèi)別。
68、與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)和積極效果在于:
69、本發(fā)明中,通過(guò)數(shù)字水印嵌入和數(shù)字簽名技術(shù)的應(yīng)用,保證了圖像數(shù)據(jù)的安全性和完整性,減少數(shù)據(jù)篡改的風(fēng)險(xiǎn),利用生成對(duì)抗網(wǎng)絡(luò)進(jìn)行的細(xì)粒度圖像分析和光學(xué)字符識(shí)別的結(jié)合,顯著提高了從復(fù)雜環(huán)境中準(zhǔn)確提取關(guān)鍵信息的能力,支持向量機(jī)在自動(dòng)分類(lèi)和歸檔執(zhí)法卷宗方面的應(yīng)用,進(jìn)一步提升了數(shù)據(jù)處理的速度和準(zhǔn)確性,特別是在處理與法律相關(guān)的內(nèi)容時(shí),確保了高效的信息流動(dòng)和更快的響應(yīng)時(shí)間。