專(zhuān)利名稱(chēng):用于處理圖像的設(shè)備、方法和計(jì)算機(jī)程序產(chǎn)品的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理圖像的設(shè)備、方法和計(jì)算機(jī)程序產(chǎn)品。
背景技術(shù):
隨著彩色掃描儀和數(shù)碼相機(jī)的廣泛使用,在某些情況下,用于輸入和輸出 圖像數(shù)據(jù)的輸入裝置和輸出裝置彼此不同。例如,打印機(jī)輸出由數(shù)碼相機(jī)拍攝 的圖像的圖像數(shù)據(jù)。輸出裝置通常在根據(jù)圖像數(shù)據(jù)的特征的校正之后輸出圖像 數(shù)據(jù),例如,對(duì)于圖像數(shù)據(jù)進(jìn)行背景顏色的校正。然而,當(dāng)輸入裝置和輸出裝 置彼此不同的時(shí)候,識(shí)別圖像數(shù)據(jù)的特征是困難的。
為了解決上述問(wèn)題,研發(fā)了各種技術(shù)。例如,能夠?qū)D像數(shù)據(jù)恰當(dāng)?shù)貓?zhí)行 圖像處理的圖像處理設(shè)備(例如,參見(jiàn)日本專(zhuān)利申請(qǐng)公開(kāi)第2006-053690號(hào))。 在這個(gè)設(shè)備中,關(guān)于例如由掃描儀的圖像輸入裝置輸入的彩色文件的圖像數(shù) 據(jù),管理例如"撤銷(xiāo)"或"重做"的每個(gè)處理的處理歷史以及處理狀態(tài),以管 理和處理根據(jù)不同的應(yīng)用用于創(chuàng)建最優(yōu)圖像數(shù)據(jù)的數(shù)據(jù)。此外,公開(kāi)了通過(guò)輸 出狀態(tài)轉(zhuǎn)換能夠使用戶視覺(jué)地和直觀地識(shí)別圖像處理的狀態(tài)轉(zhuǎn)換的圖像處理 設(shè)備(例如,參見(jiàn)日本專(zhuān)利申請(qǐng)公開(kāi)第2006-074331號(hào))。
然而,不僅進(jìn)行圖像處理的圖像數(shù)據(jù)的類(lèi)型是多種多樣的,而且用戶的偏 好和使用圖像數(shù)據(jù)的目的也是多種多樣的。例如,作為背景處理,存在背景顏 色移除,其中不管原始顏色而將背景顏色處理為白色;以及背景清除,其中通 過(guò)保持背景的原始顏色而將斑點(diǎn)或穿透的背部圖像處理為不體現(xiàn)出來(lái)。用戶可 以根據(jù)個(gè)人偏好選擇任意所述處理技術(shù)。然而,當(dāng)設(shè)備被配置為用戶需要選擇 用于期望的圖像處理的內(nèi)容或參數(shù)時(shí),用戶操作是不方便和復(fù)雜的,因此,降
低了操作有效性。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,提供了一種圖像處理設(shè)備,包括變化檢測(cè)單元, 檢測(cè)第一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第一周期中第一 圖像數(shù)據(jù)的特征和處理內(nèi)容的第 一組合存儲(chǔ)在歷史信息存儲(chǔ)單元中,在第二周 期中存儲(chǔ)相似于第 一 圖像數(shù)據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二 周期在時(shí)間上晚于第一周期;歷史信息更新單元,當(dāng)變化檢測(cè)單元檢測(cè)到第一 周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第一組合更新為第二組合;
圖像數(shù)據(jù)獲取單元,獲取要被處理的目標(biāo)圖像數(shù)據(jù);處理內(nèi)容獲取單元, 基于存儲(chǔ)在歷史信息存儲(chǔ)單元中的特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖 像數(shù)據(jù)的處理內(nèi)容;以及處理內(nèi)容輸出單元,輸出由處理內(nèi)容獲取單元獲取的 處理內(nèi)容。
此外,根據(jù)本發(fā)明的另一個(gè)方面,提供了一種圖像處理方法,包括檢測(cè) 第一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第一周期中存儲(chǔ)第一 圖像數(shù)據(jù)的特征和處理內(nèi)容的第 一組合,在第二周期中存儲(chǔ)相似于第 一圖像數(shù) 據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二周期在時(shí)間上晚于第 一周 期;當(dāng)檢測(cè)到第一周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第一組合更 新為第二組合;獲取要被處理的目標(biāo)圖像數(shù)據(jù);基于特征和處理內(nèi)容的組合來(lái) 獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容;以及輸出在獲取處理內(nèi)容中獲取的處理內(nèi)
容o
此外,根據(jù)本發(fā)明的另一個(gè)方面,提供了一種包括計(jì)算機(jī)可用介質(zhì)的計(jì)算 機(jī)程序產(chǎn)品,具有存儲(chǔ)在該介質(zhì)中的計(jì)算機(jī)可讀程序代碼,當(dāng)執(zhí)行該代碼時(shí)使
得計(jì)算機(jī)執(zhí)行
檢測(cè)第 一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第 一周期中 存儲(chǔ)第 一 圖像數(shù)據(jù)的特征和處理內(nèi)容的第 一組合,在第二周期中存儲(chǔ)相似于第 一圖像數(shù)據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二周期在時(shí)間上晚于 第一周期;當(dāng)檢測(cè)到第一周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第一 組合更新為第二組合;獲取要被處理的目標(biāo)圖像數(shù)據(jù);基于特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容;以及輸出在獲取處理內(nèi)容中獲取的
處理內(nèi)容。
本發(fā)明的上述和其他目的、特征、優(yōu)點(diǎn)和技術(shù)以及工業(yè)意義將通過(guò)結(jié)合附 圖讀取下面的本發(fā)明優(yōu)選實(shí)施例的詳細(xì)描述而得到更好理解。
圖1是根據(jù)本發(fā)明的第一實(shí)施例的圖像處理設(shè)備的電連接圖; 圖2是圖1所示的圖像處理設(shè)備的功能框圖3是在圖2所示的圖像處理設(shè)備中執(zhí)行的在歷史數(shù)據(jù)庫(kù)(DB)中存儲(chǔ) 特征矢量和處理內(nèi)容的歷史存儲(chǔ)處理的流程圖4是用于詳細(xì)說(shuō)明在圖3所示的歷史存儲(chǔ)處理中的特征計(jì)算處理的流程
圖5是用于詳細(xì)說(shuō)明圖4所示的特征計(jì)算處理中的分類(lèi)處理的流程圖; 圖6是用于說(shuō)明圖5所示的分類(lèi)處理中的多分辨率分解處理的圖案 (pattern).圖7是用于計(jì)算高階自相關(guān)函數(shù)的掩膜圖案的例子的示意圖; 圖8是已分類(lèi)的塊的例子的圖案圖; 圖9是存儲(chǔ)在歷史DB中的歷史信息的例子的表^s 圖IO是存儲(chǔ)在歷史DB中的處理內(nèi)容的例子的表格; 圖11是基于預(yù)測(cè)函數(shù)用于向用戶呈現(xiàn)最優(yōu)處理內(nèi)容的處理內(nèi)容預(yù)測(cè)處理 的流程圖12是用于詳細(xì)說(shuō)明圖ll所示的處理內(nèi)容預(yù)測(cè)處理中的偏好改變檢測(cè)處 理和學(xué)習(xí)數(shù)據(jù)集更新處理的流程圖13是用于說(shuō)明組合S的示意圖14是根據(jù)本發(fā)明的第二實(shí)施例的圖像處理設(shè)備的功能框圖; 圖15是由圖14所示的圖像處理設(shè)備執(zhí)行的處理內(nèi)容預(yù)測(cè)處理的流程圖; 圖16是根據(jù)本發(fā)明的第三實(shí)施例的多功能產(chǎn)品的示意圖;以及 圖17是根據(jù)本發(fā)明的第四實(shí)施例的圖像處理系統(tǒng)的系統(tǒng)配置圖表。
具體實(shí)施例方式
下面參考附圖詳細(xì)描述本發(fā)明的示例實(shí)施例。圖1是根據(jù)本發(fā)明的第一實(shí)施例的圖像處理設(shè)備1的電連接圖。如圖1 所示,圖像處理設(shè)備1是例如個(gè)人計(jì)算機(jī)(PC)的計(jì)算機(jī),并且包括中央處
理單元(CPU)2、主存儲(chǔ)單元5、次存儲(chǔ)單元6、可移動(dòng)磁盤(pán)裝置8、網(wǎng)絡(luò)接 口 (I/F) 10、顯示裝置11、鍵盤(pán)12以及例如鼠標(biāo)的指示裝置13。 CPU2中央 控制圖像處理設(shè)備1中的每個(gè)單元。主存儲(chǔ)單元5包括用于在其中存儲(chǔ)信息的 只讀存儲(chǔ)器(ROM) 3以及隨機(jī)讀取存儲(chǔ)器(RAM) 4。次存儲(chǔ)單元6包括硬 盤(pán)驅(qū)動(dòng)器(HDD) 7,其中存儲(chǔ)數(shù)據(jù)文件(例如,用于在彩色位映像上的圖像 數(shù)據(jù))。可移動(dòng)磁盤(pán)裝置8是例如只讀光盤(pán)存儲(chǔ)器(CD-ROM)驅(qū)動(dòng)器,并且 在CD-ROM中存々者信息,將信息分發(fā)至外部,或者從外部接收信息。網(wǎng)絡(luò)I/F 10用于通過(guò)網(wǎng)絡(luò)9與其他外部計(jì)算機(jī)通信來(lái)發(fā)送信息。顯示裝置ll包括例如 陰極射線管(CRT)或液晶顯示器(LCD),在其上為操作員顯示處理的進(jìn)程 或結(jié)果。當(dāng)操作員向CPU 2輸入命令、信息等時(shí)使用鍵盤(pán)12。通過(guò)數(shù)據(jù)總線 14在這些部件之間發(fā)送/接收數(shù)據(jù)。
在本實(shí)施例中,將圖像處理設(shè)備1應(yīng)用至通用PC。然而,本發(fā)明不限于 PC。例如,本發(fā)明可以應(yīng)用至涉及個(gè)人數(shù)字助理(PDA)、掌上PC、移動(dòng)電 話、個(gè)人手持電話系統(tǒng)(PHS)等的手持終端。
當(dāng)用戶將圖像處理設(shè)備1上電時(shí),CPU 2激活引導(dǎo)程序,其為存儲(chǔ)在ROM 3中的程序。此后,HDD7在RAM4中載入操作系統(tǒng),其為管理計(jì)算機(jī)硬件 和軟件的程序,由此運(yùn)行操作系統(tǒng)。響應(yīng)于用戶操作,操作系統(tǒng)啟動(dòng)程序、載 入信息或者存儲(chǔ)信息。"Windows ", "Unix "等是操作系統(tǒng)的主要例子。 在操作系統(tǒng)上運(yùn)行的操作程序被稱(chēng)為應(yīng)用程序。
圖像處理設(shè)備1在HDD7中將圖像處理程序存儲(chǔ)為應(yīng)用程序。由此可見(jiàn), HDD 7用作在其上存儲(chǔ)圖像處理程序的存儲(chǔ)介質(zhì)。
通常,這樣的應(yīng)用程序被存儲(chǔ)在存儲(chǔ)器介質(zhì)8a中,例如象CD-ROM和數(shù) 字化視頻光盤(pán)(DVD-ROM)的光信息存儲(chǔ)介質(zhì)或者象軟盤(pán)(FD)的磁存儲(chǔ)介 質(zhì)。記錄在存儲(chǔ)器介質(zhì)8a中的應(yīng)用程序被安裝在次存儲(chǔ)單元6中的HDD 7等 中。因此,具有便攜性的存儲(chǔ)器介質(zhì)8a也可以是用于在其上存儲(chǔ)應(yīng)用程序的 存儲(chǔ)介質(zhì)??蛇x地,應(yīng)用程序可以被存儲(chǔ)在連接至例如因特網(wǎng)的網(wǎng)絡(luò)上的外部 計(jì)算機(jī)中,使得可以從外部計(jì)算機(jī)通過(guò)要被安裝到次存儲(chǔ)單元6中的HDD 7
等中的網(wǎng)絡(luò)I/F10下載。此外,可以通過(guò)例如因特網(wǎng)的網(wǎng)絡(luò)將圖像處理設(shè)備1 實(shí)現(xiàn)的圖像處理程序提供或分發(fā)至外部。
當(dāng)圖像處理設(shè)備1在操作系統(tǒng)上運(yùn)行圖像處理程序時(shí),CPU2通過(guò)根據(jù)圖 像處理程序執(zhí)行每個(gè)計(jì)算處理來(lái)中央地控制每個(gè)單元。除了由CPU 2執(zhí)行的 計(jì)算處理之外,下面描述當(dāng)累積/發(fā)送圖像數(shù)據(jù)時(shí)要被執(zhí)行的標(biāo)準(zhǔn)化 (normalization)處理,其為本實(shí)施例特定的處理。標(biāo)準(zhǔn)化處理是將從通過(guò)網(wǎng) 絡(luò)9連接至圖像處理設(shè)備1的外部裝置(例如,掃描儀或者數(shù)碼相機(jī))接收的 數(shù)字圖像數(shù)據(jù)轉(zhuǎn)換為理想形式的處理。
在強(qiáng)調(diào)實(shí)時(shí)處理的情況下,需要高速執(zhí)行該處理。因此,優(yōu)選地向CPU2 額外提供邏輯電路(未顯示),使得CPU2使用邏輯電路來(lái)執(zhí)行計(jì)算處理。
隨后,下面描述由CPU 2執(zhí)行的圖像處理。圖2是圖像處理設(shè)備1的功 能框圖。圖像處理設(shè)備1包括圖像數(shù)據(jù)獲取單元100、特征計(jì)算單元102、規(guī) 范接收單元103、歷史數(shù)據(jù)庫(kù)(DB) 110、預(yù)測(cè)函數(shù)創(chuàng)建單元120、處理內(nèi)容 預(yù)測(cè)單元(處理內(nèi)容獲取單元)122、處理內(nèi)容輸出單元124、圖像處理單元 126、變化檢測(cè)單元130以及更新單元132。
圖像數(shù)據(jù)獲取單元100獲取圖像數(shù)據(jù)。此外,當(dāng)輸入圖像數(shù)據(jù)是文件時(shí), 圖像數(shù)據(jù)獲取單元100校正文件的歪斜。
特征計(jì)算單元102計(jì)算整個(gè)圖像數(shù)據(jù)的特征。例如,統(tǒng)計(jì)信息作為特征, 例如,整個(gè)圖像的字符比率、整個(gè)圖像的圖片比率、字符和圖片的分散度、布 局密度、字符和圖片的空間分布、顏色分布、邊緣分布以及背景的顏色。
規(guī)范接收單元104接收關(guān)于圖像數(shù)據(jù)獲取單元IOO獲取的圖像數(shù)據(jù)的處理 內(nèi)容的規(guī)范。處理內(nèi)容的規(guī)范由用戶輸入。處理內(nèi)容包括處理類(lèi)型,類(lèi)型的參 數(shù)等。例如,處理類(lèi)型有背景顏色校正處理、空間過(guò)濾處理以及分辨率擴(kuò)展處 理。
背景顏色校正處理有背景顏色移除,其中背景顏色被處理為白色;以及背 景清除,其中校正背景顏色。在以下文件中公開(kāi)了背景顏色移除的方法,例如 曰本專(zhuān)利申請(qǐng)公開(kāi)第2004-320701號(hào)以及日本專(zhuān)利申請(qǐng)公開(kāi)第2005-110184 號(hào)。當(dāng)將算法或參數(shù)集表示為"A,,時(shí),如下定義背景顏色校正處理
八={背景顏色移除、背景清除、不做任何事情}
空間過(guò)濾處理有關(guān)于整個(gè)要被處理的目標(biāo)圖像的平滑處理、邊緣增強(qiáng)處理 以及自適應(yīng)過(guò)濾。在自適應(yīng)過(guò)濾中,每個(gè)像素執(zhí)行不同的處理。自適應(yīng)過(guò)濾的
詳細(xì)描述在例如日本專(zhuān)利申請(qǐng)公開(kāi)第2003-281526號(hào)中公開(kāi)。如下定義空間過(guò) 濾處理
A-(平滑處理、邊緣增強(qiáng)處理、自適應(yīng)過(guò)濾、不做任何事情} 分辨率擴(kuò)展處理有例如日本專(zhuān)利申請(qǐng)公開(kāi)第2005-063055號(hào)中公開(kāi)的增加 字符的分辨率的處理以及正常圖像內(nèi)插。如下定義分辨率擴(kuò)展處理 A-(字符分辨率的增加、圖像內(nèi)插、不做任何事情}
的關(guān)于與每個(gè)用戶(指定給用戶的每個(gè)用戶ID)相關(guān)的預(yù)定圖像數(shù)據(jù)的處理 內(nèi)容。歷史DB 110在其中以時(shí)間順序存儲(chǔ)特征和處理內(nèi)容的組合,其中處理 內(nèi)容是由用戶指定的。換句話說(shuō),歷史DB 110在其中存儲(chǔ)歷史信息H, H表 示為
H={(x(l),a(l)),(X(2),a(2))} (1)
其中"x(k)"表示從圖像數(shù)據(jù)的第k個(gè)集中提取的特征,以及"a(W(aeJ)" 表示算法或處理參數(shù),即,適用于圖像數(shù)據(jù)的處理內(nèi)容。
預(yù)測(cè)函數(shù)創(chuàng)建單元120基于存儲(chǔ)在歷史DB 110中的特征和處理內(nèi)容對(duì)于 新獲得的圖像數(shù)據(jù)創(chuàng)建預(yù)測(cè)函數(shù)用以識(shí)別處理內(nèi)容。
處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單元)122包括特征計(jì)算單元102以及 預(yù)測(cè)函數(shù)創(chuàng)建單元120。處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單元)122基于由 特征計(jì)算單元102計(jì)算的特征和由預(yù)測(cè)函數(shù)創(chuàng)建單元120創(chuàng)建的預(yù)測(cè)函數(shù)預(yù)測(cè) 對(duì)于進(jìn)行預(yù)測(cè)的目標(biāo)圖像數(shù)據(jù)的最優(yōu)處理內(nèi)容。
處理內(nèi)容輸出單元124在顯示屏幕上顯示由處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容 獲取單元)122預(yù)測(cè)的最優(yōu)處理內(nèi)容。
圖像處理單元126根據(jù)由規(guī)范接收單元104接收的處理內(nèi)容的規(guī)范來(lái)對(duì)圖 像數(shù)據(jù)執(zhí)行圖像處理。
變化檢測(cè)單元130檢測(cè)在第一周期內(nèi)存儲(chǔ)在歷史DB 110中的圖像數(shù)據(jù)和 處理內(nèi)容之間的第一關(guān)系和在第一周期之后的第二周期內(nèi)存儲(chǔ)在歷史DB 110 中的圖像數(shù)據(jù)和處理內(nèi)容之間的第二關(guān)系之間是否具有任何變化。該圖像數(shù)據(jù)
包括圖像數(shù)據(jù)的特征。
更新單元132基于變化檢測(cè)單元130的檢測(cè)結(jié)果來(lái)更新歷史DB 110中存 儲(chǔ)的內(nèi)容。
圖3是由圖像處理設(shè)備1執(zhí)行的在歷史DB 110中存儲(chǔ)特征矢量和處理內(nèi) 容的歷史存儲(chǔ)處理的流程圖。首先,圖像數(shù)據(jù)獲取單元100獲取圖像數(shù)據(jù)(步 驟S100)。然后,特征計(jì)算單元102計(jì)算由圖像數(shù)據(jù)獲取單元100獲取的圖像 數(shù)據(jù)的特征矢量(步驟S102)。規(guī)范接收單元104接收關(guān)于由圖像數(shù)據(jù)獲取單 元IOO獲取的圖像數(shù)據(jù)的圖像處理的處理內(nèi)容的規(guī)范(步驟S104)。
由特征計(jì)算單元102計(jì)算的特征矢量和由規(guī)范接收單元104接收的指定處 理內(nèi)容以相關(guān)聯(lián)的形式存儲(chǔ)在歷史DB 110中(步驟S106)。即,將"x(k)a(k)" 加入到歷史信息H中。圖像處理單元126根據(jù)指定的處理內(nèi)容對(duì)圖像數(shù)據(jù)執(zhí) 行圖像處理(步驟S108)。
圖4是用于詳細(xì)說(shuō)明圖3所示的歷史存儲(chǔ)處理中的特征計(jì)算處理(步驟 S102 )的流程圖。特征計(jì)算單元102將由圖像數(shù)據(jù)獲取單元100獲取的圖像數(shù) 據(jù)全部劃分為相等尺寸的正方形塊(步驟SllO)。詳細(xì)地,特征計(jì)算單元102 將圖像數(shù)據(jù)劃分為例如,1平方厘米(lcm x lcm)的相等尺寸的正方形塊,(即, 在每英寸200點(diǎn)(dpi)的分辨率下為80 x 80像素,或者在300 dpi的分辨率 下為120x 120像素)。
將每個(gè)塊分類(lèi)為下面三種類(lèi)型的任一個(gè)"圖片"、"字符"和"其他"(步 驟S112)。詳細(xì)地,如圖5所示的流程圖所描述,創(chuàng)建圖像I,其要被處理的 目標(biāo)圖像塊的分辨率被降低為大約100 dpi的低分辨率(步驟S120),并且同 時(shí),設(shè)置分辨率級(jí)別L (步驟S122 ),并且初始化分辨率降低級(jí)別k (k— 0 ) (步驟S124 )。執(zhí)行步驟S120到S124的處理來(lái)不僅從圖像I,而且從如圖6 所示分辨率降低為低分辨率的圖像中提取特征。例如,當(dāng)將分辨率級(jí)別L設(shè) 置為2時(shí),從圖像I、具有圖像I的一半分辨率的圖像I,以及具有圖像I的四 分之一分辨率的圖像12中的每個(gè)提取特征。
當(dāng)分辨率降低級(jí)別k沒(méi)有達(dá)到分辨率級(jí)別L時(shí)(在步驟S126為是),創(chuàng) 建分辨率為步驟S120中創(chuàng)建的圖像I的分辨率的1/2k的圖像Ik (步驟S128)。 然后,將圖像Ik二進(jìn)制化(步驟S130)。在二進(jìn)制化的圖像中,假設(shè)由l表示黑色像素,并且由0表示白色像素。
在從具有分辨率為1&的二進(jìn)制化的圖像Ik獲得M維的特征矢量fk之后 (步驟S132 ),分辨率降低級(jí)別k增加1 (k— k+l)(步驟S134 )。
下面描述從圖像Ik ( k=0, ..., L )被二進(jìn)制化的圖像中提取特征的方法。當(dāng) 屏幕上的目標(biāo)圖像被稱(chēng)為圖像I(r)時(shí),對(duì)于位移矢量(S,S2,...,SN)將自相關(guān) 函數(shù)擴(kuò)展為高階(N階)的"高階自相關(guān)函數(shù)(N階自相關(guān)函數(shù))"被定義為
<formula>complex formula see original document page 12</formula>(2 )
其中和Z是整+圖像的像素"r"的總和。因此,根據(jù)階數(shù)或者位移矢量 (SbS2, ...,SN)從圖像中獲得無(wú)限數(shù)目的高階自相關(guān)函數(shù)。在本實(shí)施例中, 由于簡(jiǎn)化的原因?qū)⒏唠A自相關(guān)函數(shù)的階數(shù)N假設(shè)為最大為2,并且也將位移矢 量限制為在參考像素r周?chē)恢蒙?x3像素的區(qū)域。如圖7所示,當(dāng)由于并 行位移的相同特征被消除的時(shí)候,關(guān)于二進(jìn)制化的圖像的特征數(shù)目的總和為 25??梢杂萌缦路绞竭M(jìn)行每個(gè)特征的計(jì)算將對(duì)應(yīng)于本地圖案的像素的積累加 關(guān)于整個(gè)圖像的次數(shù)。例如,以如下方式計(jì)算本地圖案"No. 3"的特征計(jì) 算參考像素r的灰度值以及對(duì)于整個(gè)圖像位于參考像素r的緊右邊的像素的灰 度值的乘積和(product sum)。通過(guò)這種方式,從分辨率為1/2k的圖像將25維 (M=25)特征矢量fk計(jì)算為
<formula>complex formula see original document page 12</formula> (3)
重復(fù)步驟S128到S134的處理直到在步驟S134增加的分辨率降低級(jí)別k 超過(guò)了分辨率級(jí)別L。
當(dāng)在步驟S134增加的分辨率降低級(jí)別k超過(guò)了分辨率級(jí)別L時(shí)(步驟S126 為否),基于特征矢量fo,...,fl將該塊分類(lèi)為下面三種類(lèi)型的任一個(gè)"圖片"、 "字符"以及"其他"(步驟S136)。
下面詳細(xì)描述對(duì)塊進(jìn)行分類(lèi)的方法。首先,基于25維特征矢量<formula>complex formula see original document page 12</formula>創(chuàng)建 (25 x L ) 維特征矢量<formula>complex formula see original document page 12</formula>。為了基于特征矢量X來(lái)分類(lèi)塊,必須預(yù)先 提供學(xué)習(xí)函數(shù)。在本實(shí)施例中,將用于學(xué)習(xí)函數(shù)的數(shù)據(jù)分為兩類(lèi),即,僅包括 字符的數(shù)據(jù)和不包括字符的其他數(shù)據(jù),來(lái)計(jì)算特征矢量x。此后,預(yù)先計(jì)算包 括字符的數(shù)據(jù)的像素(此后稱(chēng)為"字符像素")的平均特征矢量po以及其他數(shù)據(jù)的像素(此后稱(chēng)為"非字符像素")的平均特征矢量p,。從要被分類(lèi)的圖像 塊獲得的特征矢量X被細(xì)分為給定特征矢量po和Pl的線性組合,使得它們的
組合系數(shù)ao和a!可以表示字符像素和非字符像素之間的比率,或者"字符的
概率"或"非字符的概率"。當(dāng)基于高階本地自相關(guān)的特征在屏幕的目標(biāo)位置 保持不變并且還具有關(guān)于目標(biāo)數(shù)目的可加性時(shí),可以進(jìn)行上述細(xì)分。如下細(xì)分
特征矢量x:
X = ao A) + ao i = A a + e ( 4 )
其中,"e"表示矢量誤差,"F"被定義為
<formula>complex formula see original document page 13</formula> (5) 通過(guò)最小平方方法,如下獲得最優(yōu)組合系數(shù)矢量"a": <formula>complex formula see original document page 13</formula> (6)
對(duì)于每個(gè)塊的表示"非字符的概率"的參數(shù)a,應(yīng)用閾值處理,由此每個(gè)塊 被分配為"圖片"、"非圖片"和"未知"的任一個(gè)。當(dāng)塊被分類(lèi)為"未知"和 "非圖片"的任一個(gè),并且指示"字符的概率"的參數(shù)ao超過(guò)閾值時(shí),該塊 被分類(lèi)為"字符"。當(dāng)塊被分類(lèi)為"未知"和"非圖片,,的任一個(gè),并且參數(shù) ao沒(méi)有超過(guò)閾值時(shí),該塊被分類(lèi)為"其他"。圖8是已分類(lèi)的塊的例子的圖案 圖。在圖8所示的例子中,黑色部分表示"字符",灰色部分表示"圖片",以 及白色部分表示"其他"。
返回圖4所示的流程圖的說(shuō)明,在每個(gè)塊被分類(lèi)為如下三種類(lèi)型,即"圖 片"、"字符"或"其他"中的任一個(gè)時(shí),基于所有塊的分類(lèi)的結(jié)果計(jì)算大約二 十個(gè)圖像特征(步驟S114)。例如,圖像特征有字符和圖片的比率、布局密度 (將字符和圖片壓縮到窄的空間的程度)、以及字符和圖片的分散程度(字符 和圖片分散分布的程度)。詳細(xì)地,將下面五個(gè)值計(jì)算為圖像特征。特征計(jì)算 單元102計(jì)算包括但不限于這五個(gè)值的不同圖像特征。特征計(jì)算單元102提取 大約二十個(gè)特征,即,大約20維特征。從創(chuàng)建基于處理內(nèi)容的規(guī)范的歷史由 各種用戶選擇最優(yōu)處理內(nèi)容的預(yù)測(cè)函數(shù)的觀點(diǎn),優(yōu)選地使用盡可能多的特征。
1. 字符比率i /s
:被分類(lèi)為"字符,,的塊和所有塊的比率
2. 非字符比率及;;e
:被分類(lèi)為"圖片,,的塊和所有塊的比率
3. 布局密度Z)e[O,l]:被分類(lèi)為"字符"和"圖片"的塊的區(qū)域之和除以繪畫(huà)區(qū)i或
4. 字符的分散程度St(X)):關(guān)于在x和y方向的字符塊的空間分布,用圖 像的區(qū)域來(lái)標(biāo)準(zhǔn)化方差-協(xié)方差矩陣
5. 非字符的分散程度Sp(X)):關(guān)于在x和y方向的圖片塊的空間分布,用 困像的區(qū)域來(lái)標(biāo)準(zhǔn)化方差-協(xié)方差矩陣
圖9是存儲(chǔ)在歷史DB 110中的歷史信息的例子的表格。在圖9所示的例 子中,圖像數(shù)據(jù)、從圖像數(shù)據(jù)中獲得的特征以及對(duì)于圖像數(shù)據(jù)指定的處理內(nèi)容 以相關(guān)聯(lián)的形式存儲(chǔ)。例如,對(duì)于圖像數(shù)據(jù)指定的處理內(nèi)容有背景顏色校正處 理(背景顏色移除、背景清除)、空間過(guò)濾處理(平滑處理、邊緣增強(qiáng)處理、 自適應(yīng)過(guò)濾)以及分辨率擴(kuò)展處理(字符分辨率的增加、圖像內(nèi)插)(見(jiàn)圖10)。 此外,如圖IO所示,對(duì)于圖像數(shù)據(jù)指定的處理內(nèi)容不僅包括處理內(nèi)容,而且 包括參數(shù)。例如,"背景顏色移除3"中的3和"邊緣增強(qiáng)1"中的l分別表示 參數(shù)。
圖11是基于預(yù)測(cè)函數(shù)用于向用戶呈現(xiàn)最優(yōu)處理內(nèi)容的處理內(nèi)容預(yù)測(cè)處理 的流程圖。當(dāng)使用關(guān)于預(yù)定集合的圖像數(shù)據(jù)的歷史信息H,例如20個(gè)集合的 圖像數(shù)據(jù)時(shí),可以得到最優(yōu)預(yù)測(cè)函數(shù)。因此,當(dāng)存儲(chǔ)關(guān)于預(yù)定集合的圖像數(shù)據(jù) 的歷史信息H時(shí),處理內(nèi)容預(yù)測(cè)處理被初始化。
首先,基于存儲(chǔ)在歷史DB IIO中的歷史信息H,預(yù)測(cè)函數(shù)創(chuàng)建單元120 創(chuàng)建用于預(yù)測(cè)關(guān)于圖像數(shù)據(jù)的處理內(nèi)容的預(yù)測(cè)函數(shù)(步驟S200)。預(yù)測(cè)函數(shù)是 由學(xué)習(xí)函數(shù)從歷史信息H中獲得的函數(shù)。換句話說(shuō),存儲(chǔ)在歷史DB110中的 歷史信息H被用作學(xué)習(xí)數(shù)據(jù)集以創(chuàng)建預(yù)測(cè)函數(shù)?;诩訖?quán)的距離的學(xué)習(xí)由最 近鄰算法的應(yīng)用來(lái)創(chuàng)建預(yù)測(cè)函數(shù)。
當(dāng)獲得表示圖像內(nèi)容的特征集F、表示處理內(nèi)容和參數(shù)的算法集A以及歷 史信息H時(shí),指示關(guān)于從給定未知的圖像數(shù)據(jù)獲得特征x的算法ae^的適用 性/Ja,x,w)的函數(shù)"f,被創(chuàng)建為預(yù)測(cè)函數(shù),函數(shù)厶表示為
/wjxi^xf/~~>i (R是實(shí)數(shù)) (7)
每個(gè)算法集A創(chuàng)建不同的函數(shù)/"換句話說(shuō),"背景顏色校正處理,,的算 法集A的函數(shù)^和"空間過(guò)濾處理"的算法集A的函數(shù)^是不同的。
然而,存在下面的技術(shù)問(wèn)題?;谪惾~斯分類(lèi)技術(shù),當(dāng)用"u"表示用戶,"x,,表示圖像特征以及"a"表示處理時(shí),適用性/^(a,x,w)可以由如下公式表 述
/ (+,x) = p(a|w). ; (x|ar,w)/j9(x|w) = _p(xla,wVZ "P(+) . ( 8 )
其中是圖像的標(biāo)準(zhǔn)化因子。因此,當(dāng)確定多個(gè)處理a的優(yōu)先級(jí) 時(shí),可以忽略標(biāo)準(zhǔn)化因子"K+)"。在這種情況下,如下獲得適用性A(",Jc,"): /w(a,x,w) = 7 (a|w) (x|Q;,w) (9)
可以從歷史信息H中容易地得到標(biāo)準(zhǔn)化因子'>(+)"。每個(gè)處理內(nèi)容和 該處理由每個(gè)用戶指定的次數(shù)一起存儲(chǔ)。用戶u向其應(yīng)用處理內(nèi)容a的圖像的 特征分布p(x|a, w)被稱(chēng)為歷史信息H。
然而,當(dāng)創(chuàng)建預(yù)測(cè)函數(shù)時(shí),需要考慮以下四點(diǎn)
1. 存儲(chǔ)在歷史DB 110中的歷史信息H依賴于圖像處理設(shè)備1的用戶的偏 好和任務(wù)。
2. 應(yīng)該假設(shè)在圖像處理設(shè)備1中,用于學(xué)習(xí)的歷史信息相對(duì)少(幾十至 幾百個(gè)集合的數(shù)據(jù))。這是因?yàn)樾枰F(xiàn)場(chǎng)支持以通過(guò)從盡可能少的數(shù)據(jù)中讀取 用戶的偏好或任務(wù)來(lái)立刻響應(yīng)。
3. 特征空間是多維(大約20維)空間。因此,僅選擇適于預(yù)測(cè)的特征, 使得必須提供特征選擇機(jī)制以消除干擾因素,或者加權(quán)每個(gè)特征維數(shù)。此外, 必須考慮適于預(yù)測(cè)的特征子集根據(jù)要被選擇的單個(gè)對(duì)象或用戶的不同而不同。
4. 特征是連續(xù)和多維的特征。此外,數(shù)據(jù)集的數(shù)目是少的。在這種情況 下,獲得特征分布/7(+,")是非常困難的。由于"維數(shù)的原因",通過(guò)非參數(shù) Parzen窗的應(yīng)用或用于假設(shè)高斯混合模型的最大期望(EM)算法來(lái)估計(jì)特征
分布pOl",w)是困難的。
另一方面,最近鄰算法適用于現(xiàn)場(chǎng)學(xué)習(xí)。最近鄰算法是使用與當(dāng)前處理的 情況最相似的過(guò)去情況的預(yù)測(cè)方法,使得當(dāng)相似數(shù)據(jù)的集的數(shù)目增加時(shí),預(yù)測(cè) 正確度增加。此外,最近鄰算法是圖案識(shí)別方法,其不需要例如高斯分布的概 率分布的估計(jì)。
關(guān)于少的學(xué)習(xí)數(shù)據(jù)和多維特征的問(wèn)題,可以以如下方式解決數(shù)據(jù)的集數(shù)和 維數(shù)之間的難題根據(jù)對(duì)每個(gè)特征維數(shù)預(yù)測(cè)的貢獻(xiàn)程度和每個(gè)學(xué)習(xí)數(shù)據(jù)的重要 程度(特征和處理內(nèi)容的組合)來(lái)加權(quán)最近鄰算法中的距離標(biāo)尺(scale )。由此,在本實(shí)施例中,應(yīng)用基于加權(quán)距離的學(xué)習(xí)的最近鄰算法。
在基于加權(quán)距離的學(xué)習(xí)的最近鄰算法中,當(dāng)計(jì)算原型點(diǎn)和預(yù)測(cè)的目標(biāo)點(diǎn)之
間的距離時(shí),計(jì)算的不是筒單的歐幾里德距離,而是計(jì)算根據(jù)原型點(diǎn)的重要程
度和預(yù)測(cè)的目標(biāo)點(diǎn)的重要程度的加權(quán)的距離。
等式(10)中定義了第i個(gè)原型點(diǎn)Xi,以及等式(11)中定義了預(yù)測(cè)的目
標(biāo)點(diǎn),即,要被識(shí)別的給定點(diǎn)"y"。在這種情況下,原型點(diǎn)Xi對(duì)應(yīng)于包括在歷
史信息H中的每個(gè)特征a,以及給定點(diǎn)y對(duì)應(yīng)于從目標(biāo)圖像數(shù)據(jù)獲得的特征a。 ;c,.= .......,x,.》 (10 )
……力) (11) 此外,假設(shè)類(lèi)被稱(chēng)作"c"。類(lèi)表示集A中的一項(xiàng),即,算法的索引(index)
或要被應(yīng)用的處理參數(shù)。每個(gè)原型點(diǎn)Xi與指示用戶指定的類(lèi)的類(lèi)信息相關(guān)聯(lián)。 基于關(guān)于類(lèi)C的第j個(gè)特征維數(shù)的權(quán)重Wej和第i個(gè)原型點(diǎn)Xi的權(quán)重Vi,
第i個(gè)原型點(diǎn)Xj和給定點(diǎn)y之間的距離的平方(A) (A(y, xi))根據(jù)等式U2) 計(jì)算。
1 J
A(M)7lXO;廣x'))2
v' 乂-' (12)
當(dāng)假設(shè)特征維數(shù)由"d,,表示,數(shù)據(jù)集的數(shù)目由"N"表示,以及類(lèi)號(hào)由 "C"表示,參數(shù)的數(shù)目是原型點(diǎn)權(quán)重"N"和由每個(gè)類(lèi)確定的每維的權(quán)重"Cd" 之和。即,參數(shù)的數(shù)目由"N + Cd"得到。
等式(12)中的權(quán)重Vi和wcj是通過(guò)學(xué)習(xí)函數(shù)從數(shù)據(jù)中自動(dòng)獲得的。作為 學(xué)習(xí)準(zhǔn)則,將由排一 (leave-one-out)方法評(píng)估的誤差率最小化。詳細(xì)地,通
過(guò)學(xué)習(xí)函數(shù)在下面四個(gè)準(zhǔn)則下使用最速下降方法來(lái)獲得權(quán)重Vj和wcj。
1. 假設(shè)在相同類(lèi)中作為預(yù)定的原型點(diǎn)的點(diǎn)是稀疏分布的,并且根據(jù)存在 或不存在原型點(diǎn)識(shí)別結(jié)果不同。在這種情況下,可以確定原型點(diǎn)對(duì)于處理內(nèi)容 的預(yù)測(cè)函數(shù)有很大的影響,即,原型點(diǎn)具有很高的重要程度。因此,為了擴(kuò)展
原型點(diǎn)影響的區(qū)域,增加權(quán)重Vi。
2. 假設(shè)在相同類(lèi)中的作為預(yù)定的原型點(diǎn)的點(diǎn)是密集的,并且由于原型點(diǎn) 的存在引起的對(duì)于辨識(shí)結(jié)果的影響程度是低的。在這種情況下,可以確定原型 點(diǎn)具有低的重要性。因此,減少權(quán)重Vi。
3. 對(duì)于預(yù)定類(lèi)C,當(dāng)?shù)趈個(gè)特征維數(shù)極大地影響預(yù)測(cè)時(shí),增加權(quán)重Wcj。
4. 對(duì)于類(lèi)c,當(dāng)?shù)趈個(gè)特征維數(shù)是干擾預(yù)測(cè)的因子時(shí),權(quán)重wcj小得趨近于零。
在R. Parede和E. Vidal于2006年7月發(fā)表在正EE Transactions on Pattern Analysis and Machine Intelligence,第28巻,第7期,1100-1110頁(yè)的"Learning weighted metrics to minimize nearest-neighbor classification error" 中描述了基于 加權(quán)距離的學(xué)習(xí)的最近鄰算法。
在創(chuàng)建了預(yù)測(cè)函數(shù)之后,圖像數(shù)據(jù)獲取單元100獲取經(jīng)過(guò)預(yù)測(cè)的目標(biāo)圖像 數(shù)據(jù)(在步驟S202中為是),以及特征計(jì)算單元102計(jì)算由圖像數(shù)據(jù)獲取單元 100獲取的目標(biāo)圖像數(shù)據(jù)的特征(步驟S204 )。以與圖4所示的特征計(jì)算處理 相同的方式執(zhí)行特征的計(jì)算。
然后,處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單元)122預(yù)測(cè)關(guān)于目標(biāo)圖像數(shù) 據(jù)的最優(yōu)處理內(nèi)容(步驟S206)。詳細(xì)地,處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取 單元)122輸入由特征接收單元102計(jì)算的關(guān)于目標(biāo)圖像數(shù)據(jù)的特征,并且預(yù) 測(cè)最優(yōu)的處理內(nèi)容,即,基于預(yù)測(cè)函數(shù)預(yù)測(cè)關(guān)于目標(biāo)圖像數(shù)據(jù)的算法或處理參 數(shù)?;陬A(yù)測(cè)函數(shù)創(chuàng)建單元120獲得的第i個(gè)原型點(diǎn)Xi的權(quán)重Vi和關(guān)于類(lèi)c
的第j個(gè)特征維數(shù)的權(quán)重Wej,第i個(gè)原型點(diǎn)Xj (第i個(gè)原型點(diǎn)Xi的類(lèi)級(jí)是C)
和從目標(biāo)圖像數(shù)據(jù)中獲得的特征y之間的距離的平方(A)根據(jù)等式(12)計(jì) 算。處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單元)122識(shí)別原型點(diǎn)和預(yù)測(cè)目標(biāo)點(diǎn)之 間的距離最小化的這樣的原型點(diǎn)。然后,處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單 元)122識(shí)別在類(lèi)級(jí)中的特征的推薦算法或推薦參數(shù)。
換句話說(shuō),從存儲(chǔ)在歷史DB 110中的圖像數(shù)據(jù)的特征中提取目標(biāo)圖像數(shù)
據(jù)的特征的最適當(dāng)特征。處理內(nèi)容預(yù)測(cè)單元(處理內(nèi)容獲取單元)122將與最 適當(dāng)特征相關(guān)的處理內(nèi)容a預(yù)測(cè)為關(guān)于目標(biāo)圖像數(shù)據(jù)的最優(yōu)處理內(nèi)容,并且從 歷史DB 110中獲:f又處理內(nèi)容a。
取的最優(yōu)處理內(nèi)容a呈現(xiàn)給用戶(步驟S208)。
以這種方式,將最優(yōu)處理內(nèi)容呈現(xiàn)給用戶。如果處理內(nèi)容是期望的處理內(nèi) 容,用戶選擇處理內(nèi)容以應(yīng)用該處理內(nèi)容至圖像數(shù)據(jù)。因此,用戶可以避免每
次輸入圖像數(shù)據(jù)都要輸入處理內(nèi)容或參數(shù)的麻煩。
另一方面,如果呈現(xiàn)的處理內(nèi)容不是期望的處理內(nèi)容,用戶可以通過(guò)例如 鍵盤(pán)或鼠標(biāo)的用戶接口指定另 一個(gè)最優(yōu)的處理內(nèi)容或參數(shù)。
當(dāng)規(guī)范接收單元104從用戶接收處理內(nèi)容變化的規(guī)范以及用戶ID時(shí)(步 驟S210為是),規(guī)范接收單元104根據(jù)規(guī)范更新歷史DB 110的內(nèi)容(步驟 S212)。在這種情況下,變化的規(guī)范表示和呈現(xiàn)的處理內(nèi)容不同的處理內(nèi)容要 被應(yīng)用至圖像數(shù)據(jù)。變化的規(guī)范包括用戶指定將呈現(xiàn)的處理內(nèi)容改變成的處理 內(nèi)容。詳細(xì)地,將從包括在變化的規(guī)范中的目標(biāo)圖像數(shù)據(jù)和處理內(nèi)容中獲得的 特征新加入到歷史信息H中。當(dāng)規(guī)范接收單元104沒(méi)有接收任何變化的規(guī)范 時(shí)(在步驟S210為否),處理控制進(jìn)行至步驟S214。
根據(jù)指定的處理內(nèi)容,對(duì)于目標(biāo)圖像數(shù)據(jù)執(zhí)行圖像處理(步驟S214)。當(dāng) 到了更新學(xué)習(xí)數(shù)據(jù)集的時(shí)候(步驟S216為是),變化檢測(cè)單元130檢測(cè)在偏好 中是否存在任何改變,并且更新數(shù)據(jù)集(步驟S218)。然后,處理控制再次返 回至步驟S202。例如,從上次更新學(xué)習(xí)數(shù)據(jù)集的時(shí)間開(kāi)始經(jīng)過(guò)預(yù)定的時(shí)間, 建立更新學(xué)習(xí)數(shù)據(jù)的定時(shí)。
可選地,例如,當(dāng)設(shè)置學(xué)習(xí)數(shù)據(jù)集之后或更新學(xué)習(xí)數(shù)據(jù)集之后將關(guān)于圖像 數(shù)據(jù)的預(yù)定集的處理內(nèi)容和特征的組合新加入到歷史DB 110時(shí),也可能更新 學(xué)習(xí)數(shù)據(jù)集。
此外,也可以在每次將關(guān)于圖像數(shù)據(jù)的特征和處理內(nèi)容的組合新加入歷史 DB110時(shí)更新學(xué)習(xí)數(shù)據(jù)集。以這種方式,只要是預(yù)定的定時(shí),更新的定時(shí)可以 被設(shè)置為任意定時(shí)。
圖12是用于詳細(xì)說(shuō)明如圖ll所示的處理內(nèi)容預(yù)測(cè)處理中的偏好變化檢測(cè) 處理和學(xué)習(xí)數(shù)據(jù)集更新處理(步驟S218)的流程圖。通過(guò)檢測(cè)與指定的圖像 數(shù)據(jù)的處理內(nèi)容不同的處理內(nèi)容是否和具有與指定的圖像數(shù)據(jù)的特征相似的 特征的圖像數(shù)據(jù)相結(jié)合,變化檢測(cè)單元130檢測(cè)偏好中是否有任何變化。
預(yù)先設(shè)定在原來(lái)創(chuàng)建預(yù)測(cè)函數(shù)(步驟S200或S224 )時(shí)使用的學(xué)習(xí)數(shù)據(jù)集 To。此外,設(shè)定在原來(lái)創(chuàng)建預(yù)測(cè)函數(shù)之后加入到歷史DB 110中的歷史信息H 中的數(shù)據(jù)集T,(步驟S220)?;趯W(xué)習(xí)數(shù)據(jù)集To創(chuàng)建的預(yù)測(cè)函數(shù)被稱(chēng)為"Po"。 學(xué)習(xí)數(shù)據(jù)集To表示為r。二((x^,):x,表示特征,yi表示選定的情況(處理內(nèi)容)} (13) 隨后,^r測(cè)誤差數(shù)據(jù)F (步驟S222 )。詳細(xì)地,通過(guò)最近鄰算法的應(yīng)用, 從滿足"r。ur,"(排一方法)的因子中獲得除了學(xué)習(xí)數(shù)據(jù)集To和數(shù)據(jù)集T,之
外的最適當(dāng)數(shù)據(jù)。此時(shí),"r。u7;"被編入索引。詳細(xì)地,從l到lr。1被稱(chēng)為
學(xué)習(xí)數(shù)據(jù)集To的因子,并且從l ^1+1到1 "被稱(chēng)為數(shù)據(jù)集T,的因子。
由等式(14)獲得誤差數(shù)據(jù)F。在這種情況下,誤差數(shù)據(jù)F表示不能被最
近鄰算法正確識(shí)別的數(shù)據(jù)。換句話說(shuō),誤差數(shù)據(jù)F是使得與除了與實(shí)際選擇的
處理內(nèi)容不同的數(shù)據(jù)之外的最適當(dāng)數(shù)據(jù)相關(guān)聯(lián)存儲(chǔ)的選定情況(處理內(nèi)容)的數(shù)據(jù)。
尸={((^,^:/表示錯(cuò)誤數(shù)據(jù)的索引, i yi表示關(guān)于i的正確數(shù)據(jù),k表示關(guān)于i的最近鄰點(diǎn)的索引)》
然后,檢測(cè)相互矛盾的數(shù)據(jù)集的組合S (步驟S224)。組合S是這樣的數(shù) 據(jù)集的組合雖然數(shù)據(jù)間的距離不遠(yuǎn),數(shù)據(jù)之間的學(xué)習(xí)數(shù)據(jù)集To和數(shù)據(jù)集T, 的選擇不同。換句話說(shuō),組合S是這樣的數(shù)據(jù)集的組合雖然每個(gè)數(shù)據(jù)的特征 是近似的,但是數(shù)據(jù)之間與每個(gè)特征相關(guān)的處理內(nèi)容不同。
組合S的定義如下
S =他"(f, 乂 F,力,/) e F, 乂. -力,K |r。 |& "|r。 |} (15)
其中"i"和"k"是組合S中的彼此的最近鄰點(diǎn),其各自屬于學(xué)習(xí)數(shù)據(jù)集 To和數(shù)據(jù)集T,。然而,選定的情況在"i"和"k"之間不同,使得當(dāng)學(xué)習(xí)數(shù)據(jù) 集To和數(shù)據(jù)集!^相互組合時(shí),學(xué)習(xí)數(shù)據(jù)集To和數(shù)據(jù)集T,之間相互負(fù)影響。 因此,這被確定為彼此矛盾的數(shù)據(jù)集的組合。
圖13是用于說(shuō)明組合S的示意圖。在圖13中,白色點(diǎn)表示學(xué)習(xí)數(shù)據(jù)集 T0,黑色點(diǎn)表示數(shù)據(jù)集T"在學(xué)習(xí)數(shù)據(jù)集T。上的數(shù)據(jù)A和在數(shù)據(jù)集T,上的數(shù) 據(jù)B之間的距離被稱(chēng)為"d"。假設(shè)在以點(diǎn)A為圓心以d為半徑的圓和以點(diǎn)B 為圓心以d為半徑的圓的區(qū)域中沒(méi)有其他數(shù)據(jù),并且點(diǎn)A和點(diǎn)B之間選定的 情況不同。在這種情況下,將數(shù)據(jù)A和數(shù)據(jù)B的組合加入到集S。
返回到圖12所示的流程圖的說(shuō)明,檢測(cè)到組合S之后(步驟S224),從 包括在學(xué)習(xí)數(shù)據(jù)集To的數(shù)據(jù)中刪除包括在組合S中的舊的數(shù)據(jù)(步驟S226)。換句話說(shuō),執(zhí)行由等式(16)表示的處理。
T?!鸗。-{(xi, yi):(i, k) ∈S} ( 16)
然后,從其中刪除舊的數(shù)據(jù)并且組合數(shù)據(jù)集T!的學(xué)習(xí)數(shù)據(jù)集To的數(shù)據(jù)被 稱(chēng)為學(xué)習(xí)數(shù)據(jù)集。換句話說(shuō),學(xué)習(xí)數(shù)據(jù)集被更新(步驟S228 )。預(yù)測(cè)函數(shù)創(chuàng)建 單元120基于新設(shè)定的學(xué)習(xí)數(shù)據(jù)集來(lái)創(chuàng)建預(yù)測(cè)函數(shù)。換句話說(shuō),預(yù)測(cè)函數(shù)創(chuàng)建 單元120更新預(yù)測(cè)函數(shù)(步驟230)。預(yù)測(cè)函數(shù)的創(chuàng)建以與參考圖1所示的流 程圖的步驟S200中的預(yù)測(cè)函數(shù)創(chuàng)建處理相同的形式執(zhí)行。
當(dāng)組合S的數(shù)目等于或大于預(yù)定指定值時(shí)(步驟S232為是),判定在偏 好中有變化,并且輸出該判定來(lái)通知用戶(步驟S234)。另一方面,當(dāng)組合S 的數(shù)目小于指定值時(shí)(步驟S232為否),判定在偏好中沒(méi)有變化,并且輸出該 判定來(lái)通知用戶(步驟236)。然后,結(jié)束偏好變化檢測(cè)處理(步驟S218)。
上面描述的處理可能被改變或修改。
隨后,下面說(shuō)明根據(jù)本發(fā)明的第二實(shí)施例的圖像處理設(shè)備20。圖像處理 設(shè)備20對(duì)于多個(gè)目標(biāo)圖像數(shù)據(jù)集分批執(zhí)行處理內(nèi)容預(yù)測(cè)處理。圖14是圖像處 理設(shè)備20的功能框圖。圖像處理設(shè)備20和圖像處理設(shè)備1的不同之處在于圖 像處理設(shè)備20還包括處理結(jié)果存儲(chǔ)單元140以及處理結(jié)果顯示單元142。用 相同的附圖標(biāo)記表示與圖2相同的部分,并且省略這些部分的描述。處理結(jié)果 存儲(chǔ)單元140在其中存儲(chǔ)由圖像處理單元126執(zhí)行的圖像處理的處理結(jié)果。處 理結(jié)果顯示單元142顯示存儲(chǔ)在處理結(jié)果存儲(chǔ)單元140中的處理結(jié)果。
圖15是由圖像處理設(shè)備20執(zhí)行的處理內(nèi)容預(yù)測(cè)處理的流程圖。以相同的 附圖標(biāo)記表示和第一實(shí)施例的圖11中的步驟相同的步驟,并且省略這些步驟 的描述。在預(yù)測(cè)最優(yōu)處理內(nèi)容之后(步驟S206),根據(jù)預(yù)測(cè)的處理內(nèi)容對(duì)于每 個(gè)目標(biāo)圖像數(shù)據(jù)集實(shí)際執(zhí)行圖像處理(步驟S240 )。圖像處理的處理結(jié)果被存 儲(chǔ)在例如主存儲(chǔ)單元5中。當(dāng)還存在沒(méi)有執(zhí)行圖像處理的目標(biāo)圖像數(shù)據(jù)的任意 集時(shí)(在步驟S244為是),處理控制繼續(xù)至步驟S204以對(duì)于沒(méi)有執(zhí)行圖像處 理的目標(biāo)圖像數(shù)據(jù)執(zhí)行步驟S204到S242的處理。當(dāng)對(duì)于目標(biāo)圖像數(shù)據(jù)的所 有集執(zhí)行了圖像處理時(shí)(步驟S244為否),顯示目標(biāo)圖像數(shù)據(jù)的所有集的處理 結(jié)果(步驟S246)。然后,執(zhí)行步驟S210到S218的處理。
以這種方式,在根據(jù)第二實(shí)施例的圖像處理設(shè)備20中,顯示圖像處理的
處理結(jié)果,使得用戶可以確定是否基于處理結(jié)果改變處理內(nèi)容。此外,對(duì)于目 標(biāo)圖像數(shù)據(jù)的多個(gè)集成批執(zhí)行處理內(nèi)容預(yù)測(cè)處理,使得可以有效執(zhí)行處理。
圖16是根據(jù)本發(fā)明的第三實(shí)施例的多功能產(chǎn)品(MFP) 50的示意圖。 MFP 50包括掃描儀單元51作為圖像讀取單元,以及打印機(jī)單元52作為圖像 打印單元。MFP 50還包括圖像處理設(shè)備1。更詳細(xì)地,在圖像處理設(shè)備l中 的圖像數(shù)據(jù)獲取單元100獲取掃描儀單元51讀取的圖像的圖像數(shù)據(jù)作為目標(biāo) 圖像數(shù)據(jù)。圖像處理設(shè)備l執(zhí)行處理,用于預(yù)測(cè)要被應(yīng)用到獲取的圖像數(shù)據(jù)的 處理內(nèi)容。
除了上面描述的這些,MFP 50的配置和MFP 50執(zhí)行的處理與圖像處理 設(shè)備1的相同,省略了這些部分的描述。
圖17是根據(jù)本發(fā)明第四實(shí)施例的圖像處理系統(tǒng)60的系統(tǒng)配置圖。圖像處 理系統(tǒng)60是客戶服務(wù)器系統(tǒng),其中服務(wù)器計(jì)算機(jī)S通過(guò)網(wǎng)絡(luò)N連接至多個(gè)客 戶計(jì)算機(jī)C。服務(wù)器計(jì)算機(jī)S和圖像處理設(shè)備1執(zhí)行相同的處理。每個(gè)客戶計(jì) 算機(jī)C發(fā)送圖像至服務(wù)器計(jì)算機(jī)S。服務(wù)器計(jì)算機(jī)S包括和圖像處理設(shè)備1 相同的功能。網(wǎng)絡(luò)掃描儀NS連接至網(wǎng)絡(luò)N,使得服務(wù)器計(jì)算機(jī)S中的圖像數(shù) 據(jù)獲取單元100可以從每個(gè)客戶計(jì)算機(jī)C或網(wǎng)絡(luò)掃描儀NS獲取圖像數(shù)據(jù)。
歷史DB IIO可以存儲(chǔ)在其他計(jì)算機(jī),即除了服務(wù)器計(jì)算機(jī)S之外的計(jì)算 機(jī)的服務(wù)器(未顯示)中。
除了上面描述的這些,圖像處理系統(tǒng)60的配置和圖像處理系統(tǒng)60執(zhí)行的 處理與圖像處理設(shè)備l的相同,省略了這些部分的描述。
雖然為了完全和清楚地揭示本發(fā)明,通過(guò)特定實(shí)施例來(lái)描述本發(fā)明,附帶 的權(quán)利要求書(shū)并不因此受限,而是構(gòu)建為體現(xiàn)本領(lǐng)域的普通技術(shù)人員可以進(jìn)行 的所有修改和可選結(jié)構(gòu),其全部?jī)?nèi)容落入本發(fā)明的基本教義中。
權(quán)利要求
1.一種圖像處理設(shè)備,包括變化檢測(cè)單元,檢測(cè)第一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第一周期中第一圖像數(shù)據(jù)的特征和處理內(nèi)容的第一組合存儲(chǔ)在歷史信息存儲(chǔ)單元中,在第二周期中存儲(chǔ)相似于第一圖像數(shù)據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二周期在時(shí)間上晚于第一周期;歷史信息更新單元,當(dāng)變化檢測(cè)單元檢測(cè)到第一周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第一組合更新為第二組合;圖像數(shù)據(jù)獲取單元,獲取要被處理的目標(biāo)圖像數(shù)據(jù);處理內(nèi)容獲取單元,基于存儲(chǔ)在歷史信息存儲(chǔ)單元中的特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容;以及處理內(nèi)容輸出單元,輸出由處理內(nèi)容獲取單元獲取的處理內(nèi)容。
2. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中 處理內(nèi)容獲取單元包括預(yù)測(cè)函數(shù)創(chuàng)建單元,基于存儲(chǔ)在歷史信息存儲(chǔ)單元中的特征和處理內(nèi) 容的組合來(lái)創(chuàng)建用于預(yù)測(cè)目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容的預(yù)測(cè)函數(shù);以及 特征計(jì)算單元,計(jì)算目標(biāo)圖像數(shù)據(jù)的特征;并且處理內(nèi)容獲取單元基于由預(yù)測(cè)函數(shù)創(chuàng)建單元?jiǎng)?chuàng)建的預(yù)測(cè)函數(shù)和由特征計(jì) 算單元計(jì)算的特征來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容。
3. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,還包括 規(guī)范接收單元,從用戶接收用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容的規(guī)范,其中 變化檢測(cè)單元檢測(cè)對(duì)于由用戶指定的目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容是否存在處理內(nèi)容上的變化。
4. 根據(jù)權(quán)利要求2所述的圖像處理設(shè)備,其中預(yù)測(cè)函數(shù)創(chuàng)建單元?jiǎng)?chuàng)建預(yù) 測(cè)函數(shù),使得關(guān)于存儲(chǔ)在歷史信息存儲(chǔ)單元中的特征和處理內(nèi)容的組合的預(yù)測(cè) 的誤差被最小化。
5. 根據(jù)權(quán)利要求4所示的圖像處理設(shè)備,其中 特征包括多個(gè)特征,并且預(yù)測(cè)函數(shù)創(chuàng)建單元從多個(gè)特征中識(shí)別對(duì)于處理內(nèi)容的預(yù)測(cè)具有較大貢獻(xiàn)的第一特征,并創(chuàng)建預(yù)測(cè)函數(shù),使得第一特征的權(quán)重大于其他特征的權(quán)重。
6. 根據(jù)權(quán)利要求4所述的圖像處理設(shè)備,其中 組合包括多個(gè)組合,并且預(yù)測(cè)函數(shù)創(chuàng)建單元從多個(gè)組合中識(shí)別對(duì)于處理內(nèi)容的預(yù)測(cè)具有較大貢獻(xiàn)的第一組合,并創(chuàng)建預(yù)測(cè)函數(shù),使得第一組合的權(quán)重大于其他組合的權(quán)重。
7. 根據(jù)權(quán)利要求5所述的圖像處理設(shè)備,其中預(yù)測(cè)函數(shù)創(chuàng)建單元通過(guò)使用最近鄰算法結(jié)合加權(quán)的距離的學(xué)習(xí)來(lái)創(chuàng)建預(yù)測(cè)函數(shù)。
8. 根據(jù)權(quán)利要求4所述的圖像處理設(shè)備,其中預(yù)測(cè)函數(shù)創(chuàng)建單元通過(guò)使用最速下降方法來(lái)創(chuàng)建預(yù)測(cè)函數(shù)。
9. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中變化檢測(cè)單元檢測(cè)當(dāng)?shù)诙芷谝呀?jīng)過(guò)時(shí)是否存在處理內(nèi)容上的變化。
10. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中第二周期是其中預(yù)定數(shù)目的組合被存儲(chǔ)到了歷史信息存儲(chǔ)單元中的周期。
11. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中第二周期是預(yù)定的時(shí)間周期。
12. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,還包括圖像處理單元,根據(jù)處理內(nèi)容獲取單元獲取的處理內(nèi)容來(lái)對(duì)目標(biāo)圖像數(shù)據(jù)執(zhí)行圖像處理;以及輸出單元,輸出圖像處理單元的圖像處理的結(jié)果。
13. 根據(jù)權(quán)利要求1所述的圖像處理設(shè)備,其中歷史信息存儲(chǔ)單元中為每個(gè)用戶存儲(chǔ)了圖像數(shù)據(jù)的特征和處理內(nèi)容的組合。
14. 一種圖像處理方法,包括檢測(cè)第一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第 一周期中存儲(chǔ)第 一圖像數(shù)據(jù)的特征和處理內(nèi)容的第 一組合,在第二周期中存儲(chǔ)相似于第 一圖像數(shù)據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二周期在時(shí)間上晚于 第一周期;當(dāng)檢測(cè)到第 一周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第 一組合更新為第二組合;獲取要被處理的目標(biāo)圖像數(shù)據(jù);基于特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容;以及 輸出在獲取處理內(nèi)容中獲取的處理內(nèi)容。
15. —種包括計(jì)算機(jī)可用介質(zhì)的計(jì)算機(jī)程序產(chǎn)品,具有存儲(chǔ)在該介質(zhì)中的 計(jì)算機(jī)可讀程序代碼,當(dāng)執(zhí)行該代碼時(shí)使得計(jì)算機(jī)執(zhí)行檢測(cè)第一周期和第二周期之間在處理內(nèi)容上是否存在變化,在第一周期中 存儲(chǔ)第 一圖像數(shù)據(jù)的特征和處理內(nèi)容的第 一組合,在第二周期中存儲(chǔ)相似于第 一圖像數(shù)據(jù)的第二圖像數(shù)據(jù)的特征和處理內(nèi)容的組合,第二周期在時(shí)間上晚于 第一周期;當(dāng)檢測(cè)到第一周期和第二周期之間在處理內(nèi)容上的變化時(shí),將第一組合更 新為第二組合;獲取要被處理的目標(biāo)圖像數(shù)據(jù);基于特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容;以及 輸出在獲取處理內(nèi)容中獲取的處理內(nèi)容。
全文摘要
本發(fā)明提供一種用于處理圖像的設(shè)備、方法和計(jì)算機(jī)程序產(chǎn)品。圖像數(shù)據(jù)的特征和處理內(nèi)容的第一組合在第一周期內(nèi)存儲(chǔ)在存儲(chǔ)單元,以及圖像數(shù)據(jù)的特征和處理內(nèi)容的第二組合在時(shí)間上更晚的第二周期內(nèi)存儲(chǔ)在存儲(chǔ)單元。當(dāng)在第一周期和第二周期檢測(cè)到處理內(nèi)容的變化時(shí),更新單元將第一組合更新為第二組合。獲取單元基于存儲(chǔ)在存儲(chǔ)單元中的特征和處理內(nèi)容的組合來(lái)獲取用于目標(biāo)圖像數(shù)據(jù)的處理內(nèi)容。輸出單元輸出由獲取單元獲取的處理內(nèi)容。
文檔編號(hào)H04N1/40GK101344964SQ20081012804
公開(kāi)日2009年1月14日 申請(qǐng)日期2008年7月10日 優(yōu)先權(quán)日2007年7月12日
發(fā)明者西田廣文 申請(qǐng)人:株式會(huì)社理光