專利名稱:用于定位圖像中包含的圖片的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,更具體地涉及用于定位圖像中包含的圖片的方法和設(shè)備。
背景技術(shù):
在計(jì)算機(jī)的多種應(yīng)用中,例如在查看網(wǎng)絡(luò)頁(yè)面或者使用軟件的應(yīng)用中,計(jì)算機(jī)屏幕上顯示的圖像中通常包含一張或多 張獨(dú)立的圖片。在很多情況下,用戶希望獲取圖像中的圖片,而不關(guān)心屏幕中除圖片外的其他信息。但是,網(wǎng)站或者軟件本身通常不會(huì)主動(dòng)、直接地向用戶提供數(shù)據(jù)形式的圖片。目前,上述問題的一種解決方式是使用屏幕打印工具(例如,Windows環(huán)境中的PrintScreen功能)獲取整個(gè)屏幕的圖像,繼而使用圖像編輯工具對(duì)該整個(gè)屏幕的圖像進(jìn)行處理,以獲得圖像中用戶所需的獨(dú)立圖片。這種方式同時(shí)需要屏幕打印工具和圖像編輯工具的支持,對(duì)設(shè)備要求較高,并且操作較繁瑣。另外一種解決方式是交互式圖片截取,例如現(xiàn)有聊天軟件中使用的框定工具。用戶可以使用該工具手動(dòng)截取屏幕上的圖片。但是,用戶手動(dòng)截取圖片容易有操作誤差,選取圖片不準(zhǔn)確,從而導(dǎo)致圖片周圍產(chǎn)生毛邊。另外,在圖像中包含很多獨(dú)立圖片的情況下,上述兩種方式都需要用戶進(jìn)行大量繁瑣的操作,很難快速獲取圖像中的圖片。
發(fā)明內(nèi)容
因此,目前需要一種自動(dòng)、快速并且準(zhǔn)確地獲取圖像中包含的圖片的方法。為了解決上述問題之一,本發(fā)明公開了一種用于定位圖像中包含的圖片的方法和設(shè)備。根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于定位圖像中包含的圖片的方法,包括響應(yīng)于獲取圖片的指令,檢測(cè)圖像中的圖片邊緣;以及根據(jù)檢測(cè)到的圖片邊緣,定位圖像中包含的圖片。根據(jù)本發(fā)明的另一方面,提供了一種用于定位圖像中包含的圖片的設(shè)備,包括邊緣檢測(cè)裝置,用于響應(yīng)于獲取圖片的指令,檢測(cè)圖像中的圖片邊緣;以及圖片定位裝置,用于根據(jù)檢測(cè)到的圖片邊緣,定位圖像中包含的圖片。本發(fā)明提出的用于定位圖像中包含的圖片的方法和設(shè)備能夠自動(dòng)、快速地定位圖像中包含的圖片,簡(jiǎn)化用戶操作,并且增加圖片定位的準(zhǔn)確性。
通過對(duì)結(jié)合附圖所示出的實(shí)施方式進(jìn)行詳細(xì)說明,本發(fā)明的上述以及其他特征將更加明顯,本發(fā)明附圖中相同的標(biāo)號(hào)表示相同或相似的元素。在附圖中圖I示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于定位圖像中包含的圖片的方法的流程圖;
圖2示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的圖像的一個(gè)示例;圖3示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的包含邊框的圖片的一個(gè)示例;圖4示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的并置圖片的一個(gè)示例;圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于定位圖像中包含的圖片的設(shè)備的框圖;以及圖6示出了可以應(yīng)用本發(fā)明實(shí)施方式的計(jì)算機(jī)系統(tǒng)的框圖。
具體實(shí)施例方式在下文中,將參考附圖通過實(shí)施方式對(duì)本發(fā)明提供的用于定位圖像中包含的圖片的方法和設(shè)備進(jìn)行詳細(xì)的描述。圖I示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于定位圖像中包含的圖片的方法的流程圖。應(yīng)當(dāng)理解,方法100中記載的各個(gè)步驟可以按照不同的順序執(zhí)行,和/或并行執(zhí)行。此外,方法100可以包括附加的步驟和/或省略執(zhí)行示出的步驟。本發(fā)明的范圍在此方面不受限制。在步驟S101,響應(yīng)于獲取圖片的指令,檢測(cè)圖像中的圖片邊緣。應(yīng)當(dāng)注意,本說明書中所稱的圖像包括可以在計(jì)算機(jī)屏幕上顯示的各種圖像,例如,用戶瀏覽的網(wǎng)頁(yè)、軟件界面或者照片等的屏幕快照,以及由攝像頭、照相機(jī)、攝錄機(jī)等攝像設(shè)備或二維碼讀取器、掃描儀等圖像讀取設(shè)備產(chǎn)生的照片或者各種視頻數(shù)據(jù)流或文件。圖片是指圖像中包含的相對(duì)獨(dú)立的子部分,以上述圖像類型為例,圖片可以包括網(wǎng)頁(yè)中嵌入的電影海報(bào)、軟件界面上顯示圖表的區(qū)域以及照片背景中的宣傳畫等等。作為一個(gè)示例,可以根據(jù)圖片與圖像中其他部分的背景顏色、紋理的差異,或者根據(jù)圖片邊緣具有不同顏色或形狀而檢測(cè)到圖片的邊緣。在步驟S102,根據(jù)檢測(cè)到的圖片邊緣,定位圖像中包含的圖片。例如,可以通過確定圖片邊緣所包圍的區(qū)域來(lái)定位圖片。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,針對(duì)單色背景的情況,檢測(cè)圖片邊緣可以使用單色邊緣算法,例如可以包括掃描圖像中的像素,例如可以按照像素讀整個(gè)圖像;檢查每個(gè)像素的相鄰像素是否顏色不同,如果顏色不同,則判斷該像素是邊緣像素;以及,如果具有連續(xù)的邊緣像素,則構(gòu)成邊緣線。根據(jù)本發(fā)明的另一個(gè)實(shí)施方式,針對(duì)非單色背景的情況,檢測(cè)圖片邊緣可以使用非單色邊緣算法,例如可以包括掃描圖像中的像素,例如可以按照像素讀整個(gè)圖像;查找每個(gè)像素的相鄰像素的最大差異方向;將最大差異方向一致的連續(xù)像素確定為圖片邊緣。在上述示例算法中,可選地,可以將每個(gè)像素的相鄰像素設(shè)置為橫向和縱向各兩個(gè),構(gòu)成四連通區(qū)域。也可以按照類似的方式構(gòu)成八連通區(qū)域。另外可選地,可以設(shè)置邊緣的噪聲容差,如果一條邊的噪聲在容差以內(nèi),則判斷這條邊是圖片邊緣。上述示例邊緣檢測(cè)算法的復(fù)雜度較低,檢測(cè)圖片邊緣所需的運(yùn)算次數(shù)較少,因此速度較快,能夠滿足即時(shí)通信環(huán)境下的速度要求,獲得良好的用戶體驗(yàn)。以上示例邊緣檢測(cè)算法適用于檢測(cè)常見的矩形圖片以及旋轉(zhuǎn)一定角度的矩形圖片的邊緣,但是這僅是本發(fā)明的實(shí)施方式的一個(gè)示例。在實(shí)際應(yīng)用中,根據(jù)圖片定位的不同需求,可以使用其他的掃描方式、連通區(qū)域設(shè)置和判斷方式而檢測(cè)到具有不同形狀的圖片,諸如圓形、菱形、平行四邊形圖片等。另外,也可以使用目前已有的邊緣檢測(cè)算法,例如Sobel算子等。在圖片檢測(cè)過程中,各種邊緣檢測(cè)算法可以獨(dú)立使用也可以組合使用。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,根據(jù)檢測(cè)到的圖片邊緣定位圖片可以基于邊緣的閉合性,例如如果檢測(cè)到的圖片邊緣構(gòu)成一個(gè)閉合區(qū)域,則將該閉合區(qū)域定位為圖片;或者如果圖片邊緣的延長(zhǎng)線可以逐一相 連構(gòu)成閉合區(qū)域,則將該閉合區(qū)域定位為圖片;或者如果圖片邊緣的延長(zhǎng)線端點(diǎn)鄰近,則將邊緣及延長(zhǎng)線所包圍的區(qū)域定位為圖片。根據(jù)本發(fā)明的另一個(gè)實(shí)施方式,還可以根據(jù)圖片邊緣的夾角來(lái)定位圖片。例如,如果試圖定位矩形圖片,則計(jì)算構(gòu)成閉合區(qū)域的邊緣或者邊緣延長(zhǎng)線之間的夾角,如果夾角均為90度,則判斷該區(qū)域是圖片。參考圖2,其示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的圖像的一個(gè)示例。作為示例,圖2所示圖像是網(wǎng)頁(yè)快照,使用上述實(shí)施方式的定位圖片的方法,可以在無(wú)需用戶的交互式操作的情況下定位該網(wǎng)頁(yè)快照中諸如201的多個(gè)圖片,如圖2中虛線所示。本發(fā)明的用于定位圖像中包含的多個(gè)圖片的方法的實(shí)施方式提供了一種友好的用戶截圖解決方案,該方案可以自動(dòng)、準(zhǔn)確地定位圖像中包含的圖片,并且運(yùn)算速度較快,能夠滿足即時(shí)通信環(huán)境下的速度要求,獲得良好的用戶體驗(yàn)。返回圖1,根據(jù)本發(fā)明的一個(gè)實(shí)施方式,在步驟S103,根據(jù)所定位的圖片的大小、縱橫比和色調(diào)中的至少一個(gè),對(duì)所定位的圖片進(jìn)行過濾。例如,如圖2所示,圖片定位過程可能會(huì)定位諸如按鈕202、標(biāo)題欄203等圖片,但是這些圖片一般是用戶不希望獲取的。在該實(shí)施方式中,通過設(shè)置圖片大小閾值,可以過濾掉圖2所示圖像中的過小圖片,諸如按鈕202。備選地,通過設(shè)置圖片的縱橫比,可以過濾圖2中的過窄圖片,諸如標(biāo)題欄203。本領(lǐng)域技術(shù)人員可以理解,也可以通過閾值設(shè)置來(lái)獲得特定大小和縱橫比的圖片。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,在步驟S104中,檢測(cè)與所定位的圖片相關(guān)聯(lián)的邊框,以及定位具有邊框的圖片以及去除邊框的圖片二者。參考圖3,其示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的包含邊框的圖片的一個(gè)示例。如圖3所示,該方法可以同時(shí)定位具有邊框的圖片以及去除邊框的圖片,以供用戶選擇。繼而,根據(jù)用戶的指示來(lái)提供用戶所需的圖片,用戶的指示例如可以通過鼠標(biāo)位置來(lái)確定。作為一個(gè)示例,如果用戶鼠標(biāo)指向被包含的圖片內(nèi)部,則提供去除邊框的圖片,如果用戶鼠標(biāo)指向邊框,則提供具有邊框的圖片。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,在步驟S105,對(duì)所定位的圖片中的兩個(gè)或更多個(gè)圖片進(jìn)行合并。參考圖4,其示出了可以應(yīng)用本發(fā)明實(shí)施方式的方法的并置圖片的一個(gè)示例。如圖4所示,以上實(shí)施方式的圖片定位方法可能將圖4中的圖片定位為兩個(gè)圖片401和402,而根據(jù)上下文判斷,401和402實(shí)際上是一張圖片。在這種情況下,可以在將401和402合并之后提供給用戶。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,對(duì)圖片進(jìn)行合并可以基于圖片的相鄰關(guān)系。例如,如果檢測(cè)到兩個(gè)圖片的一條邊重合或者相鄰,諸如間距在預(yù)定范圍內(nèi),則將兩個(gè)圖片合并。備選地,圖片合并還可以基于圖片的縱橫比,如果相鄰的多個(gè)圖片中,其中一個(gè)或者多個(gè)圖片的縱橫比不在預(yù)先設(shè)置的縱橫比范圍內(nèi),則可以將其中多個(gè)圖片合并。該預(yù)先設(shè)置的縱橫比范圍可以參考常規(guī)圖片的縱橫比。根據(jù)本發(fā)明的另一個(gè)實(shí)施方式,對(duì)圖片進(jìn)行合并可以基于圖片中包含的內(nèi)容的關(guān)聯(lián)關(guān)系。例如,如果已經(jīng)確定圖片401與圖片402相鄰,則可以分別對(duì)圖片401和402進(jìn)行文本識(shí)別,如果其中一個(gè)圖片中包含文本,則確定兩個(gè)圖片具有關(guān)聯(lián)關(guān)系。備選地,可以進(jìn)一步判斷文本中包含的意義來(lái)確定兩個(gè)圖片是否關(guān)聯(lián)。當(dāng)然,將兩個(gè)圖片進(jìn)行合并僅是本發(fā)明的一個(gè)示例,當(dāng)圖片中包含多個(gè)相關(guān)聯(lián)的子圖片時(shí),本領(lǐng)域技術(shù)人員可以按照類似的方式合并多個(gè)圖片。應(yīng)當(dāng)注意,步驟S103-S10 5僅是對(duì)所定位的圖片進(jìn)行進(jìn)一步處理的可選示例。本領(lǐng)域技術(shù)人員可以理解,步驟S103-S105可以省略,也可以執(zhí)行其中任一步驟或者幾個(gè)步驟的組合。另外,在對(duì)圖像中包含的圖片進(jìn)行定位之后,可以根據(jù)用戶的指示來(lái)提供其中一個(gè)或多個(gè)或者全部的圖片。用戶指示例如鼠標(biāo)位置、選定區(qū)域等等。備選地,可以為用戶提供候選操作列表。上述用于定位圖像中包含的圖片的方法的實(shí)施方式能夠自動(dòng)、快速、準(zhǔn)確地定位圖片,并且通過各種設(shè)置自動(dòng)選擇所定位圖片中對(duì)用戶有價(jià)值的圖片,產(chǎn)生良好的用戶體驗(yàn)。對(duì)于第三方監(jiān)控應(yīng)用,本發(fā)明的方法的實(shí)施方式可以提取對(duì)于特定目的監(jiān)控有價(jià)值的圖片,避免產(chǎn)生大量無(wú)價(jià)值的圖片造成通信和存儲(chǔ)負(fù)擔(dān)。圖5示出了根據(jù)本發(fā)明一個(gè)實(shí)施方式的用于定位圖像中包含的圖片的設(shè)備的框圖。該設(shè)備500包括邊緣檢測(cè)裝置501,其用于響應(yīng)于獲取圖片的指令,檢測(cè)圖像中的圖片邊緣;以及圖片定位裝置502,其用于根據(jù)檢測(cè)到的圖片邊緣,定位圖像中包含的圖片。作為本發(fā)明的一個(gè)實(shí)施方式,邊緣檢測(cè)裝置501進(jìn)一步用于掃描圖像中的像素,根據(jù)像素的鄰近像素顏色和最大差異方向的至少一個(gè)來(lái)查找邊緣像素,并且根據(jù)邊緣像素的連續(xù)性和邊緣噪聲的至少一個(gè)來(lái)確定圖片邊緣。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,圖片定位裝置502進(jìn)一步用于根據(jù)圖片邊緣的閉合性和夾角的至少一個(gè)來(lái)定位圖片??蛇x地,設(shè)備500還包括圖片過濾裝置503,其用于根據(jù)所定位的圖片的大小、縱橫比和色調(diào)中的至少一個(gè),對(duì)所定位的圖片進(jìn)行過濾??蛇x地,設(shè)備500還包括邊框定位裝置504,其用于檢測(cè)與所定位的圖片相關(guān)聯(lián)的邊框,以及定位具有邊框的圖片以及去除邊框的圖片二者。可選地,設(shè)備500還包括圖片合并裝置505,其用于對(duì)所定位的圖片中的兩個(gè)或更多個(gè)圖片進(jìn)行合并。根據(jù)本發(fā)明的一個(gè)實(shí)施方式,上述合并基于以下至少一項(xiàng)圖片的相鄰關(guān)系;以及圖片的縱橫比。根據(jù)本發(fā)明的另一實(shí)施方式,合并基于圖片中包含的內(nèi)容的關(guān)聯(lián)關(guān)系。例如,圖片中包含的內(nèi)容通過識(shí)別所述圖片中的文本信息來(lái)確定。應(yīng)當(dāng)理解,設(shè)備500中記載的每個(gè)裝置與參考圖I描述的方法100中的每個(gè)步驟相對(duì)應(yīng)。由此,上文針對(duì)圖I描述的操作和特征同樣適用于設(shè)備500及其中包含的裝置,在此不再贅述。還應(yīng)當(dāng)理解,設(shè)備500可以利用各種方式來(lái)實(shí)現(xiàn)。例如,在某些實(shí)施方式中,設(shè)備500可以利用軟件和/或固件模塊來(lái)實(shí)現(xiàn)。此外,設(shè)備500也可以利用硬件模塊來(lái)實(shí)現(xiàn)?,F(xiàn)在已知或者將來(lái)開發(fā)的其他方式也是可行的,本發(fā)明的范圍在此方面不受限制。圖6示出了可以應(yīng)用本發(fā)明實(shí)施方式的計(jì)算機(jī)系統(tǒng)的框圖。如圖6所示,計(jì)算機(jī)系統(tǒng)可以包括CPU(中央處理單元)601、RAM(隨機(jī)存取存儲(chǔ)器)602、ROM(只讀存儲(chǔ)器)603、系統(tǒng)總線604、硬盤控制器605、鍵盤控制器606、串行接口控制器607、并行接口控制器608、顯示控制器609、硬盤610、鍵盤611、串行外部設(shè)備612、并行外部設(shè)備613和顯示器614。在這些部件中,與系統(tǒng)總線604相連的有CPU 60URAM 602,ROM 603、硬盤控制器605、鍵盤控制器606、串行控制器607、并行控制器608和顯示控制器609。硬盤610與硬盤控制器605相連,鍵盤611與鍵盤控制器606相連,串行外部設(shè)備612與串行接口控制器607相連,并行外部設(shè)備613與并行接口控制器608相連,以及顯示器614與顯示控制器609相連。應(yīng)當(dāng)理解,圖6所述的結(jié)構(gòu)框圖僅僅為了示例的目的而示出的,而不是對(duì)本發(fā)明的限制。在某些情況下,可以根據(jù)需要增加或者減少其中的一些設(shè)備。特別地,除硬件實(shí)施方式之外,本發(fā)明的實(shí)施方式可以通過計(jì)算機(jī)程序產(chǎn)品的形式實(shí)現(xiàn)。例如,參考圖I描述的方法100可以通過計(jì)算機(jī)程序產(chǎn)品來(lái)實(shí)現(xiàn)。該計(jì)算機(jī)程序產(chǎn)品可以存儲(chǔ)在例如圖6所示的RAM 602、ROM 603、硬盤610和/或任何適當(dāng)?shù)拇鎯?chǔ)介質(zhì)中,或者通過網(wǎng)絡(luò)從適當(dāng)?shù)奈恢孟螺d到計(jì)算機(jī)系統(tǒng)600上。計(jì)算機(jī)程序產(chǎn)品可以包括計(jì)算機(jī)代碼部分,其包括可由適當(dāng)?shù)奶幚碓O(shè)備(例如,圖6中示出的CPU 601)執(zhí)行的程序指令。
本發(fā)明提出的用于定位圖像中包含的圖片的方法和設(shè)備能夠自動(dòng)、快速地定位圖像中包含的圖片,簡(jiǎn)化用戶操作,并且增加圖片定位的準(zhǔn)確性。本發(fā)明所描述的用于定位圖像中包含的圖片的方法和設(shè)備的實(shí)施方式具有多種用途。例如,可以作為聊天軟件中的截圖工具,方便用戶在聊天過程中,便捷地定位屏幕上瀏覽的圖片,以便隨后進(jìn)行存儲(chǔ)或者發(fā)送。另外,可以自動(dòng)獲取用戶所瀏覽的網(wǎng)頁(yè)中包含的圖片內(nèi)容,并進(jìn)一步保存到本地或者發(fā)送至監(jiān)控裝置,以便進(jìn)行各類監(jiān)控,諸如家長(zhǎng)監(jiān)控、網(wǎng)吧監(jiān)控和國(guó)家監(jiān)控等。而且,本發(fā)明的實(shí)施方式可以應(yīng)用于提取圖片中包含的子圖片,諸如照片背景中出現(xiàn)的宣傳畫等等。應(yīng)當(dāng)注意,本發(fā)明的實(shí)施方式可以通過硬件、軟件或者軟件和硬件的結(jié)合來(lái)實(shí)現(xiàn)。硬件部分可以利用專用邏輯來(lái)實(shí)現(xiàn);軟件部分可以存儲(chǔ)在存儲(chǔ)器中,由適當(dāng)?shù)闹噶顖?zhí)行系統(tǒng),例如微處理器或者專用設(shè)計(jì)硬件來(lái)執(zhí)行。本領(lǐng)域的普通技術(shù)人員可以理解上述的設(shè)備和方法可以使用計(jì)算機(jī)可執(zhí)行指令和/或包含在處理器控制代碼中來(lái)實(shí)現(xiàn),例如在諸如磁盤、CD或DVD-ROM的載體介質(zhì)、諸如只讀存儲(chǔ)器(固件)的可編程的存儲(chǔ)器或者諸如光學(xué)或電子信號(hào)載體的數(shù)據(jù)載體上提供了這樣的代碼。本發(fā)明的設(shè)備及其模塊可以由諸如超大規(guī)模集成電路或門陣列、諸如邏輯芯片、晶體管等的半導(dǎo)體、或者諸如現(xiàn)場(chǎng)可編程門陣列、可編程邏輯設(shè)備等的可編程硬件設(shè)備的硬件電路實(shí)現(xiàn),也可以用由各種類型的處理器執(zhí)行的軟件實(shí)現(xiàn),也可以由上述硬件電路和軟件的結(jié)合例如固件來(lái)實(shí)現(xiàn)。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了設(shè)備的若干裝置或子裝置,但是這種劃分僅僅并非強(qiáng)制性的。實(shí)際上,根據(jù)本發(fā)明的實(shí)施方式,上文描述的兩個(gè)或更多裝置的特征和功能可以在一個(gè)裝置中具體化。反之,上文描述的一個(gè)裝置的特征和功能可以進(jìn)一步劃分為由多個(gè)裝置來(lái)具體化。此外,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。相反,流程圖中描繪的步驟可以改變執(zhí)行順序。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。雖然已經(jīng)參考目前考慮到的實(shí)施方式描述了本發(fā)明,但是應(yīng)該理解本發(fā)明不限于所公開的實(shí)施方式。相反,本發(fā)明旨在涵蓋所附權(quán)利要求的精神和范圍內(nèi)所包括的各種修改和等同布置。以下權(quán)利要求的范圍符合最廣泛解釋,以便包含所有這樣的修改及等同結(jié) 構(gòu)和功能。
權(quán)利要求
1.一種用于定位圖像中包含的圖片的方法,包括 響應(yīng)于獲取圖片的指令,檢測(cè)所述圖像中的圖片邊緣;以及 根據(jù)檢測(cè)到的所述圖片邊緣,定位所述圖像中包含的圖片。
2.根據(jù)權(quán)利要求I所述的方法,其中檢測(cè)所述圖像中的圖片邊緣進(jìn)一步包括 掃描所述圖像中的像素; 根據(jù)像素的鄰近像素顏色和最大差異方向的至少一個(gè)來(lái)查找邊緣像素;以及 根據(jù)所述邊緣像素的連續(xù)性和邊緣噪聲的至少一個(gè)來(lái)確定所述圖片邊緣。
3.根據(jù)權(quán)利要求I所述的方法,其中定位所述圖像中包含的圖片包括 根據(jù)所述圖片邊緣的閉合性和夾角的至少一個(gè)來(lái)定位所述圖片。
4.根據(jù)權(quán)利要求I所述的方法,還包括 根據(jù)所定位的圖片的大小、縱橫比和色調(diào)中的至少一個(gè),對(duì)所定位的圖片進(jìn)行過濾。
5.根據(jù)權(quán)利要求I所述的方法,還包括 檢測(cè)與所定位的圖片相關(guān)聯(lián)的邊框;以及 定位具有所述邊框的圖片以及去除所述邊框的圖片二者。
6.根據(jù)權(quán)利要求I所述的方法,還包括 對(duì)所定位的圖片中的兩個(gè)或更多個(gè)圖片進(jìn)行合并。
7.根據(jù)權(quán)利要求6所述的方法,其中所述合并基于以下至少一項(xiàng)所述圖片的相鄰關(guān)系;以及所述圖片的縱橫比。
8.根據(jù)權(quán)利要求6所述的方法,其中所述合并基于所述圖片中包含的內(nèi)容的關(guān)聯(lián)關(guān)系O
9.根據(jù)權(quán)利要求8所述的方法,其中所述圖片中包含的內(nèi)容通過識(shí)別所述圖片中的文本信息來(lái)確定。
10.根據(jù)權(quán)利要求1-9任一項(xiàng)所述的方法,其中所述圖像包括屏幕快照,所述圖片為所述屏幕快照中的多個(gè)圖片。
11.一種用于定位圖像中包含的圖片的設(shè)備,包括 邊緣檢測(cè)裝置,用于響應(yīng)于獲取圖片的指令,檢測(cè)所述圖像中的圖片邊緣;以及 圖片定位裝置,用于根據(jù)檢測(cè)到的所述圖片邊緣,定位所述圖像中包含的圖片。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述邊緣檢測(cè)裝置進(jìn)一步用于 掃描所述圖像中的像素; 根據(jù)像素的鄰近像素顏色和最大差異方向的至少一個(gè)來(lái)查找邊緣像素;以及 根據(jù)所述邊緣像素的連續(xù)性和邊緣噪聲的至少一個(gè)來(lái)確定所述圖片邊緣。
13.根據(jù)權(quán)利要求11所述的設(shè)備,其中所述圖片定位裝置進(jìn)一步用于 根據(jù)所述圖片邊緣的閉合性和夾角的至少一個(gè)來(lái)定位所述圖片。
14.根據(jù)權(quán)利要求11所述的設(shè)備,還包括 圖片過濾裝置,用于根據(jù)所定位的圖片的大小、縱橫比和色調(diào)中的至少一個(gè),對(duì)所定位的圖片進(jìn)行過濾。
15.根據(jù)權(quán)利要求11所述的設(shè)備,還包括 邊框定位裝置,用于檢測(cè)與所定位的圖片相關(guān)聯(lián)的邊框,以及定位具有所述邊框的圖片以及去除所述邊框的圖片二者。
16.根據(jù)權(quán)利要求11所述的設(shè)備,還包括 圖片合并裝置,用于對(duì)所定位的圖片中的兩個(gè)或更多個(gè)圖片進(jìn)行合并。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其中所述合并基于以下至少一項(xiàng)所述圖片的相鄰關(guān)系;以及所述圖片的縱橫比。
18.根據(jù)權(quán)利要求16所述的設(shè)備,其中所述合并基于所述圖片中包含的內(nèi)容的關(guān)聯(lián)關(guān)系O
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中所述圖片中包含的內(nèi)容通過識(shí)別所述圖片中的文本信息來(lái)確定。
20.根據(jù)權(quán)利要求11-19任一項(xiàng)所述的設(shè)備,其中所述圖像包括屏幕快照,所述圖片為所述屏幕快照中的多個(gè)圖片。
全文摘要
本發(fā)明公開了一種用于定位圖像中包含的圖片的方法和設(shè)備。用于定位圖像中包含的圖片的方法包括響應(yīng)于獲取圖片的指令,檢測(cè)圖像中的圖片邊緣;以及根據(jù)檢測(cè)到的圖片邊緣,定位圖像中包含的圖片。本發(fā)明提出的用于定位圖像中包含的圖片的方法和設(shè)備能夠自動(dòng)、快速地定位圖像中包含的圖片,簡(jiǎn)化用戶操作,并且增加圖片定位的準(zhǔn)確性。
文檔編號(hào)G06K9/32GK102622595SQ201110035140
公開日2012年8月1日 申請(qǐng)日期2011年1月28日 優(yōu)先權(quán)日2011年1月28日
發(fā)明者黃歡 申請(qǐng)人:北京千橡網(wǎng)景科技發(fā)展有限公司