用于搜索引擎的圖片物料處理方法、裝置和搜索引擎的制作方法

文檔序號(hào)：6640640閱讀：212來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

用于搜索引擎的圖片物料處理方法、裝置和搜索引擎的制作方法
【專利摘要】本發(fā)明提出一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎，其中，該用于搜索引擎的圖片物料處理方法，包括以下步驟：獲取源圖片物料；對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征；根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域；以及根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。本發(fā)明的用于搜索引擎的圖片物料處理方法，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求。
【專利說(shuō)明】用于搜索弓I擎的圖片物料處理方法、裝置和搜索弓I擎

【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及搜索【技術(shù)領(lǐng)域】，特別涉及一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。

【背景技術(shù)】
[0002]目前，搜索引擎可根據(jù)網(wǎng)民輸入的搜索詞提供相應(yīng)的搜索結(jié)果，其中，網(wǎng)民輸入的搜索詞不僅僅可包含文字，還可包含多媒體信息，如語(yǔ)音、圖片等。圖片是多媒體信息中非常重要的組成部分，網(wǎng)民可通過(guò)適宜的圖片來(lái)表達(dá)其搜索需求，并進(jìn)行搜索。從而，搜索引擎能夠返回理想的圖片搜索結(jié)果給網(wǎng)民。
[0003]搜索引擎智能出圖的核心目標(biāo)是將質(zhì)量出色、與網(wǎng)民的搜索需求有良好相關(guān)性的圖片展示給網(wǎng)民。在網(wǎng)民需求復(fù)雜化多樣化的前提下，必須準(zhǔn)備數(shù)量足夠多，內(nèi)容足夠豐富，質(zhì)量足夠高的圖片物料，才可能在整體上提升出圖的效果，滿足網(wǎng)民需求。因此，準(zhǔn)備可展示的圖片物料數(shù)據(jù)是重要的基礎(chǔ)性工作。
[0004]但是，受到圖片數(shù)據(jù)來(lái)源、搜索結(jié)果展示面積等原因的限制，搜索引擎可提供、展現(xiàn)的圖片存在圖片的數(shù)量較少、質(zhì)量差異度較大、圖片與網(wǎng)民搜索需求的匹配程度較低等問(wèn)題。例如，搜索引擎可提供的多媒體物料中一部分物料主要來(lái)自于客戶自己提交，如客戶的一些標(biāo)志圖片、多媒體信息或者產(chǎn)品的注冊(cè)商標(biāo)、圖案等信息。但是受到客戶制作物料能力等客觀因素限制，物料的豐富性和質(zhì)量都比較匱乏。

【發(fā)明內(nèi)容】

[0005]本發(fā)明旨在至少在一定程度上解決上述技術(shù)問(wèn)題。
[0006]為此，本發(fā)明的第一個(gè)目的在于提出一種用于搜索引擎的圖片物料處理方法，可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求。
[0007]本發(fā)明的第二個(gè)目的在于提出一種用于搜索引擎的圖片物料處理裝置。
[0008]本發(fā)明的第三個(gè)目的在于搜索引擎。
[0009]為達(dá)上述目的，根據(jù)本發(fā)明第一方面實(shí)施例提出了一種用于搜索引擎的圖片物料處理方法，包括以下步驟:獲取源圖片物料；對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征；根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域；以及根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
[0010]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，通過(guò)獲取源圖片物料，并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料，然后提取待處理圖片物料的信息特征，并確定待處理圖片物料的目標(biāo)區(qū)域，并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、符合網(wǎng)民需求的高質(zhì)量的圖片物料，一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及，另一方面，能夠更好的滿足網(wǎng)民可具象化的需求，符合網(wǎng)民不同場(chǎng)景下的搜索要求，提升了網(wǎng)民體驗(yàn)。
[0011]此外，本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作，通過(guò)對(duì)此流程進(jìn)行工具化的封裝，能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理，為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且，能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶，根據(jù)客戶自身所有的圖片物料，最大程度利用資源，生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù)，并跟隨數(shù)據(jù)源的變化不斷更新。
[0012]本發(fā)明第二方面實(shí)施例提出了一種用于搜索引擎的圖片物料處理裝置，包括:獲取模塊，用于獲取源圖片物料；過(guò)濾模塊，用于對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；特征提取模塊，用于對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征；確定模塊，用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域；以及生成模塊，用于根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
[0013]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，通過(guò)獲取源圖片物料，并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料，然后提取待處理圖片物料的信息特征，并確定待處理圖片物料的目標(biāo)區(qū)域，并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求，一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及，另一方面，能夠更好的滿足網(wǎng)民可具象化的需求，符合網(wǎng)民不同場(chǎng)景下的搜索要求，提升了網(wǎng)民體驗(yàn)。
[0014]此外，本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作，通過(guò)對(duì)此流程進(jìn)行工具化的封裝，能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理，為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且，能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶，根據(jù)客戶自身所有的圖片物料，最大程度利用資源，生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù)，并跟隨數(shù)據(jù)源的變化不斷更新。
[0015]本發(fā)明第三方面實(shí)施例提出了一種搜索引擎，包括本發(fā)明第二方面實(shí)施例的用于搜索引擎的圖片物料處理裝置。
[0016]本發(fā)明實(shí)施例的搜索引擎，通過(guò)獲取源圖片物料，并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料，然后提取待處理圖片物料的信息特征，并確定待處理圖片物料的目標(biāo)區(qū)域，并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求，一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及，另一方面，能夠更好的滿足網(wǎng)民可具象化的需求，符合網(wǎng)民不同場(chǎng)景下的搜索要求，提升了網(wǎng)民體驗(yàn)。
[0017]此外，本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作，通過(guò)對(duì)此流程進(jìn)行工具化的封裝，能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理，為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且，能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶，根據(jù)客戶自身所有的圖片物料，最大程度利用資源，生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù)，并跟隨數(shù)據(jù)源的變化不斷更新。
[0018]本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出，部分將從下面的描述中變得明顯，或通過(guò)本發(fā)明的實(shí)踐了解到。

【專利附圖】

【附圖說(shuō)明】
[0019]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解，其中:
[0020]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖；
[0021]圖2a為根據(jù)本發(fā)明一個(gè)實(shí)施例的待處理圖片物料的示意圖；
[0022]圖2b和圖2c為根據(jù)本發(fā)明實(shí)施例的根據(jù)圖2a所示待處理圖片物料生成的圖片的不意圖；
[0023]圖2d為根據(jù)本發(fā)明另一個(gè)實(shí)施例的待處理圖片物料的示意圖；
[0024]圖2e和圖2f為根據(jù)本發(fā)明實(shí)施例的根據(jù)圖2d所示待處理圖片物料生成的圖片的不意圖；
[0025]圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖；
[0026]圖4為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖；
[0027]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖；
[0028]圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖；
[0029]圖7為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0030]下面詳細(xì)描述本發(fā)明的實(shí)施例，所述實(shí)施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的，僅用于解釋本發(fā)明，而不能理解為對(duì)本發(fā)明的限制。
[0031]由于搜索引擎的不同產(chǎn)品，在不同的場(chǎng)景下，對(duì)圖片物料有標(biāo)準(zhǔn)化和規(guī)范化的要求，例如必須滿足特定尺寸，不能包含非法信息，不能出現(xiàn)讓網(wǎng)民感到不適、傷害網(wǎng)民體驗(yàn)的信息，不能出現(xiàn)過(guò)于簡(jiǎn)單無(wú)實(shí)質(zhì)內(nèi)容的信息，因此，為了能夠?yàn)樗阉饕嫣峁└S富，質(zhì)量更高、符合搜索引擎標(biāo)準(zhǔn)和規(guī)范的圖片物料，以更好地滿足網(wǎng)民的搜索需求，本發(fā)明提出了一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。
[0032]其中，網(wǎng)民是指使用搜索引擎輸入搜索關(guān)鍵詞進(jìn)行搜索，以獲得自身所需要的信息的群體。
[0033]一種用于搜索引擎的圖片物料處理方法，包括以下步驟:獲取源圖片物料；對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征；根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域；以及根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0034]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
[0035]如圖1所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，包括:
[0036]S101，獲取源圖片物料。
[0037]目前，互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源，如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此，在本發(fā)明的實(shí)施例中，獲得授權(quán)許可的前提下，可通過(guò)多渠道來(lái)源獲取源圖片物料。例如，收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然，也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
[0038]其中，客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品，購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
[0039]S102，對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
[0040]在本發(fā)明的實(shí)施例中，可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
[0041]其中，不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
[0042]具體地，可采用OCR (Optical Character Recognit1n，光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如，可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析，以識(shí)別出不當(dāng)信息。當(dāng)然，本發(fā)明對(duì)信息提取分析的方法不做限定，也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
[0043]S103，對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
[0044]在本發(fā)明的一個(gè)實(shí)施例中，可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中，信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。
[0045]具體的識(shí)別分析方法可參照相關(guān)技術(shù)，在此不再贅述。
[0046]其中，待處理圖片物料的圖像識(shí)別結(jié)果可以是S102中的識(shí)別結(jié)果，或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別，在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
[0047]此外，由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖)，這類圖片中包含著2張以上的獨(dú)立子圖。因此，為了能夠識(shí)別出拼接圖，并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分，提高信息特征提取的準(zhǔn)確度，在本發(fā)明的一個(gè)實(shí)施例中，還需要先進(jìn)行拼接圖識(shí)別，并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖，并分別提取每個(gè)子圖的信息特征。
[0048]S104，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
[0049]由于人臉信息在一張圖中十分重要，在裁剪圖片時(shí)保留人臉信息可以起到加分作用，在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域，從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外，由于文字不容易被完整包含在裁剪圖中，并且文字在縮放過(guò)程中很容易造成模糊，因此，優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知，前景區(qū)域的信息量非常重要，目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
[0050]因此，在本發(fā)明的一個(gè)實(shí)施例中，可對(duì)提取的信息特征進(jìn)行分析，通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征，確定待處理圖片物料的目標(biāo)區(qū)域。
[0051]具體地，對(duì)于待處理圖片物料或者其子圖，如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍，則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則，需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地，可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少，且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域，并將該區(qū)域作為目標(biāo)區(qū)域。
[0052]舉例來(lái)說(shuō)，可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域，然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整，以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸，之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后，對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì)，即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察，并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
[0053]S105，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0054]在本發(fā)明的一個(gè)實(shí)施例中，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
[0055]具體地，可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái)，并將裁剪得到的圖片縮放至目標(biāo)尺寸，得到最終的圖片。
[0056]舉例來(lái)說(shuō)，對(duì)于圖2a所示的待處理圖片物料，通過(guò)S103-S105的步驟，可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片，或縮小為如圖2c所示的正方形圖片。由此，搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí)，就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息，提升了網(wǎng)民體驗(yàn)。
[0057]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，通過(guò)獲取源圖片物料，并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料，然后提取待處理圖片物料的信息特征，并確定待處理圖片物料的目標(biāo)區(qū)域，并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求，一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及，另一方面，能夠更好的滿足網(wǎng)民可具象化的需求，符合網(wǎng)民不同場(chǎng)景下的搜索要求，提升了網(wǎng)民體驗(yàn)。
[0058]此外，本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作，通過(guò)對(duì)此流程進(jìn)行工具化的封裝，能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理，為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且，能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶，根據(jù)客戶自身所有的圖片物料，最大程度利用資源，生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù)，并跟隨數(shù)據(jù)源的變化不斷更新。
[0059]應(yīng)當(dāng)理解，在本發(fā)明的實(shí)施例中，在根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片之后，可根據(jù)圖片之間的相關(guān)性，將相關(guān)的圖片進(jìn)行拼接，從而能夠得到更多新的圖片，為搜索引擎提供更豐富的圖片資源，用以滿足網(wǎng)民的搜索需求。
[0060]圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
[0061]如圖3所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，包括:
[0062]S301，獲取源圖片物料。
[0063]目前，互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源，如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此，在本發(fā)明的實(shí)施例中，獲得授權(quán)許可的前提下，可通過(guò)多渠道來(lái)源獲取源圖片物料。例如，收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然，也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
[0064]其中，客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品，購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
[0065]S302，對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
[0066]在本發(fā)明的實(shí)施例中，可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
[0067]其中，不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
[0068]具體地，可采用OCR (Optical Character Recognit1n，光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如，可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析，以識(shí)別出不當(dāng)信息。當(dāng)然，本發(fā)明對(duì)信息提取分析的方法不做限定，也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
[0069]S303，對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
[0070]在本發(fā)明的一個(gè)實(shí)施例中，可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中，信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。具體的識(shí)別分析方法可參照相關(guān)技術(shù)，在此不再贅述。
[0071]其中，待處理圖片物料的圖像識(shí)別結(jié)果可以是S302中的識(shí)別結(jié)果，或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別，在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
[0072]此外，由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖)，這類圖片中包含著2張以上的獨(dú)立子圖。因此，為了能夠識(shí)別出拼接圖，并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分，提高信息特征提取的準(zhǔn)確度，在本發(fā)明的一個(gè)實(shí)施例中，還需要先進(jìn)行拼接圖識(shí)別，并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖，并分別提取每個(gè)子圖的信息特征。
[0073]S304，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
[0074]由于人臉信息在一張圖中十分重要，在裁剪圖片時(shí)保留人臉信息可以起到加分作用，在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域，從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外，由于文字不容易被完整包含在裁剪圖中，并且文字在縮放過(guò)程中很容易造成模糊，因此，優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知，前景區(qū)域的信息量非常重要，目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
[0075]因此，在本發(fā)明的一個(gè)實(shí)施例中，可對(duì)提取的信息特征進(jìn)行分析，通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征，確定待處理圖片物料的目標(biāo)區(qū)域。
[0076]具體地，對(duì)于待處理圖片物料或者其子圖，如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍，則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則，需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地，可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少，且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域，并將該區(qū)域作為目標(biāo)區(qū)域。
[0077]舉例來(lái)說(shuō)，可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域，然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整，以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸，之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后，對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì)，即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察，并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
[0078]S305，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0079]在本發(fā)明的一個(gè)實(shí)施例中，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
[0080]具體地，可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái)，并將裁剪得到的圖片縮放至目標(biāo)尺寸，得到最終的圖片。
[0081]舉例來(lái)說(shuō)，對(duì)于圖2a所示的待處理圖片物料，通過(guò)S303-S305的步驟，可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片，或縮小為如圖2c所示的正方形圖片。由此，搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí)，就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息，提升了網(wǎng)民體驗(yàn)。
[0082]S306，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，其中，搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
[0083]在本發(fā)明的實(shí)施例中，可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量，并設(shè)定不同信息特征的權(quán)重，結(jié)合圖片變形程度，綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
[0084]具體地，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù)；根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
[0085]其中，質(zhì)量參數(shù)，即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
[0086]舉例來(lái)說(shuō)，可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值，如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整)，即進(jìn)行加分，如果不滿足質(zhì)量要求，則進(jìn)行減分。由此，通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求，得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)，然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中，可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重，從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
[0087]在本發(fā)明的一個(gè)實(shí)施例中，可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用，即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求，進(jìn)行過(guò)濾處理，不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求，可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí)，可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片，并展示給網(wǎng)民。
[0088]舉例來(lái)說(shuō)，對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異，其中圖2e所示的圖片保留了完整信息，圖2f所示的圖片裁剪掉了部分信息，因此圖2e所示的圖片的評(píng)分為10分，圖2f所示的圖片的評(píng)分為O分。
[0089]由此，搜索引擎可根據(jù)評(píng)分結(jié)果，將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民，從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果，提升了網(wǎng)民的搜索體驗(yàn)。
[0090]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，可根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，以使搜索引擎根據(jù)評(píng)分結(jié)果選擇相應(yīng)的圖片作為搜索結(jié)果提供給網(wǎng)民，使網(wǎng)民能夠獲得高質(zhì)量的搜索結(jié)果，提升了網(wǎng)民的搜索體驗(yàn)。
[0091]圖4為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
[0092]如圖4所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，包括:
[0093]S401，獲取源圖片物料。
[0094]目前，互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源，如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此，在本發(fā)明的實(shí)施例中，獲得授權(quán)許可的前提下，可通過(guò)多渠道來(lái)源獲取源圖片物料。例如，收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然，也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
[0095]其中，客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品，購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
[0096]S402，對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
[0097]在本發(fā)明的實(shí)施例中，可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
[0098]其中，不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
[0099]具體地，可采用OCR (Optical Character Recognit1n，光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如，可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析，以識(shí)別出不當(dāng)信息。當(dāng)然，本發(fā)明對(duì)信息提取分析的方法不做限定，也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
[0100]S403，對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
[0101]在本發(fā)明的一個(gè)實(shí)施例中，可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中，信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。具體的識(shí)別分析方法可參照相關(guān)技術(shù)，在此不再贅述。
[0102]其中，待處理圖片物料的圖像識(shí)別結(jié)果可以是S402中的識(shí)別結(jié)果，或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別，在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
[0103]此外，由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖)，這類圖片中包含著2張以上的獨(dú)立子圖。因此，為了能夠識(shí)別出拼接圖，并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分，提高信息特征提取的準(zhǔn)確度，在本發(fā)明的一個(gè)實(shí)施例中，還需要先進(jìn)行拼接圖識(shí)別，并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖，并分別提取每個(gè)子圖的信息特征。
[0104]S404，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
[0105]由于人臉信息在一張圖中十分重要，在裁剪圖片時(shí)保留人臉信息可以起到加分作用，在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域，從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外，由于文字不容易被完整包含在裁剪圖中，并且文字在縮放過(guò)程中很容易造成模糊，因此，優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知，前景區(qū)域的信息量非常重要，目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
[0106]因此，在本發(fā)明的一個(gè)實(shí)施例中，可對(duì)提取的信息特征進(jìn)行分析，通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征，確定待處理圖片物料的目標(biāo)區(qū)域。
[0107]具體地，對(duì)于待處理圖片物料或者其子圖，如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍，則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則，需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地，可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少，且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域，并將該區(qū)域作為目標(biāo)區(qū)域。
[0108]舉例來(lái)說(shuō)，可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域，然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整，以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸，之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后，對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì)，即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察，并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
[0109]S405，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0110]在本發(fā)明的一個(gè)實(shí)施例中，根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
[0111]具體地，可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái)，并將裁剪得到的圖片縮放至目標(biāo)尺寸，得到最終的圖片。
[0112]舉例來(lái)說(shuō)，對(duì)于圖2a所示的待處理圖片物料，通過(guò)S403-S405的步驟，可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片，或縮小為如圖2c所示的正方形圖片。由此，搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí)，就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息，提升了網(wǎng)民體驗(yàn)。
[0113]S406，根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)圖片或者圖片與文字進(jìn)行拼接。
[0114]在本發(fā)明的實(shí)施例中，當(dāng)網(wǎng)民進(jìn)行搜索時(shí)，搜索引擎可根據(jù)網(wǎng)民的查詢?cè)~獲取與該查詢出相關(guān)的文字，并從預(yù)先經(jīng)過(guò)上述處理得到的圖片中獲取與該查詢相關(guān)的圖片，然后對(duì)這些圖片進(jìn)行拼接，或者將圖片與文字進(jìn)行拼接，得到信息更加豐富的拼接圖，從而能夠?yàn)榫W(wǎng)民提供更豐富的搜索結(jié)果和資源。
[0115]例如，對(duì)于一家教育客戶，名稱為“XXX汽修學(xué)?！?，客戶自己提交的物料僅包含自身的企業(yè)logo。另外，還可從該客戶的網(wǎng)站上獲得的學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料。通過(guò)本發(fā)明實(shí)施例，可根據(jù)該企業(yè)logo、學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料進(jìn)行裁剪、縮放、拼接，從而得到數(shù)量遠(yuǎn)遠(yuǎn)多于客戶自己提交的，質(zhì)量較好且更豐富的圖片。
[0116]S407，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，其中，搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
[0117]在本發(fā)明的實(shí)施例中，可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量，并設(shè)定不同信息特征的權(quán)重，結(jié)合圖片變形程度，綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
[0118]具體地，根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù)；根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
[0119]其中，質(zhì)量參數(shù)，即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
[0120]舉例來(lái)說(shuō)，可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值，如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整)，即進(jìn)行加分，如果不滿足質(zhì)量要求，則進(jìn)行減分。由此，通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求，得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)，然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中，可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重，從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
[0121]在本發(fā)明的一個(gè)實(shí)施例中，可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用，即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求，進(jìn)行過(guò)濾處理，不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求，可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí)，可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片，并展示給網(wǎng)民。
[0122]舉例來(lái)說(shuō)，對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異，其中圖2e所示的圖片保留了完整信息，圖2f所示的圖片裁剪掉了部分信息，因此圖2e所示的圖片的評(píng)分為10分，圖2f所示的圖片的評(píng)分為O分。
[0123]由此，搜索引擎可根據(jù)評(píng)分結(jié)果，將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民，從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果，提升了網(wǎng)民的搜索體驗(yàn)。
[0124]其中，S407也可在S406之前。
[0125]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法，可根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)圖片或圖片與文字進(jìn)行拼接，得到信息更加豐富的拼接圖，拓展了圖片來(lái)源，更好地滿足網(wǎng)民需求，進(jìn)一步提升了網(wǎng)民體驗(yàn)。
[0126]為了實(shí)現(xiàn)上述實(shí)施例，本發(fā)明還提出一種用于搜索引擎的圖片物料處理裝置。
[0127]一種用于搜索引擎的圖片物料處理裝置，包括:獲取模塊，用于獲取源圖片物料；過(guò)濾模塊，用于對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；特征提取模塊，用于對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征；確定模塊，用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域；以及生成模塊，用于根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0128]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
[0129]如圖5所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40和生成模塊50。
[0130]具體地，獲取模塊10用于獲取源圖片物料。
[0131]目前，互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源，如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此，在本發(fā)明的實(shí)施例中，獲得授權(quán)許可的前提下，獲取模塊10可通過(guò)多渠道來(lái)源獲取源圖片物料。例如，收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然，也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。其中，客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品，購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
[0132]過(guò)濾模塊20用于對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
[0133]在本發(fā)明的實(shí)施例中，過(guò)濾模塊20可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
[0134]其中，不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
[0135]具體地，過(guò)濾模塊20可采用OCR (Optical Character Recognit1n，光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如，可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析，以識(shí)別出不當(dāng)信息。當(dāng)然，本發(fā)明對(duì)信息提取分析的方法不做限定，也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
[0136]特征提取模塊30用于對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
[0137]在本發(fā)明的一個(gè)實(shí)施例中，特征提取模塊30可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中，信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。
[0138]具體的識(shí)別分析方法可參照相關(guān)技術(shù)，在此不再贅述。
[0139]其中，待處理圖片物料的圖像識(shí)別結(jié)果可以是過(guò)濾模塊20在過(guò)濾過(guò)程中得到的識(shí)別結(jié)果，或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別，在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
[0140]此外，由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖)，這類圖片中包含著2張以上的獨(dú)立子圖。因此，為了能夠識(shí)別出拼接圖，并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分，提高信息特征提取的準(zhǔn)確度，在本發(fā)明的一個(gè)實(shí)施例中，還需要先進(jìn)行拼接圖識(shí)別，并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖，并分別提取每個(gè)子圖的信息特征。
[0141]確定模塊40用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
[0142]由于人臉信息在一張圖中十分重要，在裁剪圖片時(shí)保留人臉信息可以起到加分作用，在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域，從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外，由于文字不容易被完整包含在裁剪圖中，并且文字在縮放過(guò)程中很容易造成模糊，因此，優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知，前景區(qū)域的信息量非常重要，目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
[0143]因此，在本發(fā)明的一個(gè)實(shí)施例中，確定模塊40可對(duì)提取的信息特征進(jìn)行分析，通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征，確定待處理圖片物料的目標(biāo)區(qū)域。
[0144]更具體地，對(duì)于待處理圖片物料或者其子圖，如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍，則確定模塊40可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則，需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地，可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少，且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域，并將該區(qū)域作為目標(biāo)區(qū)域。
[0145]舉例來(lái)說(shuō)，確定模塊40可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域，然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整，以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸，之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后，確定模塊40對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì)，即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察，并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
[0146]生成模塊50用于根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
[0147]在本發(fā)明的一個(gè)實(shí)施例中，生成模塊50可具體用于:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
[0148]更具體地，生成模塊50可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái)，并將裁剪得到的圖片縮放至目標(biāo)尺寸，得到最終的圖片。
[0149]舉例來(lái)說(shuō)，對(duì)于圖2a所示的待處理圖片物料，通過(guò)特征提取模塊30、確定模塊40和生成模塊50可將其裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片，或縮小為如圖2c所示的正方形圖片。由此，搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí)，就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息，提升了網(wǎng)民體驗(yàn)。
[0150]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，通過(guò)獲取源圖片物料，并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料，然后提取待處理圖片物料的信息特征，并確定待處理圖片物料的目標(biāo)區(qū)域，并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片，通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料，能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求，一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及，另一方面，能夠更好的滿足網(wǎng)民可具象化的需求，符合網(wǎng)民不同場(chǎng)景下的搜索要求，提升了網(wǎng)民體驗(yàn)。
[0151]此外，本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作，通過(guò)對(duì)此流程進(jìn)行工具化的封裝，能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理，為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且，能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶，根據(jù)客戶自身所有的圖片物料，最大程度利用資源，生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù)，并跟隨數(shù)據(jù)源的變化不斷更新。
[0152]應(yīng)當(dāng)理解，在本發(fā)明的實(shí)施例中，在根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片之后，可根據(jù)圖片之間的相關(guān)性，將相關(guān)的圖片進(jìn)行拼接，從而能夠得到更多新的圖片，為搜索引擎提供更豐富的圖片資源，用以滿足網(wǎng)民的搜索需求。
[0153]圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
[0154]如圖6所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50和評(píng)分模塊60。
[0155]具體地，獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40和生成模塊50可參照?qǐng)D5所示實(shí)施例，在此不再贅述。
[0156]評(píng)分模塊60用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，其中，搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
[0157]在本發(fā)明的實(shí)施例中，評(píng)分模塊60可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量，并設(shè)定不同信息特征的權(quán)重，結(jié)合圖片變形程度，綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
[0158]更具體地，評(píng)分模塊60可具體用于:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù)；根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
[0159]其中，質(zhì)量參數(shù)，即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
[0160]舉例來(lái)說(shuō)，評(píng)分模塊60可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值，如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整)，即進(jìn)行加分，如果不滿足質(zhì)量要求，則進(jìn)行減分。由此，通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求，得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)，然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中，可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重，從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
[0161]在本發(fā)明的一個(gè)實(shí)施例中，可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用，即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求，進(jìn)行過(guò)濾處理，不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值，則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求，可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí)，可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片，并展示給網(wǎng)民。
[0162]舉例來(lái)說(shuō)，對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異，其中圖2e所示的圖片保留了完整信息，圖2f所示的圖片裁剪掉了部分信息，因此圖2e所示的圖片的評(píng)分為10分，圖2f所示的圖片的評(píng)分為O分。
[0163]由此，搜索引擎可根據(jù)評(píng)分結(jié)果，將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民，從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果，提升了網(wǎng)民的搜索體驗(yàn)。
[0164]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，可根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，以使搜索引擎根據(jù)評(píng)分結(jié)果選擇相應(yīng)的圖片作為搜索結(jié)果提供給網(wǎng)民，使網(wǎng)民能夠獲得高質(zhì)量的搜索結(jié)果，提升了網(wǎng)民的搜索體驗(yàn)。
[0165]圖7為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
[0166]如圖7所示，根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50、評(píng)分模塊60和拼接模塊
70 ο
[0167]具體地，獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50和評(píng)分模塊60可參照?qǐng)D6所示實(shí)施例，在此不再贅述。
[0168]拼接模塊70用于根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)圖片或者圖片與文字進(jìn)行拼接。
[0169]在本發(fā)明的實(shí)施例中，當(dāng)網(wǎng)民進(jìn)行搜索時(shí)，拼接模塊70可根據(jù)網(wǎng)民的查詢?cè)~獲取與該查詢出相關(guān)的文字，并從預(yù)先經(jīng)過(guò)上述處理得到的圖片中獲取與該查詢相關(guān)的圖片，然后對(duì)這些圖片進(jìn)行拼接，或者將圖片與文字進(jìn)行拼接，得到信息更加豐富的拼接圖，從而能夠?yàn)榫W(wǎng)民提供更豐富的搜索結(jié)果和資源。
[0170]例如，對(duì)于一家教育客戶，名稱為“XXX汽修學(xué)?！?，客戶自己提交的物料僅包含自身的企業(yè)logo。另外，還可從該客戶的網(wǎng)站上獲得的學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料。通過(guò)本發(fā)明實(shí)施例，可根據(jù)該企業(yè)logo、學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料進(jìn)行裁剪、縮放、拼接，從而得到數(shù)量遠(yuǎn)遠(yuǎn)多于客戶自己提交的，質(zhì)量較好且更豐富的圖片。
[0171]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置，可根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)圖片或圖片與文字進(jìn)行拼接，得到信息更加豐富的拼接圖，拓展了圖片來(lái)源，更好地滿足網(wǎng)民需求，進(jìn)一步提升了網(wǎng)民體驗(yàn)。
[0172]在本說(shuō)明書(shū)的描述中，參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中，對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且，描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外，在不相互矛盾的情況下，本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書(shū)中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
[0173]此外，術(shù)語(yǔ)“第一”、“第二”僅用于描述目的，而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此，限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中，“多個(gè)”的含義是兩個(gè)或兩個(gè)以上，除非另有明確具體的限定。
[0174]流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為，表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分，并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn)，其中可以不按所示出或討論的順序，包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序，來(lái)執(zhí)行功能，這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
[0175]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟，例如，可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表，可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中，以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用，或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書(shū)而言，"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置)，便攜式計(jì)算機(jī)盤(pán)盒(磁裝置)，隨機(jī)存取存儲(chǔ)器(RAM)，只讀存儲(chǔ)器(ROM)，可擦除可編輯只讀存儲(chǔ)器(EPR0M或閃速存儲(chǔ)器)，光纖裝置，以及便攜式光盤(pán)只讀存儲(chǔ)器(CDROM)。另外，計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì)，因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描，接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序，然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
[0176]應(yīng)當(dāng)理解，本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中，多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如，如果用硬件來(lái)實(shí)現(xiàn)，和在另一實(shí)施方式中一樣，可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門(mén)電路的離散邏輯電路，具有合適的組合邏輯門(mén)電路的專用集成電路，可編程門(mén)陣列(PGA)，現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)等。
[0177]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成，所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中，該程序在執(zhí)行時(shí)，包括方法實(shí)施例的步驟之一或其組合。
[0178]此外，在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中，也可以是各個(gè)單元單獨(dú)物理存在，也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn)，也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí)，也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
[0179]上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器，磁盤(pán)或光盤(pán)等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例，可以理解的是，上述實(shí)施例是示例性的，不能理解為對(duì)本發(fā)明的限制，本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
【權(quán)利要求】
1.一種用于搜索引擎的圖片物料處理方法，其特征在于，包括以下步驟: 獲取源圖片物料；對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征；根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域；以及根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
2.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法，其特征在于，所述根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理具體包括: 根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行裁剪并縮放。
3.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法，其特征在于，還包括: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，其中，所述搜索弓I擎根據(jù)所述評(píng)分結(jié)果選擇使用。
4.如權(quán)利要求3所述的用于搜索引擎的圖片物料處理方法，其特征在于，所述根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù)；根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
5.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法，其特征在于，還包括: 根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)所述圖片或者所述圖片與文字進(jìn)行拼接。
6.一種用于搜索引擎的圖片物料處理裝置，其特征在于，包括: 獲取模塊，用于獲取源圖片物料；過(guò)濾模塊，用于對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料；特征提取模塊，用于對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征；確定模塊，用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域；以及生成模塊，用于根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
7.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置，其特征在于，所述生成模塊具體用于: 根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行裁剪并縮放。
8.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置，其特征在于，還包括: 評(píng)分模塊，用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分，其中，所述搜索引擎根據(jù)所述評(píng)分結(jié)果選擇使用。
9.如權(quán)利要求8所述的用于搜索引擎的圖片物料處理裝置，其特征在于，所述評(píng)分模塊具體用于: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù)；根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
10.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置，其特征在于，還包括: 拼接模塊，用于根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~，對(duì)多個(gè)所述圖片或者所述圖片與文字進(jìn)行拼接。
11.一種搜索引擎，其特征在于，包括如權(quán)利要求6至10任一項(xiàng)所述的用于搜索引擎的圖片物料處理裝置。
【文檔編號(hào)】G06F17/30GK104504104SQ201410841895
【公開(kāi)日】2015年4月8日申請(qǐng)日期:2014年12月30日優(yōu)先權(quán)日:2014年12月30日
【發(fā)明者】秦首科, 張澤明, 韓友, 江焱, 陳志揚(yáng), 程小華, 徐培治, 馬小林, 文石磊, 陳世佳, 李旭斌, 陳敏申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：秦首科;張澤明;韓友;江焱;陳志揚(yáng);程小華;徐培治;馬小林;文石磊;陳世佳;李旭斌;陳敏;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>