国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于搜索引擎的圖片物料處理方法、裝置和搜索引擎的制作方法

      文檔序號(hào):6640640閱讀:212來(lái)源:國(guó)知局
      用于搜索引擎的圖片物料處理方法、裝置和搜索引擎的制作方法
      【專利摘要】本發(fā)明提出一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎,其中,該用于搜索引擎的圖片物料處理方法,包括以下步驟:獲取源圖片物料;對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料;對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征;根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域;以及根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。本發(fā)明的用于搜索引擎的圖片物料處理方法,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求。
      【專利說(shuō)明】用于搜索弓I擎的圖片物料處理方法、裝置和搜索弓I擎

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及搜索【技術(shù)領(lǐng)域】,特別涉及一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。

      【背景技術(shù)】
      [0002]目前,搜索引擎可根據(jù)網(wǎng)民輸入的搜索詞提供相應(yīng)的搜索結(jié)果,其中,網(wǎng)民輸入的搜索詞不僅僅可包含文字,還可包含多媒體信息,如語(yǔ)音、圖片等。圖片是多媒體信息中非常重要的組成部分,網(wǎng)民可通過(guò)適宜的圖片來(lái)表達(dá)其搜索需求,并進(jìn)行搜索。從而,搜索引擎能夠返回理想的圖片搜索結(jié)果給網(wǎng)民。
      [0003]搜索引擎智能出圖的核心目標(biāo)是將質(zhì)量出色、與網(wǎng)民的搜索需求有良好相關(guān)性的圖片展示給網(wǎng)民。在網(wǎng)民需求復(fù)雜化多樣化的前提下,必須準(zhǔn)備數(shù)量足夠多,內(nèi)容足夠豐富,質(zhì)量足夠高的圖片物料,才可能在整體上提升出圖的效果,滿足網(wǎng)民需求。因此,準(zhǔn)備可展示的圖片物料數(shù)據(jù)是重要的基礎(chǔ)性工作。
      [0004]但是,受到圖片數(shù)據(jù)來(lái)源、搜索結(jié)果展示面積等原因的限制,搜索引擎可提供、展現(xiàn)的圖片存在圖片的數(shù)量較少、質(zhì)量差異度較大、圖片與網(wǎng)民搜索需求的匹配程度較低等問(wèn)題。例如,搜索引擎可提供的多媒體物料中一部分物料主要來(lái)自于客戶自己提交,如客戶的一些標(biāo)志圖片、多媒體信息或者產(chǎn)品的注冊(cè)商標(biāo)、圖案等信息。但是受到客戶制作物料能力等客觀因素限制,物料的豐富性和質(zhì)量都比較匱乏。


      【發(fā)明內(nèi)容】

      [0005]本發(fā)明旨在至少在一定程度上解決上述技術(shù)問(wèn)題。
      [0006]為此,本發(fā)明的第一個(gè)目的在于提出一種用于搜索引擎的圖片物料處理方法,可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求。
      [0007]本發(fā)明的第二個(gè)目的在于提出一種用于搜索引擎的圖片物料處理裝置。
      [0008]本發(fā)明的第三個(gè)目的在于搜索引擎。
      [0009]為達(dá)上述目的,根據(jù)本發(fā)明第一方面實(shí)施例提出了一種用于搜索引擎的圖片物料處理方法,包括以下步驟:獲取源圖片物料;對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料;對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征;根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域;以及根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
      [0010]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,通過(guò)獲取源圖片物料,并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料,然后提取待處理圖片物料的信息特征,并確定待處理圖片物料的目標(biāo)區(qū)域,并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、符合網(wǎng)民需求的高質(zhì)量的圖片物料,一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及,另一方面,能夠更好的滿足網(wǎng)民可具象化的需求,符合網(wǎng)民不同場(chǎng)景下的搜索要求,提升了網(wǎng)民體驗(yàn)。
      [0011]此外,本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作,通過(guò)對(duì)此流程進(jìn)行工具化的封裝,能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理,為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且,能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶,根據(jù)客戶自身所有的圖片物料,最大程度利用資源,生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù),并跟隨數(shù)據(jù)源的變化不斷更新。
      [0012]本發(fā)明第二方面實(shí)施例提出了一種用于搜索引擎的圖片物料處理裝置,包括:獲取模塊,用于獲取源圖片物料;過(guò)濾模塊,用于對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料;特征提取模塊,用于對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征;確定模塊,用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域;以及生成模塊,用于根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
      [0013]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,通過(guò)獲取源圖片物料,并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料,然后提取待處理圖片物料的信息特征,并確定待處理圖片物料的目標(biāo)區(qū)域,并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求,一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及,另一方面,能夠更好的滿足網(wǎng)民可具象化的需求,符合網(wǎng)民不同場(chǎng)景下的搜索要求,提升了網(wǎng)民體驗(yàn)。
      [0014]此外,本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作,通過(guò)對(duì)此流程進(jìn)行工具化的封裝,能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理,為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且,能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶,根據(jù)客戶自身所有的圖片物料,最大程度利用資源,生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù),并跟隨數(shù)據(jù)源的變化不斷更新。
      [0015]本發(fā)明第三方面實(shí)施例提出了一種搜索引擎,包括本發(fā)明第二方面實(shí)施例的用于搜索引擎的圖片物料處理裝置。
      [0016]本發(fā)明實(shí)施例的搜索引擎,通過(guò)獲取源圖片物料,并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料,然后提取待處理圖片物料的信息特征,并確定待處理圖片物料的目標(biāo)區(qū)域,并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求,一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及,另一方面,能夠更好的滿足網(wǎng)民可具象化的需求,符合網(wǎng)民不同場(chǎng)景下的搜索要求,提升了網(wǎng)民體驗(yàn)。
      [0017]此外,本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作,通過(guò)對(duì)此流程進(jìn)行工具化的封裝,能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理,為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且,能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶,根據(jù)客戶自身所有的圖片物料,最大程度利用資源,生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù),并跟隨數(shù)據(jù)源的變化不斷更新。
      [0018]本發(fā)明的附加方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。

      【專利附圖】

      【附圖說(shuō)明】
      [0019]本發(fā)明的上述和/或附加的方面和優(yōu)點(diǎn)從結(jié)合下面附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:
      [0020]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖;
      [0021]圖2a為根據(jù)本發(fā)明一個(gè)實(shí)施例的待處理圖片物料的示意圖;
      [0022]圖2b和圖2c為根據(jù)本發(fā)明實(shí)施例的根據(jù)圖2a所示待處理圖片物料生成的圖片的不意圖;
      [0023]圖2d為根據(jù)本發(fā)明另一個(gè)實(shí)施例的待處理圖片物料的示意圖;
      [0024]圖2e和圖2f為根據(jù)本發(fā)明實(shí)施例的根據(jù)圖2d所示待處理圖片物料生成的圖片的不意圖;
      [0025]圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖;
      [0026]圖4為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖;
      [0027]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖;
      [0028]圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖;
      [0029]圖7為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。

      【具體實(shí)施方式】
      [0030]下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。
      [0031]由于搜索引擎的不同產(chǎn)品,在不同的場(chǎng)景下,對(duì)圖片物料有標(biāo)準(zhǔn)化和規(guī)范化的要求,例如必須滿足特定尺寸,不能包含非法信息,不能出現(xiàn)讓網(wǎng)民感到不適、傷害網(wǎng)民體驗(yàn)的信息,不能出現(xiàn)過(guò)于簡(jiǎn)單無(wú)實(shí)質(zhì)內(nèi)容的信息,因此,為了能夠?yàn)樗阉饕嫣峁└S富,質(zhì)量更高、符合搜索引擎標(biāo)準(zhǔn)和規(guī)范的圖片物料,以更好地滿足網(wǎng)民的搜索需求,本發(fā)明提出了一種用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法、裝置和搜索引擎。
      [0032]其中,網(wǎng)民是指使用搜索引擎輸入搜索關(guān)鍵詞進(jìn)行搜索,以獲得自身所需要的信息的群體。
      [0033]一種用于搜索引擎的圖片物料處理方法,包括以下步驟:獲取源圖片物料;對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料;對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征;根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域;以及根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0034]圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
      [0035]如圖1所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,包括:
      [0036]S101,獲取源圖片物料。
      [0037]目前,互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源,如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此,在本發(fā)明的實(shí)施例中,獲得授權(quán)許可的前提下,可通過(guò)多渠道來(lái)源獲取源圖片物料。例如,收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然,也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
      [0038]其中,客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品,購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
      [0039]S102,對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
      [0040]在本發(fā)明的實(shí)施例中,可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
      [0041]其中,不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
      [0042]具體地,可采用OCR (Optical Character Recognit1n,光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如,可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析,以識(shí)別出不當(dāng)信息。當(dāng)然,本發(fā)明對(duì)信息提取分析的方法不做限定,也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
      [0043]S103,對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
      [0044]在本發(fā)明的一個(gè)實(shí)施例中,可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中,信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。
      [0045]具體的識(shí)別分析方法可參照相關(guān)技術(shù),在此不再贅述。
      [0046]其中,待處理圖片物料的圖像識(shí)別結(jié)果可以是S102中的識(shí)別結(jié)果,或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別,在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
      [0047]此外,由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖),這類圖片中包含著2張以上的獨(dú)立子圖。因此,為了能夠識(shí)別出拼接圖,并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分,提高信息特征提取的準(zhǔn)確度,在本發(fā)明的一個(gè)實(shí)施例中,還需要先進(jìn)行拼接圖識(shí)別,并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖,并分別提取每個(gè)子圖的信息特征。
      [0048]S104,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
      [0049]由于人臉信息在一張圖中十分重要,在裁剪圖片時(shí)保留人臉信息可以起到加分作用,在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域,從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外,由于文字不容易被完整包含在裁剪圖中,并且文字在縮放過(guò)程中很容易造成模糊,因此,優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知,前景區(qū)域的信息量非常重要,目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
      [0050]因此,在本發(fā)明的一個(gè)實(shí)施例中,可對(duì)提取的信息特征進(jìn)行分析,通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征,確定待處理圖片物料的目標(biāo)區(qū)域。
      [0051]具體地,對(duì)于待處理圖片物料或者其子圖,如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍,則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則,需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地,可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少,且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域,并將該區(qū)域作為目標(biāo)區(qū)域。
      [0052]舉例來(lái)說(shuō),可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域,然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整,以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸,之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后,對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì),即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察,并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
      [0053]S105,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0054]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
      [0055]具體地,可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái),并將裁剪得到的圖片縮放至目標(biāo)尺寸,得到最終的圖片。
      [0056]舉例來(lái)說(shuō),對(duì)于圖2a所示的待處理圖片物料,通過(guò)S103-S105的步驟,可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片,或縮小為如圖2c所示的正方形圖片。由此,搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí),就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息,提升了網(wǎng)民體驗(yàn)。
      [0057]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,通過(guò)獲取源圖片物料,并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料,然后提取待處理圖片物料的信息特征,并確定待處理圖片物料的目標(biāo)區(qū)域,并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求,一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及,另一方面,能夠更好的滿足網(wǎng)民可具象化的需求,符合網(wǎng)民不同場(chǎng)景下的搜索要求,提升了網(wǎng)民體驗(yàn)。
      [0058]此外,本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作,通過(guò)對(duì)此流程進(jìn)行工具化的封裝,能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理,為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且,能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶,根據(jù)客戶自身所有的圖片物料,最大程度利用資源,生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù),并跟隨數(shù)據(jù)源的變化不斷更新。
      [0059]應(yīng)當(dāng)理解,在本發(fā)明的實(shí)施例中,在根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片之后,可根據(jù)圖片之間的相關(guān)性,將相關(guān)的圖片進(jìn)行拼接,從而能夠得到更多新的圖片,為搜索引擎提供更豐富的圖片資源,用以滿足網(wǎng)民的搜索需求。
      [0060]圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
      [0061]如圖3所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,包括:
      [0062]S301,獲取源圖片物料。
      [0063]目前,互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源,如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此,在本發(fā)明的實(shí)施例中,獲得授權(quán)許可的前提下,可通過(guò)多渠道來(lái)源獲取源圖片物料。例如,收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然,也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
      [0064]其中,客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品,購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
      [0065]S302,對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
      [0066]在本發(fā)明的實(shí)施例中,可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
      [0067]其中,不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
      [0068]具體地,可采用OCR (Optical Character Recognit1n,光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如,可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析,以識(shí)別出不當(dāng)信息。當(dāng)然,本發(fā)明對(duì)信息提取分析的方法不做限定,也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
      [0069]S303,對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
      [0070]在本發(fā)明的一個(gè)實(shí)施例中,可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中,信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。具體的識(shí)別分析方法可參照相關(guān)技術(shù),在此不再贅述。
      [0071]其中,待處理圖片物料的圖像識(shí)別結(jié)果可以是S302中的識(shí)別結(jié)果,或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別,在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
      [0072]此外,由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖),這類圖片中包含著2張以上的獨(dú)立子圖。因此,為了能夠識(shí)別出拼接圖,并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分,提高信息特征提取的準(zhǔn)確度,在本發(fā)明的一個(gè)實(shí)施例中,還需要先進(jìn)行拼接圖識(shí)別,并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖,并分別提取每個(gè)子圖的信息特征。
      [0073]S304,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
      [0074]由于人臉信息在一張圖中十分重要,在裁剪圖片時(shí)保留人臉信息可以起到加分作用,在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域,從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外,由于文字不容易被完整包含在裁剪圖中,并且文字在縮放過(guò)程中很容易造成模糊,因此,優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知,前景區(qū)域的信息量非常重要,目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
      [0075]因此,在本發(fā)明的一個(gè)實(shí)施例中,可對(duì)提取的信息特征進(jìn)行分析,通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征,確定待處理圖片物料的目標(biāo)區(qū)域。
      [0076]具體地,對(duì)于待處理圖片物料或者其子圖,如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍,則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則,需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地,可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少,且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域,并將該區(qū)域作為目標(biāo)區(qū)域。
      [0077]舉例來(lái)說(shuō),可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域,然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整,以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸,之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后,對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì),即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察,并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
      [0078]S305,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0079]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
      [0080]具體地,可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái),并將裁剪得到的圖片縮放至目標(biāo)尺寸,得到最終的圖片。
      [0081]舉例來(lái)說(shuō),對(duì)于圖2a所示的待處理圖片物料,通過(guò)S303-S305的步驟,可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片,或縮小為如圖2c所示的正方形圖片。由此,搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí),就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息,提升了網(wǎng)民體驗(yàn)。
      [0082]S306,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,其中,搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
      [0083]在本發(fā)明的實(shí)施例中,可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量,并設(shè)定不同信息特征的權(quán)重,結(jié)合圖片變形程度,綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
      [0084]具體地,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù);根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
      [0085]其中,質(zhì)量參數(shù),即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
      [0086]舉例來(lái)說(shuō),可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值,如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整),即進(jìn)行加分,如果不滿足質(zhì)量要求,則進(jìn)行減分。由此,通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求,得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù),然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中,可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重,從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
      [0087]在本發(fā)明的一個(gè)實(shí)施例中,可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用,即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求,進(jìn)行過(guò)濾處理,不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求,可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí),可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片,并展示給網(wǎng)民。
      [0088]舉例來(lái)說(shuō),對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異,其中圖2e所示的圖片保留了完整信息,圖2f所示的圖片裁剪掉了部分信息,因此圖2e所示的圖片的評(píng)分為10分,圖2f所示的圖片的評(píng)分為O分。
      [0089]由此,搜索引擎可根據(jù)評(píng)分結(jié)果,將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民,從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果,提升了網(wǎng)民的搜索體驗(yàn)。
      [0090]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,可根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,以使搜索引擎根據(jù)評(píng)分結(jié)果選擇相應(yīng)的圖片作為搜索結(jié)果提供給網(wǎng)民,使網(wǎng)民能夠獲得高質(zhì)量的搜索結(jié)果,提升了網(wǎng)民的搜索體驗(yàn)。
      [0091]圖4為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理方法的流程圖。
      [0092]如圖4所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,包括:
      [0093]S401,獲取源圖片物料。
      [0094]目前,互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源,如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此,在本發(fā)明的實(shí)施例中,獲得授權(quán)許可的前提下,可通過(guò)多渠道來(lái)源獲取源圖片物料。例如,收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然,也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。
      [0095]其中,客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品,購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
      [0096]S402,對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
      [0097]在本發(fā)明的實(shí)施例中,可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
      [0098]其中,不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
      [0099]具體地,可采用OCR (Optical Character Recognit1n,光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如,可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析,以識(shí)別出不當(dāng)信息。當(dāng)然,本發(fā)明對(duì)信息提取分析的方法不做限定,也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
      [0100]S403,對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
      [0101]在本發(fā)明的一個(gè)實(shí)施例中,可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中,信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。具體的識(shí)別分析方法可參照相關(guān)技術(shù),在此不再贅述。
      [0102]其中,待處理圖片物料的圖像識(shí)別結(jié)果可以是S402中的識(shí)別結(jié)果,或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別,在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
      [0103]此外,由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖),這類圖片中包含著2張以上的獨(dú)立子圖。因此,為了能夠識(shí)別出拼接圖,并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分,提高信息特征提取的準(zhǔn)確度,在本發(fā)明的一個(gè)實(shí)施例中,還需要先進(jìn)行拼接圖識(shí)別,并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖,并分別提取每個(gè)子圖的信息特征。
      [0104]S404,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
      [0105]由于人臉信息在一張圖中十分重要,在裁剪圖片時(shí)保留人臉信息可以起到加分作用,在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域,從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外,由于文字不容易被完整包含在裁剪圖中,并且文字在縮放過(guò)程中很容易造成模糊,因此,優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知,前景區(qū)域的信息量非常重要,目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
      [0106]因此,在本發(fā)明的一個(gè)實(shí)施例中,可對(duì)提取的信息特征進(jìn)行分析,通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征,確定待處理圖片物料的目標(biāo)區(qū)域。
      [0107]具體地,對(duì)于待處理圖片物料或者其子圖,如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍,則可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則,需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地,可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少,且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域,并將該區(qū)域作為目標(biāo)區(qū)域。
      [0108]舉例來(lái)說(shuō),可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域,然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整,以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸,之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后,對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì),即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察,并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
      [0109]S405,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0110]在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理可具體包括:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
      [0111]具體地,可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái),并將裁剪得到的圖片縮放至目標(biāo)尺寸,得到最終的圖片。
      [0112]舉例來(lái)說(shuō),對(duì)于圖2a所示的待處理圖片物料,通過(guò)S403-S405的步驟,可裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片,或縮小為如圖2c所示的正方形圖片。由此,搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí),就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息,提升了網(wǎng)民體驗(yàn)。
      [0113]S406,根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)圖片或者圖片與文字進(jìn)行拼接。
      [0114]在本發(fā)明的實(shí)施例中,當(dāng)網(wǎng)民進(jìn)行搜索時(shí),搜索引擎可根據(jù)網(wǎng)民的查詢?cè)~獲取與該查詢出相關(guān)的文字,并從預(yù)先經(jīng)過(guò)上述處理得到的圖片中獲取與該查詢相關(guān)的圖片,然后對(duì)這些圖片進(jìn)行拼接,或者將圖片與文字進(jìn)行拼接,得到信息更加豐富的拼接圖,從而能夠?yàn)榫W(wǎng)民提供更豐富的搜索結(jié)果和資源。
      [0115]例如,對(duì)于一家教育客戶,名稱為“XXX汽修學(xué)?!?,客戶自己提交的物料僅包含自身的企業(yè)logo。另外,還可從該客戶的網(wǎng)站上獲得的學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料。通過(guò)本發(fā)明實(shí)施例,可根據(jù)該企業(yè)logo、學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料進(jìn)行裁剪、縮放、拼接,從而得到數(shù)量遠(yuǎn)遠(yuǎn)多于客戶自己提交的,質(zhì)量較好且更豐富的圖片。
      [0116]S407,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,其中,搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
      [0117]在本發(fā)明的實(shí)施例中,可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量,并設(shè)定不同信息特征的權(quán)重,結(jié)合圖片變形程度,綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
      [0118]具體地,根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù);根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
      [0119]其中,質(zhì)量參數(shù),即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
      [0120]舉例來(lái)說(shuō),可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值,如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整),即進(jìn)行加分,如果不滿足質(zhì)量要求,則進(jìn)行減分。由此,通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求,得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù),然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中,可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重,從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
      [0121]在本發(fā)明的一個(gè)實(shí)施例中,可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用,即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求,進(jìn)行過(guò)濾處理,不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求,可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí),可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片,并展示給網(wǎng)民。
      [0122]舉例來(lái)說(shuō),對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異,其中圖2e所示的圖片保留了完整信息,圖2f所示的圖片裁剪掉了部分信息,因此圖2e所示的圖片的評(píng)分為10分,圖2f所示的圖片的評(píng)分為O分。
      [0123]由此,搜索引擎可根據(jù)評(píng)分結(jié)果,將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民,從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果,提升了網(wǎng)民的搜索體驗(yàn)。
      [0124]其中,S407也可在S406之前。
      [0125]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理方法,可根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)圖片或圖片與文字進(jìn)行拼接,得到信息更加豐富的拼接圖,拓展了圖片來(lái)源,更好地滿足網(wǎng)民需求,進(jìn)一步提升了網(wǎng)民體驗(yàn)。
      [0126]為了實(shí)現(xiàn)上述實(shí)施例,本發(fā)明還提出一種用于搜索引擎的圖片物料處理裝置。
      [0127]一種用于搜索引擎的圖片物料處理裝置,包括:獲取模塊,用于獲取源圖片物料;過(guò)濾模塊,用于對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料;特征提取模塊,用于對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征;確定模塊,用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域;以及生成模塊,用于根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0128]圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
      [0129]如圖5所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40和生成模塊50。
      [0130]具體地,獲取模塊10用于獲取源圖片物料。
      [0131]目前,互聯(lián)網(wǎng)上有充足的多媒體物料來(lái)源,如一些客戶自身的站點(diǎn)、擁有版權(quán)的物料庫(kù)以及由開(kāi)發(fā)者或者客戶設(shè)計(jì)并上傳的圖片資源等。因此,在本發(fā)明的實(shí)施例中,獲得授權(quán)許可的前提下,獲取模塊10可通過(guò)多渠道來(lái)源獲取源圖片物料。例如,收集互聯(lián)網(wǎng)中各個(gè)站點(diǎn)中的圖片、獲得第三方版權(quán)物料庫(kù)的授權(quán)后從物料庫(kù)中獲取圖片等。當(dāng)然,也可以自建源圖片物料、獲取或接收開(kāi)發(fā)者或者客戶設(shè)計(jì)后提供或上傳的圖片等。其中,客戶是指使用搜索引擎出圖商業(yè)產(chǎn)品,購(gòu)買(mǎi)了搜索關(guān)鍵詞的廣告主。
      [0132]過(guò)濾模塊20用于對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料。
      [0133]在本發(fā)明的實(shí)施例中,過(guò)濾模塊20可過(guò)濾掉源圖片物料中的已損壞的圖片、尺寸不滿足最低要求的圖片(如長(zhǎng)和/或?qū)捫∮谧畹鸵?、信息量過(guò)少的圖片(如二維碼圖片、純色圖片等)、質(zhì)量低(不清晰)的圖片、包含不當(dāng)信息的圖片等。
      [0134]其中,不當(dāng)信息可包括但不限于非法內(nèi)容(如色情、暴力內(nèi)容)、使網(wǎng)民感到不適的內(nèi)容(如網(wǎng)民看到會(huì)感到惡心的內(nèi)容)等。
      [0135]具體地,過(guò)濾模塊20可采用OCR (Optical Character Recognit1n,光學(xué)字符識(shí)別)、主體區(qū)域識(shí)別(如,可通過(guò)通用目標(biāo)檢測(cè)框技術(shù)進(jìn)行主體區(qū)域識(shí)別)、人臉識(shí)別、特殊圖片識(shí)別模型等技術(shù)對(duì)源圖片物料中的文字、內(nèi)容等進(jìn)行識(shí)別以及信息提取分析,以識(shí)別出不當(dāng)信息。當(dāng)然,本發(fā)明對(duì)信息提取分析的方法不做限定,也可使用其他方法或模型對(duì)源圖片物料進(jìn)行信息提取分析。
      [0136]特征提取模塊30用于對(duì)待處理圖片物料進(jìn)行特征提取以生成待處理圖片物料對(duì)應(yīng)的信息特征。
      [0137]在本發(fā)明的一個(gè)實(shí)施例中,特征提取模塊30可根據(jù)對(duì)待處理圖片物料的圖像識(shí)別結(jié)果進(jìn)行分析以提取出待處理圖片物料的信息特征。其中,信息特征可包括但不限于人臉、人物、文字、主體區(qū)域、前景、背景、地域、自然環(huán)境等。
      [0138]具體的識(shí)別分析方法可參照相關(guān)技術(shù),在此不再贅述。
      [0139]其中,待處理圖片物料的圖像識(shí)別結(jié)果可以是過(guò)濾模塊20在過(guò)濾過(guò)程中得到的識(shí)別結(jié)果,或者利用其他識(shí)別技術(shù)進(jìn)行更精準(zhǔn)的識(shí)別,在此對(duì)識(shí)別技術(shù)不進(jìn)行一一列舉。
      [0140]此外,由于有些圖片時(shí)由一張或多張獨(dú)立的圖片拼接而成的圖片(拼接圖),這類圖片中包含著2張以上的獨(dú)立子圖。因此,為了能夠識(shí)別出拼接圖,并對(duì)拼接圖中的對(duì)子圖進(jìn)行準(zhǔn)確拆分,提高信息特征提取的準(zhǔn)確度,在本發(fā)明的一個(gè)實(shí)施例中,還需要先進(jìn)行拼接圖識(shí)別,并對(duì)識(shí)別出的拼接圖拆分為獨(dú)立的子圖,并分別提取每個(gè)子圖的信息特征。
      [0141]確定模塊40用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征確定待處理圖片物料的目標(biāo)區(qū)域。
      [0142]由于人臉信息在一張圖中十分重要,在裁剪圖片時(shí)保留人臉信息可以起到加分作用,在裁剪圖片時(shí)可以根據(jù)人臉?biāo)趨^(qū)域提供禁止裁圖的區(qū)域,從而避免出現(xiàn)人臉被裁剪掉一半的情況。另外,由于文字不容易被完整包含在裁剪圖中,并且文字在縮放過(guò)程中很容易造成模糊,因此,優(yōu)質(zhì)裁剪圖不應(yīng)該含有大量的文字。根據(jù)經(jīng)驗(yàn)可知,前景區(qū)域的信息量非常重要,目標(biāo)區(qū)域在前景范圍內(nèi)更容易獲得有意義的圖像信息。
      [0143]因此,在本發(fā)明的一個(gè)實(shí)施例中,確定模塊40可對(duì)提取的信息特征進(jìn)行分析,通過(guò)獲取的人臉、人物、文字、主體區(qū)域、前景背景等信息特征,確定待處理圖片物料的目標(biāo)區(qū)域。
      [0144]更具體地,對(duì)于待處理圖片物料或者其子圖,如果圖片的尺寸與預(yù)設(shè)的目標(biāo)區(qū)域的尺寸(長(zhǎng)寬)的誤差小于預(yù)設(shè)范圍,則確定模塊40可將該待處理圖片物料或者子圖作為待處理圖片物料的目標(biāo)區(qū)域。否則,需要從待處理圖片物料或者子圖上確定目標(biāo)區(qū)域。更具體地,可通過(guò)算法確定待處理圖片物料或者子圖中覆蓋人臉最多、覆蓋文字最少,且前景和主體區(qū)域占待處理圖片物料或子圖的面積大于預(yù)設(shè)面積閾值的區(qū)域,并將該區(qū)域作為目標(biāo)區(qū)域。
      [0145]舉例來(lái)說(shuō),確定模塊40可先確定待處理圖片物料或者子圖中覆蓋人臉最多的主體區(qū)域,然后對(duì)這個(gè)區(qū)域進(jìn)行長(zhǎng)寬調(diào)整,以使該區(qū)域的尺寸滿足預(yù)設(shè)的目標(biāo)區(qū)域的尺寸,之后進(jìn)行邊界調(diào)整以躲避人臉和文字區(qū)域。最后,確定模塊40對(duì)進(jìn)行邊界調(diào)整之后的區(qū)域進(jìn)行置信度估計(jì),即根據(jù)該區(qū)域包含的人臉數(shù)、包含的文字?jǐn)?shù)、包含的前景面積、包含的主體面積、變形程度等信息進(jìn)行綜合考察,并將滿足置信度要求的區(qū)域確定為目標(biāo)區(qū)域。
      [0146]生成模塊50用于根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片。
      [0147]在本發(fā)明的一個(gè)實(shí)施例中,生成模塊50可具體用于:根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行裁剪并縮放。
      [0148]更具體地,生成模塊50可根據(jù)目標(biāo)區(qū)域從待處理圖片物料中裁剪出來(lái),并將裁剪得到的圖片縮放至目標(biāo)尺寸,得到最終的圖片。
      [0149]舉例來(lái)說(shuō),對(duì)于圖2a所示的待處理圖片物料,通過(guò)特征提取模塊30、確定模塊40和生成模塊50可將其裁剪并縮小為如圖2b所示的長(zhǎng)方形圖片,或縮小為如圖2c所示的正方形圖片。由此,搜索引擎將處理后的圖片作為搜索結(jié)果提供給網(wǎng)民時(shí),就不會(huì)因?yàn)閳D片尺寸太大而占據(jù)大部分搜索結(jié)果界面而導(dǎo)致網(wǎng)民無(wú)法獲取全面的搜索結(jié)果信息,提升了網(wǎng)民體驗(yàn)。
      [0150]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,通過(guò)獲取源圖片物料,并對(duì)源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料,然后提取待處理圖片物料的信息特征,并確定待處理圖片物料的目標(biāo)區(qū)域,并根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成供搜索引擎使用的圖片,通過(guò)利用深度學(xué)習(xí)處理技術(shù)對(duì)待處理圖片進(jìn)行處理后可為搜索引擎提供充足、豐富且高質(zhì)量的圖片物料,能夠適應(yīng)不同的搜索引擎產(chǎn)品規(guī)范和要求、滿足網(wǎng)民對(duì)高質(zhì)量的圖片的需求,一方面有利于圖片對(duì)應(yīng)的結(jié)果的推廣和普及,另一方面,能夠更好的滿足網(wǎng)民可具象化的需求,符合網(wǎng)民不同場(chǎng)景下的搜索要求,提升了網(wǎng)民體驗(yàn)。
      [0151]此外,本發(fā)明的實(shí)施例有利于將圖片物料處理技術(shù)進(jìn)行大規(guī)模應(yīng)用并形成標(biāo)準(zhǔn)流程化操作,通過(guò)對(duì)此流程進(jìn)行工具化的封裝,能夠支持長(zhǎng)期大批量的數(shù)據(jù)處理,為搜索引擎提供豐富、充足、高質(zhì)量的圖片來(lái)源。并且,能夠針對(duì)不同行業(yè)屬性、不同規(guī)模的客戶,根據(jù)客戶自身所有的圖片物料,最大程度利用資源,生成每一位客戶獨(dú)立的圖片數(shù)據(jù)庫(kù),并跟隨數(shù)據(jù)源的變化不斷更新。
      [0152]應(yīng)當(dāng)理解,在本發(fā)明的實(shí)施例中,在根據(jù)目標(biāo)區(qū)域?qū)Υ幚韴D片物料進(jìn)行處理以生成圖片之后,可根據(jù)圖片之間的相關(guān)性,將相關(guān)的圖片進(jìn)行拼接,從而能夠得到更多新的圖片,為搜索引擎提供更豐富的圖片資源,用以滿足網(wǎng)民的搜索需求。
      [0153]圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
      [0154]如圖6所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50和評(píng)分模塊60。
      [0155]具體地,獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40和生成模塊50可參照?qǐng)D5所示實(shí)施例,在此不再贅述。
      [0156]評(píng)分模塊60用于根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,其中,搜索引擎根據(jù)評(píng)分結(jié)果選擇使用。
      [0157]在本發(fā)明的實(shí)施例中,評(píng)分模塊60可評(píng)估人臉、文字、主體區(qū)域、前景面積等信息特征的保留完整性和裁剪質(zhì)量,并設(shè)定不同信息特征的權(quán)重,結(jié)合圖片變形程度,綜合計(jì)算出圖片質(zhì)量對(duì)應(yīng)的評(píng)分。
      [0158]更具體地,評(píng)分模塊60可具體用于:根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù);根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
      [0159]其中,質(zhì)量參數(shù),即圖片質(zhì)量可包括但不限于內(nèi)容豐富程度、主體完整性、信息表述是否直觀等。
      [0160]舉例來(lái)說(shuō),評(píng)分模塊60可對(duì)每個(gè)質(zhì)量參數(shù)設(shè)定一個(gè)基礎(chǔ)分值,如果一個(gè)質(zhì)量參數(shù)滿足其對(duì)應(yīng)的質(zhì)量要求(例如主體保留完整),即進(jìn)行加分,如果不滿足質(zhì)量要求,則進(jìn)行減分。由此,通過(guò)設(shè)定覆蓋面盡可能廣的質(zhì)量參數(shù)的質(zhì)量要求,得到每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù),然后將各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行求和得到圖片的評(píng)分。在本發(fā)明的一個(gè)實(shí)施例中,可預(yù)先設(shè)定每個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的權(quán)重,從而對(duì)各個(gè)質(zhì)量參數(shù)對(duì)應(yīng)的質(zhì)量分?jǐn)?shù)進(jìn)行加權(quán)求和得到圖片的評(píng)分。
      [0161]在本發(fā)明的一個(gè)實(shí)施例中,可通過(guò)設(shè)定分?jǐn)?shù)閾值判斷圖片是否可用,即是否適合在搜索引擎上展現(xiàn)給網(wǎng)民。如果圖片的評(píng)分低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量不符合搜索引擎展現(xiàn)要求,進(jìn)行過(guò)濾處理,不予使用。如果圖片的評(píng)分不低于分?jǐn)?shù)閾值,則認(rèn)為該圖片的質(zhì)量符合搜索引擎展現(xiàn)要求,可作為搜索引擎的可用圖片。搜索引擎在提供搜索結(jié)果時(shí),可按照評(píng)分高低選擇符合網(wǎng)民需求的圖片,并展示給網(wǎng)民。
      [0162]舉例來(lái)說(shuō),對(duì)于圖2d所示的圖片中的標(biāo)的物體在圖2e和圖2f兩個(gè)裁剪結(jié)果中的信息保留程度有差異,其中圖2e所示的圖片保留了完整信息,圖2f所示的圖片裁剪掉了部分信息,因此圖2e所示的圖片的評(píng)分為10分,圖2f所示的圖片的評(píng)分為O分。
      [0163]由此,搜索引擎可根據(jù)評(píng)分結(jié)果,將與網(wǎng)民的搜索需求相符且評(píng)分較高的圖片提供給網(wǎng)民,從而網(wǎng)民能夠得到高質(zhì)量的搜索結(jié)果,提升了網(wǎng)民的搜索體驗(yàn)。
      [0164]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,可根據(jù)待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,以使搜索引擎根據(jù)評(píng)分結(jié)果選擇相應(yīng)的圖片作為搜索結(jié)果提供給網(wǎng)民,使網(wǎng)民能夠獲得高質(zhì)量的搜索結(jié)果,提升了網(wǎng)民的搜索體驗(yàn)。
      [0165]圖7為根據(jù)本發(fā)明又一個(gè)實(shí)施例的用于搜索引擎的圖片物料處理裝置的結(jié)構(gòu)示意圖。
      [0166]如圖7所示,根據(jù)本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,包括:獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50、評(píng)分模塊60和拼接模塊
      70 ο
      [0167]具體地,獲取模塊10、過(guò)濾模塊20、特征提取模塊30、確定模塊40、生成模塊50和評(píng)分模塊60可參照?qǐng)D6所示實(shí)施例,在此不再贅述。
      [0168]拼接模塊70用于根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)圖片或者圖片與文字進(jìn)行拼接。
      [0169]在本發(fā)明的實(shí)施例中,當(dāng)網(wǎng)民進(jìn)行搜索時(shí),拼接模塊70可根據(jù)網(wǎng)民的查詢?cè)~獲取與該查詢出相關(guān)的文字,并從預(yù)先經(jīng)過(guò)上述處理得到的圖片中獲取與該查詢相關(guān)的圖片,然后對(duì)這些圖片進(jìn)行拼接,或者將圖片與文字進(jìn)行拼接,得到信息更加豐富的拼接圖,從而能夠?yàn)榫W(wǎng)民提供更豐富的搜索結(jié)果和資源。
      [0170]例如,對(duì)于一家教育客戶,名稱為“XXX汽修學(xué)?!?,客戶自己提交的物料僅包含自身的企業(yè)logo。另外,還可從該客戶的網(wǎng)站上獲得的學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料。通過(guò)本發(fā)明實(shí)施例,可根據(jù)該企業(yè)logo、學(xué)校的環(huán)境、住宿生活條件、教學(xué)設(shè)施、訓(xùn)練設(shè)備和場(chǎng)地、所獲獎(jiǎng)項(xiàng)等相關(guān)的圖片物料進(jìn)行裁剪、縮放、拼接,從而得到數(shù)量遠(yuǎn)遠(yuǎn)多于客戶自己提交的,質(zhì)量較好且更豐富的圖片。
      [0171]本發(fā)明實(shí)施例的用于搜索引擎的圖片物料處理裝置,可根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)圖片或圖片與文字進(jìn)行拼接,得到信息更加豐富的拼接圖,拓展了圖片來(lái)源,更好地滿足網(wǎng)民需求,進(jìn)一步提升了網(wǎng)民體驗(yàn)。
      [0172]在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不必須針對(duì)的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。此外,在不相互矛盾的情況下,本領(lǐng)域的技術(shù)人員可以將本說(shuō)明書(shū)中描述的不同實(shí)施例或示例以及不同實(shí)施例或示例的特征進(jìn)行結(jié)合和組合。
      [0173]此外,術(shù)語(yǔ)“第一”、“第二”僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性或者隱含指明所指示的技術(shù)特征的數(shù)量。由此,限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個(gè)該特征。在本發(fā)明的描述中,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上,除非另有明確具體的限定。
      [0174]流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬【技術(shù)領(lǐng)域】的技術(shù)人員所理解。
      [0175]在流程圖中表示或在此以其他方式描述的邏輯和/或步驟,例如,可以被認(rèn)為是用于實(shí)現(xiàn)邏輯功能的可執(zhí)行指令的定序列表,可以具體實(shí)現(xiàn)在任何計(jì)算機(jī)可讀介質(zhì)中,以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備(如基于計(jì)算機(jī)的系統(tǒng)、包括處理器的系統(tǒng)或其他可以從指令執(zhí)行系統(tǒng)、裝置或設(shè)備取指令并執(zhí)行指令的系統(tǒng))使用,或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用。就本說(shuō)明書(shū)而言,"計(jì)算機(jī)可讀介質(zhì)"可以是任何可以包含、存儲(chǔ)、通信、傳播或傳輸程序以供指令執(zhí)行系統(tǒng)、裝置或設(shè)備或結(jié)合這些指令執(zhí)行系統(tǒng)、裝置或設(shè)備而使用的裝置。計(jì)算機(jī)可讀介質(zhì)的更具體的示例(非窮盡性列表)包括以下:具有一個(gè)或多個(gè)布線的電連接部(電子裝置),便攜式計(jì)算機(jī)盤(pán)盒(磁裝置),隨機(jī)存取存儲(chǔ)器(RAM),只讀存儲(chǔ)器(ROM),可擦除可編輯只讀存儲(chǔ)器(EPR0M或閃速存儲(chǔ)器),光纖裝置,以及便攜式光盤(pán)只讀存儲(chǔ)器(CDROM)。另外,計(jì)算機(jī)可讀介質(zhì)甚至可以是可在其上打印所述程序的紙或其他合適的介質(zhì),因?yàn)榭梢岳缤ㄟ^(guò)對(duì)紙或其他介質(zhì)進(jìn)行光學(xué)掃描,接著進(jìn)行編輯、解譯或必要時(shí)以其他合適方式進(jìn)行處理來(lái)以電子方式獲得所述程序,然后將其存儲(chǔ)在計(jì)算機(jī)存儲(chǔ)器中。
      [0176]應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn):具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門(mén)電路的離散邏輯電路,具有合適的組合邏輯門(mén)電路的專用集成電路,可編程門(mén)陣列(PGA),現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)等。
      [0177]本【技術(shù)領(lǐng)域】的普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。
      [0178]此外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。
      [0179]上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。盡管上面已經(jīng)示出和描述了本發(fā)明的實(shí)施例,可以理解的是,上述實(shí)施例是示例性的,不能理解為對(duì)本發(fā)明的限制,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的范圍內(nèi)可以對(duì)上述實(shí)施例進(jìn)行變化、修改、替換和變型。
      【權(quán)利要求】
      1.一種用于搜索引擎的圖片物料處理方法,其特征在于,包括以下步驟: 獲取源圖片物料; 對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料; 對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征; 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域;以及 根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
      2.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法,其特征在于,所述根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理具體包括: 根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行裁剪并縮放。
      3.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法,其特征在于,還包括: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,其中,所述搜索弓I擎根據(jù)所述評(píng)分結(jié)果選擇使用。
      4.如權(quán)利要求3所述的用于搜索引擎的圖片物料處理方法,其特征在于,所述根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分具體包括: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù); 根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
      5.如權(quán)利要求1所述的用于搜索引擎的圖片物料處理方法,其特征在于,還包括: 根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)所述圖片或者所述圖片與文字進(jìn)行拼接。
      6.一種用于搜索引擎的圖片物料處理裝置,其特征在于,包括: 獲取模塊,用于獲取源圖片物料; 過(guò)濾模塊,用于對(duì)所述源圖片物料進(jìn)行過(guò)濾以生成待處理圖片物料; 特征提取模塊,用于對(duì)所述待處理圖片物料進(jìn)行特征提取以生成所述待處理圖片物料對(duì)應(yīng)的信息特征; 確定模塊,用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述待處理圖片物料的目標(biāo)區(qū)域;以及 生成模塊,用于根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行處理以生成圖片。
      7.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置,其特征在于,所述生成模塊具體用于: 根據(jù)所述目標(biāo)區(qū)域?qū)λ龃幚韴D片物料進(jìn)行裁剪并縮放。
      8.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置,其特征在于,還包括: 評(píng)分模塊,用于根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征對(duì)處理后生成的圖片進(jìn)行評(píng)分,其中,所述搜索引擎根據(jù)所述評(píng)分結(jié)果選擇使用。
      9.如權(quán)利要求8所述的用于搜索引擎的圖片物料處理裝置,其特征在于,所述評(píng)分模塊具體用于: 根據(jù)所述待處理圖片物料對(duì)應(yīng)的信息特征確定所述處理后生成的圖片的質(zhì)量參數(shù); 根據(jù)所述質(zhì)量參數(shù)生成所述處理后生成的圖片的評(píng)分。
      10.如權(quán)利要求6所述的用于搜索引擎的圖片物料處理裝置,其特征在于,還包括: 拼接模塊,用于根據(jù)網(wǎng)民所請(qǐng)求的查詢?cè)~,對(duì)多個(gè)所述圖片或者所述圖片與文字進(jìn)行拼接。
      11.一種搜索引擎,其特征在于,包括如權(quán)利要求6至10任一項(xiàng)所述的用于搜索引擎的圖片物料處理裝置。
      【文檔編號(hào)】G06F17/30GK104504104SQ201410841895
      【公開(kāi)日】2015年4月8日 申請(qǐng)日期:2014年12月30日 優(yōu)先權(quán)日:2014年12月30日
      【發(fā)明者】秦首科, 張澤明, 韓友, 江焱, 陳志揚(yáng), 程小華, 徐培治, 馬小林, 文石磊, 陳世佳, 李旭斌, 陳敏 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
      網(wǎng)友詢問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1