專利名稱:圖片搜索方法及搜索系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索引擎技術(shù),尤其涉及一種圖片搜索方法及搜索系統(tǒng)。
背景技術(shù):
隨著互聯(lián)網(wǎng)上信息的飛速增長(zhǎng),網(wǎng)絡(luò)上充斥了越來(lái)越多的冗余信息,而對(duì)于在 網(wǎng)絡(luò)上搜尋自己所需要信息的互聯(lián)網(wǎng)用戶而言,面對(duì)這些漫無(wú)邊際的信息無(wú)疑像大海撈 針。搜索引擎的出現(xiàn)無(wú)疑在一定程度上為用戶的搜索需求帶來(lái)了很大便利。搜索引擎是 一種在網(wǎng)絡(luò)上應(yīng)用的軟件系統(tǒng),其以一定的策略在網(wǎng)絡(luò)上搜集和發(fā)現(xiàn)信息,并在對(duì)信息 進(jìn)行處理和組織后,為用戶提供互聯(lián)網(wǎng)上的信息搜索服務(wù)。通常,這種軟件系統(tǒng)提供一 個(gè)網(wǎng)頁(yè)界面,讓用戶在客戶端通過(guò)瀏覽器軟件提交搜索詞,然后很快返回一個(gè)可能和用 戶輸入的搜索內(nèi)容相關(guān)的信息列表。這個(gè)列表通常會(huì)包括上萬(wàn)個(gè)條目,每個(gè)條目代表一 篇搜索到的相關(guān)網(wǎng)頁(yè)。過(guò)去十幾年以來(lái),相應(yīng)地,眾多的互聯(lián)網(wǎng)搜索引擎及對(duì)應(yīng)的網(wǎng)站應(yīng)運(yùn)而生,這 中間的佼佼者包括百度公司的百度搜索(www.baidu.com)和谷歌公司的谷歌搜索(www. google.cn)。隨著網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,用戶對(duì)搜索引擎的要求已經(jīng)不再滿足于只是對(duì)文本 的搜索,很多用戶還希望可以通過(guò)搜索引擎對(duì)網(wǎng)絡(luò)圖片進(jìn)行搜索。然而,在目前的圖片 搜索系統(tǒng)中,如谷歌、YAHOO、BING等均是采用基于文本的搜索技術(shù)?;谖谋镜膱D 片搜索是將圖片作為數(shù)據(jù)庫(kù)存儲(chǔ)的對(duì)象,用關(guān)鍵字或自由文本對(duì)其進(jìn)行描述。然而,對(duì) 于圖片中包含的視覺(jué)特征,如顏色或形狀等,無(wú)法用文本對(duì)這些視覺(jué)特征進(jìn)行客觀的描 述。當(dāng)需要根據(jù)圖片中包含的視覺(jué)特征搜索圖片時(shí),基于文本的搜索技術(shù)將不再適用。 舉例說(shuō)明現(xiàn)在多數(shù)使用搜索引擎的用戶經(jīng)常遇到這樣的問(wèn)題,在網(wǎng)站或電腦上看到一 張圖片,該圖片可能是人物、風(fēng)景、物品等,而并不知道該圖片中的人物是誰(shuí)、風(fēng)景是 在哪兒、物品是什么,如圖1所示,該圖片10是用戶在網(wǎng)站上看到的一個(gè)物品,當(dāng)用戶 想了解該圖片10中的物品是什么時(shí),很難將該物品的視覺(jué)特征用語(yǔ)言描述出來(lái),即便表 達(dá)能力較好的用戶將其視覺(jué)特征描述出來(lái)了,也很難在現(xiàn)有的搜索引擎中找到與該圖片 相似的圖片和相應(yīng)的文本信息,導(dǎo)致搜索效率低下,使用網(wǎng)絡(luò)流量較大。中國(guó)專利申請(qǐng)第200910300147.1號(hào),揭示了一種圖片搜索系統(tǒng)及方法,該方法 首先提取查詢圖片的視覺(jué)特征,再根據(jù)查詢圖片的視覺(jué)特征及圖片索引數(shù)據(jù)庫(kù)中各個(gè)圖 庫(kù)圖片的索引信息計(jì)算各個(gè)圖庫(kù)圖片的相似度,并且利用分布式架構(gòu)執(zhí)行搜索任務(wù),最 后快速地搜索出與查詢圖片相似的圖庫(kù)圖片。該系統(tǒng)包括提取模塊,用于提取查詢圖片 的視覺(jué)特征,并將查詢圖片的視覺(jué)特征發(fā)送給各個(gè)計(jì)算子節(jié)點(diǎn)服務(wù)器;分配模塊,用于 根據(jù)圖片索引數(shù)據(jù)庫(kù)的大小以及計(jì)算子結(jié)點(diǎn)服務(wù)器的數(shù)量給各個(gè)計(jì)算子結(jié)點(diǎn)服務(wù)器分配 搜索任務(wù),以使各個(gè)計(jì)算子結(jié)點(diǎn)服務(wù)器根據(jù)各個(gè)圖庫(kù)圖片的索引信息及查詢圖片的視覺(jué) 特征計(jì)算各個(gè)圖庫(kù)圖片的相似度并返回各個(gè)圖庫(kù)圖片的相似度及索引信息;匯總模塊, 用于對(duì)各個(gè)計(jì)算子結(jié)點(diǎn)服務(wù)器返回的各個(gè)圖庫(kù)圖片的相似度及索引信息進(jìn)行匯總;排序模塊,用于將匯總后的各個(gè)圖庫(kù)圖片的相似度發(fā)送給排序服務(wù)器,以使排序服務(wù)器根據(jù) 各個(gè)圖庫(kù)圖片的相似度對(duì)各個(gè)圖庫(kù)圖片進(jìn)行排序;輸出模塊,用于接收排序服務(wù)器的排 序結(jié)果,并根據(jù)該排序結(jié)果輸出各個(gè)圖庫(kù)圖片的索引信息。然而這種圖片搜索系統(tǒng)及方 法均不是提供對(duì)全網(wǎng)圖片的搜索,且只能根據(jù)圖片搜索到其相似的圖片,而并不能搜索 到與之相對(duì)應(yīng)的文本信息。有鑒于此,需要提供一種圖片搜索方法及搜索系統(tǒng),可根據(jù)圖片本身搜索其相 似圖片和對(duì)應(yīng)文本信息,滿足用戶需求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種改進(jìn)的基于圖片的搜索方法,其不僅可以通過(guò)圖片 搜索相似圖片,還可以根據(jù)圖片搜索到與之相對(duì)應(yīng)的文本信息。本發(fā)明的目的還在于提供一種實(shí)現(xiàn)上述基于圖片的搜索方法的搜索系統(tǒng)。為實(shí)現(xiàn)上述發(fā)明目的之一,本發(fā)明的一種基于圖片的搜索方法,包括以下步 驟Si、接收并處理上傳圖片;S2、計(jì)算所述圖片局部特征;S3、通過(guò)所述圖片局部特征在圖片特征索引中搜索相似圖片;S4、通過(guò)所述相似圖片在文本索引中搜索文本數(shù)據(jù);S5、輸出所述相似圖片與所述文本數(shù)據(jù)。作為本發(fā)明的進(jìn)一步改進(jìn),在所述S5前,還包括排序步驟,對(duì)搜索到的所述相似圖片和所述文本數(shù)據(jù)進(jìn)行排序。作為本發(fā)明的進(jìn)一步改進(jìn),所述排序參考因素為圖片相似度。作為本發(fā)明的進(jìn)一步改進(jìn),所述排序參考因素為圖片相似度、死鏈狀態(tài),以及 網(wǎng)頁(yè)權(quán)值。作為本發(fā)明的進(jìn)一步改進(jìn),所述Sl步驟包括SlU接收用戶上傳圖片;S13、根據(jù)圖片的內(nèi)容簽名分發(fā)所述上傳圖片。作為本發(fā)明的進(jìn)一步改進(jìn),在所述S13步驟前,還包括S12、壓縮所述上傳圖片若上傳圖片大于設(shè)定閾值,則將所述上傳圖片壓縮 后,再進(jìn)入S13步驟。作為本發(fā)明的進(jìn)一步改進(jìn),所述S2步驟包括判斷上傳圖片是否為本地圖片;若不是本地圖片,則下載所述URL地址的圖片;計(jì)算所述圖片局部特征。作為本發(fā)明的進(jìn)一步改進(jìn),所述S5步驟包括S51、將排序后的搜索結(jié)果緩存;S52、將所述搜索結(jié)果拼裝后輸出結(jié)果頁(yè)面;S53、將所述結(jié)果頁(yè)面輸出。作為本發(fā)明的進(jìn)一步改進(jìn),所述圖片特征索引和所述文本索引的建立方法包括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ;獲取所述圖片的文本信息;計(jì)算所述圖片的局部特征;查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征;若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征 標(biāo)記至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。作為本發(fā)明的進(jìn)一步改進(jìn),所述圖片特征索引和所述文本索引的建立方法包 括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ;獲取圖片的URL;計(jì)算所述圖片的局部特征;查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征;若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征 標(biāo)記至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。作為本發(fā)明的進(jìn)一步改進(jìn),所述圖片特征索引和所述文本索引的建立方法包 括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ;計(jì)算所述圖片的局部特征;查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征;若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征 標(biāo)記至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。作為本發(fā)明的進(jìn)一步改進(jìn),在查詢存儲(chǔ)的已有圖片特征后,還包括建縮略圖 庫(kù),所述縮略圖庫(kù)可將縮略圖插入到線上縮略圖訪問(wèn)服務(wù)系統(tǒng)中。作為本發(fā)明的進(jìn)一步改進(jìn),在通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL步驟中,所述 網(wǎng)絡(luò)數(shù)據(jù)為展示數(shù)據(jù),所述網(wǎng)絡(luò)圖片為展示圖片。作為本發(fā)明的進(jìn)一步改進(jìn),建立所述已有圖片特征,包括以下步驟在全網(wǎng)圖片數(shù)據(jù)中提取圖片;分布式計(jì)算所述圖片的圖片特征;存儲(chǔ)所述圖片特征。作為本發(fā)明的進(jìn)一步改進(jìn),在“分布式計(jì)算所述圖片的圖片特征”步驟之前, 還包括判斷該圖片是否已計(jì)算過(guò)圖片特征;
若未計(jì)算過(guò)圖片特征,則進(jìn)行“分布式計(jì)算所述圖片的圖片特征”步驟。作為本發(fā)明的進(jìn)一步改進(jìn),在“分布式計(jì)算所述圖片的圖片特征”之前,還包 括判斷該圖片是否已計(jì)算過(guò)圖片特征;若已計(jì)算過(guò)所述圖片的圖片特征,則回到“在全網(wǎng)圖片數(shù)據(jù)中提取圖片”步驟 中,提取下一圖片。作為本發(fā)明的進(jìn)一步改進(jìn),所述分布式計(jì)算圖片特征是載入視覺(jué)字典,將圖片 相關(guān)的特征量化到視覺(jué)字。相應(yīng)地,作為實(shí)現(xiàn)上述另一目的,本發(fā)明的一種基于圖片的搜索系統(tǒng)包括WEB服務(wù)器和分發(fā)拼裝模塊用于接收并處理上傳圖片,以及輸出搜索到的所 述相似圖片與所述文本數(shù)據(jù);特征提取模塊用于計(jì)算所述圖片局部特征;圖片特征索引模塊用于通過(guò)所述圖片局部特征在所述圖片特征索引模塊中搜 索相似圖片;文本索引模塊用于通過(guò)所述相似圖片在所述文本索引模塊中搜索文本數(shù)據(jù)。作為本發(fā)明的進(jìn)一步改進(jìn),所述WEB服務(wù)器的功能還包括用于負(fù)責(zé)與用戶瀏 覽器交互,支持用戶在瀏覽器上進(jìn)行圖片上傳的POST請(qǐng)求,維持與用戶的連接,并將用 戶上傳的圖片發(fā)送給所述分發(fā)拼裝模塊,并維持與所述分發(fā)拼裝模塊的連接,等待所述 分發(fā)拼裝模塊返回的結(jié)果頁(yè)面,再得到該所述結(jié)果頁(yè)面后將其返回至所述用戶瀏覽器。作為本發(fā)明的進(jìn)一步改進(jìn),所述分發(fā)拼裝模塊的功能還包括用于接收所述 WEB服務(wù)器傳遞的圖片,并根據(jù)圖片內(nèi)容簽名發(fā)送給不同的特征提取模塊,以及將搜索 結(jié)果拼裝為結(jié)果頁(yè)面并返回至所述WEB服務(wù)器。作為本發(fā)明的進(jìn)一步改進(jìn),所述特征提取模塊的功能還包括用于對(duì)搜索到的 所述相似圖片與所述文本數(shù)據(jù)進(jìn)行緩存和排序。作為本發(fā)明的進(jìn)一步改進(jìn),所述排序參考因素為圖片相似度。作為本發(fā)明的進(jìn)一步改進(jìn),所述排序參考因素為圖片相似度、死鏈狀態(tài),以及 網(wǎng)頁(yè)權(quán)值。作為本發(fā)明的進(jìn)一步改進(jìn),所述一個(gè)分發(fā)拼裝模塊對(duì)應(yīng)多個(gè)特征提取模塊。作為本發(fā)明的進(jìn)一步改進(jìn),所述一個(gè)特征提取模塊對(duì)應(yīng)多個(gè)圖片特征索引模塊 和多個(gè)文本索引模塊。作為本發(fā)明的進(jìn)一步改進(jìn),所述圖片搜索系統(tǒng)還包括URL圖片下載模塊用于 當(dāng)用戶上傳圖片URL地址時(shí),下載URL地址上的圖片,并將所述圖片發(fā)送至特征提取模 塊。作為本發(fā)明的進(jìn)一步改進(jìn),為建立所述圖片特征索引模塊和所述文本索引模 塊,所述圖片搜索系統(tǒng)還包括圖片獲取模塊用于通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ;文本獲取模塊用于獲取所述圖片的文本信息;圖片特征計(jì)算模塊用于計(jì)算所述圖片的局部特征;特征存儲(chǔ)模塊用于查詢存儲(chǔ)的已有圖片特征;
索引建立模塊用于建立文本索引模塊和圖片特征索引模塊。作為本發(fā)明的進(jìn)一步改進(jìn),所述圖片搜索系統(tǒng)還包括縮略圖建庫(kù)模塊用于建 立縮略圖庫(kù),將縮略圖插入到線上縮略圖訪問(wèn)服務(wù)系統(tǒng)中。作為本發(fā)明的進(jìn)一步改進(jìn),所述網(wǎng)絡(luò)數(shù)據(jù)為展示數(shù)據(jù),所述網(wǎng)絡(luò)圖片為展示圖 片。作為本發(fā)明的進(jìn)一步改進(jìn),為了建立所述特征存儲(chǔ)模塊,所述圖片搜索系統(tǒng)還 包括圖片數(shù)據(jù)存儲(chǔ)模塊用于存儲(chǔ)全網(wǎng)圖片數(shù)據(jù);圖片傳輸模塊用于在所述圖片數(shù)據(jù)存儲(chǔ)模塊中提取圖片,并將所述圖片傳輸 至分布式計(jì)算平臺(tái),以及,接收所述分布式計(jì)算平臺(tái)計(jì)算完成的圖片特征,并將該圖片 特征傳輸至所述的所述特征存儲(chǔ)模塊;分布式計(jì)算平臺(tái)用于分布式計(jì)算所述圖片的圖片特征。作為本發(fā)明的進(jìn)一步改進(jìn),所述分布式計(jì)算圖片特征是載入視覺(jué)字典,將圖片 相關(guān)的特征量化到視覺(jué)字。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是通過(guò)本發(fā)明的基于圖片的搜索方法和 系統(tǒng),不僅可實(shí)現(xiàn)在全網(wǎng)通過(guò)圖片搜索與之相似的圖片,還可以根據(jù)圖片搜索與之相對(duì) 應(yīng)的文本信息,滿足用戶需求,提高搜索效率,節(jié)約網(wǎng)絡(luò)流量,同時(shí),本發(fā)明通過(guò)空間 劃分,進(jìn)行視覺(jué)字量化和進(jìn)行索引,解決了大數(shù)據(jù)量的查詢效率問(wèn)題,使得上幾十億的 圖片,檢索只需要幾百毫秒。
圖1是本發(fā)明中具體實(shí)例中的待搜索圖片;
圖2是本發(fā)明圖片搜索引擎結(jié)果頁(yè)面;
圖3是本發(fā)明一實(shí)施方式圖片搜索系統(tǒng)的模塊圖4是本發(fā)明一實(shí)施方式圖片搜索方法的流程圖5是本發(fā)明Sl步驟的子流程圖6是本發(fā)明S2步驟的子流程圖7是本發(fā)明S6步驟的子流程圖8是本發(fā)明圖片特征索引和文本索引建立方法的流程圖9是本發(fā)明為建立圖片特征索引模塊和文本索引模塊的系統(tǒng)模塊圖
圖10是本發(fā)明特征存儲(chǔ)模塊建立方法的流程圖11是本發(fā)明為建立特征存儲(chǔ)模塊的系統(tǒng)模塊圖。
具體實(shí)施例方式以下將結(jié)合附圖所示的各實(shí)施方式對(duì)本發(fā)明進(jìn)行詳細(xì)描述。但這些實(shí)施方式并 不限制本發(fā)明,本領(lǐng)域的普通技術(shù)人員根據(jù)這些實(shí)施方式所輕易做出的結(jié)構(gòu)、方法、或 功能上的變換均包含在本發(fā)明的保護(hù)范圍內(nèi)。本發(fā)明的圖片搜索方法及搜索系統(tǒng)的搜索思維與文本搜索方法及搜索系統(tǒng)的搜 索思維完全不一樣。文本搜索方法及搜索系統(tǒng)實(shí)現(xiàn)了文本到圖片的關(guān)聯(lián),而本發(fā)明則是實(shí)現(xiàn)了圖片到文本的關(guān)聯(lián),它可以通過(guò)接收用戶上傳的圖片來(lái)搜索和該圖片相關(guān)的文本 或者其他信息。其主要解決的問(wèn)題是尋找圖片的相關(guān)文本信息,以及尋找更高質(zhì)量圖片 的需求。如圖2所示,本發(fā)明的圖片搜索方法及搜索系統(tǒng)可通過(guò)用戶在瀏覽器20中上傳 待搜索的本地圖片或上傳待搜索圖片的URL地址對(duì)待搜索圖片進(jìn)行搜索。例如,當(dāng)待搜 索圖片為本地圖片時(shí),首先應(yīng)點(diǎn)擊上傳本地圖片按鈕201,并通過(guò)瀏覽器20上傳本地圖 片完成后,點(diǎn)擊確認(rèn)按鈕203進(jìn)行搜索;當(dāng)待搜索圖片為網(wǎng)絡(luò)圖片時(shí),則可首先點(diǎn)擊輸 入圖片URL地址按鈕202,并輸入圖片相應(yīng)的URL地址后點(diǎn)擊確認(rèn)按鈕203進(jìn)行搜索。通過(guò)對(duì)圖片的搜索可返回一條或多條搜索結(jié)果,每一條搜索結(jié)果可包括相似圖 片欄204和文本欄205,該搜索結(jié)果可按照相似圖片欄204中的結(jié)果圖片與待搜索圖片的 相似度進(jìn)行排序,優(yōu)選地,相似度越高的結(jié)果圖片越靠前顯示,該文本欄205中可顯示 與該結(jié)果圖片相應(yīng)的文本信息,例如,該結(jié)果圖片的長(zhǎng)寬信息、格式信息、名稱、相關(guān) 報(bào)道等。舉例說(shuō)明參照?qǐng)D1、圖2,用戶在一網(wǎng)站上看到了圖片10,并想了解該圖片 10中的物品是什么,則可打開(kāi)本發(fā)明的圖片搜索系統(tǒng),并輸入該圖片10的URL地址,點(diǎn) 擊確認(rèn)按鈕203,本發(fā)明的圖片搜索系統(tǒng)即會(huì)根據(jù)該圖片10進(jìn)行搜索,并得到多條搜索 結(jié)果,從搜索結(jié)果的文本信息中,可讓用戶了解到,該待查圖片10中的物品為蘋(píng)果公司 出品的“IPAD”。滿足用戶了需求,提高了搜索效率,節(jié)約了網(wǎng)絡(luò)流量。為實(shí)現(xiàn)上述技術(shù)效果,如圖3所示,本發(fā)明的圖片搜索系統(tǒng)包括WEB服務(wù) 器100、分發(fā)拼裝模塊102、特征提取模塊104、圖片特征索引模塊106、文本索引模塊 108。WEB服務(wù)器100和分發(fā)拼裝模塊102用于接收并處理用戶上傳圖片。其中, WEB服務(wù)器100:用于負(fù)責(zé)與用戶瀏覽器20交互,支持用戶在瀏覽器20上進(jìn)行圖片上 傳的POST請(qǐng)求,維持與用戶的連接,并將用戶上傳的圖片發(fā)送給分發(fā)拼裝模塊102,并 維持與分發(fā)拼裝模塊102的連接,等待分發(fā)拼裝模塊102返回的結(jié)果頁(yè)面,再得到該結(jié)果 頁(yè)面后將其返回至用戶瀏覽器20。分發(fā)拼裝模塊102:用于負(fù)責(zé)頁(yè)面建立和各種錯(cuò)誤的處理。該分發(fā)拼裝模塊102 可接收WEB服務(wù)器100傳遞的圖片,并根據(jù)圖片內(nèi)容簽名發(fā)送給不同的特征提取模塊 104,另外,該分發(fā)拼裝模塊102還負(fù)責(zé)將搜索結(jié)果拼裝為結(jié)果頁(yè)面并返回至WEB服務(wù)器 100。特征提取模塊104:用于計(jì)算圖片局部特征。優(yōu)選地,該局部特征可包括角 點(diǎn)、Sift等。需要說(shuō)明的是該特征提取模塊104除了用于圖片的特征計(jì)算外,還用于對(duì) 搜索結(jié)果進(jìn)行緩存和排序。該特征提取模塊104可接收分發(fā)拼裝模塊102傳遞的圖片, 轉(zhuǎn)換各種圖片的格式后計(jì)算圖片特征,并將計(jì)算出的圖片特征發(fā)送至圖片特征索引模塊 106進(jìn)行相似圖片查詢,在相似圖片查詢得到結(jié)果后,向文本索引模塊108查詢?cè)摻Y(jié)果的 文本數(shù)據(jù),并將查詢結(jié)果(相似圖片+文本數(shù)據(jù))發(fā)送至分發(fā)拼裝模塊102。圖片特征索引模塊106:用于搜索上述計(jì)算出的圖片特征搜索,并返回相似圖 片的搜索結(jié)果該圖片特征索引模塊106可接收特征提取模塊104提取的圖片特征,并進(jìn)行 查詢,將查詢到的圖片的內(nèi)容簽名返回給特征提取模塊104。優(yōu)選地,本發(fā)明的圖片特征 索引模塊可設(shè)置為多個(gè),在每一個(gè)圖片特征索引模塊中查找該圖片特征,并返回給特征提取模塊104。文本索引模塊108 根據(jù)特征提取模塊104的查詢請(qǐng)求,對(duì)相似圖片的相應(yīng)文本 數(shù)據(jù)進(jìn)行搜索,并返回文本數(shù)據(jù)至特征提取模塊104。優(yōu)選地,本發(fā)明的文本索引模塊可 設(shè)置為多個(gè),在每一個(gè)文本索引模塊中查找相似圖片對(duì)應(yīng)的文本數(shù)據(jù),并返回給特征提 取模塊104。值得一提的是本發(fā)明的圖片搜索系統(tǒng)還可以進(jìn)一步地包括URL圖片下載模塊 110,該圖片URL圖片下載模塊用于當(dāng)用戶上傳圖片URL地址時(shí),特征提取模塊104會(huì) 將該URL地址發(fā)送至圖片URL圖片下載模塊,并在該模塊中下載該URL上的圖片后, 將該圖片返回至特征提取模塊104,并通過(guò)特征提取模塊104向圖片特征索引模塊106和 文本索引模塊108發(fā)出查詢請(qǐng)求,得到相似圖片以及相應(yīng)文本數(shù)據(jù)。優(yōu)選地,本發(fā)明采用了多個(gè)特征提取模塊104協(xié)同多個(gè)圖片特征索引模塊106和 文本索引模塊108的分布式模式,使得圖片檢索速度較快,反應(yīng)時(shí)間較短。相應(yīng)地,如圖4所示,本發(fā)明的圖片搜索方法包括以下步驟Si、接收并處理上傳圖片。如上所述,該圖片為用戶通過(guò)瀏覽器所提交,優(yōu)選 地,其可通過(guò)上傳本地圖片或上傳圖片URL地址完成。S2、計(jì)算所述圖片特征。計(jì)算所接收到的圖片的局部特征,優(yōu)選地,該局部特 征可包括角點(diǎn)、Sift等。S3、通過(guò)所述圖片特征在圖片特征索引中搜索相似圖片;S4、通過(guò)所述相似圖片在文本索引中查詢文本數(shù)據(jù);S5、搜索結(jié)果排序。對(duì)搜索到的相似圖片和文本數(shù)據(jù)進(jìn)行排序,排序原則一般 地是依照?qǐng)D片相似度進(jìn)行,即與輸入圖片越相似的圖片排名越靠前。當(dāng)然,在本發(fā)明的 其他實(shí)施方式中,該排序除了可參考圖片相似度之外,還需要依據(jù)死鏈狀態(tài),以及網(wǎng)頁(yè) 權(quán)值,即是先對(duì)圖片相似度、死鏈狀態(tài)、網(wǎng)頁(yè)權(quán)值的進(jìn)行非線性計(jì)算,并根據(jù)計(jì)算結(jié)果 進(jìn)行排序。值得一提的是在本發(fā)明中,該步驟是為了更好的提升用戶體驗(yàn),提高搜 索效率,而并非本發(fā)明的圖片搜索方法的必要步驟,在其他實(shí)施方式中,可以省略該步 馬聚οS6、輸出搜索結(jié)果。將搜索到的相似圖片和文本按照?qǐng)D2所示的方式輸出至用 戶瀏覽器,以供用戶參考。如圖5所示,所述Sl具體包括SlU接收用戶上傳圖片。S12、壓縮所述圖片;瀏覽器的JS對(duì)于大于一個(gè)設(shè)定閾值的圖片進(jìn)行壓縮,并 將壓縮后的圖片發(fā)送至WEB服務(wù)器。值得一提的是在本發(fā)明中,該步驟是為了更好 的提升用戶體驗(yàn),減少網(wǎng)絡(luò)流量,而并非本發(fā)明的圖片搜索方法的必要步驟,在其他實(shí) 施方式中,可以省略該步驟。S13、分發(fā)所述圖片;WEB服務(wù)器接收到該圖片后,發(fā)送至分發(fā)拼裝模塊,并 由該分發(fā)拼裝模塊根據(jù)圖片的內(nèi)容簽名發(fā)送給不同的特征提取模塊。如圖6所示,在本發(fā)明的另一實(shí)施方式中,所述S2步驟包括S21、判斷上傳圖片是否為本地圖片;若是,則進(jìn)入S23、若不是,則進(jìn)入 S22 ;
S22、下載所述URL地址的圖片,并進(jìn)入S23 ;S23、計(jì)算所述圖片特征。如圖7所示,所述S6具體包括S61、將排序后的搜索結(jié)果緩存;S62、將搜索結(jié)果拼裝后輸出結(jié)果頁(yè)面,所述結(jié)果頁(yè)面包括正常結(jié)果頁(yè)面、錯(cuò)誤 結(jié)果頁(yè)面、無(wú)結(jié)果頁(yè)面;S63、將結(jié)果頁(yè)面輸出至用戶瀏覽器。如圖8所示,為了實(shí)現(xiàn)上述S3、S4步驟,在本發(fā)明的圖片搜索系統(tǒng)中,首先需 要建立圖片特征索引和文本索引。其中,對(duì)于圖片特征索引和文本索引的建立方法包括 以下流程S31、通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL;該圖片數(shù)據(jù)可通過(guò)網(wǎng)絡(luò)抓取方法, 將互聯(lián)網(wǎng)上的圖片抓取至本地服務(wù)器,該抓取方法本領(lǐng)域普通技術(shù)人員已能通過(guò)現(xiàn)有技 術(shù)熟練掌握,在此不再贅述。S32、獲取上述圖片的文本信息;S33、計(jì)算所述圖片的局部特征;優(yōu)選地,在本發(fā)明中,是通過(guò)分布式計(jì)算平臺(tái) 對(duì)圖片的特征進(jìn)行計(jì)算,該分布式計(jì)算平臺(tái)可載入視覺(jué)字典,將相關(guān)的特征量化到視覺(jué) 字典,該局部特征可包括角點(diǎn)、Sift等。S34、查詢存儲(chǔ)的已有圖片特征;S35、判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征;S36、若有相似特征的圖片特征,則建立文本信息索引和圖片特征標(biāo)記至少一 個(gè)索引號(hào);優(yōu)選地,一張圖片的特征可能包括多個(gè),每個(gè)特征都可對(duì)應(yīng)一個(gè)索引號(hào),這 樣,即可使得一張圖片對(duì)應(yīng)多個(gè)索引號(hào),而相同的索引號(hào)又可能對(duì)應(yīng)多張圖片。S37、若無(wú)相似特征的圖片特征,則過(guò)濾掉該圖片;S38、重復(fù)上述步驟,通過(guò)索引號(hào)建立索引。S39、優(yōu)選地,在本發(fā)明最佳實(shí)施方式中,還會(huì)建立一縮略圖庫(kù),建立縮略圖庫(kù) 的主要目的是將縮略圖插入到線上縮略圖訪問(wèn)服務(wù)系統(tǒng)中,需要做的事情就是生成相應(yīng) 的縮略圖字典即可。該縮略圖庫(kù)的建立方法,本領(lǐng)域的普通技術(shù)人員已能通過(guò)現(xiàn)有技術(shù) 熟練掌握,在此不再贅述。值得一提的是當(dāng)對(duì)一個(gè)含有圖片的網(wǎng)頁(yè)進(jìn)行抓取時(shí),即會(huì)給該網(wǎng)頁(yè)中的圖片 一個(gè)內(nèi)部ID,并且給該網(wǎng)頁(yè)中的文本信息一個(gè)相應(yīng)的內(nèi)部ID,這樣,當(dāng)通過(guò)圖片特征找 到相似的圖片后,即可通過(guò)該圖片的內(nèi)部ID,搜索到相應(yīng)內(nèi)部ID文本信息,這樣即可將 該圖片索引與該文本索引進(jìn)行關(guān)聯(lián)。使得在通過(guò)圖片特征搜索到圖片時(shí),一并可以搜索 到該圖片的文本信息,以滿足用戶需求。另外,在本發(fā)明的另一實(shí)施方式中,上述S31和S32的順序也可以顛倒,即先獲 取文本信息,再獲取與該文本信息相應(yīng)的圖片URL,其余步驟相同,仍然可建立圖片特 征索引和文本索引。在本發(fā)明的再一實(shí)施方式中,上述S31和S32也可同時(shí)進(jìn)行,即在 獲取圖片URL的同時(shí),也獲取與該圖片相應(yīng)的文本信息,其余步驟相同,仍可建立圖片 特征索引和文本索引。優(yōu)選地,在S31中獲得的網(wǎng)頁(yè)圖片數(shù)據(jù)為展示數(shù)據(jù),該“展示數(shù)據(jù)”是指在一般搜索引擎下可搜索到的圖片;該“展示圖片”是指被展現(xiàn)于搜索結(jié)果中次數(shù)較多的圖 片。相應(yīng)地,如圖9所示,為建立圖片特征索引模塊和文本索引模塊,本發(fā)明的圖 片搜索系統(tǒng)還包括圖片獲取模塊31 用于通過(guò)網(wǎng)絡(luò)圖片數(shù)據(jù)獲得圖片對(duì)應(yīng)的URL ;該圖片數(shù)據(jù)可 通過(guò)網(wǎng)絡(luò)抓取方法,將互聯(lián)網(wǎng)上的圖片抓取至本地服務(wù)器,該抓取方法本領(lǐng)域普通技術(shù) 人員已能通過(guò)現(xiàn)有技術(shù)熟練掌握,在此不再贅述。文本獲取模塊32 獲取上述圖片的文本信息。圖片特征計(jì)算模塊33:用于計(jì)算圖片的圖片特征;優(yōu)選地,在本發(fā)明中,是通 過(guò)分布式計(jì)算平臺(tái)對(duì)圖片的特征進(jìn)行計(jì)算,該分布式計(jì)算平臺(tái)可載入視覺(jué)字典,將相關(guān) 的特征量化到視覺(jué)字典,該特征可包括角點(diǎn)、Sift等。特征存儲(chǔ)模塊34:用于存儲(chǔ)圖片特征,并可查詢?cè)搱D片特征,判斷是否存在相 似特征的圖片。索引建立模塊35 用于建立文本索引模塊和圖片特征索引模塊??s略圖建庫(kù)模塊36:用于建立縮略圖庫(kù),建立縮略圖庫(kù)的主要目的是將縮略圖 插入到線上縮略圖訪問(wèn)服務(wù)系統(tǒng)中,需要做的事情就是生成相應(yīng)的縮略圖字典即可。為了提高建立文本信息庫(kù)和圖片特征庫(kù)的效率,使得在建庫(kù)時(shí)候不需要等待圖 片的特征計(jì)算(因圖片特征計(jì)算是比較耗時(shí)的),方便圖片特征比對(duì),因此需要首先提 供一用于查詢存儲(chǔ)的已有圖片特征的特征存儲(chǔ)模塊,如圖10所示,建立所述已有圖片特 征,包括SlOU在存儲(chǔ)的圖片數(shù)據(jù)中提取圖片,優(yōu)選地,該圖片數(shù)據(jù)為全網(wǎng)圖片數(shù)據(jù)。S102、判斷該圖片是否已計(jì)算過(guò)圖片特征;S103、若未計(jì)算過(guò)圖片特征,則對(duì)圖片進(jìn)行分布式計(jì)算,計(jì)算圖片特征;需要 載入視覺(jué)字典,將相關(guān)的特征量化到視覺(jué)字。若已計(jì)算過(guò)圖片特征,則回到SlOl步驟 中,提取下一圖片。S104、存儲(chǔ)該圖片特征。相應(yīng)地,如圖11所示,為建立該特征存儲(chǔ)模塊,本發(fā)明的圖片搜索系統(tǒng)還包 括圖片數(shù)據(jù)存儲(chǔ)模塊101:用于存儲(chǔ)從網(wǎng)頁(yè)中抓取下的圖片數(shù)據(jù),優(yōu)選地,該圖 片數(shù)據(jù)為全網(wǎng)圖片數(shù)據(jù)。圖片傳輸模塊102 用于在圖片數(shù)據(jù)存儲(chǔ)模塊101中提取圖片,并將圖片傳輸至 分布式計(jì)算平臺(tái),同時(shí),接收分布式計(jì)算平臺(tái)計(jì)算完成的圖片特征,并將該圖片特征傳 輸至所述的特征存儲(chǔ)模塊。該圖片傳輸模塊102還可以用于判斷該圖片是否已計(jì)算過(guò)圖 片特征,若未計(jì)算過(guò)圖片特征,則對(duì)圖片發(fā)送至分布式計(jì)算平臺(tái)103;若已計(jì)算過(guò)圖片 特征,重新再圖片數(shù)據(jù)存儲(chǔ)模塊101中提取圖片數(shù)據(jù)。分布式計(jì)算平臺(tái)103:用于分布式計(jì)算所述圖片的圖片特征,其需要載入視覺(jué) 字典,將相關(guān)的特征量化到視覺(jué)字。通過(guò)上述的圖片數(shù)據(jù)存儲(chǔ)模塊101、圖片傳輸模塊102、分布式計(jì)算平臺(tái)103算 出的圖片特征,即可存儲(chǔ)一數(shù)據(jù)庫(kù),形成特征存儲(chǔ)模塊34,以便在圖片特征建庫(kù)時(shí)運(yùn)
通過(guò)上述的描述可知,通過(guò)本發(fā)明的基于圖片的搜索方法和系統(tǒng),不僅可實(shí)現(xiàn) 在全網(wǎng)通過(guò)圖片搜索與之相似的圖片,還可以根據(jù)圖片搜索與之相對(duì)應(yīng)的文本信息,滿 足用戶需求,提高搜索效率,節(jié)約網(wǎng)絡(luò)流量,同時(shí),本發(fā)明通過(guò)空間劃分,進(jìn)行視覺(jué)字 量化和進(jìn)行索引,解決了大數(shù)據(jù)量的查詢效率問(wèn)題,使得上幾十億的圖片,檢索只需要
幾百毫秒。應(yīng)當(dāng)理解,雖然本說(shuō)明書(shū)按照實(shí)施方式加以描述,但并非每個(gè)實(shí)施方式僅包含 一個(gè)獨(dú)立的技術(shù)方案,說(shuō)明書(shū)的這種敘述方式僅僅是為清楚起見(jiàn),本領(lǐng)域技術(shù)人員應(yīng)當(dāng) 將說(shuō)明書(shū)作為一個(gè)整體,各實(shí)施例中的技術(shù)方案也可以經(jīng)適當(dāng)組合,形成本領(lǐng)域技術(shù)人 員可以理解的其他實(shí)施方式。上文所列出的一系列的詳細(xì)說(shuō)明僅僅是針對(duì)本發(fā)明的可行性實(shí)施方式的具體說(shuō) 明,它們并非用以限制本發(fā)明的保護(hù)范圍,凡未脫離本發(fā)明技藝精神所作的等效實(shí)施方 式或變更均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種圖片搜索方法,其特征在于,所述圖片搜索方法包括以下步驟51、接收并處理上傳圖片;52、計(jì)算所述圖片局部特征;53、通過(guò)所述圖片局部特征在圖片特征索引中搜索相似圖片;54、通過(guò)所述相似圖片在文本索引中搜索文本數(shù)據(jù);55、輸出所述相似圖片與所述文本數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,在所述S5前,還包括 排序步驟,對(duì)搜索到的所述相似圖片和所述文本數(shù)據(jù)進(jìn)行排序。
3.根據(jù)權(quán)利要求2所述的圖片搜索方法,其特征在于,所述排序參考因素為圖片相似度。
4.根據(jù)權(quán)利要求2所述的圖片搜索方法,其特征在于,所述排序參考因素為圖片相似 度、死鏈狀態(tài),以及網(wǎng)頁(yè)權(quán)值。
5.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述Sl步驟包括 SlU接收用戶上傳圖片;S13、根據(jù)圖片的內(nèi)容簽名分發(fā)所述上傳圖片。
6.根據(jù)權(quán)利要求5所述的圖片搜索方法,其特征在于,在所述S13步驟前,還包括 S12、壓縮所述上傳圖片若上傳圖片大于設(shè)定閾值,則將所述上傳圖片壓縮后,再進(jìn)入S13步驟。
7.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述S2步驟包括 判斷上傳圖片是否為本地圖片;若不是本地圖片,則下載所述URL地址的圖片; 計(jì)算所述圖片局部特征。
8.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述S5步驟包括551、將排序后的搜索結(jié)果緩存;552、將所述搜索結(jié)果拼裝后輸出結(jié)果頁(yè)面;553、將所述結(jié)果頁(yè)面輸出。
9.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述圖片特征索引和所述文本 索引的建立方法包括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL; 獲取所述圖片的文本信息; 計(jì)算所述圖片的局部特征; 查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征; 若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征標(biāo)記 至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。
10.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述圖片特征索引和所述文 本索引的建立方法包括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ;獲取圖片的URL; 計(jì)算所述圖片的局部特征; 查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征; 若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征標(biāo)記 至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。
11.根據(jù)權(quán)利要求1所述的圖片搜索方法,其特征在于,所述圖片特征索引和所述文 本索引的建立方法包括通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL ; 計(jì)算所述圖片的局部特征; 查詢存儲(chǔ)的已有圖片特征;判斷在已有圖片特征中是否存在與所述局部特征相似的圖片特征; 若存在與所述局部特征相似的圖片特征,則對(duì)所述圖片的文本信息和圖片特征標(biāo)記 至少一個(gè)索引號(hào);重復(fù)上述步驟,建立索引。
12.根據(jù)權(quán)利要求9或10或11所述的圖片搜索方法,其特征在于,在查詢存儲(chǔ)的已 有圖片特征后,還包括建縮略圖庫(kù),所述縮略圖庫(kù)可將縮略圖插入到線上縮略圖訪問(wèn)服 務(wù)系統(tǒng)中。
13.根據(jù)權(quán)利要求9或10或11所述的圖片搜索方法,其特征在于,在通過(guò)網(wǎng)絡(luò)數(shù)據(jù) 獲取網(wǎng)絡(luò)圖片的URL步驟中,所述網(wǎng)絡(luò)數(shù)據(jù)為展示數(shù)據(jù),所述網(wǎng)絡(luò)圖片為展示圖片。
14.根據(jù)權(quán)利要求9或10或11所述的圖片搜索方法,其特征在于,建立所述已有圖 片特征,包括以下步驟在全網(wǎng)圖片數(shù)據(jù)中提取圖片; 分布式計(jì)算所述圖片的圖片特征; 存儲(chǔ)所述圖片特征。
15.根據(jù)權(quán)利要求14所述的圖片搜索方法,其特征在于,在“分布式計(jì)算所述圖片的 圖片特征”步驟之前,還包括判斷該圖片是否已計(jì)算過(guò)圖片特征;若未計(jì)算過(guò)圖片特征,則進(jìn)行“分布式計(jì)算所述圖片的圖片特征”步驟。
16.根據(jù)權(quán)利要求14所述的圖片搜索方法,其特征在于,在“分布式計(jì)算所述圖片的 圖片特征”之前,還包括判斷該圖片是否已計(jì)算過(guò)圖片特征;若已計(jì)算過(guò)所述圖片的圖片特征,則回到“在全網(wǎng)圖片數(shù)據(jù)中提取圖片”步驟中, 提取下一圖片。
17.根據(jù)權(quán)利要求14所述的圖片搜索方法,其特征在于,所述分布式計(jì)算圖片特征是 載入視覺(jué)字典,將圖片相關(guān)的特征量化到視覺(jué)字。
18.—種圖片搜索系統(tǒng),其特征在于,所述圖片搜索系統(tǒng)包括WEB服務(wù)器和分發(fā)拼裝模塊用于接收并處理上傳圖片,以及輸出搜索到的所述相似圖片與所述文本數(shù)據(jù);特征提取模塊用于計(jì)算所述圖片局部特征;圖片特征索引模塊用于通過(guò)所述圖片局部特征在所述圖片特征索引模塊中搜索相 似圖片;文本索引模塊用于通過(guò)所述相似圖片在所述文本索引模塊中搜索文本數(shù)據(jù)。
19.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,所述WEB服務(wù)器的功能還 包括用于負(fù)責(zé)與用戶瀏覽器交互,支持用戶在瀏覽器上進(jìn)行圖片上傳的POST請(qǐng)求, 維持與用戶的連接,并將用戶上傳的圖片發(fā)送給所述分發(fā)拼裝模塊,并維持與所述分發(fā) 拼裝模塊的連接,等待所述分發(fā)拼裝模塊返回的結(jié)果頁(yè)面,再得到該所述結(jié)果頁(yè)面后將 其返回至所述用戶瀏覽器。
20.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,所述分發(fā)拼裝模塊的功能還 包括用于接收所述WEB服務(wù)器傳遞的圖片,并根據(jù)圖片內(nèi)容簽名發(fā)送給不同的特征提 取模塊,以及將搜索結(jié)果拼裝為結(jié)果頁(yè)面并返回至所述WEB服務(wù)器。
21.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,所述特征提取模塊的功能還 包括用于對(duì)搜索到的所述相似圖片與所述文本數(shù)據(jù)進(jìn)行緩存和排序。
22.根據(jù)權(quán)利要求21所述的圖片搜索系統(tǒng),其特征在于,所述排序參考因素為圖片相 似度。
23.根據(jù)權(quán)利要求21所述的圖片搜索系統(tǒng),其特征在于,所述排序參考因素為圖片相 似度、死鏈狀態(tài),以及網(wǎng)頁(yè)權(quán)值。
24.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,所述一個(gè)分發(fā)拼裝模塊對(duì)應(yīng) 多個(gè)特征提取模塊。
25.根據(jù)權(quán)利要求18或24所述的圖片搜索系統(tǒng),其特征在于,所述一個(gè)特征提取模 塊對(duì)應(yīng)多個(gè)圖片特征索引模塊和多個(gè)文本索引模塊。
26.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,所述圖片搜索系統(tǒng)還包括 URL圖片下載模塊用于當(dāng)用戶上傳圖片URL地址時(shí),下載URL地址上的圖片,并將 所述圖片發(fā)送至特征提取模塊。
27.根據(jù)權(quán)利要求18所述的圖片搜索系統(tǒng),其特征在于,為建立所述圖片特征索引模 塊和所述文本索引模塊,所述圖片搜索系統(tǒng)還包括圖片獲取模塊用于通過(guò)網(wǎng)絡(luò)數(shù)據(jù)獲取網(wǎng)絡(luò)圖片的URL;文本獲取模塊用于獲取所述圖片的文本信息;圖片特征計(jì)算模塊用于計(jì)算所述圖片的局部特征;特征存儲(chǔ)模塊用于查詢存儲(chǔ)的已有圖片特征;索引建立模塊用于建立文本索引模塊和圖片特征索引模塊。
28.根據(jù)權(quán)利要求27所述的圖片搜索系統(tǒng),其特征在于,所述圖片搜索系統(tǒng)還包括縮 略圖建庫(kù)模塊用于建立縮略圖庫(kù),將縮略圖插入到線上縮略圖訪問(wèn)服務(wù)系統(tǒng)中。
29.根據(jù)權(quán)利要求27所述的圖片搜索系統(tǒng),其特征在于,所述網(wǎng)絡(luò)數(shù)據(jù)為展示數(shù)據(jù), 所述網(wǎng)絡(luò)圖片為展示圖片。
30.根據(jù)權(quán)利要求27所述的圖片搜索系統(tǒng),其特征在于,為了建立所述特征存儲(chǔ)模 塊,所述圖片搜索系統(tǒng)還包括圖片數(shù)據(jù)存儲(chǔ)模塊用于存儲(chǔ)全網(wǎng)圖片數(shù)據(jù);圖片傳輸模塊用于在所述圖片數(shù)據(jù)存儲(chǔ)模塊中提取圖片,并將所述圖片傳輸至分 布式計(jì)算平臺(tái),以及,接收所述分布式計(jì)算平臺(tái)計(jì)算完成的圖片特征,并將該圖片特征 傳輸至所述的所述特征存儲(chǔ)模塊;分布式計(jì)算平臺(tái)用于分布式計(jì)算所述圖片的圖片特征。
31.根據(jù)權(quán)利要求30所述的圖片搜索系統(tǒng),其特征在于,所述分布式計(jì)算圖片特征是 載入視覺(jué)字典,將圖片相關(guān)的特征量化到視覺(jué)字。
全文摘要
本發(fā)明提供一種圖片搜索方法,包括接收并處理上傳圖片;計(jì)算所述圖片局部特征;通過(guò)所述圖片局部特征在圖片特征索引中搜索相似圖片;通過(guò)所述相似圖片在文本索引中搜索文本數(shù)據(jù);輸出所述相似圖片與所述文本數(shù)據(jù)。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是通過(guò)本發(fā)明的基于圖片的搜索方法和系統(tǒng),不僅可實(shí)現(xiàn)在全網(wǎng)通過(guò)圖片搜索與之相似的圖片,還可以根據(jù)圖片搜索與之相對(duì)應(yīng)的文本信息,滿足用戶需求,提高搜索效率,節(jié)約網(wǎng)絡(luò)流量,同時(shí),本發(fā)明通過(guò)空間劃分,進(jìn)行視覺(jué)字量化和進(jìn)行索引,解決了大數(shù)據(jù)量的查詢效率問(wèn)題,使得上幾十億的圖片,檢索只需要幾百毫秒。
文檔編號(hào)G06F17/30GK102012934SQ20101057456
公開(kāi)日2011年4月13日 申請(qǐng)日期2010年11月30日 優(yōu)先權(quán)日2010年11月30日
發(fā)明者文林福 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司