專利名稱:適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體數(shù)據(jù)分類,具體地說,涉及適用于多媒體數(shù)據(jù)(以下稱為多媒體內(nèi)容)的數(shù)據(jù)庫構(gòu)造方法,在該方法中,多媒體內(nèi)容按語義分類和存儲在一預(yù)先確定的數(shù)據(jù)庫中。
在萬維網(wǎng)(World Wide Web,WWW)上,通常要使用大量多媒體內(nèi)容。但檢索方法主要用來檢索文本數(shù)據(jù),還沒有引入用來檢索圖像、音頻數(shù)據(jù)和具有聲音的動態(tài)影象數(shù)據(jù)的快速而有效的方法。
隨著近來多媒體數(shù)據(jù)量的增加,需要適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法以及使用已經(jīng)建立的數(shù)據(jù)庫向用戶提供檢索服務(wù)的方法。
為了解決以上問題,本發(fā)明的一個目的是提供一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法,在該方法中,將分散在萬維網(wǎng)或其它電信網(wǎng)絡(luò)上的多媒體內(nèi)容有效地收集和存儲在一個數(shù)據(jù)庫中,以便能夠快速地檢索多媒體內(nèi)容。
本發(fā)明的另一目的是提供適一種用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備,它使用適用于多媒體內(nèi)容的該數(shù)據(jù)庫構(gòu)造方法。
本發(fā)明的另一目的是提供一種在由適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法構(gòu)造的該數(shù)據(jù)庫中,快速檢索多媒體內(nèi)容的多媒體內(nèi)容檢索方法。
本發(fā)明的另一目的是提供一種使用適用于多媒體內(nèi)容的檢索方法的多媒體內(nèi)容檢索設(shè)備。
為了實現(xiàn)本發(fā)明的以上目的,這里提供一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法,該方法包括步驟(a)經(jīng)由電信網(wǎng)絡(luò)存取提供多媒體內(nèi)容的一任意站點;(b)通過結(jié)網(wǎng)(spidering)該站點調(diào)用多媒體內(nèi)容;以及(c)根據(jù)存儲的地址分類該多媒體內(nèi)容并將其存儲到一預(yù)先確定的數(shù)據(jù)庫中。
此外,該多媒體內(nèi)容可以為圖像數(shù)據(jù)。
該地址最好為統(tǒng)一資源定位符(URL)。
該任意站點最好在一檢索站點或一入口站點之間選擇。
該步驟(b)最好還包括子步驟(b-1)輸入搜索字;(b-2)相應(yīng)于與在具有輸入的搜索字的檢索結(jié)果的超文本標(biāo)示語言(HTML)的網(wǎng)頁數(shù)據(jù)中對應(yīng)于多個子類對應(yīng)的多個文本的多媒體內(nèi)容的文件名的多個文本進(jìn)行分析;以及(b-3)將具有相應(yīng)于分析過的文本的地址的多媒體數(shù)據(jù)調(diào)用。
該方法最好在步驟(b-3)之前還包括(p-b-3-1)當(dāng)相應(yīng)于該子類的文本在載入的HTML網(wǎng)頁數(shù)據(jù)中分析時,訪問相應(yīng)的子類。
在步驟(b-2)中,最好將代表這些文本的特征的關(guān)鍵詞與相應(yīng)于該子類的文本和相應(yīng)于該多媒體內(nèi)容的文件名的文本一起在載入的HTML網(wǎng)頁數(shù)據(jù)中進(jìn)行分析。
該方法最好在步驟(b-3)之后還包括(b-4)濾出所調(diào)用的圖像中的噪聲圖像。
步驟(b-4)最好包括子步驟(b-4-1)確定一調(diào)用圖像的像素數(shù)是否等于或大于一預(yù)先確定的閾值;以及(b-4-2)當(dāng)一調(diào)用圖像的像素數(shù)等于或大于該預(yù)先確定的閾值時,索引相應(yīng)的圖像。
該閾值最好是128。
步驟(c)最好還包括子步驟(c-1)降低該調(diào)用圖像的分辨率;以及(c-2)根據(jù)該分類結(jié)構(gòu),將分辨率降低了的該圖像存儲在一預(yù)先確定的數(shù)據(jù)庫中。
作為替換,在步驟(c)中最好使用該URL信息將存儲該調(diào)用多媒體內(nèi)容數(shù)據(jù)的網(wǎng)頁的URL存儲在一預(yù)先確定的數(shù)據(jù)庫中。
作為替換,在步驟(c)中,最好將至少一個URL信息或關(guān)鍵詞信息與關(guān)于各自圖像上的信息一起存儲在各自預(yù)先確定的數(shù)據(jù)庫中,以便關(guān)鍵詞能夠鏈接到單個的圖像。
為了實現(xiàn)本發(fā)明的另一目的,這里還提供適用于多媒體內(nèi)容的一數(shù)據(jù)庫構(gòu)造方法,該方法包括步驟(a)使用具有分類的結(jié)構(gòu)的數(shù)據(jù)庫存取提供多媒體內(nèi)容的一任意站點;(b)通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及(c)使用該分類的結(jié)構(gòu),將調(diào)用的多媒體內(nèi)容數(shù)據(jù)存儲到一預(yù)先確定的數(shù)據(jù)庫中。
為了實現(xiàn)本發(fā)明的另一目的,這里還提供適用于多媒體內(nèi)容的一數(shù)據(jù)庫構(gòu)造設(shè)備,該設(shè)備包括網(wǎng)站訪問器(web visitor),用于存取提供多媒體內(nèi)容的一任意站點,并且通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及數(shù)據(jù)庫,使用該站點的數(shù)據(jù)庫的分類結(jié)構(gòu)和存儲調(diào)用的多媒體內(nèi)容數(shù)據(jù)的地址,分類和存儲調(diào)用的多媒體內(nèi)容數(shù)據(jù)。
為了實現(xiàn)本發(fā)明的另一目的,這里還提供一種適用于多媒體內(nèi)容的一檢索方法,該方法包括步驟(a)接收來自用戶的、相應(yīng)于將要搜索的查詢圖像的關(guān)鍵詞;以及(b)在存儲相應(yīng)于單個的圖像以及多個圖像的一預(yù)先確定的數(shù)據(jù)庫中檢索相應(yīng)于關(guān)鍵詞的圖像。
為了實現(xiàn)本發(fā)明的另一目的,這里還提供適用于多媒體內(nèi)容的一檢索設(shè)備,具有存儲多個圖像以及相應(yīng)于單個圖像的關(guān)鍵詞的數(shù)據(jù)庫;和檢索單元,用于接收來自用戶的、相應(yīng)于查詢圖像的關(guān)鍵詞;以及在該數(shù)據(jù)庫中檢索相應(yīng)于該關(guān)鍵詞的多媒體內(nèi)容數(shù)據(jù)。
通過以下參考附圖詳細(xì)描述其優(yōu)選實施例,將會更容易地理解本發(fā)明以上目的和優(yōu)越性,其中
圖1是展示根據(jù)本發(fā)明的一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備的結(jié)構(gòu)的框圖。
圖2是展示使用在圖1的設(shè)備中的、根據(jù)本發(fā)明的一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法的主要步驟的流程圖。
圖3是展示使用在圖1的設(shè)備中的、根據(jù)本發(fā)明的另一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法的主要步驟的流程圖。
圖4是展示根據(jù)本發(fā)明的一實施例的多媒體內(nèi)容檢索設(shè)備的結(jié)構(gòu)的框圖。以及圖5展示使用在圖4的多媒體內(nèi)容檢索設(shè)備中的、根據(jù)本發(fā)明的一實施例的多媒體內(nèi)容的檢索方法的主要步驟的流程圖。
以下參考附圖詳細(xì)描述本發(fā)明的實施例。本發(fā)明不局限于下列實施例,在本發(fā)明的精神和范圍之內(nèi)可能有多種變形。根據(jù)本發(fā)明的實施例是為了更完整地向本領(lǐng)域的普通技術(shù)人員解釋本發(fā)明而提供的。
根據(jù)本發(fā)明,按語義分類多媒體內(nèi)容以便有效地實施該檢索或瀏覽。例如相應(yīng)于“F-16戰(zhàn)斗機(jī)”的多媒體內(nèi)容可以分類到被稱為“海灣戰(zhàn)爭”的分類中。對于這一點,用到了在檢索站點中分類結(jié)構(gòu)的優(yōu)點。例如,諸如YahooTM這樣的檢索站點具有分類的結(jié)構(gòu)。例如如果點擊了按“電影”分類的文本,則提供在以諸如“色情”、“動作”或“人文逸事”分類的文本格式中與電影有關(guān)的更詳細(xì)的站點的收集的信息。此外,提供與各種電影相關(guān)的詳細(xì)站點的地址。很好地實現(xiàn)這樣的檢索站點和入口站點語義分類。因此,本發(fā)明在制作適用于多媒體內(nèi)容的數(shù)據(jù)庫時,使用這樣的檢索站點和入口站點分類結(jié)構(gòu)。
圖1是展示根據(jù)本發(fā)明的一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備的框圖。圖2是展示使用在圖1的設(shè)備中的、根據(jù)本發(fā)明的一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法的主要步驟的流程圖。下列解釋會經(jīng)常參考圖2。
對本實施例,取圖像作為該多媒體內(nèi)容的一實例。參考圖1,根據(jù)本發(fā)明的實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備10連接到萬維網(wǎng)(WWW)12,它具有一網(wǎng)站訪問器100、分析器102、過濾單元104、分辨率降低單元106、圖像數(shù)據(jù)庫1008、類別數(shù)據(jù)庫110、關(guān)鍵詞數(shù)據(jù)庫112、統(tǒng)一資源定位符(URL)數(shù)據(jù)庫114以及控制單元120。
現(xiàn)在解釋該適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備的運行。首先,在步驟202中用戶選擇和訪問一任意的檢索站點,并且在步驟204中在該正在訪問的主頁,即將要構(gòu)造的數(shù)據(jù)庫的對象上點擊用戶感興趣領(lǐng)域所對應(yīng)的類別的文本。檢索站點的內(nèi)容分類具有一分類結(jié)構(gòu)。在步驟206中,響應(yīng)該用戶點擊,網(wǎng)站訪問器100從該文本中裝載一映射的超文本標(biāo)記語言網(wǎng)頁數(shù)據(jù)。接下來在步驟208中,分析器102分析相應(yīng)于子類的文本,或者在本實施例中是相應(yīng)于圖像文件名的文本,例如帶擴(kuò)展名“.JPG”、“.GIF”或“.BMF”文本的多媒體內(nèi)容。接下來在步驟210中確定分析過的文本是否包括在一子類中。當(dāng)確定了分析過的文本包括在一子類中時,在步驟212中訪問該子類并執(zhí)行步驟206。同時,當(dāng)分析相應(yīng)于在裝載的HTML網(wǎng)頁數(shù)據(jù)中的圖像的文件名的文本時,在步驟214中調(diào)用具有相應(yīng)于分析過的文本的文件名的圖像。在這樣處理之后,網(wǎng)站訪問器100分級訪問該檢索站點的網(wǎng)頁并調(diào)用圖像。這樣的操作自動執(zhí)行并且可以使用被稱為網(wǎng)頁機(jī)器人(web robot)的裝置實現(xiàn)這種操作。即可以說該網(wǎng)頁機(jī)器人站點通過結(jié)網(wǎng)所選擇的URL和它的下級URL與所選擇的URL關(guān)聯(lián)。
此外,在步驟206中,分析器102最好分析展示該文本以及相應(yīng)于圖像的文件名的文本的特征的關(guān)鍵詞。由于關(guān)鍵詞一般是名詞,所以可以使用已知的方法提取它們。
同時,在調(diào)用的圖像中用來美化網(wǎng)站的圖形等被看成噪聲并且在索引時剔除。因此,過濾該調(diào)用的圖像然后索引。在本實施例中,在步驟216中,過濾單元104確定一所調(diào)用的圖像的像素數(shù)是否等于或大于128。當(dāng)所調(diào)用的圖像的像素數(shù)小于128時,在步驟218中將所調(diào)用的圖像確定成一微縮圖(thumb nail),然后將所調(diào)用的圖像過濾出并且不索引。當(dāng)所調(diào)用的圖像的像素數(shù)等于或大于128時,在步驟220中將所調(diào)用的圖像確定成非微縮圖并且該分辨率降低單元降低該圖像的分辨率。
在步驟222中,將降低了分辨率的圖像存儲在圖像數(shù)據(jù)庫108中,并且將關(guān)于存儲在圖像數(shù)據(jù)庫108中的圖像的識別信息以及所訪問的網(wǎng)頁數(shù)據(jù)的類別信息都存儲在類別數(shù)據(jù)庫110中。
作為替換,未降低其分辨率的原始數(shù)據(jù)可以存儲在該數(shù)據(jù)庫中,而不用將所調(diào)用的圖像存儲到該數(shù)據(jù)庫中,可以存儲具有該圖像的網(wǎng)頁的URL,以使得可以鏈接相應(yīng)的站點。此外,為了能夠讓關(guān)鍵詞鏈接到各自圖像,可以將相應(yīng)于各自圖像的關(guān)鍵詞與存儲在圖像數(shù)據(jù)庫中的各個圖像上的信息一起存儲到關(guān)鍵詞數(shù)據(jù)庫112中。
在步驟224中,控制單元120確定所索引的圖像的數(shù)量是否等于或大于1,000。當(dāng)所索引的圖像的數(shù)量小于1,000時,輸出一“低”電平控制信號,而當(dāng)所索引的圖像的數(shù)量等于或大于1,000時,輸出一“高”電平控制信號。響應(yīng)該輸出一“高”電平控制信號,分析器102執(zhí)行步驟208,而響應(yīng)該“低”電平控制信號,完成分析。即當(dāng)所索引的圖像的數(shù)量等于或大于1,000時,完成對一站點的訪問。
在根據(jù)本發(fā)明的實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法中,使用相應(yīng)的站點的類別信息,將位于分層地被訪問的類別中的多媒體內(nèi)容,例如降低了圖像分辨率的微縮圖,或者原始圖,按語義分類和存儲在相應(yīng)的數(shù)據(jù)庫中。
此外,在根據(jù)本發(fā)明的實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法中,使用URL,并且考慮WWW上的站點的目錄結(jié)構(gòu)。例如,諸如GoogleTM或AltavistaTM這樣的檢索站點提供基于URL而不是類別信息的檢索。例如,當(dāng)輸入一搜索詞“英式足球”時,提供與“英式足球”相關(guān)的站點地址作為搜索結(jié)果。即使當(dāng)使用這些檢索站點時,也提供與相應(yīng)的搜索詞按語義緊密相關(guān)的站點。
在根據(jù)本發(fā)明的另一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法中,能夠進(jìn)行這些檢索站點的語義搜索的結(jié)構(gòu),被用于構(gòu)造適用于多媒體內(nèi)容的數(shù)據(jù)庫。圖3是展示使用在圖1的設(shè)備中的、根據(jù)本發(fā)明的另一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法的主要步驟的流程圖。參考圖3,在根據(jù)本發(fā)明的另一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法中,首先在步驟302中,網(wǎng)站訪問器100在選擇該站點之后訪問一任意檢索站點。接下來,在步驟304中用戶輸入相應(yīng)于要被構(gòu)造的數(shù)據(jù)庫的領(lǐng)域的搜索詞。該搜索詞相應(yīng)于要包括在該數(shù)據(jù)庫中的多媒體內(nèi)容的識別符。接下來,在步驟306中網(wǎng)站訪問器100接收相關(guān)于該輸入搜索詞的站點的地址,例如,具有URL信息的HTML網(wǎng)頁數(shù)據(jù)。
接下來,在步驟308中,分析器102分析接收到的HTML網(wǎng)頁數(shù)據(jù)中的站點的地址。在步驟310中,該網(wǎng)站訪問器100分層地訪問相應(yīng)于分析過的地址的站點。然后在步驟312中該網(wǎng)站訪問器100從正在訪問的檢索站點中裝載根HTML網(wǎng)頁數(shù)據(jù)。在步驟314中,分析器102分析被裝載的HTML網(wǎng)頁數(shù)據(jù)中的多媒體內(nèi)容,在本實施例中例如為相應(yīng)于圖像文件名的文本,諸如帶擴(kuò)展名“.JPG”、“.GIF”或“.BMF”的文本。作為替換,可以使用用于HTML語言中的ALT標(biāo)記符。由于這些圖像的名稱或ALT標(biāo)記符由網(wǎng)站作者手工輸入,所以圖像的特征,一般來說,多媒體內(nèi)容的特征相對好表達(dá)。
在步驟314中,分析器102頁最好也分析代表所分析的文本的特征的關(guān)鍵詞。因為關(guān)鍵詞一般為名詞,所以可能一已知的方法提取它們。
接下來,在步驟316中,網(wǎng)站訪問器100調(diào)用相應(yīng)于所分析的文本的圖像數(shù)據(jù)。同時,將在所調(diào)用的圖像數(shù)據(jù)中用于美化網(wǎng)站的圖形看成噪聲,并且必須在索引時剔除。因此,過濾單元104過濾所調(diào)用的圖像,以濾出噪聲圖像。在本實施例中,在步驟318中,過濾單元104確定所調(diào)用的圖像的像素數(shù)量是否等于或大于128。當(dāng)所調(diào)用的圖像的像素數(shù)量小于128時,在步驟320中將所調(diào)用的圖像確定成一微縮圖,然后將所調(diào)用的圖像過濾出以便在索引時剔除它。當(dāng)該所調(diào)用的圖像的像素數(shù)等于或大于128時,在步驟322中分辨率降低單元106確定所調(diào)用的圖像為非微縮圖而是一圖像,并且降低該圖像的分辨率。在步驟324中,將降低了分辨率的圖像存儲在圖像數(shù)據(jù)庫108中,并且將存儲在圖像數(shù)據(jù)庫108中的各自圖像的信息以及所訪問的網(wǎng)頁數(shù)據(jù)的URL信息都存儲在URL數(shù)據(jù)庫中。
作為替換,未降低其分辨率的原始數(shù)據(jù)可以存儲在該圖像數(shù)據(jù)庫108中,并且通過在該數(shù)據(jù)庫中存儲存儲了該圖像的網(wǎng)頁的URL,而不是存儲所調(diào)用的圖像,可以鏈接相應(yīng)的站點。最好將相應(yīng)于各自圖像的關(guān)鍵詞與存儲在圖像數(shù)據(jù)庫108中的各自圖像上的信息一起存儲到關(guān)鍵詞數(shù)據(jù)庫112中。
在步驟326中,控制單元120確定所索引的圖像的數(shù)量是否等于或大于一預(yù)先確定的數(shù)。當(dāng)所索引的圖像的數(shù)量小于1,000時,網(wǎng)站訪問器100根據(jù)步驟310從正在訪問的檢索站點裝載根HTML網(wǎng)頁數(shù)據(jù)。當(dāng)所索引的圖像的數(shù)量等于或大于1,000時,完成對一站點的訪問。
同時,為了有效地檢索圖像,可以提取紋理特征和/或顏色以存儲在各自的特征數(shù)據(jù)庫(未在圖中顯示)中。這些特征可以由具有比例和方向系數(shù)的Gabor濾波器提取。例如當(dāng)由具有3種比例系數(shù)和4種方向系數(shù)的一組Gabor濾波器構(gòu)成的濾波器計算輸入的圖像的一特征向量,并且如果平均的一個分布用于該特征向量的分量時,該特征向量可以表達(dá)成下列等式1ftexture=[t1,t2,t2,…t24,]……(1)使用該特征向量索引圖像。在該特征數(shù)據(jù)庫中,存儲該特征向量和相應(yīng)于該特征向量的圖像信息。
類似地,可以提取顏色特征以存儲在各自特征數(shù)據(jù)庫中??梢詮脑贑IELUV顏色空間中計算出來的顏色分布圖表中提取展示顏色圖元(primitive)的特征向量。例如,如果3維顏色空間的每一維都按四級進(jìn)行量化,則可以將其表達(dá)成如下列等式2的64維顏色特征向量fcolor=[c1,c2,c2,…c64,]……(2)在該特征數(shù)據(jù)庫中存儲該特征向量和相應(yīng)于該特征向量的圖像信息。
在根據(jù)本發(fā)明的另一實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法中,圖像分辨率降低了的微縮圖或原始圖像都在使用相應(yīng)的站點的URL信息按語義分類之后,存儲在相應(yīng)的數(shù)據(jù)庫中,其中微縮圖和原始圖像都是從所訪問的類別中調(diào)用的。存儲調(diào)用圖像的紋理和/或顏色特征到各自的特征數(shù)據(jù)庫中。
在根據(jù)本發(fā)明的、適用于多媒體的數(shù)據(jù)庫構(gòu)造方法中,按語義分類和索引WWW上的多媒體內(nèi)容。這樣的適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法可以用于諸如電視新聞廣播這樣的多媒體內(nèi)容,或者用于使用在線多媒體表達(dá)的商品清單。
雖然在以上實施例中示范了構(gòu)造一個圖像數(shù)據(jù)庫,但本發(fā)明可以用于諸如聲音片斷以及具有聲音的電影剪輯這樣的各種多媒體內(nèi)容。即本發(fā)明不局限于上述實施例,并且本發(fā)明的范圍由附隨的權(quán)利要求書確定。
在由根據(jù)上述描述的本發(fā)明的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法構(gòu)造的數(shù)據(jù)庫中,使用類別信息或URL信息很好地收集了分散在WWW上的多媒體內(nèi)容,并且按語義很好地分類了該多媒體內(nèi)容。因此,可以使用適用于多媒體的各種檢索方法來有效地檢索所要的多媒體內(nèi)容。特別是,當(dāng)(使用)根據(jù)本發(fā)明的、用于檢索多媒體內(nèi)容的方法時,可以有效地檢索類似于多媒體數(shù)據(jù)中的查詢數(shù)據(jù)的數(shù)據(jù)。
圖4是展示根據(jù)本發(fā)明的一實施例的多媒體內(nèi)容檢索設(shè)備的結(jié)構(gòu)的框圖。參考圖4,根據(jù)本發(fā)明的一實施例的多媒體內(nèi)容檢索設(shè)備經(jīng)由WWW42連接到服務(wù)器44,以提供圖像檢索服務(wù),該服務(wù)器經(jīng)由因特網(wǎng)提供一種服務(wù)。
該多媒體內(nèi)容檢索設(shè)備具有一關(guān)鍵詞檢索單元402、一顯示圖像選擇單元404、一圖像顯示單元406、一圖像檢索單元408、一用戶接口410以及一用來與WWW42通信的網(wǎng)絡(luò)服務(wù)器412。
服務(wù)器44具有由參考圖2和3所解釋的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法構(gòu)造的一些數(shù)據(jù)庫,即一圖像數(shù)據(jù)庫440、一類別數(shù)據(jù)庫442、一URL數(shù)據(jù)庫444以及一關(guān)鍵詞數(shù)據(jù)庫446。此外,服務(wù)器44還有一用于與WWW通信的網(wǎng)絡(luò)服務(wù)器448。
圖5展示使用在圖4的多媒體內(nèi)容檢索設(shè)備中的、根據(jù)本發(fā)明的一實施例的多媒體內(nèi)容的檢索方法的主要步驟的流程圖。圖5時常被參考。在本實施例中,圖像取成多媒體內(nèi)容的一實例,并假設(shè)數(shù)據(jù)庫使用根據(jù)參考圖2解釋過的本發(fā)明的實施例的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法構(gòu)造。
參考圖5,首先,在步驟502中接收相應(yīng)于由一用戶所要求的一查詢圖像的、來自用戶的關(guān)鍵詞。當(dāng)用戶要求檢索帶有查詢圖像、有一定形狀的“鞋”時,用戶在一計算機(jī)中運行存儲了用于執(zhí)行根據(jù)本發(fā)明所述多媒體內(nèi)容檢索方法的程序碼的記錄介質(zhì),并向位于顯示在用戶監(jiān)視器上的運行屏幕上的一檢索關(guān)鍵詞空間輸入關(guān)鍵詞“鞋”。
接下來,關(guān)鍵詞檢索單元402經(jīng)由網(wǎng)絡(luò)服務(wù)器412,在服務(wù)器44的關(guān)鍵詞數(shù)據(jù)庫446中檢索與所輸入的關(guān)鍵詞的相同詞。當(dāng)檢索該相同的詞時,從圖像數(shù)據(jù)庫440中調(diào)入鏈接到所檢索的詞的圖像。通過這些處理后,在步驟504中,檢索相應(yīng)于所輸入的關(guān)鍵詞的圖像。
同時,由于在數(shù)據(jù)庫中存在很多圖像,并且通過僅使用一個關(guān)鍵詞在龐大的數(shù)據(jù)庫中獲得的所檢索的圖像可能包括實際上與所要的圖像不相似的那些圖像,所以僅使用一個關(guān)鍵詞幾乎不可能通過用一次檢索檢索到所要的圖像。因此,用戶最好用裸眼在所按所的圖像中核對某些圖像,并選擇類似的圖像來將所選擇的圖像反饋給圖像檢索單元408,以便再次執(zhí)行檢索。
對于這一點,在步驟504種,顯示圖像選擇單元404從所檢索的圖像中間選擇預(yù)先確定的數(shù)量的圖像,并且在步驟506中,圖像顯示單元406為用戶顯示預(yù)先確定數(shù)量的所選擇的圖像。
接下來,用戶通過用裸眼觀察所顯示的圖像,選擇一個或多個與用戶要尋找的圖像相似的圖像,并且將那些圖像確定為查詢圖像和提供關(guān)于它們的信息。在本實施例中,響應(yīng)用戶的輸入,用戶接口410選擇多個鞋形圖像并提供選擇信息。通過這樣的處理后,在步驟508中,圖像檢索單元408從該用戶處接收關(guān)于候選的查詢圖像的信息,其中的圖像是判決為視覺上相似于所要的圖像的圖像。
接下來,在步驟510中,圖像檢索單元408在該圖像數(shù)據(jù)庫中,檢索在被確定為視覺上相似于該查詢圖像的候選的查詢圖像中至少在顏色特征、紋理特征和形狀中的一特征相似的圖像。
為了確定是否有兩個圖像,即該查詢圖像和所檢索的圖像真正相似,可以通過計算兩個圖像的特征向量的差異來獲得相似性。在本實施例中,假設(shè)圖像的特征向量存儲在一特征數(shù)據(jù)庫(未在圖中顯示)中。當(dāng)k為紋理向量的長度時,兩個圖像I和j的紋理特征之間的差異可以由以下等式3獲得dtexture(i,j)=Σk=124|tk(i)-tk(j)|......(3)]]>此外,當(dāng)k為顏色向量的長度時,兩個圖像I和j的顏色特征之間的差異可以通過計算兩個特征向量的歐氏(Euclidean)距離,使用下列等式4獲得dcolor(i,j)=(Σk=164(ck(i)-ck(j))2)1/2......(4)]]>確定與已給的查詢圖像的特征向量相比具有最小差異的特征向量的圖像為所檢索的圖像。
當(dāng)要檢索的圖像是一原始圖像時,所檢索的圖像按原樣提供給用戶。當(dāng)要檢索的圖像是微縮圖時,所檢索的圖像的URL,即相應(yīng)于該微縮圖的原始圖像的URL將在具有相應(yīng)于該URL的站點經(jīng)由因特網(wǎng)連接上之后,被用于調(diào)用該原始圖像,然后給用戶提供該原始圖像。這時,可以將該URL信息與微縮圖一其存儲在圖像數(shù)據(jù)庫422中。
在基于內(nèi)容檢索時,用戶選擇有關(guān)的查詢圖像的一個集合R。依據(jù)在顏色空間中收集這樣的圖像集合的緊密程度確定顏色和紋理特征的相對加權(quán)值。即當(dāng)|R|為該查詢收集的圖像數(shù)量時,該加權(quán)值通過下列等式5和6獲得d-texture=1|R|Σi,j∈Rdtexture(i,j)......(5)]]>d-color=1|R|Σi,j∈Rdcolor(i,j).....(6)]]>接下來,當(dāng)ε為用來防止任何一個特征極其顯著的預(yù)先確定的小值時,該加權(quán)值可以經(jīng)由下列等式7和8來獲得Wtexture=1d-texture+ϵ......(7)]]>Wcolor=1d-color+ϵ......(8)]]>當(dāng)N是一預(yù)先確定的正數(shù)時,可以通過計算下列等式9獲得N的最近的近鄰d(·,·)=wtexturedtexture(·,·)+wcolordcolor(·,·)……(9)一般來說,查詢由紋理特征向量和顏色特征向量的單一對指定。因此,在本實施例中,當(dāng)選擇多個查詢圖像時,使用該特征向量和顏色特征向量的平均。即通過下列等式10和11獲得該值f-texture=1|Rq|Σi∈Rftexture(i)......(10)]]>f-color=1|Rq|Σi∈Rfcolor(i)......(11)]]>基于內(nèi)容的檢索可以推廣如下。在使用特征向量ftexture和fcolor的一單一查詢圖像中,首先,當(dāng)i為1,…,N/2和i≤j時,假設(shè)下列條件12和13滿足dtexture(ftexture,stexture(i))≤dtexture(ftexture,stexture(j))......(12)]]>(Here,x∈Stexture)dtexture(ftexture,stexture(N/2))≤dtexture(ftexture,xtexture(j))......(13)]]>然后可使用下列等式14Stexture={S(i)}……(14)第二,當(dāng)i為1,…,N/2和i≤j時,假設(shè)下列條件15和16滿足dcolor(fcolor,scolor(i))≤dcolor(fcolor,scolor(j))......(15)]]>(Here,x∈Scolor)dcolor(fcolor,scolor(N/2))≤dcolor,(fcolor,xcolor(j))......(16)]]>然后可使用下列等式17scolor={s(i)}......(17)]]>此外,在具有ftexture和fcolor的多個查詢圖像中,當(dāng)i為1,…,N/2和i≤j時,假設(shè)下列條件18和19滿足d((f-texture,f-color),(stexture(i),scolor(i)))≤d((f-texture,f-color),(stexture(j),scolor(j)))......(18)]]>(Here,x∈Stexture)d((f-texture,f-color),(s-(N)texture,s-(N)color))≤d((f-texture,f-color),(xtexture,xcolor))......(19)]]>然后可使用下列等式20S={S(i)}………(20)接下來,顯示圖像選擇單元404再從所檢索的、至少顏色特征、紋理特征和形狀之一相似的圖像中間選擇預(yù)先確定的數(shù)量的圖像,并且在步驟512中,圖像顯示單元406為用戶顯示預(yù)先確定數(shù)量的所選擇的圖像。這里,檢索范圍最好限制在該查詢圖像的類別和鄰近類別之內(nèi)。
當(dāng)該數(shù)據(jù)庫根據(jù)適用于多媒體內(nèi)容的、根據(jù)參考圖4解釋的本發(fā)明的第二實施例的數(shù)據(jù)庫構(gòu)造方法構(gòu)造時,檢索范圍最好限制在該查詢圖像URL和鄰近URL之內(nèi)。檢索的目標(biāo)圖像可以是原始圖像也可以是通過降低該原始圖像的分辨率獲得的微縮圖。當(dāng)該檢索目標(biāo)圖像是原始圖像時,可以更精確地實現(xiàn)檢索,但檢索時間會依據(jù)數(shù)據(jù)量和系統(tǒng)性能延長。當(dāng)該檢索目標(biāo)圖像是微縮圖時,精確度降低但檢索時間縮短。因此,可以根據(jù)目的適當(dāng)?shù)毓芾頂?shù)據(jù)庫。
響應(yīng)用戶的輸入,當(dāng)用戶通過用裸眼觀察所顯示的圖像時,用戶接口410選擇一個或多個被確定為與用戶所要的圖像相似的圖像,并且提供被確定為視覺上相似于該查詢圖像的圖像的信息。通過這樣的處理后,圖像檢索單元408再次從該用戶處接收被確定為視覺上相似于該查詢圖像的圖像的信息。再次接收到的圖像看成候選查詢圖像。接下來,圖像檢索單元408再次在該圖像數(shù)據(jù)庫422中檢索那些圖像,其中至少那些圖像的顏色特征、紋理特征和形狀之一視覺上相似于該查詢圖像。即在步驟514中,確定是否檢索到所要的圖像,當(dāng)未檢索到所要的圖像時,重復(fù)執(zhí)行步驟508至512。這里,檢索范圍最好限制在該查詢圖像的類別和鄰近類別之內(nèi)。
該多媒體內(nèi)容檢索方法能夠在收集存儲多媒體內(nèi)容的數(shù)據(jù)庫中快速檢索所要的圖像。
該適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法和檢索方法可以寫成運行于個人計算機(jī)或服務(wù)器類計算機(jī)的程序。構(gòu)成該程序的程序代碼和代碼段可以由該領(lǐng)域的計算機(jī)程序員輕而易舉地寫出。該程序可以存儲在計算機(jī)可讀記錄介質(zhì)中。該記錄介質(zhì)包括磁記錄介質(zhì)、光記錄介質(zhì)和無線電波介質(zhì)。
如上所述,根據(jù)本發(fā)明的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法,使用相應(yīng)的站點的類別信息,按語義分類多媒體內(nèi)容,并將它們存儲在相應(yīng)的數(shù)據(jù)庫中。在由根據(jù)本發(fā)明的、適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法構(gòu)造的數(shù)據(jù)庫中,很好地收集了分散在WWW上的多媒體內(nèi)容,并且使用類別信息或URL信息按語義很好地分類該多媒體內(nèi)容。因此,可以使用用來檢索多媒體內(nèi)容的各種方法,使得快速有效地檢索所要的多媒體內(nèi)容。
權(quán)利要求
1.一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法,該方法包括步驟(a)經(jīng)由電信網(wǎng)絡(luò)存取提供多媒體內(nèi)容的一任意站點;(b)通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及(c)根據(jù)存儲的地址分類該多媒體內(nèi)容并將其存儲到一預(yù)先確定的數(shù)據(jù)庫中。
2.如權(quán)利要求1的數(shù)據(jù)庫構(gòu)造方法,其中該多媒體內(nèi)容為圖像數(shù)據(jù)。
3.如權(quán)利要求1的數(shù)據(jù)庫構(gòu)造方法,其中該地址為統(tǒng)一資源定位符。
4.如權(quán)利要求1的數(shù)據(jù)庫構(gòu)造方法,其中該任意站點在一檢索站點或一入口站點之間選擇。
5.如權(quán)利要求4的數(shù)據(jù)庫構(gòu)造方法,其中該步驟(b)還包括子步驟(b-1)輸入搜索字;(b-2)在具有關(guān)于輸入的搜索字的檢索結(jié)果的超文本標(biāo)示語言的網(wǎng)頁數(shù)據(jù)中,與對應(yīng)于多個子類的多個文本的多媒體內(nèi)容的文件名對應(yīng)的多個文本進(jìn)行分析;以及(b-3)將具有相應(yīng)于分析過的文本的地址的多媒體數(shù)據(jù)調(diào)用。
6.如權(quán)利要求5的數(shù)據(jù)庫構(gòu)造方法,在步驟(b-3)之前還包括(p-b-3-1)當(dāng)相應(yīng)于該子類的文本在載入的HTML網(wǎng)頁數(shù)據(jù)中分析時,訪問相應(yīng)的類別。
7.如權(quán)利要求5的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(b-2)中,將代表這些文本的特征的關(guān)鍵詞與相應(yīng)于該子類的文本和相應(yīng)于在該多媒體內(nèi)容的文件名的文本一起載入的HTML網(wǎng)頁數(shù)據(jù)中進(jìn)行分析。
8.如權(quán)利要求5的數(shù)據(jù)庫構(gòu)造方法,其中該多媒體內(nèi)容為圖像數(shù)據(jù)。
9.如權(quán)利要求8的數(shù)據(jù)庫構(gòu)造方法,在步驟(b-3)之后還包括(b-4)濾出所調(diào)用的圖像中的噪聲圖像。
10.如權(quán)利要求9的數(shù)據(jù)庫構(gòu)造方法,其中步驟(b-4)還包括子步驟(b-4-1)確定一調(diào)用圖像的像素數(shù)是否等于或大于一預(yù)先確定的閾值;以及(b-4-2)當(dāng)一調(diào)用圖像的像素數(shù)等于或大于該預(yù)先確定的閾值時,索引相應(yīng)的圖像。
11.如權(quán)利要求10的數(shù)據(jù)庫構(gòu)造方法,其中該閾值是128。
12.如權(quán)利要求4的數(shù)據(jù)庫構(gòu)造方法,其中步驟(c)還包括子步驟(c-1)降低該調(diào)用圖像的分辨率;以及(c-2)根據(jù)該分類結(jié)構(gòu),將分辨率降低了的該圖像存儲在一預(yù)先確定的數(shù)據(jù)庫中。
13.如權(quán)利要求3的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(c)中使用該URL信息將存儲該調(diào)用多媒體內(nèi)容數(shù)據(jù)的網(wǎng)頁的URL存儲在一預(yù)先確定的數(shù)據(jù)庫中。
14.如權(quán)利要求7的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(c)中,將至少一個URL信息或關(guān)鍵詞信息與關(guān)于各自圖像上的信息一起存儲在各自的預(yù)先確定的數(shù)據(jù)庫中,以使得關(guān)鍵詞能夠鏈接到單個的圖像。
15.一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法,該方法包括步驟(a)使用具有分類的結(jié)構(gòu)的數(shù)據(jù)庫存取提供多媒體內(nèi)容的一任意站點;(b)通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及(c)使用該分類的結(jié)構(gòu),將該調(diào)用的多媒體內(nèi)容數(shù)據(jù)存儲到一預(yù)先確定的數(shù)據(jù)庫中。
16.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中該多媒體內(nèi)容為圖像數(shù)據(jù)。
17.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中該步驟(b)還包括子步驟(b-1)從正在訪問的站點中裝載根HTML網(wǎng)頁數(shù)據(jù);(b-2)分析相應(yīng)于一子類別或相應(yīng)于被裝入的網(wǎng)頁數(shù)據(jù)中的多媒體內(nèi)容的文件名的多個文本;以及(b-3)調(diào)用相應(yīng)于分析過的文本的地址的多媒體內(nèi)容數(shù)據(jù)。
18.如權(quán)利要求17的數(shù)據(jù)庫構(gòu)造方法,在步驟(b-3)之前還包括(p-b-3-1)當(dāng)相應(yīng)于該子類的文本在載入的HTML網(wǎng)頁數(shù)據(jù)中分析時,訪問相應(yīng)的子類。
19.如權(quán)利要求17的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(b-2)中,將代表這些文本的特征的關(guān)鍵詞與相應(yīng)于該子類的文本或相應(yīng)于該多媒體內(nèi)容的文件名的文本一起進(jìn)行分析。
20.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中該多媒體內(nèi)容為圖像數(shù)據(jù)。
21.如權(quán)利要求20的數(shù)據(jù)庫構(gòu)造方法,在步驟(b-3)之后還包括(b-4)濾出所調(diào)用的圖像中的噪聲圖像。
22.如權(quán)利要求21的數(shù)據(jù)庫構(gòu)造方法,其中步驟(b-4)還包括子步驟(b-4-1)確定所調(diào)用圖像的像素數(shù)是否等于或大于一預(yù)先確定的閾值;以及(b-4-2)當(dāng)所調(diào)用圖像的像素數(shù)等于或大于該預(yù)先確定的閾值時,索引相應(yīng)的圖像。
23.如權(quán)利要求22的數(shù)據(jù)庫構(gòu)造方法,其中該閾值是128。
24.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中步驟(c)還包括子步驟(c-1)降低所調(diào)用的圖像的分辨率;以及(c-2)使用所分類的結(jié)構(gòu),將分辨率降低了的該圖像存儲在一預(yù)先確定的數(shù)據(jù)庫中。
25.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(c)中使用所分類的結(jié)構(gòu),將存儲所調(diào)用的多媒體內(nèi)容的網(wǎng)頁的URL存儲在一預(yù)先確定的數(shù)據(jù)庫中。
26.如權(quán)利要求15的數(shù)據(jù)庫構(gòu)造方法,其中在步驟(c)中,將至少一個URL信息或關(guān)鍵詞信息與關(guān)于單個圖像上的信息一起存儲在各自的、預(yù)先確定的數(shù)據(jù)庫中。
27.一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造設(shè)備,該設(shè)備包括網(wǎng)站訪問器,用于存取提供多媒體內(nèi)容的一任意站點,并且通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及數(shù)據(jù)庫,用于使用存儲調(diào)用的多媒體內(nèi)容數(shù)據(jù)的站點或地址的數(shù)據(jù)庫的該分類的結(jié)構(gòu),來分類和存儲該調(diào)用的多媒體內(nèi)容數(shù)據(jù)。
28.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該網(wǎng)站訪問器選擇和訪問一任意站點;從正在訪問的檢索站點中裝載根HTML網(wǎng)頁數(shù)據(jù);在被裝入的網(wǎng)頁數(shù)據(jù)中分析了相應(yīng)于該子類別的文本之后,訪問相應(yīng)的子類別;以及分層地訪問鏈接在該HTML網(wǎng)頁數(shù)據(jù)上并且具有相應(yīng)于已分析的文本的地址的其它網(wǎng)頁或站點。
29.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該多媒體內(nèi)容為圖像數(shù)據(jù)。
30.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,還包括過濾單元,用來濾出所調(diào)用的圖像中的噪聲圖像。
31.如權(quán)利要求30的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該過濾單元基于圖像的像素數(shù)濾出噪聲圖像。
32.如權(quán)利要求31的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該過濾單元確定所調(diào)用的圖像的像素數(shù)是否等于或大于一預(yù)先確定的閾值;以及當(dāng)所調(diào)用的圖像的像素數(shù)小于該預(yù)先確定的閾值時,濾出相應(yīng)的圖像。
33.如權(quán)利要求29的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該分析器分析代表這些文本的特征的關(guān)鍵詞以及該多媒體內(nèi)容的文件名。
34.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,還包括分辨率降低單元,用于降低圖像的分辨率。
35.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,還包括控制單元,用來輸出控制信號,其中確定所索引的多媒體內(nèi)容的數(shù)量是否等于或大于一預(yù)先確定的數(shù)量,并當(dāng)所索引的多媒體內(nèi)容的數(shù)量等于或大于該預(yù)先確定的數(shù)量時,該控制信號具有第一預(yù)先確定的邏輯電平,而當(dāng)所索引的多媒體內(nèi)容的數(shù)量小于該預(yù)先確定的數(shù)量時,該控制信號具有第二預(yù)先確定的邏輯電平。
36.如權(quán)利要求35的數(shù)據(jù)庫構(gòu)造設(shè)備,其中響應(yīng)具有第一預(yù)先確定的邏輯電平的控制信號,該分析器完成分析,而響應(yīng)具有第二預(yù)先確定的邏輯電平的控制信號,該分析器分析相應(yīng)于鏈接在該HTML網(wǎng)頁數(shù)據(jù)中的其它網(wǎng)頁或站點的地址的文本。
37.如權(quán)利要求27的數(shù)據(jù)庫構(gòu)造設(shè)備,其中該數(shù)據(jù)庫包括至少下列數(shù)據(jù)庫之一第一數(shù)據(jù)庫,用來存儲類別信息;第二數(shù)據(jù)庫,用來存儲URL信息;第三數(shù)據(jù)庫,用來存儲關(guān)鍵詞列表;以及第四數(shù)據(jù)庫,用來存儲由存儲在該第一數(shù)據(jù)庫、第二數(shù)據(jù)庫和第三數(shù)據(jù)庫中的信息所索引的多媒體內(nèi)容。
38.如權(quán)利要求37的數(shù)據(jù)庫構(gòu)造設(shè)備,其中第四數(shù)據(jù)庫使用存儲在第一數(shù)據(jù)庫、第二數(shù)據(jù)庫和第三數(shù)據(jù)庫中的信息,存儲關(guān)于存儲所索引的多媒體內(nèi)容的URL的信息。
39.如權(quán)利要求37的數(shù)據(jù)庫構(gòu)造設(shè)備,其中存儲在第四數(shù)據(jù)庫中的多媒體內(nèi)容是通過降低原始圖像的分辨率所產(chǎn)生的微縮圖。
40.一種適用于多媒體內(nèi)容的檢索方法,該方法包括步驟(a)接收來自用戶的、相應(yīng)于所要搜索的查詢圖像的關(guān)鍵詞;以及(b)在存儲相應(yīng)于單個圖像以及多個圖像的關(guān)鍵詞的一預(yù)先確定的數(shù)據(jù)庫中檢索相應(yīng)于關(guān)鍵詞的圖像。
41.如權(quán)利要求40的檢索方法,其中該多媒體內(nèi)容是圖像,并且還包括步驟(c-1)將所檢索的圖像中的多個圖像顯示給用戶;(c-2)從用戶處接收關(guān)于被確定為視覺上相似于該查詢圖像的圖像的信息;以及(c-3)在數(shù)據(jù)庫中的、被確定為視覺上相似于該查詢圖像的圖像中,檢索至少顏色特征、紋理特征和形狀之一相似的圖像。
42.如權(quán)利要求41的檢索方法,其中該多個圖像是通過降低原始圖像的分辨率所獲得的微縮圖。
43.如權(quán)利要求40的檢索方法,其中預(yù)先確定數(shù)據(jù)庫按類別存儲該多個圖像,并且步驟(b)還包括子步驟(b-1)檢索代表該查詢圖像的類別;以及(b-2)在所檢索的類別的圖像中的、被確定為視覺上相似于該查詢圖像的圖像中間,檢索至少顏色特征、紋理特征和形狀之一相似的圖像。
44.如權(quán)利要求40的檢索方法,其中步驟(b)還包括子步驟(b-1)在整個關(guān)鍵詞數(shù)據(jù)庫中檢索與所輸入的關(guān)鍵詞相同的詞;以及(b-2)當(dāng)檢索到與所輸入的關(guān)鍵詞相同的詞時,通過從該圖像數(shù)據(jù)庫中調(diào)用鏈接到所檢索的詞的圖像,來檢索相應(yīng)于所輸入的關(guān)鍵詞的圖像。
45.如權(quán)利要求44的檢索方法,其中步驟(b)的子步驟(b-2)之后還包括子步驟(b-3)在所檢索的圖像中選擇預(yù)先確定數(shù)量的圖像之后,將預(yù)先確定數(shù)量的所選擇的圖像顯示給用戶;(b-4)從用戶處接收關(guān)于被確定為視覺上相似于所要的圖像的查詢圖像的信息;以及(c-5)在該圖像數(shù)據(jù)庫的、確定為視覺上相似于該查詢圖像的圖像中間,檢索至少顏色特征、紋理特征和形狀之一相似的圖像。
46.如權(quán)利要求40的檢索方法,其中檢索范圍限制在該查詢圖像的類別和鄰近類別之內(nèi)。
47.如權(quán)利要求40的檢索方法,其中檢索范圍限制在該查詢圖像的URL和鄰近的URL之內(nèi)。
48.一種適用于多媒體內(nèi)容的檢索設(shè)備,包括數(shù)據(jù)庫,用來存儲多個圖像以及相應(yīng)于各個圖像的關(guān)鍵詞;和檢索單元,用于接收來自用戶的、相應(yīng)于查詢圖像的關(guān)鍵詞,并在該數(shù)據(jù)庫中檢索相應(yīng)于該關(guān)鍵詞的多媒體內(nèi)容數(shù)據(jù)。
49.如權(quán)利要求48的檢索設(shè)備,其中該檢索單元包括關(guān)鍵詞檢索單元,用來在整個數(shù)據(jù)庫中檢索與所輸入的關(guān)鍵詞相同的詞,并且通過在檢索到與輸入的關(guān)鍵詞相同的詞后,調(diào)用鏈接到所檢索的詞的多媒體內(nèi)容,來檢索相應(yīng)于所輸入的關(guān)鍵詞的多媒體內(nèi)容。
50.如權(quán)利要求48的檢索設(shè)備,其中該多媒體內(nèi)容是圖像,并且該檢索單元還包括圖像檢索單元,用來從該用戶處接收關(guān)于被確定為真正地相似于所要圖像的該查詢圖像的信息,并且在該圖像數(shù)據(jù)庫中被確定為真正地相似于該查詢圖像的圖像中間,檢索至少顏色特征、紋理特征和形狀之一相似的圖像。
51.如權(quán)利要求48的檢索設(shè)備,其中該多媒體內(nèi)容是圖像,并且該檢索單元還包括用戶接口,用來響應(yīng)用戶的輸入,選擇多個用戶所要的圖像,并提供選擇信息;顯示圖像選擇單元,用來在所選擇的圖像中間選擇預(yù)先確定的數(shù)量的圖像;以及圖像顯示單元,用來為用戶顯示預(yù)先確定數(shù)量的所選擇的圖像。
52.如權(quán)利要求48的檢索設(shè)備,其中的數(shù)據(jù)庫包括至少下列之一圖像數(shù)據(jù)庫,用來存儲單個圖像;以及關(guān)鍵詞數(shù)據(jù)庫,用來存儲相應(yīng)于單個圖像的關(guān)鍵詞以及關(guān)于存儲在該圖像數(shù)據(jù)庫中的單個圖像的信息。
53.如權(quán)利要求48的檢索設(shè)備,其中的數(shù)據(jù)庫包括至少下列之一圖像數(shù)據(jù)庫,用來存儲單個圖像;以及類別數(shù)據(jù)庫,用來存儲正在訪問的網(wǎng)頁的數(shù)據(jù)的類別信息以及關(guān)于存儲在該圖像數(shù)據(jù)庫中的單個圖像的信息。
全文摘要
提供了一種適用于多媒體內(nèi)容的數(shù)據(jù)庫構(gòu)造方法。該方法包括步驟:(a)經(jīng)由電信網(wǎng)絡(luò)存取提供多媒體內(nèi)容的一任意站點;(b)通過結(jié)網(wǎng)該站點調(diào)用多媒體內(nèi)容;以及(c)根據(jù)存儲的地址分類該多媒體內(nèi)容并將其存儲到一預(yù)先確定的數(shù)據(jù)庫中。本方法使用關(guān)于相應(yīng)的站點的類別信息,按語義分類多媒體內(nèi)容并將它們存儲在相應(yīng)的數(shù)據(jù)庫中。在本方法構(gòu)造的數(shù)據(jù)庫中,很好地收集了分散在WWW上的多媒體內(nèi)容并且按語義分類了該多媒體內(nèi)容,因此可以使用各種檢索方法來快速有效地檢索所要的多媒體內(nèi)容。
文檔編號G06F17/30GK1326158SQ0111127
公開日2001年12月12日 申請日期2001年3月13日 優(yōu)先權(quán)日2000年5月31日
發(fā)明者申鉉枓, 崔良林, 巴里斯·蘇門根, 班加洛爾·S·曼朱納思 申請人:三星電子株式會社, 加利福尼亞大學(xué)董事會