專利名稱:用于操縱數(shù)據(jù)文件的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)文件操縱方法和設(shè)備,并更具體地涉及媒體文件操
縱方法和"i殳備。
背景技術(shù):
隨著在消費(fèi)電子設(shè)備中存儲成本的下降和存儲能力的增強(qiáng),消費(fèi)者 可以處理存儲在一個存儲單元中的大量的文件。例如,在數(shù)字娛樂領(lǐng)域
中,消費(fèi)者可以在媒體中心、自動唱片點(diǎn)唱機(jī)或MP3播放器上存儲大 量的媒體文件。40-100GB的存儲能力在今天的MP3播放器市場上已不 罕見,從而允許用戶在一個播放器中存儲超過10,000首MP3歌曲。
除本地存儲之外,連通性的發(fā)展允許消費(fèi)者訪問龐大的網(wǎng)絡(luò)/遠(yuǎn)端的 存儲。
與此同時,媒體收藏包括多語言內(nèi)容,例如中文歌曲、英文歌曲、 法文歌曲、日文歌曲。已知的搜索或分類的方法分別對待不同的語言, 即在輸入用于搜索一個給定々某體文件的一個查詢之前,用戶必須選4奪語 言輸入才莫式。
在另一方面,CE設(shè)備典型地由一個遙控或其他有限的控制鍵來控 制。這些設(shè)備通常包括一個鍵盤,其具有比在相關(guān)語言的字母表中的字 母數(shù)更少的鍵。例如,使用簡化的鍵盤的許多設(shè)備使用如用在一個按鍵 式電話上的一個三乘四鍵矩陣。
大型的媒體數(shù)據(jù)庫和有限的控制/顯示能力對媒體收藏的瀏覽或從 一個長長的列表中定位一個特定媒體造成很多問題。典型地,需要許多 鍵按壓并要求用戶對他正在尋找的媒體名稱很有把握,這使得搜索復(fù)雜 化。
已經(jīng)開發(fā)了使用簡化的鍵盤來輸入和顯示期望的文本的各種方法, 例如,專利申請US 20020126097 y^開了一種方法和i殳備,用于通過一 個簡化的鍵盤使用與上下文相關(guān)的字典,將文字?jǐn)?shù)字?jǐn)?shù)據(jù)輸入到 一個電 子設(shè)備中。專利申請US 6307548B1提供了一種簡化的鍵盤的歧義消除 系統(tǒng)。然而,上述現(xiàn)有技術(shù)未能提供一種這樣的解決方案,其不管語言模 式的差異,使用統(tǒng)一的輸入方法來搜索一個目標(biāo)文件。
發(fā)明內(nèi)容
本發(fā)明的一個目的是提出一種改進(jìn)的編碼數(shù)據(jù)文件的方法,以便于 搜索在 一個存儲單元中的該文件。
該目的在一種對存儲于一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行編碼 的方法中實(shí)現(xiàn),所述方法包括步驟從所述數(shù)據(jù)文件抽取一個非字母數(shù)
據(jù),所述數(shù)據(jù)與所述文件相關(guān)聯(lián);使用從一個第一符號集中獲得的符號 將所述數(shù)據(jù)轉(zhuǎn)換成一個詞;以及用一個查找表來編碼所述詞以生成一個 索引數(shù)據(jù),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二 符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。
該目的還在一種對存儲于一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行編 碼的設(shè)備中實(shí)現(xiàn),所述設(shè)備包括一個抽取裝置,用于從所述數(shù)據(jù)文件抽 取一個非字母數(shù)據(jù),所述數(shù)據(jù)與所述文件相關(guān)聯(lián);轉(zhuǎn)換裝置,用于使用 從一個第 一符號集中獲得的符號將所述數(shù)據(jù)轉(zhuǎn)換成 一 個詞;以及編碼裝 置,用于用一個查找表來編碼所述詞以生成一個索引數(shù)據(jù),所述查找表 將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所 述第一符號集的一個子集相關(guān)聯(lián)。
本發(fā)明的另 一個目的是提出 一種改進(jìn)的獲取存儲在一個存儲單元 中的數(shù)據(jù)文件的方法。
該目的在一種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的方法中實(shí) 現(xiàn),每個所述文件與一個索引數(shù)據(jù)相關(guān)聯(lián),所述方法包括步驟使用一 個第一符號集獲得的符號來生成一個詞;用一個查找表來編碼所述詞以 生成一個編碼數(shù)據(jù),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián), 所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);以及 搜索具有與所述編碼數(shù)據(jù)相匹配的索引數(shù)據(jù)的所有數(shù)據(jù)文件。
該目的還在一種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的設(shè)備中 實(shí)現(xiàn),每個所述文件都與一個索引數(shù)據(jù)相關(guān)聯(lián),所述設(shè)備包括;生成裝 置,用于使用從第一個符號集獲得的符號來生成一個詞;編碼裝置,用 于用一個查找表來編碼所述詞以生成一個編碼數(shù)據(jù),所述查找表將所述 符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);以及搜索裝置,用于搜索具有與所述編碼數(shù)
據(jù)相匹配的索引數(shù)據(jù)的所有數(shù)據(jù)文件。
因此,本發(fā)明提供了一個以不依賴于一種語言的方式處理不同的語 言,以操縱數(shù)據(jù)文件的解決方案,同時,提供了一個不必確切地知道查 詢內(nèi)容而進(jìn)行數(shù)據(jù)文件搜索的解決方案。
通過結(jié)合附圖參考下列說明書和權(quán)利要求書,其他的目的和成就以 及對本發(fā)明的一個完整的理解將變得顯而易見并易于理解。
本發(fā)明將參考附圖進(jìn)行描述,其中
圖1示出了一個根據(jù)本發(fā)明的用于對一個非字母數(shù)據(jù)文件進(jìn)行編碼 的方法的流程圖。
圖2示出了一個根據(jù)本發(fā)明的獲取在一個存儲單元中的數(shù)據(jù)文件的 流程圖。
圖3示出了一個根據(jù)本發(fā)明的數(shù)據(jù)記錄格式的一個結(jié)構(gòu)。
圖4描述了在根據(jù)本發(fā)明的方法中使用的一個查找表。
圖5代表一種根據(jù)本發(fā)明的用于對存儲在一個存儲單元中的一個數(shù)
據(jù)文件進(jìn)行編碼的設(shè)備。
圖6代表一種根據(jù)本發(fā)明的用于獲取存儲在一個存儲單元中的數(shù)據(jù)
文件的設(shè)備。
在這些圖中,同樣的部分用同樣的參考標(biāo)記來標(biāo)識。
具體實(shí)施例方式
圖1示出了一個根據(jù)本發(fā)明的用于對一個非字母數(shù)據(jù)文件進(jìn)行編碼 的方法的流程圖。
本發(fā)明提供了一種對存儲于一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行 編碼的方法,所述方法包括抽取一個非字母數(shù)據(jù)的步驟100,所述數(shù)據(jù) 與所述文件相關(guān)聯(lián)。當(dāng)一個新的數(shù)據(jù)文件存儲到一個數(shù)據(jù)文件存儲單元 時,在步驟100中抽取與該文件相關(guān)聯(lián)的數(shù)據(jù),其中該數(shù)據(jù)可以包括該 文件的關(guān)鍵字或該文件的元數(shù)據(jù),例如一個MP3文件的ID3標(biāo)簽,或 一個圖片的可交換圖形文件(Exif)數(shù)據(jù)。例如,對于對應(yīng)于一首名為 "紙飛機(jī)"的中文歌曲并存儲在一個MP3播放器中的一個數(shù)據(jù)文件,通過步驟IOO抽取出文本單詞"紙飛機(jī)"。
該方法還包括步驟101,用于使用從一個第一符號集獲得的符號將
所述非字母數(shù)據(jù)轉(zhuǎn)換成一個詞。因?yàn)槌槿〉臄?shù)據(jù)可以是字母或非字母的
(例如中文,韓文和日文),所以在步驟101中,使用從一個第一符號 集,其可以是26個英文字母A, B, C, D, E, F...Z獲得的符號將非 字母數(shù)據(jù)轉(zhuǎn)換成一個詞。任何筒體中文字符或繁體中文字符可以轉(zhuǎn)換成
"拼音"符號,任何韓文字符可以轉(zhuǎn)換成"字母(Jamo)"符號。所以, 在步驟101中,非字母字符"紙飛機(jī)',被轉(zhuǎn)換成它的"拼音"形式"zhifeiji"。
該方法還包括步驟102,用一個查找表來編碼所述詞以生成一個索 引數(shù)據(jù)320,所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第 二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。
在步驟101之后,非字母數(shù)據(jù);故轉(zhuǎn)換成一個詞。在步驟102中,用 一個查找表對該詞進(jìn)行編碼以生成一個索引數(shù)據(jù)320。在圖4中示出了 一個查找表。繼續(xù)上面的例子,在步驟102中,根據(jù)如圖4所示的一個 查找表對詞"zhifeiji"進(jìn)行編碼。如果使用這個表,稱為索引的編碼數(shù) 據(jù)將是"72322333"。
圖4描述了 一個在根據(jù)本發(fā)明的方法中使用的查找表。在這個表中, 左列代表一個第一符號集A, B, C, D, E, F…Z,以及右列代表一 個第二符號集1, 2, 3, 4, 5, 6, 7。顯然,這些符號可以是任何其 他的符號。第二符號集的每個符號與第一符號集的一個子集相關(guān)聯(lián),例 如,符號"1"與A, B, C, D相關(guān)聯(lián)以及符號"2"與E, F, G, H相 關(guān)聯(lián)。顯然,第一符號集的對應(yīng)的子集可以變化。
另外,本發(fā)明提供了一種方法,其包括生成一個數(shù)據(jù)記錄的步驟(未 示出),所述數(shù)據(jù)記錄包括所述索引數(shù)據(jù)320和一個文件指針,所述文
件指針將所述數(shù)據(jù)記錄與所述文件相鏈接,以及將所述數(shù)據(jù)記錄存儲到 一個數(shù)據(jù)庫中的步驟。
圖3示出了根據(jù)本發(fā)明的一個數(shù)據(jù)記錄格式的結(jié)構(gòu)。所述數(shù)據(jù)記錄 包括一個索引數(shù)據(jù)320和一個文件指針330,所述文件指針330將所述 數(shù)據(jù)記錄與所述文件相鏈接,然后將該數(shù)據(jù)記錄存儲到一個數(shù)據(jù)庫中。 指針330可以是文件的存儲位置(即地址)或是一個到平臺的參考,通 過它應(yīng)用可以定位這個數(shù)據(jù)記錄所代表的文件。附加標(biāo)簽340是細(xì)樣吏地 分類文件內(nèi)容的任何其他的標(biāo)簽,如語言,類別,個人愛好標(biāo)記等。使用多少或什么樣的標(biāo)簽是可選的并取決于應(yīng)用。本發(fā)明也可以用不同的 類別來定位文件,如"專輯名稱","藝術(shù)家名稱"。對每個類別都產(chǎn) 生一個數(shù)據(jù)記錄并添加到數(shù)據(jù)庫中。為識別不同的搜索類別,類別信息
可以添加到數(shù)據(jù)記錄"附加標(biāo)簽,,340中。頭部310是一個預(yù)定義的標(biāo) 簽用來標(biāo)記一個新記錄的開始。
此外,本發(fā)明提供了一種包括生成多個數(shù)據(jù)記錄的步驟(未示出) 的方法,每個所述數(shù)據(jù)記錄包含一個所述索引數(shù)據(jù)320的子串。假設(shè)一 個文件具有名稱"ABCDEFGHI",其對應(yīng)的索引數(shù)據(jù)為"111 122 223"。 產(chǎn)生下列三個索引數(shù)據(jù)320的子串
111 122 223
122 223
223
因此,生成了三個數(shù)據(jù)記錄。它們的每一個包含索引數(shù)據(jù)320的一 個子串。所有這三個數(shù)據(jù)記錄通過使用指針330分別與名為"ABCDEF GHI"的文件相關(guān)聯(lián)。因此,該方法還提供了一個子串編碼方法。
另一方面,當(dāng)所述索引數(shù)據(jù)320包括多個符號集時,本發(fā)明提供了 一種包括通過連接每個符號集的每個第一符號生成一個導(dǎo)出的索引數(shù) 據(jù)的步驟的方法。在上面的例子中,通過連接每個符號集111 122 223 的每個第一符號,生成一個導(dǎo)出的索引數(shù)據(jù)112。
圖2示出了一個根據(jù)本發(fā)明的來獲取在一個存儲單元中的數(shù)據(jù)文件 的流程圖。
本發(fā)明提供了 一種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的方法, 每個所述數(shù)據(jù)文件與一個索引數(shù)據(jù)320相關(guān)聯(lián),所述方法包括使用一個 第一符號集獲得的符號來生成一個詞的步驟200。在步驟200中,生成 一個查詢以搜索存儲在一個存儲單元中的一個特定數(shù)據(jù)文件,每個所述 文件與一個索引數(shù)據(jù)320相關(guān)聯(lián)。如果查詢是非字母的,則應(yīng)該使用從 一個第一符號集,其可以是26個英文字母A, B, C, D, E, F…Z中 獲得的符號將其首先轉(zhuǎn)換成一個詞。在此的一個實(shí)施例中,如果用戶想 要查找一首名為"紙飛機(jī),,的中文歌曲,他可以使用拼音形式"zhifeiji,,。 在大多數(shù)情況下,用戶不需要輸入完整的字符串,在獲得期望的數(shù)據(jù)文 件之前通常他只需要按下2-5個鍵。
該方法還包括一個步驟201,用一個查找表對所述詞進(jìn)行編碼以生成一個編碼數(shù)據(jù),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所 述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。當(dāng)用戶輸入他的詞時,由步驟201用一個查找表對該詞進(jìn)4亍編碼以生成一個編 碼數(shù)據(jù)。查找表的一個例子由圖4說明。 一個簡化的鍵盤可以采用查找 表,其中鍵盤的每個鍵與字符的一個子集相關(guān)聯(lián)。該方法還包括一個步驟202,搜索具有與所述編碼數(shù)據(jù)相匹配的索 引數(shù)據(jù)320的所有數(shù)據(jù)文件。有兩種其中所述索引數(shù)據(jù)320與所述編碼數(shù)據(jù)相匹配的情況。在一 種情況中,所述搜索步驟202包括一個識別與索引數(shù)據(jù)320相關(guān)聯(lián)的數(shù) 據(jù)文件的步驟(未示出),所述索引數(shù)據(jù)320包括所述編碼數(shù)據(jù)。例如, 如果一個用戶想要搜索名為"ABCDEFGHI"的文件,其對應(yīng)的索引數(shù) 據(jù)320為"111 122 223",他可以只知道ABC, DEF或GHI,于是他可 以輸入ABC或DEF或GHI,每個相應(yīng)的編碼數(shù)據(jù)分別為111或122或 223。搜索算法將搜索整個索引數(shù)據(jù)"111 122 223"。因?yàn)樗l(fā)現(xiàn)所述 索引數(shù)據(jù)"111 122 223"包括所述編碼數(shù)據(jù)"111"或"122"或"223", 它將識別與索引數(shù)據(jù)320相關(guān)聯(lián)的所有數(shù)據(jù)文件,所述索引數(shù)據(jù)320包 括所述編碼數(shù)據(jù)。在另一種情況中,所述搜索步驟202包括一個識別與索引數(shù)據(jù)320 相關(guān)聯(lián)的數(shù)據(jù)文件的步驟(未示出),所述索引數(shù)據(jù)320包括多個符號 集,進(jìn)一步包括步驟連接(未示出)所述符號集的所有第一符號以生 成一個連接的詞;以及將所述連接的詞與所述編碼數(shù)據(jù)進(jìn)行比較。仍然 利用上面的例子用戶想要輸入名的每個第一字母"ADG"(對應(yīng)于編 碼數(shù)據(jù)"112")來定位文件,搜索算法連接所述符號集("111 122 223") 的所有第一符號以生成一個連接的詞"112"并將連接的詞"112"與所 述編碼數(shù)據(jù)"112"進(jìn)行比較。此外,本發(fā)明提供了 一種包括一旦所述詞由所述生成步驟進(jìn)行了改 動,就觸發(fā)(未示出)所述編碼步驟201和搜索步驟202的步驟的方法。 這是本發(fā)明的另一個方面,即無論何時用戶產(chǎn)生一個單一的按壓, 一旦 所述詞由所述生成步驟進(jìn)4亍了改動,它就將觸發(fā)所述編碼步驟201和4叟 索步驟202。如圖1和圖2所示的方法可以有利地進(jìn)行組合以形成一種梯:縱存4諸 在一個存儲單元的數(shù)據(jù)文件的方法,所述方法包括步驟從所述數(shù)據(jù)文件抽取一個非字母數(shù)據(jù)100,所述數(shù)據(jù)與所述文件相關(guān)聯(lián);使用從一個 第一符號集中獲得的符號將所述數(shù)據(jù)轉(zhuǎn)換成一個詞101;以及用一個查找表來編碼所述詞102以生成一個索引數(shù)據(jù)320,所述查找表將所述符 號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);使用從所述第一符號集獲得的符號來生成一個 詞200;用所述查找表來編碼所述詞以生成一個編碼數(shù)據(jù)201;以及^臾 索具有與所述編碼數(shù)據(jù)相匹配的索引數(shù)據(jù)320的所有數(shù)據(jù)文件202,每 個所述數(shù)據(jù)文件與所述索引數(shù)據(jù)320相關(guān)聯(lián)。圖5代表一種根據(jù)本發(fā)明的用于對存儲在一個存儲單元中的一個數(shù) 據(jù)文件進(jìn)行編碼的設(shè)備。對一個存儲在一個存儲單元中的文件511進(jìn)行編碼的一種設(shè)備 520,該文件可以是一個例如MP3文件的媒體文件,所述設(shè)備包括一個 抽取裝置521,用于從所述文件抽取一個非字母數(shù)據(jù);轉(zhuǎn)換裝置522, 用于使用一個第一符號集獲得的符號將所述非字母數(shù)據(jù)轉(zhuǎn)換成一個詞; 以及編碼裝置523,用于用一個查找表來編碼所述詞以生成一個索引數(shù) 據(jù)320,所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符 號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。圖6代表一種根據(jù)本發(fā)明的用于獲取存儲在一個存儲單元中的數(shù)據(jù) 文件的設(shè)備。一種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的設(shè)備610,每個所述 文件都與一個索引數(shù)據(jù)320相關(guān)聯(lián)。所述設(shè)備包括生成裝置611,用于 使用一個第一符號集獲得的符號來生成一個詞;編碼裝置612,用于用 一個查找表來編碼所述詞以生成一個編碼數(shù)據(jù),所述查找表將所述符號 與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);以及搜索裝置613,用于搜索具有與所述編碼數(shù) 據(jù)相匹配的索引數(shù)據(jù)320的所有數(shù)據(jù)文件。如圖5和圖6所示的設(shè)備可以有利地進(jìn)行組合以形成一種操縱存儲 在一個存儲單元的數(shù)據(jù)文件的系統(tǒng),包括抽取裝置521,用于從所述文 件抽取一個非字母數(shù)據(jù);轉(zhuǎn)換裝置522,用于使用一個第一符號集獲得 的符號將所述非字母數(shù)據(jù)轉(zhuǎn)換成一個詞;編碼裝置523,用于用一個查 找表來編碼所述詞以生成一個索引數(shù)據(jù)320,所述查找表將所述符號與 一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);生成裝置611,用于使用所述第一符號集獲得的符 號來生成一個詞;編碼裝置612,用于用所述查找表來編碼所述詞以生 成一個編碼數(shù)據(jù);以及搜索裝置613,用于搜索具有與所述編碼數(shù)據(jù)相 匹配的索引數(shù)據(jù)320的所有數(shù)據(jù)文件。應(yīng)該注意,以示例性而不是限制性的意義采用了上述本發(fā)明的實(shí)施 方式。本領(lǐng)域的技術(shù)人員可以在不違背本發(fā)明的范圍的情況下對這些實(shí) 施方式進(jìn)4于各種改動。
權(quán)利要求
1.一種對存儲在一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行編碼的方法,所述方法包括步驟-從所述數(shù)據(jù)文件抽取(100)一個非字母數(shù)據(jù),所述數(shù)據(jù)與所述文件相關(guān)聯(lián);-使用從一個第一符號集中獲得的符號將所述數(shù)據(jù)轉(zhuǎn)換(101)成一個詞;以及-用一個查找表來編碼(102)所述詞以生成一個索引數(shù)據(jù)(320),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。
2. 根據(jù)權(quán)利要求1所述的方法,其中所述非字母數(shù)據(jù)是一個元數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1或2所述的方法,進(jìn)一步包括步驟-生成一個數(shù)據(jù)記錄,所述數(shù)據(jù)記錄包括所述索引數(shù)據(jù)(320)和一 個文件指針(330),所述文件指針(330)將所述數(shù)據(jù)記錄與所述文件 相鏈接;-將所述數(shù)據(jù)記錄存儲到一個數(shù)據(jù)庫中。
4. 根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括步驟-將一個標(biāo)簽(340)添加到所述數(shù)據(jù)記錄中,所述標(biāo)簽(340)對 所述文件的內(nèi)容進(jìn)行分類。
5. 根據(jù)權(quán)利要求3所述的方法,進(jìn)一步包括步驟-生成多個數(shù)據(jù)記錄,每個所述數(shù)據(jù)記錄包含所述索引數(shù)據(jù)(320) 的一個子串。
6. 根據(jù)權(quán)利要求1所述的方法,其中所述索引數(shù)據(jù)(320)包括多 個符號集,進(jìn)一步包括步驟-通過連接每個符號集的每個第一符號,生成一個導(dǎo)出的索引數(shù)據(jù)。
7. —種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的方法,每個所述數(shù) 據(jù)文件與一個索引數(shù)據(jù)(320 )相關(guān)聯(lián),所述方法包括步驟-使用從一個第一符號集獲得的符號來生成(200) —個詞;-用一個查找表來編碼(201 )所述詞以生成一個編碼數(shù)據(jù),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);以及-搜索(202)具有與所述編碼數(shù)據(jù)相匹配的索引數(shù)據(jù)(320)的所 有數(shù)據(jù)文件。
8. 根據(jù)權(quán)利要求7所述的方法,其中所述搜索步驟(202)包括識 別與索引數(shù)據(jù)(320)相關(guān)聯(lián)的數(shù)據(jù)文件的步驟,所述索引數(shù)據(jù)(320) 包括所述編碼數(shù)據(jù)。
9. 根據(jù)權(quán)利要求7所述的方法,其中所述搜索步驟(202)包括識 別與一個索引數(shù)據(jù)(320)相關(guān)聯(lián)的數(shù)據(jù)文件的步驟,所述索引數(shù)據(jù)(320) 包括多個符號集,所述方法進(jìn)一步包括步驟-連接所述符號集的所有第一符號以生成一個連接的詞;以及 -將所述連接的詞與所述編碼數(shù)據(jù)進(jìn)行比較。
10. 根據(jù)權(quán)利要求7所述的方法,進(jìn)一步包括步驟- 一旦所述詞由所述生成步驟進(jìn)行了改動,就觸發(fā)所述編碼步驟 (201 )和搜索步驟(202)。
11. 一種操縱存儲在一個存儲單元中的數(shù)據(jù)文件的方法,所述方法 包括步驟-從所述數(shù)據(jù)文件抽取一個非字母數(shù)據(jù)(100),所述數(shù)據(jù)與所述文 件相關(guān)聯(lián);-使用從一個第一符號集中獲得的符號將所述數(shù)據(jù)轉(zhuǎn)換(101 )成一 個詞;-用一個查找表來編碼(102)所述詞以生成一個索引數(shù)據(jù)(320), 所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每 個符號與所述第 一符號集的 一個子集相關(guān)聯(lián);-使用從所述第一符號集獲得的符號來生成(200) —個詞; -用所述查找表來編碼(201)所述詞以生成一個編碼數(shù)據(jù);以及 -搜索(202)具有與所述編碼數(shù)據(jù)相匹配的索引數(shù)據(jù)(320)的所 有數(shù)據(jù)文件,每個所述數(shù)據(jù)文件與所述索引數(shù)據(jù)(320)相關(guān)聯(lián)。
12. —種對存儲在一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行編碼的設(shè) 備,所述設(shè)備包括-抽取裝置(521),用于從所述數(shù)據(jù)文件(511)中抽取一個非字母數(shù)據(jù),所述數(shù)據(jù)與所述文件(511)相關(guān)聯(lián);-轉(zhuǎn)換裝置(522 ),用于使用從一個第一符號集中獲得的符號將所 述數(shù)據(jù)轉(zhuǎn)換成一個詞;以及-編碼裝置(523 ),用于用一個查找表來編碼所述詞以生成一個索 引數(shù)據(jù)(320),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所 述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。
13. —種獲取存儲在一個存儲單元中的數(shù)據(jù)文件的設(shè)備,每個所述 數(shù)據(jù)文件與一個索引數(shù)據(jù)(320)相關(guān)聯(lián),所述設(shè)備包括-生成裝置(611),用于使用從一個第一符號集中獲得的符號來生 成一個詞;-編碼裝置(612),用于用一個查找表來編碼所述詞以生成一個編 碼數(shù)據(jù),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符 號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);以及-搜索裝置(613),用于搜索具有與所述編碼數(shù)據(jù)相匹配的索引數(shù) 據(jù)(320)的所有數(shù)據(jù)文件。
14. 一種操縱存儲在一個存儲單元中的數(shù)據(jù)文件的系統(tǒng),包括-抽取裝置(521),用于從所述文件中抽取一個非字母數(shù)據(jù),所述 數(shù)據(jù)與所述文件相關(guān)聯(lián);-轉(zhuǎn)換裝置(522),用于使用從一個第一符號集中獲得的符號將所 述數(shù)據(jù)轉(zhuǎn)換成一個詞;-編碼裝置(523 ),用于用一個查找表來編碼所述詞以生成一個索 引數(shù)據(jù)(320),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所 述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián);-生成裝置(611),用于使用從所述第一符號集獲得的符號來生成 一個詞;-編碼裝置(612),用于用所述查找表來編碼所述詞以生成一個編 碼數(shù)據(jù);以及-搜索裝置(613),用于搜索具有與所述編碼數(shù)據(jù)相匹配的索引數(shù) 據(jù)(320)的所有數(shù)據(jù)文件。
全文摘要
一種對存儲在一個存儲單元中的一個數(shù)據(jù)文件進(jìn)行編碼的方法,所述方法包括步驟從所述數(shù)據(jù)文件中抽取(100)一個非字母數(shù)據(jù),所述數(shù)據(jù)與所述文件相關(guān)聯(lián);使用從一個第一符號集中獲得的符號將所述數(shù)據(jù)轉(zhuǎn)換(101)成一個詞;以及用一個查找表來編碼(102)所述詞以生成一個索引數(shù)據(jù)(320),所述查找表將所述符號與一個第二符號集相關(guān)聯(lián),所述第二符號集的每個符號與所述第一符號集的一個子集相關(guān)聯(lián)。
文檔編號G06F17/30GK101331483SQ200680046921
公開日2008年12月24日 申請日期2006年12月11日 優(yōu)先權(quán)日2005年12月14日
發(fā)明者于東海, 袁海榮 申請人:皇家飛利浦電子股份有限公司