專利名稱:無線射頻識別數(shù)據(jù)的分布式存儲方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種無線射頻識別數(shù)據(jù)的存儲方法,具體涉及一種通過分布式結(jié)構(gòu) 進行無線射頻識別數(shù)據(jù)的存儲方法,本發(fā)明涉及無線射頻識別數(shù)據(jù)庫領(lǐng)域。
背景技術(shù):
RFID (Radio Frequency Identification,即無線射頻識別),也稱射頻識別, 是一種非接觸式的通信技術(shù)。最早出現(xiàn)在二戰(zhàn)時期,在用以區(qū)別敵軍飛機的辨識系 統(tǒng)中起了關(guān)鍵的作用。射頻技術(shù)利用無線電波在媒體上讀寫相關(guān)數(shù)據(jù),實現(xiàn)目標的 自動識別,識別工作過程無需人工干預(yù)。RFID識別的有效距離可達幾十厘米至幾米, 根據(jù)讀寫的方式,可以輸入多達數(shù)千字節(jié)的信息。RFID當前的應(yīng)用非常廣泛,給制 造、零售、物流等產(chǎn)業(yè)帶來了革命性的變化,適用的領(lǐng)域包括生產(chǎn)管理、物流和供 應(yīng)管理、運載工具和貨架識別等要求非接觸數(shù)據(jù)采集和交換的場合,在要求頻繁改 變數(shù)據(jù)內(nèi)容的情況下尤為適用。然而,RFID技術(shù)要實現(xiàn)完全的推廣和應(yīng)用,還有許 多需要解決的問題。其中一個問題是RFID系統(tǒng)每天都產(chǎn)生堆積如山的數(shù)據(jù),例如 在物流領(lǐng)域中,供應(yīng)體系的商品、貨盤、集裝箱、紙箱、搬運箱的位置、包裝、裝 載、卸載等活動,對商品的信息檢索和運送路徑等信息的追蹤,都產(chǎn)生出海量的實 時數(shù)據(jù)。目前大多數(shù)企業(yè)還沒有實現(xiàn)隨時傳輸、存儲、操作并整合數(shù)量如此龐大的 RFID數(shù)據(jù),對RFID數(shù)據(jù)倉庫領(lǐng)域的研究也尚未成熟。
經(jīng)對現(xiàn)有技術(shù)文獻的檢索發(fā)現(xiàn),Hector Gonzalez,韓家衛(wèi),李小磊(音), Diego Klabjan于2005年4月發(fā)表了一篇名為Warehousing and Analyzing Massive RFID Data Sets, ICDE 2006 (大量無線射頻識別數(shù)據(jù)組的倉儲和分析,2006國際數(shù)據(jù)工程大會)。該技術(shù)提出根據(jù)RFID應(yīng)用領(lǐng)域中數(shù)據(jù)產(chǎn)生過程的特點,建立起了 名為RFID-Cuboid,即無線射頻識別立方體結(jié)構(gòu),該結(jié)構(gòu)考慮到了物品在物流過程 中的移動特點以及應(yīng)用領(lǐng)域?qū)FID數(shù)據(jù)的路徑信息查詢要求,提出了路徑查詢的 新概念,
提高了 RFID系統(tǒng)的查詢效率。同時該模型能夠存儲物流過程的動態(tài)路徑信息, 并能夠另外儲存與物品移動過程無關(guān)的信息,同時也強調(diào)了對移動過程中路徑信息 的有效存儲和計算,有效地利用了 RFID數(shù)據(jù)在應(yīng)用中的特點處理在實際工作場景 中產(chǎn)生的動態(tài)變化的大量數(shù)據(jù),創(chuàng)新性地完善了在RFID數(shù)據(jù)查詢,尤其是與路徑 信息有關(guān)的查詢。該現(xiàn)有技術(shù)由于將模型建立在集中式的結(jié)構(gòu)上,并不具備可擴展 性和可靠性;并且當應(yīng)用環(huán)境中需要執(zhí)行大量查詢操作時,該系統(tǒng)的先進先出的隊 列式操作方法將無法同時處理多個查詢請求,而最終導致查詢效率難以滿足需要。
發(fā)明內(nèi)容
技術(shù)問題本發(fā)明的目的在于克服現(xiàn)有技術(shù)中的不足,提供一種無線射頻識別 數(shù)據(jù)的分布式存儲和查詢方法,達到對實時數(shù)據(jù)的快速處理和高效率查詢;并利用 分布式系統(tǒng)的特性,提高系統(tǒng)的數(shù)據(jù)恢復(fù)性能和可擴展性。
技術(shù)方案本發(fā)明使用的數(shù)據(jù)庫立方體結(jié)構(gòu)包括一個由二進制數(shù)字0和1組成 的的數(shù)字序列稱為組標識,即gid[n]=gidngidn.lgidn.2......gid2gidlgid。,其中n為自然常
數(shù),每個gid代表一段移動路線,完整的gid[n]的序列就能表示一組物品所移動的 路徑,其中序列g(shù)id[n。-l]則稱為gid[n。]的前綴,表示該組物品所移動過的相同路 徑中的若干地點;
由該gid[n]所標識的數(shù)據(jù)庫立方體結(jié)構(gòu)內(nèi)部包括STAY、 MAP和INFO (駐留信 息、地圖信息、靜態(tài)信息)三個數(shù)據(jù)結(jié)構(gòu)
其中駐留信息STAY數(shù)據(jù)為四元數(shù)組結(jié)構(gòu),具體包括gid[n]序列,讀取地點, 到達時間,離開時間四個關(guān)鍵數(shù)組,該四元數(shù)組結(jié)構(gòu)表示由gid[n]序列標識的一組 物品在到達時間和離開時間之間停留在讀取地點;其中地圖信息MAP數(shù)據(jù)具體包括gid[n]序列和一個指針,該指針指向物品下 一步將會移動到的地點所述的gid[n+l],gid[n+2]……;對于停止移動的物品對應(yīng) 的指針指向具體的電子產(chǎn)品代碼,表示該產(chǎn)品已不再移動;
其中靜態(tài)信息INFO數(shù)據(jù)包含了不隨著物品移動發(fā)生變化的信息,例如電子產(chǎn) 品代碼、物品的生產(chǎn)商、出廠日期或物品種類。
本發(fā)明將有共同路徑關(guān)系,即前綴關(guān)系的組標識數(shù)據(jù)gid所對應(yīng)的靜態(tài)信息 INFO和地圖信息MAP數(shù)據(jù)則復(fù)制到中央數(shù)據(jù)庫服務(wù)器和所有節(jié)點數(shù)據(jù)庫服務(wù)器中, 而駐留信息數(shù)據(jù)STAY結(jié)構(gòu)則以路徑聚簇方式分散到分布式系統(tǒng)的各個節(jié)點數(shù)據(jù)庫 服務(wù)器上即把具有相同前綴關(guān)系的一組gid歸為一類,將具有相同路徑聚簇的gid 的對應(yīng)駐留信息STAY數(shù)據(jù)傳輸?shù)酵粋€節(jié)點數(shù)據(jù)庫服務(wù)器上,使得數(shù)據(jù)歸類后再 進行查詢。
本發(fā)明具體包括以下步驟
步驟1原始數(shù)據(jù)清理工作環(huán)境中得到的RFID原始數(shù)據(jù)是以(EPC,讀取時 間,讀取地點)的三元形式存在且按照讀取時間順序存儲,首先需要將原始數(shù)據(jù)中 重復(fù)的記錄刪除;
步驟2原始數(shù)據(jù)排序?qū)⒃紨?shù)據(jù)按照EPC、讀取時間兩元素進行兩維排序。 步驟3原始數(shù)據(jù)轉(zhuǎn)換通過步驟2的排序得到相同EPC在不同讀取地點的不 同讀取時間,從而將三元形式轉(zhuǎn)變?yōu)镾TAY (駐留信息)形式的四元組數(shù)據(jù)結(jié)構(gòu),即 依次為EPC, location(讀取地點),timejn(讀取地點進入時間),time—out (讀取 地點離開時間)四個元素。這個四個元素表示編碼為EPC的物品,在time—in時刻 在某地點被閱讀器獲取到信息,然后在time—out時刻離開這個地點;
步驟4構(gòu)造樹型結(jié)構(gòu)利用步驟3得到的駐留信息STAY格式的四元數(shù)組構(gòu)造 出樹型結(jié)構(gòu);
步驟5合并相同信息合并該樹型結(jié)構(gòu)中路徑相同和時間信息相同的四元組, 得到簡化了的gid數(shù)據(jù);
步驟6遍歷樹型結(jié)構(gòu)遍歷該樹型結(jié)構(gòu)中所有駐留信息STAY數(shù)據(jù),根據(jù)一個節(jié)點上駐留信息對應(yīng)的gid數(shù)據(jù)和其孩子節(jié)點的對應(yīng)gid數(shù)據(jù),產(chǎn)生地圖信息MAP 中的gid數(shù)據(jù)和其對應(yīng)子節(jié)點的gid數(shù)據(jù),從而最終產(chǎn)生一個完整的無線射頻識別 立方體數(shù)據(jù)結(jié)構(gòu);
步驟7中央數(shù)據(jù)庫服務(wù)器數(shù)據(jù)備份將完整的無線射頻識別立方體結(jié)構(gòu),即 包括INF0、 STAY、 MAP結(jié)構(gòu)所有的數(shù)據(jù)備份在中央數(shù)據(jù)服務(wù)器中;
步驟8節(jié)點數(shù)據(jù)庫服務(wù)器靜態(tài)數(shù)據(jù)備份將無線射頻識別立方體中的靜態(tài)信 息INFO傳輸?shù)礁鞴?jié)點數(shù)據(jù)庫服務(wù)器上進行存儲;
步驟9計算目的服務(wù)器編號根據(jù)組標識gid,通過組標識映射函數(shù)、目的函 數(shù)計算出對應(yīng)的目的服務(wù)器編號,即用來存儲該gid數(shù)據(jù)對應(yīng)的停留信息STAY的 節(jié)點數(shù)據(jù)庫服務(wù)器的整數(shù)型編號;
9.1) 所述的組標識映射函數(shù)GMF具體如下
G,(g/剩)=(械+ 1)*3^ +1)*3賊-'+……+械*3' +風*30 +1,(式1)
其中g(shù)id為組標識序列,n為自然常數(shù),表明該gid數(shù)據(jù)的長度;
9.2) 所述的目的函數(shù)DF(N)用于計算目的服務(wù)器編號,具體計算方式如下
,=(Lxl& Ng{W ......,4, N督(幽) (式2)
其中N為組標識映射函數(shù)值,S為節(jié)點數(shù)據(jù)庫服務(wù)器個數(shù);
步驟IO將動態(tài)信息傳送至目的服務(wù)器將步驟9中組標識gid對應(yīng)的駐留信 息STAY數(shù)據(jù)傳輸?shù)侥康姆?wù)器中存儲,同時其前綴gid對應(yīng)的駐留信息也送到這 個服務(wù)器;
步驟11節(jié)點數(shù)據(jù)庫服務(wù)器動態(tài)數(shù)據(jù)備份在節(jié)點數(shù)據(jù)庫服務(wù)器中,將收到的 駐留信息STAY數(shù)據(jù)的每個路徑聚簇中按照其最長的gid數(shù)據(jù)排序建立索引,當有 新的gid數(shù)據(jù)產(chǎn)生,則重復(fù)以上步驟直到?jīng)]有新的RFID數(shù)據(jù)進入該系統(tǒng);
步驟12存儲結(jié)束當節(jié)點數(shù)據(jù)庫服務(wù)器完成索引后本存儲過程結(jié)束。
有益效果本發(fā)明通過對無線射頻識別數(shù)據(jù)庫的重組和歸類,將相同路徑的信息分別傳輸?shù)讲煌墓?jié)點數(shù)據(jù)庫服務(wù)器上分別并行處理存儲,加快了數(shù)據(jù)管理和 查詢的效率,保證對RFID系統(tǒng)內(nèi)數(shù)據(jù)的多個諸如存儲或查詢的同時操作之間互不 干擾,避免了操作需要等待延遲的問題。
圖l是本發(fā)明方法的流程圖。
具體實施例方式
以下結(jié)合具體的實施例對本發(fā)明的技術(shù)方案作進一步詳細描述本實施例在以 本發(fā)明技術(shù)方案為前提下進行實施,給出了詳細的實施方式和具體的操作過程,但 本發(fā)明的保護范圍不限于下述的實施例。
本實施例硬件環(huán)境CPU為Intel Pentium 42. 0GHz、內(nèi)存為512M的IBM臺式 個人電腦;
本實施例軟件環(huán)境操作系統(tǒng)平臺為Windows XP;采用的數(shù)據(jù)為人工合成數(shù) 據(jù),用0++語言實現(xiàn)本方法發(fā)明的具體步驟;數(shù)據(jù)庫系統(tǒng)采用Microsoft SQL Server 平臺;
本實施例中的原始數(shù)據(jù)采用人工合成數(shù)據(jù),數(shù)據(jù)以(EPC,讀取時間,讀取 地點)的形式存在,本實驗的數(shù)據(jù)量從1000k到10000k遞增,在這個數(shù)據(jù)的基礎(chǔ) 上構(gòu)架無線射頻識別立方體結(jié)構(gòu),其中的組標識序列g(shù)id:從gid[l]^0]
開始 構(gòu)建,第一次生成gid[2M0]
和
[1],并按照此枚舉方式拓展到 gid[9];
本實施例所用模擬節(jié)點存儲器個數(shù)10。
步驟l原始數(shù)據(jù)整理將原始三維數(shù)據(jù)中的重復(fù)記錄刪除; 步驟2原始數(shù)據(jù)排序?qū)⒃紨?shù)據(jù)按照EPC、讀取時間兩元素進行兩維排序; 步驟3原始數(shù)據(jù)轉(zhuǎn)換如現(xiàn)有兩個三元組形式的數(shù)據(jù)(EPC1,T1,L1)和 (EPCl, T2, L2) , (EPC1, T3, L3),即EPC代碼為EPC1的物品,分別在時間Tl被地點 在Ll的閱讀器監(jiān)測到,在時間T2被地點在L2的地方監(jiān)測到,在時間T3被地點在 L3的地方監(jiān)測到。將該三元組數(shù)據(jù)轉(zhuǎn)換成(EPC1, T1,T2, Ll)和(EPC1, T2, T3, L2)的四元組形式,即EPC代碼為EPC1的物品,在時間點Tl到達地點Ll,在時間T2離 開Ll,又在在時間點T2到達地點L2,在時間T3離開L2。
步驟4構(gòu)造樹型結(jié)構(gòu)利用上一步得到的四元組形式數(shù)據(jù),將EPC代碼相同 的四元組按時間順序排列,如(EPC1, T1,T2, Ll)、 (EPC1, T2, T3, L2)、 (EPC1,T3,T5,L5),將其按照時間順序在樹型結(jié)構(gòu)上排列則(EPC1, T1,T2, Ll) 為(EPC1, T2, T3, L2)的父節(jié)點,(EPC1, T2, T3, L2)為(EPC1, T3, T5, L5)的父節(jié)點。
步驟5合并相同信息:如現(xiàn)在樹型結(jié)構(gòu)中有以下幾個節(jié)點的對應(yīng)四元組(EPC1, T1,T2, Ll)、 (EPC2, T1,T2, Ll)和(EPC1, T2, T3, L2) 、 (EPC2, T2, T4, L3),則可 以將(EPC1, T1,T2, Ll)與(EPC2, T1,T2, Ll)整合成一個節(jié)點,這個節(jié)點的子 節(jié)點對應(yīng)四元組是(EPC1,T2,T3,L2)和(EPC2, T2, T4, L3)。整個樹型結(jié)構(gòu)合并完 成之后,對每個節(jié)點用[O]、 [l]編碼,產(chǎn)生的結(jié)構(gòu)就是gid數(shù)據(jù)。
步驟6遍歷樹型結(jié)構(gòu)對節(jié)點上0、 l編碼的gid數(shù)據(jù)進行遍歷,對于每一個 節(jié)點,都統(tǒng)計其子節(jié)點,構(gòu)成(父節(jié)點,(子節(jié)點l,子節(jié)點2,子節(jié)點3…))的數(shù) 據(jù)形式,以上形式的數(shù)據(jù)就構(gòu)成了MAP結(jié)構(gòu)。
步驟7中央數(shù)據(jù)庫服務(wù)器數(shù)據(jù)備份將完整的無線射頻識別立方體結(jié)構(gòu),即 包括INF0、 STAY、 MAP結(jié)構(gòu)所有的數(shù)據(jù)備份在中央數(shù)據(jù)服務(wù)器中;
步驟8節(jié)點數(shù)據(jù)庫服務(wù)器靜態(tài)數(shù)據(jù)備份將無線射頻識別立方體中的靜態(tài)信 息INFO傳輸?shù)礁鞴?jié)點數(shù)據(jù)庫服務(wù)器上進行存儲;
步驟9計算目的服務(wù)器編號-
9. 1)本實施例所述的組標識映射函數(shù)GMF(gid)為
G,(g4"]) = (#《+1) *381《++1) * +……+ *31 + g7W0 *3。 +1,(式
1)
如,gid[3]為
[1],經(jīng)過GMF計算得到41;
9. 2)如(式2)所示計算得出目的服務(wù)器編號為ZF(41)二4hmiK^l;
步驟10將動態(tài)信息傳送至目的服務(wù)器將步驟9中組標識gid對應(yīng)的駐留信 息STAY數(shù)據(jù)傳輸?shù)侥康姆?wù)器中存儲;如上例,gid為[O][O][O][l],對應(yīng)的STAY數(shù)據(jù)傳輸?shù)侥康姆?wù)器編號為1的節(jié)點數(shù)據(jù)庫服務(wù)器中存儲,此外gid為
和[O] [O]的STAY數(shù)據(jù)也送到該節(jié)點數(shù)據(jù)庫服務(wù)器中。
步驟11節(jié)點數(shù)據(jù)庫服務(wù)器動態(tài)數(shù)據(jù)備份如上例的[O][O], [O][O][O],
[1]組成的路徑聚簇,將
作為該聚簇的標識,與其他聚簇的標 識進行排序,然后得到本聚簇的存儲位置。
步驟12存儲結(jié)束。
本發(fā)明在對逐漸增大的數(shù)據(jù)量的情況下仍然能夠保持快速可靠的處理,而且由 于網(wǎng)絡(luò)傳輸和節(jié)點服務(wù)器上的處理操作都可以并行進行,所以所耗時間并不與數(shù)據(jù) 量增大成正比,能夠在不改變硬件設(shè)備的情況下適應(yīng)大量增加的數(shù)據(jù)集上的工作; 另外,在節(jié)點服務(wù)器增加的情況下,可并行執(zhí)行的存儲操作更多,可以實現(xiàn)更快的 存儲,同時也不會增加系統(tǒng)的負擔,即具有可擴展性。
權(quán)利要求
1、一種無線射頻識別數(shù)據(jù)的分布式存儲方法,其特征在于所述的存儲方法具體包括以下步驟步驟1原始數(shù)據(jù)整理將原始獲得的無線射頻識別三元數(shù)據(jù),即包括電子產(chǎn)品編碼、讀取時間和讀取地點的原始數(shù)據(jù)中重復(fù)的記錄刪除;步驟2原始數(shù)據(jù)排序?qū)⒃极@得的無線射頻識別三元數(shù)據(jù)按照電子產(chǎn)品編碼、讀取時間兩元素進行兩維排序;步驟3原始數(shù)據(jù)轉(zhuǎn)換將原始獲得的無線射頻識別三元數(shù)據(jù)轉(zhuǎn)換為駐留信息形式的四元組數(shù)據(jù),即包擴電子產(chǎn)品編碼,讀取地點,讀取地點進入時間和讀取地點離開時間四個數(shù)組;步驟4構(gòu)造樹型結(jié)構(gòu)利用步驟3得到的駐留信息格式的四元數(shù)組構(gòu)造出樹型結(jié)構(gòu);步驟5合并相同信息合并步驟4中的樹型結(jié)構(gòu)中具有相同路徑信息和時間信息的記錄,得到簡化了的組標識序列;遍歷該樹型結(jié)構(gòu)中所有駐留信息數(shù)據(jù)并構(gòu)造一個完整的無線射頻識別立方體數(shù)據(jù)結(jié)構(gòu);步驟6遍歷樹型結(jié)構(gòu)將完整的無線射頻識別立方體結(jié)構(gòu)的數(shù)據(jù)備份在中央數(shù)據(jù)服務(wù)器中;步驟7中央數(shù)據(jù)庫服務(wù)器數(shù)據(jù)備份將完整的無線射頻識別立方體結(jié)構(gòu)數(shù)據(jù)備份在中央數(shù)據(jù)服務(wù)器中;步驟8節(jié)點數(shù)據(jù)庫服務(wù)器靜態(tài)數(shù)據(jù)備份將無線射頻識別立方體結(jié)構(gòu)中的靜態(tài)信息傳輸?shù)礁鞴?jié)點數(shù)據(jù)庫服務(wù)器上進行存儲;步驟9計算目的服務(wù)器編號根據(jù)組標識序列通過組標識映射函數(shù)、目的函數(shù)計算出對應(yīng)的目的服務(wù)器編號;步驟10將動態(tài)信息傳送至目的服務(wù)器將步驟9中組標識序列所對應(yīng)的駐留信息數(shù)據(jù)傳輸?shù)侥康姆?wù)器中存儲;步驟11節(jié)點數(shù)據(jù)庫服務(wù)器動態(tài)數(shù)據(jù)備份將收到的駐留信息數(shù)據(jù)的每個路徑聚簇中按照其最長的gid數(shù)據(jù)排序建立索引;步驟12存儲結(jié)束。
2、 如權(quán)利要求1所述的無線射頻識別數(shù)據(jù)的分布式存儲方法,其特征在于所 述的組標識序列g(shù)id具體是指長度為n的序列,n為自然常數(shù),該序列每一位代表 一段移動路線。
3、 如權(quán)利要求1所述的無線射頻識別數(shù)據(jù)的分布式存儲方法,其特征在于所 述的組標識映射函數(shù)GMF具體如下<formula>formula see original document page 3</formula>,(式1)其中g(shù)id為組標識序列,n為自然常數(shù),表明該gid數(shù)據(jù)的長度。
4、 如權(quán)利要求1所述的無線射頻識別數(shù)據(jù)的分布式存儲方法,其特征在于所 述的目的函數(shù)DF具體如下<formula>formula see original document page 3</formula><formula>formula see original document page 3</formula> (式2)其中N為組標識映射函數(shù)值,S為節(jié)點數(shù)據(jù)庫服務(wù)器個數(shù)。
全文摘要
本發(fā)明公開了一種涉及無線射頻識別數(shù)據(jù)庫技術(shù)領(lǐng)域的無線射頻識別數(shù)據(jù)的分布式存儲方法,其特征在于本方法具體包括原始數(shù)據(jù)整理、排序和轉(zhuǎn)換;構(gòu)造樹型結(jié)構(gòu);合并相同信息;遍歷樹型結(jié)構(gòu);中央數(shù)據(jù)庫服務(wù)器數(shù)據(jù)備份;節(jié)點數(shù)據(jù)庫服務(wù)器靜態(tài)數(shù)據(jù)備份;計算目的服務(wù)器編號;將動態(tài)信息傳送至目的服務(wù)器;節(jié)點數(shù)據(jù)庫服務(wù)器動態(tài)數(shù)據(jù)備份。本發(fā)明優(yōu)點在于對逐漸增大的數(shù)據(jù)量的情況下仍然能夠保持快速可靠的處理,其查詢存儲所耗時間并不與數(shù)據(jù)量增大成正比,能夠在不改變硬件設(shè)備的情況下適應(yīng)大量增加的數(shù)據(jù)集上的工作;另外,在節(jié)點服務(wù)器增加的情況下,可并行執(zhí)行的存儲操作更多,可以實現(xiàn)更快的存儲,同時也不會增加系統(tǒng)的負擔,即具有可擴展性。
文檔編號G06F17/30GK101295299SQ200710039989
公開日2008年10月29日 申請日期2007年4月26日 優(yōu)先權(quán)日2007年4月26日
發(fā)明者霞 王 申請人:霞 王