本發(fā)明涉及定位技術(shù)領(lǐng)域,尤其涉及一種指紋聚類方法及裝置。
背景技術(shù):
隨著移動互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,基于位置的服務(wù)需求隨之越來越廣泛,滲透于軍事、商業(yè)、生活等各個方面。目前,對于定位,人們最常使用的是全球定位系統(tǒng)(globalpositioningsystem,gps),其通過多顆衛(wèi)星與用戶的gps接收機(jī)之間的信號時間差給用戶定位,定位范圍可覆蓋全球,但衛(wèi)星信號容易受到各種障礙物遮擋,即定位技術(shù)并不適用于室內(nèi)或高樓林立的場合,需采用其他的技術(shù)手段進(jìn)行室內(nèi)定位。
基于wifi(wirelessfidelity,無線保真)指紋庫的室內(nèi)定位技術(shù)在近幾年得到了廣泛的關(guān)注,該技術(shù)主要通過在多個經(jīng)過事先劃分且具有位置信息的區(qū)域中收集多個無線網(wǎng)絡(luò)接入點(diǎn)(accesspoint,ap)的接收信號強(qiáng)度(receivedsignalstrength,rss)值,建立一個包含每個位置點(diǎn)與該位置點(diǎn)收集到的rss值對應(yīng)關(guān)系的室內(nèi)定位指紋庫,以此,在對移動設(shè)備進(jìn)行定位時,可以通過在指紋庫中尋找與當(dāng)前移動設(shè)備收集到的rss值相匹配的位置點(diǎn),實(shí)現(xiàn)定位。
目前對于基于wifi的室內(nèi)定位系統(tǒng)的研究,主要集中在wifi指紋庫的建立和實(shí)施定位兩個方面。其中,wifi指紋庫即所有采集到的wifi指紋的集合,雖然指紋庫都是基于采樣獲得的指紋,但是不同的處理方式會獲得不同類型的指紋庫,實(shí)現(xiàn)的定位效果不同,其決定著wifi指紋定位系統(tǒng)在實(shí)施過程中的定位效果,所以wifi指紋庫的準(zhǔn)確與可靠是非常重要的。針對wifi指紋庫中指紋數(shù)量較少、較為分散等技術(shù)問題,雖然可以采用建立連續(xù)模型的方式加以解決,但是在連續(xù)模型中,通常是一個位置坐標(biāo)對應(yīng)一個信號強(qiáng)度值,指紋的數(shù)量過于龐大,無疑會給實(shí)時定位階段指紋庫的檢索帶來較大的負(fù)擔(dān),影響實(shí)時定位的效率。
技術(shù)實(shí)現(xiàn)要素:
針對上述問題,本發(fā)明提供了一種基于wifi室內(nèi)定位的指紋聚類方法及裝置,有效解決現(xiàn)有技術(shù)中,針對采集的wifi指紋建立連續(xù)模型后,定位階段檢索負(fù)擔(dān)過大的技術(shù)問題。
本發(fā)明提供的技術(shù)方案如下:
一種基于wifi室內(nèi)定位的指紋聚類方法,包括:
s1在目標(biāo)區(qū)域中針對選定的無線接入點(diǎn)隨機(jī)采樣多個采樣點(diǎn);
s2根據(jù)采樣點(diǎn)的高斯過程建立各點(diǎn)的rss分布模型;
s3在所述rss分布模型中選定多個樣本點(diǎn),并將選定的樣本點(diǎn)作為中心點(diǎn);
s4計算rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的歐氏距離,進(jìn)而將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇;
s5重新計算每個簇的中心點(diǎn),并判斷同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值,若是,跳轉(zhuǎn)至步驟s6,否則,跳轉(zhuǎn)至步驟s4;
s6完成針對該無線接入點(diǎn)的rss分布模型的指紋聚類。
進(jìn)一步優(yōu)選地,在步驟s4中,rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的平方歐式距離v為:
其中,ui表示第i個中心點(diǎn),si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo);
和/或,在步驟s5中,重新計算每個簇的中心點(diǎn)為:
其中,mi表示第i個簇中包括的樣本點(diǎn)的數(shù)量,si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
進(jìn)一步優(yōu)選地,在步驟s2中具體包括:
s21根據(jù)采樣點(diǎn)之間的相關(guān)度得到各點(diǎn)信號強(qiáng)度值之間的相關(guān)度;
s22根據(jù)各點(diǎn)信號強(qiáng)度值之間的相關(guān)度得到rss分布模型;
s23根據(jù)rss分布模型得到目標(biāo)區(qū)域中任意一點(diǎn)對應(yīng)的信號強(qiáng)度值,完成該無線接入點(diǎn)在目標(biāo)區(qū)域中指紋庫的建立。
進(jìn)一步優(yōu)選地,在步驟s21中:
采樣點(diǎn)之間的相關(guān)度k(xi,yj)為:
各點(diǎn)信號強(qiáng)度值之間的相關(guān)度cov(xi,yj)為:
其中,
在步驟s22中:
根據(jù)步驟s21中得到的信號強(qiáng)度值之間的相關(guān)度,對于采樣點(diǎn)矩陣x得到各點(diǎn)信號強(qiáng)度矩陣y的相關(guān)度cov(y):
其中,k表示根據(jù)采樣點(diǎn)矩陣x求得的n×b的協(xié)方差矩陣k[i,j]=k(xi,yj);
得到rss分布模型:
進(jìn)一步優(yōu)選地,在步驟s23中,目標(biāo)區(qū)域中任意一點(diǎn)x*的信號強(qiáng)度值y*為:
其中,
本發(fā)明還提供了一種基于wifi室內(nèi)定位的指紋聚類裝置,包括:
信息接收模塊,用于接收針對選定的無線接入點(diǎn)采樣的多個采樣點(diǎn);
模型建立模塊,用于根據(jù)信息接收模塊接收到的采樣點(diǎn)的高斯過程建立各點(diǎn)的rss分布模型;
樣本點(diǎn)選擇模塊,用于從模型建立模塊建立的rss分布模型中選定多個樣本點(diǎn),并將選定的樣本點(diǎn)作為中心點(diǎn);
計算模塊,用于計算rss分布模型中剩余樣本點(diǎn)與樣本點(diǎn)選擇模塊選定的中心點(diǎn)之間的歐氏距離,及用于根據(jù)歸類模塊的歸類結(jié)果重新計算每個簇的中心點(diǎn);
歸類模塊,用于根據(jù)計算模塊的計算結(jié)果將剩余樣本點(diǎn)歸類至距離自己最近的中心點(diǎn)的簇;
判斷模塊,用于判斷同一簇中計算模塊計算得到的中心點(diǎn)與樣本點(diǎn)選擇模塊選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值。
進(jìn)一步優(yōu)選地,在計算模塊中:
rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的平方歐式距離為:
其中,ui表示第i個中心點(diǎn),si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo);
和/或,根據(jù)歸類模塊的歸類結(jié)果重新計算每個簇的中心點(diǎn)為:
其中,mi表示第i個簇中包括的樣本點(diǎn)的數(shù)量,si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
進(jìn)一步優(yōu)選地,計算模塊還用于根據(jù)信息接收模塊接收的采樣點(diǎn)之間的相關(guān)度得到各點(diǎn)信號強(qiáng)度值之間的相關(guān)度,用于根據(jù)模型建立模塊建立的rss分布模型計算得到目標(biāo)區(qū)域中任意一點(diǎn)對應(yīng)的信號強(qiáng)度值;
模型建立模塊用于根據(jù)各點(diǎn)信號強(qiáng)度值之間的相關(guān)度得到rss分布模型。
進(jìn)一步優(yōu)選地,在計算模塊中:
采樣點(diǎn)之間的相關(guān)度k(xi,yj)為:
各點(diǎn)信號強(qiáng)度值之間的相關(guān)度cov(xi,yj)為:
其中,
在模型建立模塊中:
根據(jù)計算模塊計算得到的信號強(qiáng)度值之間的相關(guān)度,對于采樣點(diǎn)矩陣x得到各點(diǎn)信號強(qiáng)度矩陣y的相關(guān)度cov(y):
其中,k表示根據(jù)采樣點(diǎn)矩陣x求得的n×b的協(xié)方差矩陣k[i,j]=k(xi,yj);
進(jìn)而得到rss分布模型:
進(jìn)一步優(yōu)選地,在計算模塊中:
根據(jù)模型建立模塊建立的rss分布模型,根據(jù)以下公式計算目標(biāo)區(qū)域中任意一點(diǎn)x*的信號強(qiáng)度值y*:
其中,
在本發(fā)明中,對室內(nèi)各個無線接入點(diǎn)進(jìn)行隨機(jī)采樣,獲取有限數(shù)量的wifi指紋,并根據(jù)采樣點(diǎn)的高斯過程建立各點(diǎn)的rss分布模型,計算出目標(biāo)區(qū)域中各點(diǎn)的信號強(qiáng)度值;隨后采用聚類算法對建立的rss分布模型中的樣本點(diǎn)進(jìn)行分類,生成基于概率模型算法所需的指紋庫。
其根據(jù)離散的wifi指紋分布得到連續(xù)的全平面的wifi指紋分布,尤其是對于隨機(jī)采樣過程中未涉及的區(qū)域,同樣能夠通過該方法進(jìn)行覆蓋;另外,對于wifi指紋采集初期,在指紋采集數(shù)量較少的情況,也能夠根據(jù)該方法建立信號強(qiáng)度模型,得到目標(biāo)區(qū)域中任意位置對應(yīng)的信號強(qiáng)度值(指紋值),將wifi指紋由一維采樣路徑擴(kuò)展到目標(biāo)區(qū)域的二維全平面覆蓋,提供更多的wifi指紋數(shù)量幫助定位,并采用聚類算法對wifi指紋進(jìn)行歸類,大大提升室內(nèi)wifi定位的精度的同時,降低了實(shí)時定位階段的指紋庫檢索負(fù)擔(dān)。
附圖說明
下面將以明確易懂的方式,結(jié)合附圖說明優(yōu)選實(shí)施方式,對上述特性、技術(shù)特征、優(yōu)點(diǎn)及其實(shí)現(xiàn)方式予以進(jìn)一步說明。
圖1為本發(fā)明中基于wifi室內(nèi)定位的指紋聚類方法一種實(shí)施方式流程示意圖;
圖2為本發(fā)明中基于wifi室內(nèi)定位的指紋聚類方法另一種實(shí)施方式流程示意圖;
圖3為本發(fā)明一實(shí)例中針對某一無線接入點(diǎn)的采樣點(diǎn)分布;
圖4為本發(fā)明根據(jù)如圖3所示的采樣點(diǎn)建立的rss分布模型;
圖5為本發(fā)明一實(shí)例中采用指紋聚類算法得到的指紋庫;
圖6為本發(fā)明中基于wifi室內(nèi)定位的指紋聚類裝置示意圖;
附圖標(biāo)記:
100-指紋聚類裝置,110-信息接收模塊,120-模型建立模塊,130-樣本點(diǎn)選擇模塊,140-計算模塊,150-歸類模塊,160-判斷模塊。
具體實(shí)施方式
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對照附圖說明本發(fā)明的具體實(shí)施方式。顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖,并獲得其他的實(shí)施方式。
氣壓圖被廣泛應(yīng)用于氣象研究中,其通過建立氣壓圖就可以得到任意目標(biāo)位置的氣壓值,我們知道,在緯度高的地方相應(yīng)地氣壓值也更高,距離無線接入點(diǎn)的距離越近rss值也越大;溫度與濕度變化,以及氣流運(yùn)動等因素會造成氣壓的波動,室內(nèi)場景下的多徑效應(yīng)、非視距傳播等因素同樣會導(dǎo)致不遵從傳播模型的信號波動現(xiàn)象??芍愃朴跉鈮褐档倪B續(xù)變化,rss值在室內(nèi)也是連續(xù)變化的,即當(dāng)目標(biāo)區(qū)域某位置的rss值發(fā)生突變,其附近位置的rss值也會呈現(xiàn)相同趨勢的變化。
以此,若針對目前wifi室內(nèi)定位存在的wifi指紋分離、數(shù)量較少等問題,在目標(biāo)區(qū)域中能夠得到類似“氣壓圖”的rss分布模型,就可以獲取目標(biāo)區(qū)域任意位置的近似rss向量,雖然采用這種方法能夠解決目前wifi室內(nèi)定位中指紋采樣數(shù)量過少問題,但是rss分布模型是一種連續(xù)模型,如果目標(biāo)區(qū)域范圍很大,相應(yīng)地指紋數(shù)量也會很大,無疑會給實(shí)時定位過程中指紋庫檢索帶來負(fù)擔(dān)。
基于此,本發(fā)明中提供了一種基于wifi室內(nèi)定位的指紋聚類方法,假定室內(nèi)包括多個無線接入點(diǎn),在該指紋庫建立方法中逐一針對各個無線接入點(diǎn)采集wifi指紋,并針對采集到的wifi指紋根據(jù)高斯過程得到rss分布模型,完成指紋庫的建;之后,分別采用聚類算法對各無線接入點(diǎn)對應(yīng)的rss分布模型進(jìn)行聚類。
如圖1所示為該指紋聚類方法一種實(shí)施方式流程示意圖,從圖中可以看出,在該指紋聚類方法中包括:s1在目標(biāo)區(qū)域中針對選定的無線接入點(diǎn)隨機(jī)采樣多個采樣點(diǎn);s2根據(jù)采樣點(diǎn)的高斯過程建立各點(diǎn)的信號強(qiáng)度分布模型;s3在信號強(qiáng)度分布模型中選定多個樣本點(diǎn),并將選定的樣本點(diǎn)作為中心點(diǎn);s4計算rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的歐氏距離,進(jìn)而將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇;s5重新計算每個簇的中心點(diǎn),并判斷同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值,若是,跳轉(zhuǎn)至步驟s6,否則,跳轉(zhuǎn)至步驟s4;s6完成針對該無線接入點(diǎn)的信號強(qiáng)度分布模型的指紋聚類。
對上述實(shí)施方式進(jìn)行改進(jìn)得到本實(shí)施方式,如圖2所示,在本實(shí)施方式中,該指紋庫建立方法中包括:s1在目標(biāo)區(qū)域中針對選定的無線接入點(diǎn)隨機(jī)采樣多個采樣點(diǎn);s21根據(jù)采樣點(diǎn)之間的相關(guān)度得到各點(diǎn)信號強(qiáng)度值之間的相關(guān)度;s22根據(jù)各點(diǎn)信號強(qiáng)度值之間的相關(guān)度得到信號強(qiáng)度分布模型;s23根據(jù)信號強(qiáng)度分布模型得到目標(biāo)區(qū)域中任意一點(diǎn)對應(yīng)的信號強(qiáng)度值,完成該無線接入點(diǎn)在目標(biāo)區(qū)域中指紋庫的建立;s3在信號強(qiáng)度分布模型中選定多個樣本點(diǎn),并將選定的樣本點(diǎn)作為中心點(diǎn);s4計算rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的歐氏距離,進(jìn)而將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇;s5重新計算每個簇的中心點(diǎn),并判斷同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值,若是,跳轉(zhuǎn)至步驟s6,否則,跳轉(zhuǎn)至步驟s4;s6完成針對該無線接入點(diǎn)的信號強(qiáng)度分布模型的指紋聚類。
假設(shè)高斯過程有一組包含噪聲的訓(xùn)練樣本:
d={(x1,y1),(x2,y2),...,(xn,yn)}
則:
yi=f(xi)+ε
其中,xi表示d維空間
基于此,在上述實(shí)施方式中,將n個輸入自標(biāo)量x用n×d的矩陣x來表示,n個觀察值用n×1的矩陣y表示。具體,在rss分布模型中,x表示目標(biāo)區(qū)域的n個采樣點(diǎn)位置坐標(biāo),y表示選定的無線接入點(diǎn)在這些采樣點(diǎn)對應(yīng)的信號強(qiáng)度值(rss值)。
高斯過程通過函數(shù)f和訓(xùn)練樣本d來估算后驗(yàn)分布,其核心在于不同觀察值之間是相關(guān)的,即f(xi)與f(yi)的協(xié)方差取決于xi與yi的協(xié)方差??紤]到高斯噪聲,采樣點(diǎn)之間的協(xié)方差函數(shù)k(xi,yj)具體為:
各點(diǎn)信號強(qiáng)度值之間的相關(guān)度cov(xi,yj)為:
其中,
以此,對于輸入位置坐標(biāo)樣本矩陣x(采樣點(diǎn)矩陣),得到各位置坐標(biāo)點(diǎn)信號強(qiáng)度矩陣y的相關(guān)度cov(y)為:
其中,k表示根據(jù)采樣點(diǎn)矩陣x求得的n×b的協(xié)方差矩陣k[i,j]=k(xi,yj)??梢园l(fā)現(xiàn)信號強(qiáng)度值為高斯分布:
從上式中可以看出,每當(dāng)有一組采樣點(diǎn)矩陣x輸入,就可以利用協(xié)方差矩陣k描述采樣點(diǎn)作為坐標(biāo)與信號強(qiáng)度值之間的相關(guān)度,以此,針對選定的無線接入點(diǎn),目標(biāo)區(qū)域中任意一點(diǎn)x*的信號強(qiáng)度值y*為:
其中,
在一個實(shí)例中,如圖3所示為目標(biāo)區(qū)域中某一無線ap的原始采樣點(diǎn),基于上述描述的指紋庫建立方法建立的rss分布模型如圖4所示,具體,在圖3和圖4中,橫縱坐標(biāo)x/y表示采樣點(diǎn)的坐標(biāo)位置(二維坐標(biāo)),z軸表示采樣點(diǎn)對應(yīng)的信號強(qiáng)度值。
由于rss分布模型是一種連續(xù)模型,為了減輕時定位過程中指紋庫檢索的負(fù)擔(dān),在上述實(shí)施方式中,進(jìn)一步采用聚類方法對其中包括的樣本點(diǎn)進(jìn)行聚類。我們知道,聚類(clustering)是指制定一個標(biāo)準(zhǔn),作為某個對象集合進(jìn)行分類的根據(jù),得到的這些類被稱為簇(cluster)。在制定的標(biāo)準(zhǔn)下,同一簇內(nèi)的對象是相似的,不同簇中的對象有一定的差異性。也就是說,聚類是用來將具有某個共同點(diǎn)的對象聚為一類,與差異性較大的對象盡量分離。聚類分析是一種統(tǒng)計分析方法,應(yīng)用于模式識別、市場劃分、生物行為分析、數(shù)據(jù)空間分布等眾多領(lǐng)域。
在聚類分析中,為了描述目標(biāo)之間的接近程度,或者是目標(biāo)之間的相異度,需要定義一些聚類統(tǒng)計量作為聚類分析的量化指標(biāo),歐式距離即是經(jīng)常被用來表示相異度的一種指標(biāo)。具體,對于空間中的兩個p維向量xi=(xi1,xi2,...,xip)t和xj=(xj1,xj2,...,xjp)t,則兩個向量之間的歐式距離可以表示為:
基于此,在上述實(shí)施方式中,將上述xi和yi替換為采樣的二維坐標(biāo),利用k-means聚類算法根據(jù)樣本點(diǎn)的位置坐標(biāo)進(jìn)行分類即可完成對信號強(qiáng)度分布模型中樣本點(diǎn)的聚類,具體:
首先在目標(biāo)區(qū)域某一無線接入點(diǎn)的rss分布模型中n個樣本點(diǎn)中選定k(k<n)個作為中心點(diǎn);對于rss分布模型中剩余樣本點(diǎn),測量其到每個中心點(diǎn)的歐氏距離,進(jìn)而將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇。具體,在rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的平方歐式距離v為:
其中,ui表示第i個中心點(diǎn),si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
歸類完成之后,根據(jù)下式重新計算每個簇的中心點(diǎn)ui:
其中,mi表示第i個簇中包括的樣本點(diǎn)的數(shù)量,si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
之后根據(jù)計算得到的中心點(diǎn)判斷同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值,若是,完成針對該無線接入點(diǎn)的rss分布模型的指紋聚類;否則,重新測量rss分布模型中剩余樣本點(diǎn)到新的中心點(diǎn)的歐氏距離,將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)(計算得到的中心點(diǎn))的簇,并重新計算各簇的中心點(diǎn),直到同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離小于預(yù)設(shè)閾值uthres,即
以此通過k-means算法將rss分布模型中的樣本點(diǎn)歸類為k個簇,針對每個簇,將這個簇中所有的樣本點(diǎn)坐標(biāo)統(tǒng)一為一個相同的坐標(biāo),該坐標(biāo)具體為該簇的中心點(diǎn)的坐標(biāo)。也就是說,經(jīng)過聚類之后,每個簇只對應(yīng)著一個位置坐標(biāo)(簇的中心坐標(biāo)),且該位置坐標(biāo)對應(yīng)該簇中所有樣本點(diǎn)對應(yīng)的rss向量集合。
聚類完成之后,得到基于概率模型算法實(shí)時定位的指紋庫,在一個實(shí)例中,假若基于上述聚類算法得到指紋庫如圖5所示,其中,包括位置信息1和位置信息2,對于位置信息1來說,mac1(對應(yīng)一個無線接入點(diǎn))中對應(yīng)rss均值1為-90dbm(分貝毫x)的概率為概率11、rss均值1為-89dbm的概率為概率12、rss均值1為-88dbm的概率為概率13;mac2中對應(yīng)rss均值2為-90dbm的概率為概率21、rss均值2為-89dbm的概率為概率22、rss均值2為-88dbm的概率為概率23;mac3中對應(yīng)rss均值3為-90dbm的概率為概率31、rss均值3為-89dbm的概率為概率32、rss均值3為-88dbm的概率為概率33,以此類推,在實(shí)時定位階段基于該概率模型進(jìn)行定位。
如圖6所示為本發(fā)明提供的基于wifi室內(nèi)定位的指紋聚類裝置示意圖,從圖中可以看出,在該指紋聚類裝置100中包括:信息接收模塊110、模型建立模塊120、樣本點(diǎn)選擇模塊130、計算模塊140、歸類模塊150以及判斷模塊160,其中,模型建立模塊120與信息接收模塊110連接,樣本點(diǎn)選擇模塊130與模型建立模塊120連接,計算模塊140分別與樣本點(diǎn)選擇模塊130、模型建立模塊120以及歸類模塊150連接,判斷模塊160分別與樣本點(diǎn)選擇模塊130和計算模塊140連接。
在工作過程中,選定了一未建立指紋庫的無線接入點(diǎn)之后,在目標(biāo)區(qū)域針對選定的無線接入點(diǎn)隨機(jī)采樣多個采樣點(diǎn),并將各采樣點(diǎn)發(fā)送至指紋聚類裝置100中。指紋聚類裝置100中的信息接收模塊110在接收到各采樣點(diǎn)之后,模型建立模塊120根據(jù)采樣點(diǎn)的高斯過程建立各點(diǎn)的rss分布模型;之后,樣本點(diǎn)選擇模塊130在rss分布模型中選定多個樣本點(diǎn),并將選定的樣本點(diǎn)作為中心點(diǎn);之后,計算模塊140計算rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的歐氏距離,進(jìn)而歸類模塊150將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇;之后,計算模塊140重新計算每個簇的中心點(diǎn),并通過,若是,則完成針對該無線接入點(diǎn)的rss分布模型的指紋聚類否則,計算模塊140重新計算rss分布模型中剩余樣本點(diǎn)與新的中心點(diǎn)之間的歐氏距離,通過歸類模塊150進(jìn)行重新歸類,之后再次重新計算新的簇的中心點(diǎn),直到判斷模塊160判斷同一簇中計算得到的中心點(diǎn)與前一次計算得到的中心點(diǎn)之間的距離小于預(yù)設(shè)閾值。
更進(jìn)一步來說,上述計算模塊140還用于根據(jù)信息接收模塊110接收的采樣點(diǎn)之間的相關(guān)度得到各點(diǎn)信號強(qiáng)度值之間的相關(guān)度、根據(jù)模型建立模塊120建立的信號強(qiáng)度分布模型計算得到目標(biāo)區(qū)域中任意一點(diǎn)對應(yīng)的信號強(qiáng)度值;模型建立模塊120根據(jù)各點(diǎn)信號強(qiáng)度值之間的相關(guān)度得到信號強(qiáng)度分布模型。
假設(shè)高斯過程有一組包含噪聲的訓(xùn)練樣本:
d={(x1,y1),(x2,y2),...,(xn,yn)}
則:
yi=f(xi)+ε
其中,xi表示d維空間
基于此,在本實(shí)施方式中,將n個輸入自標(biāo)量x用n×d的矩陣x來表示,n個觀察值用n×1的矩陣y表示。具體,在rss分布模型中,x表示目標(biāo)區(qū)域的n個采樣點(diǎn)位置坐標(biāo),y表示選定的無線接入點(diǎn)在這些采樣點(diǎn)對應(yīng)的信號強(qiáng)度值(rss值)。
高斯過程通過函數(shù)f和訓(xùn)練樣本d來估算后驗(yàn)分布,其核心在于不同觀察值之間是相關(guān)的,即f(xi)與f(yi)的協(xié)方差取決于xi與yi的協(xié)方差??紤]到高斯噪聲,采樣點(diǎn)之間的協(xié)方差函數(shù)k(xi,yj)具體為:
各點(diǎn)信號強(qiáng)度值之間的相關(guān)度cov(xi,yj)為:
其中,
以此,對于輸入位置坐標(biāo)樣本矩陣x(采樣點(diǎn)矩陣),得到各位置坐標(biāo)點(diǎn)信號強(qiáng)度矩陣y的相關(guān)度cov(y)為:
其中,k表示根據(jù)采樣點(diǎn)矩陣x求得的n×b的協(xié)方差矩陣k[i,j]=k(xi,yj)??梢园l(fā)現(xiàn)信號強(qiáng)度值為高斯分布:
從上式中可以看出,每當(dāng)有一組采樣點(diǎn)矩陣x輸入,就可以利用協(xié)方差矩陣k描述采樣點(diǎn)作為坐標(biāo)與信號強(qiáng)度值之間的相關(guān)度,以此,針對選定的無線接入點(diǎn),目標(biāo)區(qū)域中任意一點(diǎn)x*的信號強(qiáng)度值y*為:
其中,
由于rss分布模型是一種連續(xù)模型,為了減輕時定位過程中指紋庫檢索的負(fù)擔(dān),在本實(shí)施方式中,進(jìn)一步采用聚類方法對其中包括的樣本點(diǎn)進(jìn)行聚類,并采用歐式距離作為衡量指標(biāo)。具體,對于空間中的兩個p維向量xi=(xi1,xi2,...,xip)t和xj=(xj1,xj2,...,xjp)t,則兩個向量之間的歐式距離可以表示為:
基于此,在本實(shí)施方式中,將上述xi和yi替換為采樣的二維坐標(biāo),利用k-means聚類算法根據(jù)樣本點(diǎn)的位置坐標(biāo)進(jìn)行分類即可完成對信號強(qiáng)度分布模型中樣本點(diǎn)的聚類,具體:
首先在目標(biāo)區(qū)域某一無線接入點(diǎn)的rss分布模型中n個樣本點(diǎn)中選定k(k<n)個作為中心點(diǎn);對于rss分布模型中剩余樣本點(diǎn),測量其到每個中心點(diǎn)的歐氏距離,進(jìn)而將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)的簇。具體,在rss分布模型中剩余樣本點(diǎn)與各中心點(diǎn)之間的平方歐式距離v為:
其中,ui表示第i個中心點(diǎn),si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
歸類完成之后,根據(jù)下式重新計算每個簇的中心點(diǎn)ui:
其中,mi表示第i個簇中包括的樣本點(diǎn)的數(shù)量,si表示rss分布模型中剩余樣本點(diǎn)的集合,xj表示rss分布模型中剩余樣本點(diǎn)的坐標(biāo)。
之后根據(jù)計算得到的中心點(diǎn)判斷同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離是否小于預(yù)設(shè)閾值,若是,完成針對該無線接入點(diǎn)的rss分布模型的指紋聚類;否則,重新測量rss分布模型中剩余樣本點(diǎn)到新的中心點(diǎn)的歐氏距離,將剩余樣本點(diǎn)分別歸類至距離自己最近的中心點(diǎn)(計算得到的中心點(diǎn))的簇,并重新計算各簇的中心點(diǎn),直到同一簇中計算得到的中心點(diǎn)與選定的中心點(diǎn)之間的距離小于預(yù)設(shè)閾值uthres,即
以此通過k-means算法將rss分布模型中的樣本點(diǎn)歸類為k個簇,針對每個簇,將這個簇中所有的樣本點(diǎn)坐標(biāo)統(tǒng)一為一個相同的坐標(biāo),該坐標(biāo)具體為該簇中心點(diǎn)的坐標(biāo)。也就是說,經(jīng)過聚類之后,每個簇只對應(yīng)著一個位置坐標(biāo)(簇的中心坐標(biāo)),且該位置坐標(biāo)對應(yīng)該簇中所有樣本點(diǎn)對應(yīng)的rss向量集合,聚類完成之后,得到基于概率模型算法實(shí)時定位的指紋庫。
應(yīng)當(dāng)說明的是,上述實(shí)施例均可根據(jù)需要自由組合。以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。