本發(fā)明屬于環(huán)境監(jiān)測,具體是指基于機器學(xué)習(xí)的礦山環(huán)境監(jiān)測方法及系統(tǒng)。
背景技術(shù):
1、礦山環(huán)境監(jiān)測方法是利用機器學(xué)習(xí)算法對礦山環(huán)境中的各種數(shù)據(jù)進行分析和處理,實時評估礦山環(huán)境狀態(tài),為礦山的管理和決策提供科學(xué)依據(jù),幫助制定更合理的環(huán)境保護和治理措施,同時提高監(jiān)測的效率和準(zhǔn)確性,減少人力成本和誤差。但是現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在監(jiān)測設(shè)備差異和礦山環(huán)境類型分布不均,導(dǎo)致模型產(chǎn)生偏差,不能真實反映礦山環(huán)境實際情況的問題;現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在礦山環(huán)境數(shù)據(jù)具有高度的復(fù)雜性和多樣性,且不同區(qū)域的礦山環(huán)境狀況差異很大,導(dǎo)致對礦山環(huán)境狀況的誤判和無法有效監(jiān)測礦山環(huán)境的問題。
技術(shù)實現(xiàn)思路
1、針對上述情況,為克服現(xiàn)有技術(shù)的缺陷,本發(fā)明提供了基于機器學(xué)習(xí)的礦山環(huán)境監(jiān)測方法及系統(tǒng),針對現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在監(jiān)測設(shè)備差異和礦山環(huán)境類型分布不均,導(dǎo)致模型產(chǎn)生偏差,不能真實反映礦山環(huán)境實際情況的問題,本方案設(shè)計加權(quán)標(biāo)準(zhǔn)距離和指數(shù)衰減距離得到數(shù)據(jù)之間的總距離,根據(jù)總距離計算數(shù)據(jù)的最近鄰數(shù)據(jù),篩選出噪音數(shù)據(jù)并去除,提高了數(shù)據(jù)的準(zhǔn)確性和可靠性;引入離散度來構(gòu)建離散數(shù)據(jù)集,基于離散度和最近鄰數(shù)據(jù)確定需要合成的數(shù)據(jù)數(shù)量,基于離散數(shù)據(jù)集并引入隨機噪聲合成新數(shù)據(jù),在平衡數(shù)據(jù)的同時增加了數(shù)據(jù)的多樣性;構(gòu)建礦山環(huán)境平衡數(shù)據(jù)集,改善了數(shù)據(jù)類別不平衡狀況,提升了對礦山環(huán)境監(jiān)測的合理性;針對現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在礦山環(huán)境數(shù)據(jù)具有高度的復(fù)雜性和多樣性,且不同區(qū)域的礦山環(huán)境狀況差異很大,導(dǎo)致對礦山環(huán)境狀況的誤判和無法有效監(jiān)測礦山環(huán)境的問題,本方案根據(jù)總距離計算數(shù)據(jù)的最近鄰數(shù)據(jù),設(shè)計局部密度和全局密度得到數(shù)據(jù)的總密度,綜合考慮局部和全局特征,更全面細致地反映數(shù)據(jù)特征;基于數(shù)據(jù)的最小距離計算距離閾值,基于調(diào)節(jié)因子和總密度計算密度閾值,構(gòu)建候選中心數(shù)據(jù)集,避免遺漏重要的潛在中心;基于最近鄰數(shù)據(jù)計算重疊最近鄰數(shù)據(jù)集合,根據(jù)總密度和重疊數(shù)據(jù)數(shù)量得到聚類中心數(shù)據(jù)集,并將剩余數(shù)據(jù)分配到總距離最近的聚類中心所屬的簇中,進而提升整個評估模型的質(zhì)量,有利于準(zhǔn)確評估礦山環(huán)境狀態(tài),有助于更好地理解和分析礦山環(huán)境。
2、本發(fā)明采取的技術(shù)方案如下:本發(fā)明提供的基于機器學(xué)習(xí)的礦山環(huán)境監(jiān)測方法,該方法包括以下步驟:
3、步驟s1:數(shù)據(jù)采集;
4、步驟s2:數(shù)據(jù)預(yù)處理;
5、步驟s3:礦山環(huán)境數(shù)據(jù)平衡;
6、步驟s4:構(gòu)建礦山環(huán)境狀態(tài)評估模型;
7、步驟s5:礦山環(huán)境實時監(jiān)測。
8、進一步地,在步驟s1中,所述數(shù)據(jù)采集是采集歷史礦山環(huán)境數(shù)據(jù);所述歷史礦山環(huán)境數(shù)據(jù)包括空氣質(zhì)量數(shù)據(jù)、氣象數(shù)據(jù)、水質(zhì)數(shù)據(jù)、土壤數(shù)據(jù)、作業(yè)活動數(shù)據(jù)、生物數(shù)據(jù)、地質(zhì)數(shù)據(jù)和環(huán)境狀態(tài);所述空氣質(zhì)量數(shù)據(jù)包括氧氣濃度、二氧化碳濃度、揮發(fā)性有機化合物濃度、顆粒物濃度和有害氣體濃度;所述氣象數(shù)據(jù)包括溫度、濕度、氣壓、降水量、風(fēng)速和風(fēng)向;所述水質(zhì)數(shù)據(jù)包括水體ph值和水質(zhì)污染物;所述土壤數(shù)據(jù)包括土壤ph值、土壤濕度和重金屬含量;所述作業(yè)活動數(shù)據(jù)包括設(shè)備排放數(shù)據(jù)和開采量;所述生物數(shù)據(jù)包括生物多樣性和植被覆蓋率;所述地質(zhì)數(shù)據(jù)包括地質(zhì)結(jié)構(gòu)、地層穩(wěn)定性和地應(yīng)力;所述環(huán)境狀態(tài)包括優(yōu)秀、良好、一般、較差和惡劣,將環(huán)境狀態(tài)作為數(shù)據(jù)標(biāo)簽,數(shù)據(jù)標(biāo)簽在聚類時不予考慮,僅作為選取簇標(biāo)簽時使用。
9、進一步地,在步驟s2中,所述數(shù)據(jù)預(yù)處理是對采集的數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸一化和構(gòu)建數(shù)據(jù)集處理;數(shù)據(jù)清洗包括處理缺失值、異常值和重復(fù)值;數(shù)據(jù)轉(zhuǎn)換是將數(shù)據(jù)轉(zhuǎn)化為向量形式;數(shù)據(jù)歸一化是基于最大最小歸一化方法統(tǒng)一數(shù)據(jù)范圍;構(gòu)建數(shù)據(jù)集是基于處理后的數(shù)據(jù)構(gòu)建礦山環(huán)境數(shù)據(jù)集,并基于礦山環(huán)境數(shù)據(jù)集得到少數(shù)類數(shù)據(jù)集和多數(shù)類數(shù)據(jù)集。
10、進一步地,在步驟s3中,所述礦山環(huán)境數(shù)據(jù)平衡具體包括以下步驟:
11、步驟s31:去除噪音數(shù)據(jù),包括以下步驟:
12、步驟s311:計算數(shù)據(jù)之間的總距離,用歐氏距離的反比來作為權(quán)重,并結(jié)合均值和標(biāo)準(zhǔn)差設(shè)計加權(quán)標(biāo)準(zhǔn)距離,再引入衰減系數(shù)和指數(shù)函數(shù)設(shè)計指數(shù)衰減距離,將加權(quán)標(biāo)準(zhǔn)距離和指數(shù)衰減距離相結(jié)合得到礦山環(huán)境數(shù)據(jù)集中每兩個礦山環(huán)境數(shù)據(jù)之間的總距離,所用公式如下:
13、;
14、;
15、;
16、;
17、式中,是礦山環(huán)境數(shù)據(jù)xi和xj之間的權(quán)重,、和分別是礦山環(huán)境數(shù)據(jù)xi和xj之間的加權(quán)標(biāo)準(zhǔn)距離、指數(shù)衰減距離和總距離,xi和xj分別是第i個和第j個礦山環(huán)境數(shù)據(jù),i和j是礦山環(huán)境數(shù)據(jù)索引,ed(·)是歐幾里得函數(shù),是平滑項,β是(0,1)范圍內(nèi)的衰減系數(shù),d是礦山環(huán)境數(shù)據(jù)的特征維度,d是維度索引,xid和xjd分別是礦山環(huán)境數(shù)據(jù)xi和xj中第d個維度的特征,是l2范式的平方,μd和σd分別是礦山環(huán)境數(shù)據(jù)集中第d個維度的均值和標(biāo)準(zhǔn)差,e是自然常數(shù),α1和α2分別是(0,1)范圍內(nèi)的加權(quán)標(biāo)準(zhǔn)距離權(quán)值和指數(shù)衰減距離權(quán)值,且α1+α2=1;
18、步驟s312:噪聲數(shù)據(jù)篩選,根據(jù)總距離計算少數(shù)類數(shù)據(jù)集中每個數(shù)據(jù)在礦山環(huán)境數(shù)據(jù)集中的k1個最近鄰數(shù)據(jù),若少數(shù)類數(shù)據(jù)的k1個最近鄰數(shù)據(jù)都屬于多數(shù)類數(shù)據(jù),則將該少數(shù)類數(shù)據(jù)作為噪音數(shù)據(jù)從少數(shù)類數(shù)據(jù)集中去除;否則,該少數(shù)類數(shù)據(jù)保留;將篩選后的少數(shù)類數(shù)據(jù)集作為去噪數(shù)據(jù)集;
19、步驟s32:計算離散度,預(yù)先設(shè)置離散閾值,基于去噪數(shù)據(jù)集中離散度大于離散閾值的礦山環(huán)境數(shù)據(jù)構(gòu)建離散數(shù)據(jù)集,所用公式如下:
20、;
21、;
22、;
23、式中,和分別是第i個礦山環(huán)境數(shù)據(jù)的前a個和前a+1個最近鄰數(shù)據(jù)的中心,a是最近鄰數(shù)據(jù)索引,是第i個礦山環(huán)境數(shù)據(jù)的前a個最近鄰數(shù)據(jù)集合,c是中的數(shù)據(jù),和分別是第i個礦山環(huán)境數(shù)據(jù)的前a個和前a+1個最近鄰數(shù)據(jù)的中心偏移量,是第i個礦山環(huán)境數(shù)據(jù)的離散度;
24、步驟s33:計算合成數(shù)量,基于離散度和最近鄰數(shù)據(jù)確定去噪數(shù)據(jù)集中每個礦山環(huán)境數(shù)據(jù)需要合成的數(shù)據(jù)數(shù)量,所用公式如下:
25、;
26、;
27、式中,smajority和sminority分別是多數(shù)類數(shù)據(jù)集和少數(shù)類數(shù)據(jù)集中的數(shù)據(jù)數(shù)量,r是平衡比例,snew是總共需要合成的數(shù)據(jù)數(shù)量,f是中的數(shù)據(jù),是第i個礦山環(huán)境數(shù)據(jù)的k1個最近鄰數(shù)據(jù)集合,是第i個礦山環(huán)境數(shù)據(jù)和其最近鄰數(shù)據(jù)f之間的歐幾里得距離,edmax是第i個礦山環(huán)境數(shù)據(jù)和其最近鄰數(shù)據(jù)之間的最大歐幾里得距離,是向下取整函數(shù),是第i個礦山環(huán)境數(shù)據(jù)需要合成的數(shù)據(jù)數(shù)量;
28、步驟s34:合成新數(shù)據(jù),對于去噪數(shù)據(jù)集中每個礦山環(huán)境數(shù)據(jù),每次從離散數(shù)據(jù)集中隨機選擇一個數(shù)據(jù)作為參考數(shù)據(jù),并引入隨機噪聲進行數(shù)據(jù)合成,直至去噪數(shù)據(jù)集中每個礦山環(huán)境數(shù)據(jù)合成的新數(shù)據(jù)數(shù)量等于步驟s33計算的其需要合成的數(shù)據(jù)數(shù)量,所用公式如下:
29、;
30、式中,是第i個礦山環(huán)境數(shù)據(jù)合成的新數(shù)據(jù),是從均值為0和方差為σ2的正態(tài)分布中采樣的隨機噪聲,g是從離散數(shù)據(jù)集中隨機選擇的一個數(shù)據(jù),γ1和γ2分別是(0,1)范圍內(nèi)的控制插值系數(shù)和控制噪聲強度系數(shù);
31、步驟s35:構(gòu)建礦山環(huán)境平衡數(shù)據(jù)集,將步驟s34合成新數(shù)據(jù)、少數(shù)類數(shù)據(jù)集和多數(shù)類數(shù)據(jù)集匯總,得到礦山環(huán)境平衡數(shù)據(jù)集。
32、進一步地,在步驟s4中,所述構(gòu)建礦山環(huán)境狀態(tài)評估模型具體包括以下步驟:
33、步驟s41:計算每個數(shù)據(jù)的總密度,包括以下步驟:
34、步驟s411:計算礦山環(huán)境平衡數(shù)據(jù)集中每個數(shù)據(jù)的局部密度,根據(jù)總距離計算每個數(shù)據(jù)在礦山環(huán)境平衡數(shù)據(jù)集中的k2個最近鄰數(shù)據(jù),基于最近鄰數(shù)據(jù)計算礦山環(huán)境數(shù)據(jù)的局部密度,所用公式如下:
35、;
36、式中,是第i個礦山環(huán)境數(shù)據(jù)的局部密度,是第i個礦山環(huán)境數(shù)據(jù)的k2個最近鄰數(shù)據(jù)集合,n是中的數(shù)據(jù),是第i個礦山環(huán)境數(shù)據(jù)和其最近鄰數(shù)據(jù)n之間的總距離;
37、步驟s412:計算礦山環(huán)境平衡數(shù)據(jù)集中每個數(shù)據(jù)的全局密度,所用公式如下:
38、;
39、式中,是第i個礦山環(huán)境數(shù)據(jù)的全局密度,是第j個礦山環(huán)境數(shù)據(jù)的局部密度,n是礦山環(huán)境平衡數(shù)據(jù)集中的數(shù)據(jù)數(shù)量;
40、步驟s413:計算礦山環(huán)境平衡數(shù)據(jù)集中每個數(shù)據(jù)的總密度,所用公式如下:
41、;
42、式中,是第i個礦山環(huán)境數(shù)據(jù)的總密度;
43、步驟s42:計算最小距離,所用公式如下:
44、;
45、式中,是第i個礦山環(huán)境數(shù)據(jù)的最小距離,是第j個礦山環(huán)境數(shù)據(jù)的總密度;
46、步驟s43:確定聚類中心,包括以下步驟:
47、步驟s431:計算候選中心數(shù)據(jù)集,基于最小距離將礦山環(huán)境平衡數(shù)據(jù)集中的數(shù)據(jù)按從大到小的順序排序,選取前個礦山環(huán)境數(shù)據(jù)的最小距離計算距離閾值;預(yù)先設(shè)置調(diào)節(jié)因子,基于調(diào)節(jié)因子和礦山環(huán)境平衡數(shù)據(jù)集中所有數(shù)據(jù)的總密度計算密度閾值;選取礦山環(huán)境平衡數(shù)據(jù)集中其總密度和最小距離同時大于密度閾值和距離閾值的礦山環(huán)境數(shù)據(jù)作為候選中心,構(gòu)建候選中心數(shù)據(jù)集,所用公式如下:
48、;
49、;
50、式中,δthreshold和mthreshold分別是距離閾值和密度閾值,p是(0,1)范圍內(nèi)的調(diào)節(jié)因子;
51、步驟s432:計算重疊最近鄰數(shù)據(jù)集合,根據(jù)總距離計算每個數(shù)據(jù)在候選中心數(shù)據(jù)集中的k3個最近鄰數(shù)據(jù),然后構(gòu)建候選中心數(shù)據(jù)集中每兩個不同數(shù)據(jù)之間的重疊最近鄰數(shù)據(jù)集合,得到重疊數(shù)據(jù)數(shù)量;
52、步驟s433:計算聚類中心數(shù)據(jù)集,包括以下步驟:
53、步驟s4331:刪除,預(yù)先設(shè)置聚類中心數(shù)量,若候選中心數(shù)據(jù)集中的數(shù)據(jù)數(shù)量大于預(yù)先設(shè)置的聚類中心數(shù)量,則基于總密度將候選中心數(shù)據(jù)中的數(shù)據(jù)按從大到小的順序排序,按順序?qū)⒑蜻x中心數(shù)據(jù)集中重疊數(shù)據(jù)數(shù)量大于0的兩個不同數(shù)據(jù)隨機選取一個進行刪除,當(dāng)候選中心數(shù)據(jù)集中剩余數(shù)據(jù)數(shù)量等于預(yù)先設(shè)置的聚類中心數(shù)量時停止刪除,基于候選中心數(shù)據(jù)集中的剩余數(shù)據(jù)構(gòu)建聚類中心數(shù)據(jù)集,并轉(zhuǎn)至步驟s44進行聚類;
54、步驟s4332:迭代,若步驟s4331刪除后,候選中心數(shù)據(jù)集中剩余數(shù)據(jù)數(shù)量仍大于預(yù)先設(shè)置的聚類中心數(shù)量,則重新根據(jù)總距離計算剩余數(shù)據(jù)在當(dāng)前候選中心數(shù)據(jù)集中的k3個最近鄰數(shù)據(jù),并轉(zhuǎn)至步驟s4331再次進行刪除,直至候選中心數(shù)據(jù)集中剩余數(shù)據(jù)數(shù)量等于預(yù)先設(shè)置的聚類中心數(shù)量時停止迭代;
55、步驟s44:聚類,將礦山環(huán)境平衡數(shù)據(jù)集中除聚類中心外的剩余數(shù)據(jù)分配到總距離最近的聚類中心所屬的簇中,完成聚類,得到礦山環(huán)境狀態(tài)評估模型。
56、進一步地,在步驟s5中,所述礦山環(huán)境實時監(jiān)測是采集實時礦山環(huán)境數(shù)據(jù);所述實時礦山環(huán)境數(shù)據(jù)包括空氣質(zhì)量數(shù)據(jù)、氣象數(shù)據(jù)、水質(zhì)數(shù)據(jù)、土壤數(shù)據(jù)、作業(yè)活動數(shù)據(jù)、生物數(shù)據(jù)和地質(zhì)數(shù)據(jù);對實時礦山環(huán)境數(shù)據(jù)進行數(shù)據(jù)預(yù)處理后,將實時礦山環(huán)境數(shù)據(jù)和歷史礦山環(huán)境數(shù)據(jù)共同輸入至礦山環(huán)境狀態(tài)評估模型中進行聚類處理,基于輸出的聚類結(jié)果,選取簇中具有歷史礦山環(huán)境數(shù)據(jù)最多數(shù)量的標(biāo)簽類型作為簇標(biāo)簽,得到當(dāng)前礦山環(huán)境的狀態(tài),實現(xiàn)礦山環(huán)境的實時監(jiān)測。
57、本發(fā)明提供的基于機器學(xué)習(xí)的礦山環(huán)境監(jiān)測系統(tǒng),包括數(shù)據(jù)采集模塊、數(shù)據(jù)預(yù)處理模塊、礦山環(huán)境數(shù)據(jù)平衡模塊、構(gòu)建礦山環(huán)境狀態(tài)評估模型模塊和礦山環(huán)境實時監(jiān)測模塊;
58、所述數(shù)據(jù)采集模塊采集歷史礦山環(huán)境數(shù)據(jù),并將數(shù)據(jù)發(fā)送到數(shù)據(jù)預(yù)處理模塊;
59、所述數(shù)據(jù)預(yù)處理模塊對采集的數(shù)據(jù)進行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)歸一化和構(gòu)建數(shù)據(jù)集處理,并將數(shù)據(jù)發(fā)送至礦山環(huán)境數(shù)據(jù)平衡模塊;
60、所述礦山環(huán)境數(shù)據(jù)平衡模塊設(shè)計加權(quán)標(biāo)準(zhǔn)距離和指數(shù)衰減距離得到數(shù)據(jù)之間的總距離,根據(jù)總距離計算數(shù)據(jù)的最近鄰數(shù)據(jù),篩選出噪音數(shù)據(jù)并去除,引入離散度來構(gòu)建離散數(shù)據(jù)集,基于離散度和最近鄰數(shù)據(jù)確定需要合成的數(shù)據(jù)數(shù)量,基于離散數(shù)據(jù)集并引入隨機噪聲合成新數(shù)據(jù),構(gòu)建礦山環(huán)境平衡數(shù)據(jù)集,并將數(shù)據(jù)發(fā)送至構(gòu)建礦山環(huán)境狀態(tài)評估模型模塊;
61、所述構(gòu)建礦山環(huán)境狀態(tài)評估模型模塊根據(jù)總距離計算最近鄰數(shù)據(jù),設(shè)計局部密度和全局密度得到總密度,基于最小距離計算距離閾值,基于調(diào)節(jié)因子和總密度計算密度閾值,構(gòu)建候選中心數(shù)據(jù)集,計算重疊最近鄰數(shù)據(jù)集合,根據(jù)總密度和重疊數(shù)據(jù)數(shù)量得到聚類中心數(shù)據(jù)集,并將剩余數(shù)據(jù)分配到總距離最近的聚類中心所屬的簇中,完成聚類,得到礦山環(huán)境狀態(tài)評估模型,并將數(shù)據(jù)發(fā)送到礦山環(huán)境實時監(jiān)測模塊;
62、所述礦山環(huán)境實時監(jiān)測模塊將采集的礦山環(huán)境數(shù)據(jù)輸入至礦山環(huán)境狀態(tài)評估模型中進行聚類處理,基于輸出的聚類結(jié)果,得到當(dāng)前礦山環(huán)境的狀態(tài),實現(xiàn)礦山環(huán)境的實時監(jiān)測。
63、采用上述方案本發(fā)明取得的有益效果如下:
64、(1)針對現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在監(jiān)測設(shè)備差異和礦山環(huán)境類型分布不均,導(dǎo)致模型產(chǎn)生偏差,不能真實反映礦山環(huán)境實際情況的問題,本方案設(shè)計加權(quán)標(biāo)準(zhǔn)距離和指數(shù)衰減距離得到數(shù)據(jù)之間的總距離,根據(jù)總距離計算數(shù)據(jù)的最近鄰數(shù)據(jù),篩選出噪音數(shù)據(jù)并去除,提高了數(shù)據(jù)的準(zhǔn)確性和可靠性,減少噪音對監(jiān)測和分析的干擾;引入離散度來構(gòu)建離散數(shù)據(jù)集,基于離散度和最近鄰數(shù)據(jù)確定需要合成的數(shù)據(jù)數(shù)量,基于離散數(shù)據(jù)集并引入隨機噪聲合成新數(shù)據(jù),在平衡數(shù)據(jù)的同時增加了數(shù)據(jù)的多樣性,有利于更全面和準(zhǔn)確地監(jiān)測礦山環(huán)境;構(gòu)建礦山環(huán)境平衡數(shù)據(jù)集,改善了數(shù)據(jù)類別不平衡狀況,使模型訓(xùn)練和評估更有效,提升了對礦山環(huán)境監(jiān)測的科學(xué)性和合理性,為決策提供更好依據(jù)。
65、(2)針對現(xiàn)有的礦山環(huán)境監(jiān)測方法中存在礦山環(huán)境數(shù)據(jù)具有高度的復(fù)雜性和多樣性,且不同區(qū)域的礦山環(huán)境狀況差異很大,導(dǎo)致對礦山環(huán)境狀況的誤判和無法有效監(jiān)測礦山環(huán)境的問題,本方案根據(jù)總距離計算數(shù)據(jù)的最近鄰數(shù)據(jù),設(shè)計局部密度和全局密度得到數(shù)據(jù)的總密度,綜合考慮局部和全局特征,更全面細致地反映數(shù)據(jù)特征,識別不同的環(huán)境區(qū)域和特征;基于數(shù)據(jù)的最小距離計算距離閾值,基于調(diào)節(jié)因子和總密度計算密度閾值,構(gòu)建候選中心數(shù)據(jù)集,避免遺漏重要的潛在中心,從而使聚類結(jié)果更加準(zhǔn)確和具有代表性;基于最近鄰數(shù)據(jù)計算重疊最近鄰數(shù)據(jù)集合,根據(jù)總密度和重疊數(shù)據(jù)數(shù)量得到聚類中心數(shù)據(jù)集,并將剩余數(shù)據(jù)分配到總距離最近的聚類中心所屬的簇中,完成聚類,得到礦山環(huán)境狀態(tài)評估模型,使聚類中心更具合理性和準(zhǔn)確性,進而提升整個評估模型的質(zhì)量,有利于準(zhǔn)確評估礦山環(huán)境狀態(tài),有助于更好地理解和分析礦山環(huán)境。