或典型相關(guān)系數(shù)、 或特征值等的大小,衡量判別方法的相對(duì)優(yōu)劣。
[0029] 步驟1)中實(shí)地采集國(guó)內(nèi)外N個(gè)已知產(chǎn)地(N為產(chǎn)地?cái)?shù),為正整數(shù),范圍2-50個(gè)產(chǎn) 地)的軟玉樣品,W保證樣品的可靠來(lái)源。每個(gè)產(chǎn)地均選取一定數(shù)量的代表性樣品,制成兩 面平行、良好拋光的樣片。
[0030] 步驟2)中所稱的微量元素是相對(duì)于主量元素而言。寫(xiě)入化學(xué)分子式中的元素稱 為主量元素,將礦物中不計(jì)入化學(xué)分子式而在礦物中存在的含量較少元素稱為微量元素。 軟玉的化學(xué)式一般為Ca2(Mg,F(xiàn)e)5(Sis〇22)化地)2,除化,Mg,化,Si, 0, H,F(xiàn)W外的元素被看 做微量元素。
[0031] 微量元素所攜帶的地質(zhì)指紋特征,對(duì)于寶玉石產(chǎn)地區(qū)分具有很重要的價(jià)值 度reedingandShen, 2010;Blodgettand化en, 2011;Zhongetal., 2013)。本發(fā)明優(yōu)選 采用高靈敏度的激光剝蝕電感禪合等離子質(zhì)譜儀(LA-ICP-M巧,對(duì)所有樣品所含的微量元 素含量進(jìn)行準(zhǔn)確測(cè)定。測(cè)試的樣品點(diǎn)分為"訓(xùn)練組"和"測(cè)試組"兩組,每組都包含所有產(chǎn) 地的樣品,"訓(xùn)練組"樣品點(diǎn)及微量元素信息,用于建立產(chǎn)地判別模型,"測(cè)試組"樣品點(diǎn)及微 量元素信息,用于檢驗(yàn)"訓(xùn)練組"建立模型的可行性。
[0032] 本發(fā)明方法中,所述步驟2)中"訓(xùn)練組"每個(gè)產(chǎn)地的樣品點(diǎn)數(shù),占其總樣本點(diǎn)數(shù)的 1/2-2/3,"測(cè)試組"每個(gè)產(chǎn)地的樣品點(diǎn)數(shù)占其總樣本點(diǎn)數(shù)的1/3-1/2。本發(fā)明不排除對(duì)"訓(xùn) 練組"和"測(cè)試組"樣品量的隨機(jī)分組。
[0033] 步驟2)中所述激光剝蝕電感禪合等離子質(zhì)譜分析法中,測(cè)試的激光能量密度為 5-40J/cm2,優(yōu)選為5-lOJ/cm2;激光光斑大小為16-120ym,優(yōu)選為32-44ym;測(cè)試元素為微 量元素中的34-65個(gè)。
[0034] 所述激光剝蝕電感禪合等離子質(zhì)譜分析法中,所用外部參考樣品為NIST,USGS, MPI-DING,CGSC,GSJ天然或合成玻璃系列標(biāo)樣中的一種或多種,選擇29Si作為數(shù)據(jù)處理的 內(nèi)標(biāo)。其他實(shí)驗(yàn)參數(shù)設(shè)置及微量元素含量的轉(zhuǎn)換方法可按照LA-ICP-MS常規(guī)方法,如參考 文獻(xiàn)化iuetal,. 2008, 2010)。
[0035] 其中,所述步驟3)采用多元方差分析法或卡方檢驗(yàn),對(duì)N個(gè)產(chǎn)地的每個(gè)微量元素 進(jìn)行組均值的均等性的檢驗(yàn)。當(dāng)取95%的置信度時(shí),若顯著性水平sig<0. 05,說(shuō)明該變量 的組均值不相等,各組之間存在顯著性差異,開(kāi)展下一步判別分析具有意義。也可取99%或 更高的置信度,此時(shí)若顯著性水平sig<0. 01,說(shuō)明微量元素變量在不同組之間存在極顯著 的差異。本發(fā)明不排除使用卡方檢驗(yàn)或其他方法開(kāi)展統(tǒng)計(jì)顯著性檢驗(yàn)。
[0036] 所述步驟4)和步驟6)中,每一輪IB-LDA或LDA可采用直接法"一起輸入自變量" 或逐步加入變量的"逐步篩選法"中的一種來(lái)確定微量元素變量。在"逐步篩選法"中,具 體可采用"Wi化'SLambda"、"馬氏距離"、"未解釋方差"、"最小F值"、"Rao'SV"方法中的 一種,根據(jù)每一個(gè)微量元素對(duì)產(chǎn)地的判別能力,篩選具有判別效能的微量元素變量;"逐步 篩選法"中系統(tǒng)引入變量和剔除變量默認(rèn)的判據(jù),可采用"使用F值"或"使用F檢驗(yàn)的概 率"中的一種,來(lái)決定元素變量是否被加入判別函數(shù)或移除,系統(tǒng)默認(rèn)的引入變量的臨界F 值為3. 84,剔除變量的臨界F值為2. 71 ;系統(tǒng)默認(rèn)的加入變量的F值概率是0. 05,移出變 量的F值概率是0. 10 ;
[0037] IB-LDA通過(guò)兩兩判別分析,將對(duì)于兩組區(qū)分貢獻(xiàn)較大的微量元素和對(duì)應(yīng)的判別系 數(shù)、分類(lèi)系數(shù)提取出來(lái),特征微量元素及其判別系數(shù)組合成一個(gè)最佳的投影矢量方向(在 運(yùn)個(gè)方向上,兩組間差異最大化,同時(shí)組內(nèi)差異最小化),運(yùn)一投影方向即對(duì)應(yīng)IB-LDA中的 典型判別函數(shù)DFYi,簡(jiǎn)稱判別函數(shù),其數(shù)學(xué)表達(dá)式如公式(1)所示:
[003引 DFYi=a品+曰2;乂2+曰3;乂3+......+曰。;乂。+曰0; (1)
[0039] 式中,DFYk對(duì)應(yīng)每一輪IB-LDA篩選中產(chǎn)地的線性判別函數(shù),k= 1,2,……,N-1; ......,Xm是篩選出的特征變量,對(duì)應(yīng)軟玉所含的特征微量元素;aik,a2k,曰3k,......, amk是特征元素前面的線性判別系數(shù),bK為線性判別函數(shù)的常數(shù)項(xiàng)。
[0040] 其中,所述步驟4)中,關(guān)于IB-LDA的分類(lèi)函數(shù)CFi,其數(shù)學(xué)表達(dá)式如公式(2)和 (3)所示: 陽(yáng) 04UCFii=b11X1+621X2+631X3+......+bmiiXm+bii 似
[0042] CFi2=b12X1+622X2+633X3+......+b"i2X"+bi2 (3)
[00創(chuàng)式中,化郝CF。分別對(duì)應(yīng)第i輪IB-LDA篩選中的產(chǎn)地和未被區(qū)分組的分類(lèi)函數(shù),i= 1,2,……,N-1 ;Xi,X2,X3,……,Xm是每輪IB-LDA篩選出的特征變量,對(duì)應(yīng)軟玉所含 的特征微量元素;b。,b2i-bmii,……,bmi2是特征變量對(duì)應(yīng)的分類(lèi)函數(shù)系數(shù),b。和b12為分 類(lèi)函數(shù)的常數(shù)項(xiàng)。 W44] 對(duì)"訓(xùn)練組",每一輪IB-LDA中被篩選中產(chǎn)地的判別概率,可使用交叉驗(yàn)證判別準(zhǔn) 確率CVi(CrossValidationcorrectlyclassifiedrate,簡(jiǎn)稱CVi)表示,i為進(jìn)行IB-LDA的輪數(shù)。交叉驗(yàn)證W"留一個(gè)或若干個(gè)樣本在外"的原則為基礎(chǔ),是指在判別分析時(shí),隨機(jī) 提取一個(gè)或若干個(gè)樣品點(diǎn)在外作為"省略樣品",而W剩下的樣品點(diǎn)建立判別函數(shù),用建立 的判別函數(shù)判定"省略樣品"的產(chǎn)地,與其實(shí)際產(chǎn)地對(duì)比,W檢驗(yàn)判別函數(shù)的可靠性,在運(yùn)算 中會(huì)重復(fù)運(yùn)一過(guò)程直到所有樣品點(diǎn)都作為"省略樣品"被檢測(cè);被準(zhǔn)確判別的"省略樣品" 數(shù)占總樣品數(shù)的百分比即為交叉驗(yàn)證判別準(zhǔn)確率。交叉驗(yàn)證一方面在此表示某產(chǎn)地被準(zhǔn)確 判別的概率,另一方面,起到在建立判別函數(shù)過(guò)程中輔助建立模型,防止出現(xiàn)過(guò)度擬合的作 用。CVi的計(jì)算公式如公式(9)所示
[0045]
[0046] 如某產(chǎn)地在第i輪IB-LDA中被篩選出來(lái),其對(duì)應(yīng)的判別概率為CV"fi,定義為從第 一次輪兩組區(qū)分的CVi持續(xù)到第i輪兩組區(qū)分CV1的乘積,公式如下:
[0047] CV。" =CV1X……CVi1XCVi(4)
[0048] or為origin縮寫(xiě),表示產(chǎn)地。 W例通過(guò)IB-LDA篩選中的所有產(chǎn)地被準(zhǔn)確判別的概率優(yōu)先用CViet。^表示,定義為每 個(gè)被篩選中產(chǎn)地CV"i加和的算數(shù)平均值,計(jì)算公式如(5)所示: 陽(yáng)化0]
f氣) |;0051] 或,使用初始分組案例判別準(zhǔn)確率(Originalgroupedcasescorrectly classifiedrate,簡(jiǎn)稱OGi)來(lái)表示每一輪IB-LDA中被篩選中產(chǎn)地的判別概率,初始分組 案例中,不提取樣品在外,而W輸入軟件的所有初始樣本點(diǎn)數(shù)建立判別函數(shù),進(jìn)而對(duì)每個(gè)樣 品點(diǎn)進(jìn)行判別。
[0052] OGi的計(jì)算公式如公式(10)所示:
[0053]
no)
[0054] 若某產(chǎn)地在第i輪IB-LDA中被判別出來(lái),其對(duì)應(yīng)的分組初始案例判別準(zhǔn)確率 OG。^,定義為從第一次輪兩組區(qū)分的OGi持續(xù)到第i輪兩組區(qū)分0G1的乘積;而所有產(chǎn)地被 準(zhǔn)確判別的概率也可用OGiet。^表示,定義為每個(gè)被篩選中產(chǎn)地〇G"i加和的算數(shù)平均值,計(jì) 算公式分別如(6)和(7)所示: 陽(yáng)化 5] 0G。" = 0G1X......0G, 1X0G, (6)
[0056]
(7)
[0057] 本發(fā)明方法的步驟6)可W為:比較IB-LDA和LDA在軟玉產(chǎn)地定量判別中的相對(duì) 優(yōu)劣。具體地,對(duì)步驟4)和步驟6)各自所建立的判別函數(shù),用mk'SLambda值、典型相 關(guān)系數(shù)、特征值中的一種或多種,評(píng)價(jià)判別函數(shù)的判別能力。Wi化'SLambda,簡(jiǎn)稱A值,是 組內(nèi)離差平方和/總的離差平方和,在判別檢驗(yàn)中常使用,較小的A值表示判別函數(shù)具有 較高的判別能力;典型相關(guān)系數(shù)是組間離差平方和/總離差平方和的算術(shù)平方根,特征值 是組間離差平方和/組內(nèi)離差平方和,對(duì)于判別函數(shù)而言,典型相關(guān)系數(shù)或特征值越大,其 判別能力就越強(qiáng)。
[0058] 本發(fā)明方法中,所述步驟4)和步驟6)中,對(duì)"測(cè)試組"樣品,誤判率用邸巧rror rate)表示,其數(shù)學(xué)表達(dá)式為
[0059]
獨(dú)
[0060] 將"測(cè)試組"樣品代入各產(chǎn)地分類(lèi)函數(shù)的順序與步驟4)中建立各產(chǎn)地的分類(lèi)函數(shù) 的順序相同。若"測(cè)試組"某樣品點(diǎn)被準(zhǔn)確判別為其實(shí)際產(chǎn)地,其判別準(zhǔn)確率,優(yōu)選使用該 產(chǎn)地的交叉驗(yàn)證判別準(zhǔn)確率(CV"1)表示,也可使用初始數(shù)據(jù)分類(lèi)判別準(zhǔn)確率(0G"fi)表示。
[0061] 本發(fā)明所述方法的步驟5)具體可W為:取"待測(cè)"的軟玉樣品,定量測(cè)定微量元素 含量,代入步驟4)所建立的IB-LDA判別模型,即依次帶入篩選中產(chǎn)地的分類(lèi)函數(shù),根據(jù)得 分判別其所屬產(chǎn)地,其判別準(zhǔn)確率優(yōu)先使用判別所屬產(chǎn)地的交叉驗(yàn)證準(zhǔn)確率CV"i表示,也 可用初始案例分組判別準(zhǔn)確率〇G"i表示;其中,將"待測(cè)樣品"代入各產(chǎn)地分類(lèi)函數(shù)的順序 與步驟4)中建立各產(chǎn)地的分類(lèi)函數(shù)的順序相同。若待測(cè)樣品實(shí)際產(chǎn)地不屬于IB-LDA建模 時(shí)所包含的產(chǎn)地,則可能產(chǎn)生誤判,因此要求IB-LDA建模時(shí)盡可能覆蓋所有的軟玉產(chǎn)地樣 品。
[0062] 本發(fā)明在此開(kāi)展IB-LDA所用統(tǒng)計(jì)學(xué)軟件為國(guó)際上免費(fèi)的R-Language,本發(fā)明的 方法不排除利用SPSS、MTLAB、S-PLUS、SAS、EXCEL等其他軟件開(kāi)展IB-LDA運(yùn)算。
[0063] 本發(fā)明的有益效果:
[0064] 本發(fā)明基于微量元素的二元迭代線性判別分析(IB-LDA)定量判別軟玉產(chǎn)地方 法,相對(duì)傳統(tǒng)肉眼定性鑒別和LDA方法,有很大的優(yōu)勢(shì)。 W65] (1)本發(fā)明的