〇. 06*Χ5-〇. 04*Χ7+0. 39*Χ 8+0. 04*Χ9-〇. 50*Χ10-0. 07*Χη-0. 06*Χ12-0. 08*Χ13-〇. 14*Χ14+0. 35*Χ15-〇. 01*Χ16-〇. 06*Χ17+0. 02*Χ18
[0050] F4y= 0· 14*Χ「0· 15*Χ2-0· 12*Χ3-0· 07*Χ4-0· 18*Χ5-0· 09*Χ6-0· 18*Χ7-0· 01*Χ8+0· 50 *Χ9-0. 06*Χ10+0. 05*Χη+0. 05*Χ12+0. 02*Χ13+0. 03*Χ14+0. 02*Χ15-〇. 05*Χ16-〇. 14*Χ17+0. 52*Χ18
[0051] F5y= 0. 05?!-0, 05*Χ2-0. 06*Χ3+0. 05*Χ4-〇. 07*Χ5+0. 51*Χ6-〇. 07*Χγ-〇. 03*Χ8-〇. 07 *Χ9-0. 01*X1Q+0. 01*Χη+0. 08*Χ13-0. 02*Χ15+0. 49*Χ16-0. 06*Χ17-0. 06*X1S
[0052] 3)樣本數(shù)據(jù)的聚類分析
[0053] 基于多變量聚類分析后的結(jié)果顯示,大白公豬樣本數(shù)據(jù)中的1類含269頭公豬, 2類含589頭公豬。由表3的單因素方差分析結(jié)果可知,樣本數(shù)據(jù)的1類公豬繁殖力相關(guān) 變量在總體上遠(yuǎn)優(yōu)于2類公豬,其中大白公豬樣本的1類公豬在FR、LS、NAP、NQP、NTPP、 NABPP、NQPP等變量上均極顯著高于2類公豬(P〈0. 01),在NDP變量上則極顯著低于2類 公豬(P〈〇. 01)(表3),因此可以判定基于多變量聚類的1類公豬為高受精力公豬群,而2類 公豬則為低受精力公豬群。
[0054] 表3基于多變量聚類分析結(jié)果的單因素方差分析
[0055]
[0056] 注:同一樣本數(shù)據(jù)不同類別的同一變量相比較,上標(biāo)不同大寫字母表示差異極顯 著(P〈0.01),不同小寫字母表示差異顯著(P〈0. 05),含相同字母或沒(méi)有字母表示差異不顯 著(Ρ>0· 05),下同。
[0057] 同樣地,基于樣本主成分系統(tǒng)聚類分析后每個(gè)樣本數(shù)據(jù)中的個(gè)案按自身設(shè)定的要 求同樣被成功地歸為兩類別,分別為1類群集和2類群集。其中,大白公豬樣本數(shù)據(jù)中的1 類含304頭公豬,2類含554頭公豬。
[0058] 根據(jù)表4所示,通過(guò)對(duì)該部分的聚類結(jié)果進(jìn)行單因素方差分析可知,大白公豬樣 本中的5個(gè)主成分(F 1Y、F2Y、F3Y、F4Y、F5Y)與2類的相比較,全部出現(xiàn)極顯著差異(Ρ〈0. 01)。此 外,樣本數(shù)據(jù)的1類公豬變量在總體上同樣遠(yuǎn)優(yōu)于2類公豬,其中1類公豬在FR、LS、NBA、 NQP、NTPP、NABPP、NQPP等變量上也均極顯著高于2類公豬(P〈0. 01),在NDP變量上極顯著 低于2類公豬(P〈0. 01),因此也可以認(rèn)為基于主成分聚類的結(jié)果得到的1類公豬為高受精 能力公豬群,2類公豬則為低受精能力公豬群。
[0059] 表4基于主成分聚類分析結(jié)果的單因素方差分析
[0060]
[0061] 4)數(shù)學(xué)函數(shù)模型的建立與驗(yàn)證
[0062] 4. DBayes判別模型的建立
[0063] 在進(jìn)行多變量和樣本主成分聚類分析的基礎(chǔ)上,利用SPSS18. 0軟件對(duì)大白公豬 樣本數(shù)據(jù)的 FR、LS、NBA、NDP、NQP、NAP、NSP、NWP、NMP、APW、NTPP、NABPP、NDPP、NQPP、NAPP、 NSPP、NWPP、NMPP等預(yù)測(cè)變量(多變量)和樣本主成分進(jìn)行Bayes判別分析,以生成具體 的函數(shù)模型。其中,基于多變量分析1類和2類的大白公豬Bayes判別函數(shù)模型分別為:
[0064] Yyai= I. 06*X !+69. 48*Xs+226. 52*Χ9+160· 77*Χ1(]-7· 61*Χ13-38· 98*Χ15+10· 72*X17-2 77. 99*Χ18-167. 57
[0065] Yya2= 0· 99*Χ !+79. 02*Χ8+209· 99*Χ9+164· 24*Χ10+0· 36*Χ13-72· 10*Χ15+2· 97*Χ17-26 2. 24*X1S-157. 96
[0066] 基于主成分分析1類和2類的大白公豬Bayes判別函數(shù)模型分別為:
[0067] Yyci= -2. 66*F 1Y+6. 76*F2Y-23. 79*F3Y-20. 96*F4Y-75. 63
[0068] Yyc2= -3. 62*F 1Y+9. 48*F2Y-25. 74*F3Y-23. 15*F4Y-68. 84
[0069] 在求出Bayes判別函數(shù)的情況下,可將新的未知公豬數(shù)據(jù)分別代入以上兩類的函 數(shù)模型中,比較算出的數(shù)值,哪個(gè)數(shù)值大則歸入哪一類群中。假設(shè)某頭大白公豬數(shù)據(jù)代入函 數(shù)Y yai和Y YA2中后得出Y YA1〈YYA2,那么就表明該大白公豬屬于2類。
[0070] 4. 2) Fisher判別模型的建立
[0071] Bayes判別需要給出兩個(gè)判別函數(shù)以區(qū)分不同類別,而Fisher判別僅需要給出I 個(gè)判別函數(shù)就可以區(qū)分不同類別公豬,有別于Bayes判別。經(jīng)Wilks' lambda檢驗(yàn),基于多 變量分析和樣本主成分的Fisher判別函數(shù)均具有有效性。據(jù)統(tǒng)計(jì)軟件生成結(jié)果,基于多變 量分析的大白公豬Fisher判別函數(shù)模型為:
[0072] YYa= 0. 02*X !-2. 39*X8+4. 14*Xg-〇. 87*X10-2. 00*X13+8. 30*X15+1. 94* X17-3. 95*X1S-1. 47
[0073] 基于主成分分析的大白公豬Fisher判別函數(shù)模型分別為:
[0074] Yyc= 0· 41*F 1Y-L 15*F2Y+0. 82*F3Y+0. 92*F4Y-2. 26
[0075] 基于多變量和主成分Fisher判別的組質(zhì)心圖如圖2所示,根據(jù)圖2,大白公豬基于 多變量分析的1類和2類均值分別為2. 74,-1. 25。這表明大白樣本的1類質(zhì)心位于2. 74, 2類質(zhì)心位于-1. 25 ;以此類推,基于主成分分析的1類和2類質(zhì)心為-1. 53和-0. 84。在 知道Fisher判別函數(shù)和各組質(zhì)心的情況下,可將新的未知公豬數(shù)據(jù)分別代入對(duì)應(yīng)函數(shù)模 型中算出的具體數(shù)值,并分別比較該數(shù)值與1類和2類的距離。若該數(shù)值貼近于1類質(zhì)心, 那么該未知大白公豬則屬于1類,否則屬于2類。
[0076] 4. 3)二元Logistic回歸模型的建立
[0077] 以18個(gè)變量作為預(yù)測(cè)模型的多變量和樣本公因子的主成分,不同繁殖力水平的 公豬群分別取為1和2 (SPSS內(nèi)部賦值則為0和1)進(jìn)行回歸分析。由于是二分類問(wèn)題,因 此可采用二元Logistic回歸分析,并以1和2作為因變量,其他的18個(gè)變量和主成分各為 協(xié)變量(即自變量)。二元Logistic回歸模型系數(shù)綜合檢驗(yàn)主要針對(duì)分析步驟、模塊和模 型進(jìn)行檢驗(yàn),主要觀察顯著性水平(即Sig值),若Sig小于0. 05則分析通過(guò)檢驗(yàn);模型擬 合度用于檢驗(yàn)?zāi)P偷恼w性擬合效果,Cox&Snell R2和Nagelkerke R2越接近1則代表模 型擬合效果越好;Hosmer-Lemeshow檢驗(yàn)是一個(gè)假設(shè)性檢驗(yàn),作為模型擬合度檢驗(yàn)的補(bǔ)充 和參照,若Sig值大于0. 5則表示該模型能夠很好的擬合數(shù)據(jù),結(jié)果比較理想,否則模型的 整體擬合效果不好,不具有分析的意義。
[0078] 表5基于多變量和主成分回歸模型的檢驗(yàn)
[0080] 由表5可知,基于多變量和主成分分析的大白公豬樣本Logistic回歸模型均通過(guò) 檢驗(yàn),建立的模型具有統(tǒng)計(jì)學(xué)意義。
[0081] 另外,概率直方圖代表不同樣本的Logistic回歸模型對(duì)不同類別的估計(jì)概率,反 應(yīng)了 1類和2類的概率頻數(shù)分布情況。圖3中的"1"表示為1類,"2"表示為2類。由于 是二元回歸分析,其臨界概率為0. 5,因此未知樣本若屬1類則會(huì)落入0. 5的左側(cè),若屬2類 則應(yīng)該落入0.5右側(cè)。據(jù)圖3 (a-b)顯示,已區(qū)分的兩類(1類和2類)完全分布在兩端,I 類主要靠近概率為0處,2類則靠近概率為1處,該結(jié)果說(shuō)明建立起的大白公豬Logistic回