本發(fā)明屬于農(nóng)產(chǎn)品品質(zhì)分析技術(shù)領(lǐng)域,具體涉及一種基于被動聲學(xué)信息的淡水魚品種識別的裝置和方法。
背景技術(shù):
我國是傳統(tǒng)的漁業(yè)大國,水產(chǎn)品總產(chǎn)量和出口量均居世界首位,其中淡水魚的養(yǎng)殖產(chǎn)量占內(nèi)陸水產(chǎn)品總養(yǎng)殖產(chǎn)量的較大比重,是我國主要的水產(chǎn)養(yǎng)殖種類。根據(jù)中國漁業(yè)統(tǒng)計年鑒公布的數(shù)據(jù)可知,2009~2013年之間,我國的淡水魚年產(chǎn)量平均增長率為5.5%,到2013年,我國淡水魚年產(chǎn)量就已達(dá)到2635.08萬噸,且會持續(xù)增長(梁煥秋等,2014;劉佳,2014)。魚類肉味鮮美,營養(yǎng)豐富,含有人體所必需的動物蛋白、鈣、多種維生素等營養(yǎng)物質(zhì),是日常生活中不可或缺的食材。而冷凍魚和鮮活魚無論是在營養(yǎng)價值還是在銷售價格上都有較大的差別,普通消費(fèi)者更多的傾向于購買鮮活魚類。目前,國內(nèi)和國際的淡水魚市場需求一直在持續(xù)增長,其中90%以上淡水魚以鮮活形式在市面上銷售。
相關(guān)研究表明,魚類在水下有著各種各樣的發(fā)聲方式,如骨骼發(fā)出的聲音、鰓蓋的閉合聲、游動時激起的水花和旋窩、魚在沉浮時魚鰾受到撞擊震動以及魚鰾換氣時發(fā)出的聲音、魚體與魚體之間發(fā)生碰撞所發(fā)出的聲音等,聲音信號豐富。而之所以我們聽不到魚所發(fā)出的任何聲音,是因?yàn)樗拿芏仁窍喈?dāng)于空氣密度的7500倍,魚在水里面發(fā)出的聲音幾乎都在水的介質(zhì)中逐漸消失。相關(guān)研究表明,魚類的聲音是用來實(shí)現(xiàn)種間或者種內(nèi)的信息傳遞,包括生殖時的集群聲、躲避敵害發(fā)生的聲音、尋找食物的試探聲以及識別同類的呼叫聲等,其特征與魚的種類、生理狀態(tài)等生命活動緊密關(guān)聯(lián),有著特定的生物學(xué)意義。國內(nèi)外對聲學(xué)信息在漁業(yè)中的應(yīng)用研究主要集中在魚類發(fā)聲特性及發(fā)聲機(jī)理、魚群發(fā)聲信號處理、魚類個體的水聲目標(biāo)特性和基于水聲信號的魚類資源評估方法等方面。在針對魚類聲音信號的研究中,大都圍繞在通過分析水下的魚聲信號判斷魚群的地理分布等;個別針對魚聲信號本身的研究也以海魚和船舶輻射噪聲為主,提取信號的頻域特征,目的是進(jìn)行海魚種類識別以及對魚聲信號與船舶聲音信號進(jìn)行識別;近年來,魚探儀已成為漁業(yè)資源調(diào)查與評估的一個重要工具,廣泛地應(yīng)用于監(jiān)測魚群行為、鑒別魚類性別、評估其它水生生物量、探測水體底部類型、監(jiān)測水質(zhì)和水生生態(tài)系統(tǒng)。
魚聲檢測方式主要包括主動聲吶檢測和被動聲吶檢測,現(xiàn)有研究中采用主動聲吶方式較多,但將被動水聲信息檢測技術(shù)應(yīng)用于淡水魚種類識別的應(yīng)用目前尚未發(fā)現(xiàn)。被動聲學(xué)探測具有成本適中、靈敏度高、發(fā)展較成熟的優(yōu)點(diǎn),因此,基于被動聲學(xué)信息的淡水魚狀態(tài)檢測,進(jìn)而實(shí)現(xiàn)對淡水魚進(jìn)行品種識別更具有應(yīng)用潛力,也是該領(lǐng)域的發(fā)展趨勢。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的為采用語音分析技術(shù)提取魚聲信號特征值,采用概率神經(jīng)網(wǎng)絡(luò)構(gòu)建淡水魚品種識別模型,實(shí)現(xiàn)淡水魚品種的快速檢測。
本發(fā)明技術(shù)方案:
一種基于被動聲學(xué)信息的淡水魚品種識別裝置,提取原始魚聲信號的裝置包括第一魚箱,第二魚箱,所述第一魚箱內(nèi)設(shè)有第一水聽器,所述第二魚箱內(nèi)設(shè)有第二水聽器,所述第一水聽器、第二水聽器分別與聲學(xué)記錄儀連接,所述第一魚箱、第二魚箱外設(shè)有隔音棉。
一種基于被動聲學(xué)信息的淡水魚品種識別方法,所述方法具體包括以下步驟:
1)消噪處理:提取原始魚聲信號,并對所得的魚聲信號進(jìn)行消噪處理;
2)提取特征參數(shù):根據(jù)所述步驟1)消噪處理后的魚聲信號,提取魚聲短時平均能量、魚聲短時平均過零率,再對消噪處理后的魚聲信號進(jìn)行小波包分解,采用四層、五層、六層和七層小波包分解方法對魚聲信號進(jìn)行了頻段劃分,提取各頻段能量;
3)構(gòu)建特征向量:根據(jù)所述步驟2)提取的短時平均能量、短時平均過零率和各頻段能量構(gòu)建特征向量;
4)樣本集劃分:采集不同品種不同時間的魚聲信號,構(gòu)成一個魚聲樣本集,將樣本集劃分為訓(xùn)練集和驗(yàn)證集;
5)特征頻段挑選、特征向量降維:對經(jīng)過步驟4)劃分樣本集的魚聲音信號進(jìn)行Z-score標(biāo)準(zhǔn)化預(yù)處理,并采用競爭自適應(yīng)重加權(quán)采樣法、多元線性回歸對特征頻段再次進(jìn)行優(yōu)選,剔除不顯著的特征頻段,得到魚聲信號特征頻段能量,對步驟3)特征向量降維,得到降維后的魚聲信號特征向量;
6)建立分類器模型:對所述步驟5)降維后的魚聲信號特征向量,采用概率神經(jīng)網(wǎng)絡(luò)建立淡水魚品種分類器;
7)品種識別:對未知淡水魚樣本魚聲信號進(jìn)行檢測,并將魚聲樣本的特征向量帶入步驟6)建立的分類器中,劃分出不同品種的魚類;
完成淡水魚品種的識別。
優(yōu)選地,所述步驟5)魚聲信號特征頻段挑選中,當(dāng)采用四層小波包分解方法對魚聲信號進(jìn)行了頻段劃分時篩選得到的特征頻段為0-32Hz、64~96Hz、96~128Hz、128~160Hz、160~192Hz、192~224Hz、224~256Hz、256~288Hz、288~320Hz、320~352Hz、352~384Hz、416~448Hz、448~480Hz。
優(yōu)選地,所述步驟5)魚聲信號特征頻段挑選中,當(dāng)采用五層小波包分解方法對魚聲信號進(jìn)行了頻段劃分時篩選得到的特征頻段為0-16Hz、80~96Hz、112~128Hz、144~160Hz、160~178Hz、178~192Hz、192~208Hz、208~224Hz、240~256Hz、272~288Hz、304~320Hz、320~336Hz、336~352Hz、368~384Hz、400~416Hz、432~448Hz、448~464Hz、464~480Hz。
優(yōu)選地,所述步驟5)魚聲信號特征頻段挑選中,當(dāng)采用六層小波包分解方法對魚聲信號進(jìn)行了頻段劃分時篩選得到的特征頻段為0-8Hz、8~16Hz、24~32Hz、64~72Hz、80~88Hz、88~96Hz、112~120Hz、120~128Hz、144~152Hz、176~184Hz、192~200Hz、200~208Hz、208~216Hz、216~224Hz、224~232Hz、240~248Hz、248~256Hz、272~280Hz、304~312Hz、320~328Hz、328~336Hz、336~344Hz、344~352Hz、368~376Hz、376~384Hz、400~408Hz、432~440Hz、448~456Hz、456~464Hz、464~472Hz、472~480Hz。
優(yōu)選地,所述步驟4)采用Rank-SPXY法進(jìn)行樣本集的劃分,該方法由兩部分組成,首先是Rank部分,即將樣本按因變量活魚條數(shù)的升序排序,然后將樣本等分為m份;其次是SPXY法部分,即在等分m份的每個區(qū)間內(nèi)采用SPXY法選取出訓(xùn)練集,其余的樣本自動歸為驗(yàn)證集,m分別取值為5和10。
優(yōu)選地,所述步驟6)中對淡水魚的品種識別采用的數(shù)據(jù)方法為概率神經(jīng)網(wǎng)絡(luò)分類器。
進(jìn)一步優(yōu)選地,所述分類器由四層組成:輸入層、模式層、累加層和輸出層,
輸入層神經(jīng)元節(jié)點(diǎn)對應(yīng)特征向量中的每個分量,對輸入層神經(jīng)元節(jié)點(diǎn)進(jìn)行歸一化處理;
模式層的神經(jīng)元個數(shù)取決于訓(xùn)練集樣本特征向量維度數(shù)和待匹配的類別數(shù)的乘積,在模式層中,將經(jīng)過輸入層歸一化處理后的特征向量進(jìn)行加權(quán)處理,即Z=X·W,其中W為權(quán)值矩陣,對應(yīng)于各類模式中的訓(xùn)練集樣本,然后Z經(jīng)過激活函數(shù)處理后,傳給累加層;
在累加層中,把來自模式層的輸出進(jìn)行累加,累加層各神經(jīng)元只與目標(biāo)類別的神經(jīng)元相連,并依據(jù)Parzen方法求和來估計樣本類別的概率,輸出為每一模式類別的概率估計,傳遞給輸出層;
輸出層的神經(jīng)元個數(shù)與待分類目標(biāo)的類別數(shù)相同,根據(jù)累加層對每一模式類別概率的估計,采用Bayes分類決策,選擇出具有最小“風(fēng)險”的類別,即具有最大后驗(yàn)概率的類別;
進(jìn)一步優(yōu)選地,所述概率神經(jīng)網(wǎng)絡(luò)分類器的平滑因子取值為9.0或10.0。
所述的裝置或所述方法在淡水魚養(yǎng)殖與漁業(yè)資源調(diào)查過程中的應(yīng)用。
本發(fā)明提供的一種基于被動聲學(xué)信息的淡水魚品種識別裝置及方法,有益效果如下:
1、本發(fā)明建立的淡水魚品種識別方法,對魚類的品種做到自動無損檢測,并可提高檢測效率,降低勞動成本;
2、應(yīng)用本發(fā)明建立的淡水魚品種識別方法,可以實(shí)現(xiàn)淡水魚養(yǎng)殖和漁業(yè)資源調(diào)查過程中魚類品種的在線檢測,準(zhǔn)確率最高為94.3%,因此,本發(fā)明可以幫助養(yǎng)殖戶提高水產(chǎn)養(yǎng)殖設(shè)施的信息化水平,也可幫助漁業(yè)資源調(diào)查工作人員提高工作效率。
附圖說明
圖1本發(fā)明魚聲信號采集系統(tǒng)結(jié)構(gòu)圖;
圖2概率神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖;
圖3本發(fā)明的六層小波包分解結(jié)構(gòu)方法;
圖4 PNN網(wǎng)絡(luò)訓(xùn)練后的效果圖;
圖5 PNN網(wǎng)絡(luò)訓(xùn)練后的誤差圖;
圖6 PNN神經(jīng)網(wǎng)絡(luò)預(yù)測效果圖;
其中1為第一魚箱,2為第二魚箱,3聲學(xué)記錄儀,4為第一水聽器,5為第二水聽器,6為隔音棉。
具體實(shí)施方式
分類器模型的建立
分類器模型的建立采用概率神經(jīng)網(wǎng)絡(luò)分類器算法,概率神經(jīng)網(wǎng)絡(luò)(PNN)分類器結(jié)構(gòu)如圖2所示,由四層組成:輸入層、模式層(又稱為樣本層)、累加層和輸出層(又稱為競爭層)。
在PNN的網(wǎng)絡(luò)模型中,輸入層用來接收來自訓(xùn)練集樣本的魚聲特征向量,因此,神經(jīng)元個數(shù)與魚聲特征向量維度相同。本發(fā)明提取魚聲信號的短時平均能量、短時平均過零率、四層小波包分解的各頻段(只采用0-500Hz內(nèi)的頻段,共15個頻段)能量,去除品種間差異不顯著的32~64Hz頻段能量x4和384~416Hz頻段能量x15,構(gòu)成特征向量,共15維,因此,本發(fā)明的PNN神經(jīng)網(wǎng)絡(luò)輸入層采用15個神經(jīng)元節(jié)點(diǎn),即X1、X2、…、X15。在輸入層對特征向量每個分量進(jìn)行歸一化處理,具體公式為:
模式層的神經(jīng)元個數(shù)取決于訓(xùn)練集樣本特征向量維度數(shù)和待匹配的類別數(shù)的乘機(jī),本發(fā)明將魚聲信號分為4類,因此,其神經(jīng)元個數(shù)為4×15=60個。在模式層中,將經(jīng)過輸入層歸一化處理后的特征向量進(jìn)行加權(quán)處理,即Z=X·W,其中W為權(quán)值矩陣,對應(yīng)于各類模式中的訓(xùn)練集樣本。然后Z經(jīng)過一個激活函數(shù)處理后,傳給累加層。本發(fā)明采用的激活函數(shù)為:
式中,δ2為樣本方差。則該層每個神經(jīng)元節(jié)點(diǎn)的輸出為:
式中,σ是對分類有著重要作用的平滑因子,決定了模式樣本點(diǎn)之間的影響程度,其通過影響PNN中的概率密度分布函數(shù)變化,直接決定著最終的分類效果,所以合適的平滑因子取值在設(shè)計分類器時顯得尤其重要。當(dāng)取值過大時,雖然概率密度估計比較平滑但細(xì)節(jié)丟失嚴(yán)重;而當(dāng)取值過小時,密度估計又會呈現(xiàn)較多的尖峰突起。平滑因子的取值大小需要在反復(fù)試驗(yàn)對比中來確定,本發(fā)明的平滑因子取值分別為6.0、7.0、8.0、9.0、10.0、20.0、30.0。
在累加層中,累加神經(jīng)元的作用是把來自模式層的輸出進(jìn)行累加,累加層各神經(jīng)元只與目標(biāo)類別的神經(jīng)元相連,依據(jù)Parzen窗口方法求和來估計樣本類別的概率,即其條件概率為:
該層的輸出為每一模式類別的概率估計,使概率神經(jīng)網(wǎng)絡(luò)配置按后驗(yàn)概率自動激活。
輸出層的神經(jīng)元個數(shù)與待分類目標(biāo)的類別數(shù)相同,本發(fā)明將魚聲信號分為4類:無魚C1、草魚C2、鳊魚C3、鯽魚C4,其輸出層的對應(yīng)描述如表1所示:
表1魚聲類別對應(yīng)描述
根據(jù)累加層對每一模式類別的概率估計,采用Bayes分類決策,選擇出具有最小“風(fēng)險”的類別,即具有最大后驗(yàn)概率的類別,其決策方法如下:
P(X|Ci)P(Ci)>P(X/Cj)P(Cj),i≠j (5)
則輸出y(X)=Ci。
基于小波包分解的頻段能量提取
用小波包對淡水魚聲音信號進(jìn)行分解時要選擇適合的分解尺度和小波包基函數(shù),分解尺度的確定與魚聲信號的主要頻段以及采樣頻率有關(guān)。用不同的小波包基函數(shù)對同一個魚聲信號進(jìn)行分解將會得到不同的結(jié)果,所以在選用小波包對信號進(jìn)行分解時,要根據(jù)不同信號的特征以及反復(fù)對比分析來選擇一個最好的小波包基函數(shù),選擇的小波包基函數(shù)需要滿足以下幾點(diǎn)要求:在時域和頻域都具有一定的局部化分析能力;在時域具有緊支撐性,在頻域具有快速衰減性;至少具有一階消失矩;具有良好的分解與重構(gòu)性。滿足上述要求的常用小波有SymletsA(symN)小波、Coiflet(coifN)小波、Daubechies(dbN)小波等。魚聲信號分析處理實(shí)際應(yīng)用中一般選擇dbN小波,它是Daubechies從雙尺度方程系數(shù){hk}中定義出來的離散正交小波,是離散小波變換的良好工具。N指小波的階數(shù)。
本申請采集魚聲信號時的采樣頻率是4000Hz,而常見淡水魚聲音信號的主要頻率成分是500Hz以下的低頻部分,因此,本申請只針對0-500Hz以內(nèi)的魚聲信號進(jìn)行分析研究。采用小波包分解對魚聲信號進(jìn)行特征參數(shù)提取,提取信號各頻段內(nèi)能量作為分類識別的特征參數(shù)。其步驟如下:
第一步:選取合適的分解尺度和小波基函數(shù),對魚聲信號S進(jìn)行分解。在對海洋魚類聲音信號進(jìn)行小波包分解時,分解尺度一般選取為三層或四層,而由于常見淡水魚聲音信號比較微弱,且頻率較低,因此,本發(fā)明分別選取四層、五層、六層作為分解尺度,選取db1小波作為小波包基函數(shù),以六層小波包分解為例,其分解結(jié)構(gòu)如圖3所示。
圖3中,每個節(jié)點(diǎn)都代表了一定的特征,比如,節(jié)點(diǎn)(0,0)代表原始魚聲信號S;節(jié)點(diǎn)(1,0)代表第一層小波包分解第0個節(jié)點(diǎn)的系數(shù);節(jié)點(diǎn)(1,1)代表第一層小波包分解第1個節(jié)點(diǎn)的系數(shù);依次類推。
第二步:利用分解的節(jié)點(diǎn)系數(shù)對分解尺度上的信號進(jìn)行單尺度重構(gòu),得到各頻段內(nèi)的小波包重構(gòu)信號。以Sij表示節(jié)點(diǎn)(i,j)的小波包重構(gòu)信號,則原始魚聲信號S可以表示為:
S=S60+S61+S62+S63+…+S662+S663
四層、五層、和七層小波包分解方法與此方法相同。
實(shí)施例1
如圖1所示,一種基于被動聲學(xué)信息的淡水魚存活率預(yù)測裝置,提取原始魚聲信號的裝置包括第一魚箱1,第二魚箱2,所述第一魚箱1內(nèi)設(shè)有第一水聽器4,所述第二魚箱2內(nèi)設(shè)有第二水聽器5,所述第一水聽器4、第二水聽器5分別與聲學(xué)記錄儀3連接,所述第一魚箱1,第二魚箱2外設(shè)有隔音棉6。
實(shí)施例2
1)魚聲信號采集及消噪處理:分別在圖1中第一魚箱和第二魚箱中注入500L的水,水溫度為10~15℃,溶氧量為7-8mg/L,pH為7.2-7.5,將第一水聽器和第二水聽器布置在水面以下20cm處,靜置5min,待魚在水中比較穩(wěn)定時,設(shè)置聲學(xué)記錄儀進(jìn)行魚聲信號采集。
設(shè)置參數(shù)如下:采集時長:1min;采樣頻率:4000Hz;采集通道:雙通道;采集次數(shù):3次。將草魚、鳊魚、鯽魚放入1號魚箱中,采集次數(shù)為1次,共采集草魚聲音信號樣本44個,鳊魚聲音信號樣本44個,鯽魚聲音信號樣本44個,并采集無魚聲音信號樣本44個。
2)提取特征參數(shù):根據(jù)所述步驟1)消噪處理后的魚聲信號,提取魚聲短時平均能量、魚聲短時平均過零率,再對消噪處理后的魚聲信號進(jìn)行小波包分解,采用四層小波包分解方法對魚聲信號進(jìn)行了頻段劃分,提取各頻段能量;
3)構(gòu)建特征向量:根據(jù)所述步驟2)提取的短時平均能量、短時平均過零率和各頻段能量構(gòu)建特征向量;
4)樣本集劃分:采集不同品種不同時間的魚聲信號,構(gòu)成一個魚聲樣本集,將樣本集劃分為訓(xùn)練集和驗(yàn)證集;本實(shí)施例運(yùn)用魚聲信號采集系統(tǒng)分別采集了無魚、草魚、鳊魚和鯽魚的聲音信號各44組作為概率神經(jīng)網(wǎng)絡(luò)分類器的數(shù)據(jù)樣本,訓(xùn)練集和驗(yàn)證集的劃分結(jié)果如表2所示:
表2樣本集劃分結(jié)果
5)特征頻段挑選、特征向量降維:對經(jīng)過步驟4)劃分樣本集的魚聲音信號進(jìn)行Z-score標(biāo)準(zhǔn)化預(yù)處理,并采用競爭自適應(yīng)重加權(quán)采樣法、多元線性回歸對特征頻段再次進(jìn)行優(yōu)選,剔除不顯著的特征頻段,得到魚聲信號特征頻段能量,對步驟3)特征向量降維,得到降維后的魚聲信號特征向量;
魚聲信號頻段能量顯著性分析結(jié)果如表所示,由表3可知:當(dāng)采用四層小波包分解方法對魚聲信號進(jìn)行了頻段劃分時不同品種淡水魚聲音信號除32~64Hz和384~416Hz頻段能量之外,其它13個頻段能量均具有顯著差異,
即篩選得到的特征頻段為0-32Hz、64~96Hz、96~128Hz、128~160Hz、160~192Hz、192~224Hz、224~256Hz、256~288Hz、288~320Hz、320~352Hz、352~384Hz、416~448Hz、448~480Hz;
表3魚聲信號四層分解頻段能量顯著性分析
注:xi為鯽魚聲音信號經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后特征值,x1是指魚聲短時平均能量、x2是指魚聲短時平均過零率,xi中i≥3時為基于四層小波包分解的頻段能量。
6)建立分類器模型:對所述步驟5)降維后的魚聲信號特征向量,采用概率神經(jīng)網(wǎng)絡(luò)建立淡水魚品種分類器;
將特征向量代入到分類器中進(jìn)行品種識別。平滑因子不同取值的分類結(jié)果如表4所示:
表4平滑因子不同取值的分類結(jié)果比較
準(zhǔn)確率計算公式如下:
其中,T為樣本分類正確數(shù),N為樣本數(shù),無魚、草魚、鳊魚、鯽魚的樣本數(shù)為22,總樣本數(shù)為88。
由表4可知,當(dāng)平滑因子取值為9.0或10.0時,分類準(zhǔn)確率最高,為94.3%,其訓(xùn)練效果圖如圖4、5所示,預(yù)測效果圖如圖6所示。
通過觀察訓(xùn)練效果圖可知,PNN神經(jīng)網(wǎng)絡(luò)對訓(xùn)練樣本集的模擬分類的準(zhǔn)確率為100%,說明本實(shí)施例所構(gòu)建的PNN神經(jīng)網(wǎng)絡(luò)是可信的,且訓(xùn)練效果良好。在對88組驗(yàn)證集樣本進(jìn)行預(yù)測的分類結(jié)果中可以發(fā)現(xiàn)預(yù)測分類結(jié)果跟魚聲樣本真實(shí)類別基本一致,其中,3個無魚聲音信號樣本被判定為鳊魚,2個無魚聲音信號樣本被判定為鯽魚,總準(zhǔn)確率達(dá)到94.3%,說明所構(gòu)建的PNN神經(jīng)網(wǎng)絡(luò)具有較好的預(yù)測能力。根據(jù)分類結(jié)果可知,采用四層小波包分解提取頻段能量構(gòu)建特征向量,分類準(zhǔn)確率已經(jīng)達(dá)到94.3%,且數(shù)據(jù)量少,計算量小,模型運(yùn)行速度快,故本實(shí)施例采用四層小波包分解對魚聲信號進(jìn)行頻段劃分,提取頻段能量特征。
本實(shí)施例構(gòu)建了概率神經(jīng)網(wǎng)絡(luò)分類器實(shí)現(xiàn)了淡水魚的品種識別,并探討了平滑因子的取值對分類器分類準(zhǔn)確率的影響。當(dāng)平滑因子取值為9.0時,分類器的分類效果達(dá)到最佳,總分類準(zhǔn)確率為94.3%,其中無魚的分類準(zhǔn)確率為77.3%,草魚、鳊魚、鯽魚的分類準(zhǔn)確率均為100%,識別效果較好。
實(shí)施例3鯽魚存活率預(yù)測模型
1)魚聲信號采集及消噪處理:分別在圖1中第一魚箱和第二魚箱中注入500L的水,水溫度為10~15℃,溶氧量為7-8mg/L,pH為7.2-7.5,將第一水聽器和第二水聽器布置在水面以下20cm處。將鯽魚放入1號魚箱中,鯽魚的活魚條數(shù)范圍為1-50條,最小魚水比為1:999,最大魚水比為1:19,靜置5min,待魚在水中比較穩(wěn)定時,設(shè)置聲學(xué)記錄儀進(jìn)行魚聲信號采集。
設(shè)置參數(shù)如下:采集時長:1min;采樣頻率:4000Hz;采集通道:雙通道;采集次數(shù):3次。共采集鯽魚聲音信號樣本1363個。
2)提取特征參數(shù):根據(jù)所述步驟1)消噪處理后的魚聲信號,提取魚聲短時平均能量、魚聲短時平均過零率,再對消噪處理后的魚聲信號進(jìn)行分解,采用四層、五層、六層和七層小波包分解方法對魚聲信號進(jìn)行了頻段劃分,提取各頻段能量;
3)構(gòu)建特征向量:根據(jù)所述步驟2)提取的短時平均能量、短時平均過零率和各頻段能量構(gòu)建特征向量;特征向量維數(shù)如表5所示。
表5不同分解尺度的特征向量維數(shù)
4)樣本集劃分:對步驟1)采集的鯽魚聲音信號樣本劃分為訓(xùn)練集和驗(yàn)證集,樣本數(shù)為1363個。
分別采用了SPXY法和Rank-SPXY法將鯽魚聲音信號樣本集按照4:1的比例劃分為訓(xùn)練集和驗(yàn)證集,并進(jìn)行了分析比較,其中Rank-SPXY法的m分別取值為5和10。樣本集劃分結(jié)果如表6所示。Rank-SPXY法,該方法由兩部分組成,首先是“Rank”部分,即將樣本按因變量(活魚條數(shù))的升序排序,然后將樣本等分為m份;其次是“SPXY法”部分,即在等分的每個區(qū)間內(nèi)采用SPXY法選取出訓(xùn)練集,其余的樣本自動歸為驗(yàn)證集。其中m也是重要參數(shù),當(dāng)m=1時,即為SPXY法;當(dāng)m較大時,得到的訓(xùn)練集活魚條數(shù)更加均勻,但特征值的代表性有所下降。
表6不同樣本集劃分方法劃分結(jié)果
由表6可知,采用SPXY法劃分的樣本集中,29-50條的鯽魚聲音樣本全部劃分為了訓(xùn)練集,這造成了樣本集劃分不均勻,而Rank-SPXY法所劃分的驗(yàn)證集的數(shù)據(jù)范圍包含在訓(xùn)練集的數(shù)據(jù)范圍內(nèi),并且驗(yàn)證集平均值小于訓(xùn)練集平均值,因此選擇Rank-SPXY法劃分樣本集更加合理。在采用Rank-SPXY法對樣本集進(jìn)行劃分時,通過比較m=5和m=10時驗(yàn)證集的標(biāo)準(zhǔn)差可知,采用m=10對鯽魚聲音信號樣本集的劃分更加均勻,但m值較大也會影響特征值的代表性。因此,本實(shí)施例同時采用m兩種不同取值對鯽魚聲音信號樣本集進(jìn)行劃分,并建立預(yù)測模型,比較哪種取值更佳。
5)特征值挑選、特征向量降維:對經(jīng)過步驟4)劃分樣本集的鯽魚聲音信號進(jìn)行Z-score(標(biāo)準(zhǔn)分?jǐn)?shù))標(biāo)準(zhǔn)化預(yù)處理,并采用運(yùn)用競爭自適應(yīng)重加權(quán)采樣(CARS)法對鯽魚聲音信號樣本集進(jìn)行特征值優(yōu)選,并采用10折交叉驗(yàn)證選擇模型交叉驗(yàn)證均方差(RMSECV)值最小的特征值變量子集;
運(yùn)用多元線性回歸(MLR)對特征頻率再次進(jìn)行優(yōu)選,MLR建模后,剔除不顯著的特征頻率段,得到魚聲信號特征頻段能量,對步驟3)特征向量降維,得到降維后的魚聲信號特征向量,優(yōu)選結(jié)果如表7所示。
表7鯽魚聲音信號特征值優(yōu)選結(jié)果
6)模型建立:對所述步驟5)降維后的魚聲信號特征向量,采用多元線性回歸(MLR)法和偏最小二乘(PLSR)法分別建立鯽魚存活率預(yù)測模型。預(yù)測模型的相關(guān)系數(shù)如表8所示。
表8預(yù)測模型相關(guān)系數(shù)
綜合上述的采用不同特征提取、不同樣本集劃分方法以及不同建模方法得到的建模結(jié)果可知,“7層+Rank-SPXY(m=10)”得到的樣本集建立的MLR預(yù)測模型的相關(guān)系數(shù)最高,但計算量是“6層+Rank-SPXY(m=10)”時的二倍,因此選取短時平均能量和短時平均過零率以及基于6層小波包分解的頻段能量為鯽魚聲音信號樣本的最優(yōu)特征提取方法;Rank-SPXY(m=10)法為鯽魚聲音信號樣本的最優(yōu)樣本集劃分方法。對鯽魚聲音信號進(jìn)行特征提取后,采用Rank-SPXY(m=10)法劃分樣本集,然后進(jìn)行Z-score(標(biāo)準(zhǔn)分?jǐn)?shù))標(biāo)準(zhǔn)化預(yù)處理,并采用CARS法對樣本集進(jìn)行特征值優(yōu)選,最后建立鯽魚存活率MLR預(yù)測模型,回歸方程如下:
y=40.471-3.095x2+1.710x4-1.981x5-1.768x6+2.349x7-10.883x11+7.301x12-1.306x16-2.187x18+19.417x25+9.734x28+70.133x35-25.264x43-79.860x47-40.098x50+26.155x55-24.005x61+31.320x62
方程的參數(shù)及其顯著性見表9,其中,回歸常數(shù)項(xiàng)b=40.071,xi為鯽魚聲音信號經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后特征值,x1是指魚聲短時平均能量、x2是指魚聲短時平均過零率,xi中i≥3時為基于6層小波包分解的頻段能量,具體含義見表10,ai為各特征值的回歸系數(shù)。
表9回歸方程的參數(shù)及其顯著性
表10魚聲信號短時平均能量、短時平均過零率及魚六層分解頻段能量特征值
鯽魚存活率預(yù)測模型的相關(guān)系數(shù)R值為0.835,定標(biāo)標(biāo)準(zhǔn)差RMSECV值為10.096,說明模型具有較好的穩(wěn)定性和預(yù)測性。由表5可知,在x35、x47、x50處,回歸系數(shù)絕對值最大,其t值相對較大,P值均為0.000,說明這些特征值對預(yù)測模型的影響比較顯著,其分別代表了鯽魚聲音信號的特征頻段為256~264Hz、352~360Hz、376~384Hz。
7)預(yù)測存活率:對未知淡水魚樣本魚聲信號進(jìn)行檢測,并將魚聲樣本的特征向量經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后帶入到回歸方程中,計算出活魚條數(shù);
運(yùn)用所述步驟6)建立的回歸方程,對驗(yàn)證集中的274個鯽魚聲音樣本進(jìn)行預(yù)測。將274個鯽魚聲音樣本的18個特征值經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后帶入到回歸方程中,計算出活魚條數(shù)。部分鯽魚驗(yàn)證集的實(shí)際條數(shù)以及預(yù)測條數(shù)見表10。鯽魚存活率預(yù)測模型驗(yàn)證的相關(guān)系數(shù)R為0.816,校驗(yàn)標(biāo)準(zhǔn)差RMSEP值為8.015,相對分析誤差RPD值為1.79,說明該預(yù)測模型較可靠。
表11鯽魚存活率預(yù)測結(jié)果
由表11可知,靠近兩端(1條和50條)的樣本預(yù)測條數(shù)誤差較大,在12條左右;而中間的樣本預(yù)測條數(shù)誤差較小,在3條左右,模型精度有待進(jìn)一步提高。
實(shí)施例4鳊魚存活率預(yù)測模型
1)魚聲信號采集及消噪處理:分別在圖1中第一魚箱和第二魚箱中注入500L的水,水溫度為10~15℃,溶氧量為7-8mg/L,pH為7.2-7.5,將第一水聽器和第二水聽器布置在水面以下20cm處。將鯽魚放入1號魚箱中,鳊魚的活魚條數(shù)范圍為1-30條,最小魚水比為1:666,最大魚水比為1:21,靜置5min,待魚在水中比較穩(wěn)定時,設(shè)置聲學(xué)記錄儀進(jìn)行魚聲信號采集。
設(shè)置參數(shù)如下:采集時長:1min;采樣頻率:4000Hz;采集通道:雙通道;采集次數(shù):3次。鳊魚聲音信號樣本294個。
2)提取特征參數(shù):同實(shí)施例3;
3)構(gòu)建特征向量:同實(shí)施例3;
4)樣本集劃分:對步驟1)采集的鯽魚聲音信號樣本劃分為訓(xùn)練集和驗(yàn)證集,樣本數(shù)為294個。
采用了SPXY法和Rank-SPXY法將鳊魚聲音信號樣本集按照4:1的比例劃分為訓(xùn)練集和驗(yàn)證集,并進(jìn)行了分析比較,其中Rank-SPXY法的m分別取值為5和10。樣本集劃分結(jié)果如表12所示。
表12不同樣本集劃分方法劃分結(jié)果
由表12可知,采用SPXY法劃分的樣本集中,訓(xùn)練集和驗(yàn)證集的平均值和標(biāo)準(zhǔn)差均相差較大,而采用Rank-SPXY法劃分樣本集的平均值和標(biāo)準(zhǔn)差均相差不大,說明采用SPXY法劃分樣本集造成了劃分不均勻,而采用Rank-SPXY法對樣本集進(jìn)行劃分更加均勻。因此選擇Rank-SPXY法劃分鳊魚聲音信號樣本集更加合理。在采用Rank-SPXY法對樣本集進(jìn)行劃分時,通過比較m=5和m=10時驗(yàn)證集的標(biāo)準(zhǔn)差可知,采用m=10對樣本集的劃分更加均勻,但m值較大也會影響特征值的代表性。因此本實(shí)施例同時采用m兩種不同取值對鳊魚聲音信號樣本集進(jìn)行劃分。
5)特征值挑選、特征向量降維:對經(jīng)過步驟4)劃分樣本集的鯽魚聲音信號進(jìn)行Z-score(標(biāo)準(zhǔn)分?jǐn)?shù))標(biāo)準(zhǔn)化預(yù)處理,并采用運(yùn)用競爭自適應(yīng)重加權(quán)采樣(CARS)法對對鳊魚聲音信號樣本集進(jìn)行特征值優(yōu)選,并采用10折交叉驗(yàn)證選擇模型交叉驗(yàn)證均方差(RMSECV)值最小的特征值變量子集。
運(yùn)用MLR對特征頻率再次進(jìn)行優(yōu)選,MLR建模后,剔除不顯著的特征頻率段,得到魚聲信號特征頻段能量,對步驟3)特征向量降維,得到降維后的魚聲信號特征向量,優(yōu)選結(jié)果如表13所示。
表13鳊魚聲音信號特征值優(yōu)選結(jié)果
6)模型建立:對所述步驟5)降維后的魚聲信號特征向量,采用多元線性回歸(MLR)法和偏最小二乘(PLSR)法分別建立鳊魚存活率預(yù)測模型。預(yù)測模型的相關(guān)系數(shù)如表14所示。
表14預(yù)測模型相關(guān)系數(shù)
綜合上述的采用不同特征提取、不同樣本集劃分方法以及不同建模方法得到的建模結(jié)果可知,“7層+Rank-SPXY(m=5)”得到的樣本集建立MLR預(yù)測模型的相關(guān)系數(shù)最高,但計算量是“6層+Rank-SPXY(m=5)”時的二倍,因此本實(shí)施例選取短時平均能量和短時平均過零率以及基于6層小波包分解的頻段能量為鳊魚聲音信號樣本的最優(yōu)特征提取方法;Rank-SPXY(m=5)法為鳊魚聲音信號樣本的最優(yōu)樣本集劃分方法。對鳊魚聲音信號進(jìn)行特征提取后,采用Rank-SPXY(m=5)法劃分樣本集,然后進(jìn)行Z-score標(biāo)準(zhǔn)化預(yù)處理,并采用CARS法對樣本集進(jìn)行特征值優(yōu)選,最后建立鳊魚存活率MLR預(yù)測模型,回歸方程如下:
y=4.384+1.415x5+2.681x9+8.356x14+2.694x18-3.290x24
方程的參數(shù)及其顯著性見表15,其中,回歸常數(shù)項(xiàng)b=4.384,xi為鳊魚聲音信號經(jīng)預(yù)處理后的特征值,ai為各特征值的回歸系數(shù)。
表15鳊魚存活率預(yù)測模型的參數(shù)及其顯著性
鳊魚存活率模型的相關(guān)系數(shù)R值為0.894,定標(biāo)標(biāo)準(zhǔn)差RMSECV值為3.83,說明模型具有較好的穩(wěn)定性和預(yù)測性。由表4-10可知,在x9、x14、x18、x24處,回歸系數(shù)絕對值最大,其t值相對較大,P值最大為0.034,小于0.05,說明這些特征值對預(yù)測模型的影響比較顯著,其分別代表了鳊魚聲音信號的特征頻段為48~56Hz、88~96Hz、120~128Hz、168~178Hz。
7)預(yù)測存活率:對未知淡水魚樣本魚聲信號進(jìn)行檢測,并將魚聲樣本的特征向量經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后帶入到回歸方程中,計算出活魚條數(shù);
運(yùn)用步驟6)所建立的回歸方程,對驗(yàn)證集中60個鳊魚聲音樣本進(jìn)行預(yù)測。將60個鳊魚聲音樣本的5個特征值經(jīng)Z-score標(biāo)準(zhǔn)化預(yù)處理后帶入到回歸方程中,計算出活魚條數(shù)。部分鳊魚驗(yàn)證集的實(shí)際條數(shù)以及預(yù)測條數(shù)見表15。鳊魚存活率預(yù)測模型驗(yàn)證的相關(guān)系數(shù)R為0.865,校驗(yàn)標(biāo)準(zhǔn)差RMSEP值為4.54,相對分析誤差RPD值為2.01,說明該預(yù)測模型非常可靠。
表15鳊魚存活率預(yù)測結(jié)果
由表15可知,偏差最小為0條,最大為7條,這種誤差是由于噪音干擾造成,有待進(jìn)一步提高信號的信噪比,進(jìn)而提高模型的預(yù)測精度。
本實(shí)施例建立了淡水魚鳊魚存活率預(yù)測模型,運(yùn)用模型對驗(yàn)證集樣本進(jìn)行了預(yù)測,并研究了不同分解尺度的頻段分解以及不同樣本集劃分方法對存活率預(yù)測模型性能的影響,結(jié)果表明:采用“短時平均能量+短時平均過零率+6層小波包分解各頻段能量”提取特征結(jié)合Rank-SPXY(m=5)樣本劃分方法建立的鳊魚存活率預(yù)測模型預(yù)測性能最優(yōu)(R=0.894,RPD=2.01)。
上述的實(shí)施例僅為本發(fā)明的優(yōu)選技術(shù)方案,而不應(yīng)視為對于本發(fā)明的限制,本申請中的實(shí)施例及實(shí)施例中的特征在不沖突的情況下,可以相互任意組合。本發(fā)明的保護(hù)范圍應(yīng)以權(quán)利要求記載的技術(shù)方案,包括權(quán)利要求記載的技術(shù)方案中技術(shù)特征的等同替換方案為保護(hù)范圍。即在此范圍內(nèi)的等同替換改進(jìn),也在本發(fā)明的保護(hù)范圍之內(nèi)。