專利名稱:一種并-串聯(lián)模式識別方法及其在機(jī)器嗅覺中的應(yīng)用的制作方法
技術(shù)領(lǐng)域:
本發(fā)明為一種面向大規(guī)模學(xué)習(xí)問題的模式識別方法及其在機(jī)器嗅覺儀器實(shí)時(shí)確定大規(guī)模氣味類別與強(qiáng)度中的應(yīng)用,涉及任務(wù)分解、不平衡樣本集的虛擬平衡、并—串聯(lián)神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)與參數(shù)優(yōu)化、基于機(jī)器嗅覺的氣味類別與強(qiáng)度同時(shí)確定方法及其應(yīng)用。
背景技術(shù):
香料香精、酒類、卷煙、茶、大米、小麥、食用油等物品都有香氣這一項(xiàng)質(zhì)量檢驗(yàn)指標(biāo),目前的檢驗(yàn)“儀器”就是人的鼻子,描述香氣質(zhì)量好壞的無非是“正?!?、“純正”、“尚可”、“濃馥”等極其模糊的術(shù)語,難以做到科學(xué)、客觀與公正。本發(fā)明用性能彼此重疊的多個(gè)氣敏傳感器組成陣列模仿人鼻中的大量嗅感受器細(xì)胞,用神經(jīng)網(wǎng)絡(luò)模型模擬人的邏輯與形象思維方式,構(gòu)造智能化的機(jī)器嗅覺系統(tǒng)。本發(fā)明主要涉及面向大規(guī)模復(fù)雜氣味類別確定與香氣強(qiáng)度量化的模式識別理論和機(jī)器嗅覺實(shí)現(xiàn)方法,包括氣敏傳感器陣列技術(shù)、大規(guī)模學(xué)習(xí)任務(wù)分解、樣本虛擬平衡、分類器和函數(shù)逼近模型選擇與優(yōu)化、組合策略,目的在于用機(jī)器嗅覺儀器快速準(zhǔn)確地確定呈香物質(zhì)的香氣類別,量化香氣強(qiáng)度,從而建立香料香精、酒類、醬油、醋、食用油等物品香氣質(zhì)量量化評定體系,為香氣質(zhì)量評定與量化提供新的分析方法與裝置。
下面扼要介紹國家標(biāo)準(zhǔn)關(guān)于香料、濃香型白酒、大米、小麥、食用油的香氣評定方法和要求。
《香料—香氣評定法》GB/T14454.2-93(A)液體香料。用辨香紙分別蘸取容器內(nèi)試樣與標(biāo)準(zhǔn)樣品約1~2cm(兩者須接近等量),然后用嗅覺進(jìn)行評香。......。(B)固體香料。試樣和標(biāo)準(zhǔn)樣品可直接(或擦在清潔的手背上)進(jìn)行香氣評定。......。標(biāo)準(zhǔn)樣品由國家主管部門授權(quán)審發(fā),并根據(jù)不同產(chǎn)品的特性定期審換,一般為1年。香氣評定結(jié)果可用分?jǐn)?shù)表示(滿分40分)或選用純正(39.1~40.0分)、較純正(36.0~39.0分)、可以(32.0~35.9分)、尚可(28.0~31.9分)及格(24.0~27.9分)和不及格(24.0分以下)描述。
《濃香型白酒》GB10781.1-89香氣要求。(A)優(yōu)級具有濃郁的己酸乙酯為主體的復(fù)合香氣;(B)一級具有較濃郁的己酸乙酯為主體的復(fù)合香氣;(C)二級具有己酸乙酯為主體的復(fù)合香氣。
《大米》GB1354-86特等、標(biāo)準(zhǔn)一等、標(biāo)準(zhǔn)二等、標(biāo)準(zhǔn)三等均用氣味是否正常來作為檢驗(yàn)標(biāo)準(zhǔn)。《小麥》GB1351-1999用具有一批小麥的綜合氣味來度量。
《食用油》GB1535-86一級和二級具有大豆油固有的氣味和滋味,無異味;《芝麻香油》GB8233-87一級具有濃郁的芝麻油香味,無異味,二級具有顯著的芝麻油味,無異味?!陡呒壊俗雅胝{(diào)油》ZBX14011-87用氣味良好來度量;《濃香花生油》GB8615-88氣味正常,無異味。
綜上所述,我們可以看出,國家標(biāo)準(zhǔn)關(guān)于香氣質(zhì)量評定的術(shù)語是模糊的,評香師靠感官實(shí)際評定時(shí)很難做到科學(xué)、客觀與公正。人們通常用一種香氣來描述另一種香氣。例如,我們會說某種香氣像桔皮香氣或香蕉香氣,問題是什么是桔皮香氣或香蕉香氣又是什么香氣?這是一個(gè)非常難以說明的問題。同樣地,我們常用強(qiáng)烈、尖銳、芳香撲鼻等詞句來形容香氣的強(qiáng)度,但究競香到什么程度就又難以說明了。感官分析方法強(qiáng)調(diào)更多的是經(jīng)驗(yàn),某廠評了一輩子酒的一位老師傅曾多次將市售工業(yè)酒精加水配制的酒精溶液評為優(yōu)質(zhì)酒,感官方法的局限性由此可見一斑(參見秦含章,白酒釀造的科學(xué)與技術(shù),中國輕工業(yè)出版社,1997.5.)。
嗅覺是氣味刺激鼻腔內(nèi)嗅感受器細(xì)胞而在大腦中樞產(chǎn)生的一種復(fù)雜而模糊感覺,這種感覺不僅語言文字上的描述過于貧乏,而且受生理、心理等因素的影響難以做到評定結(jié)果的客觀與公正。人們對過去曾經(jīng)嗅聞過的香氣,僅能留存在記憶和想象中,不能通過數(shù)據(jù)和記錄作量化比較?,F(xiàn)在,人們已能用氣相色譜、色—質(zhì)聯(lián)用等分析方法測量氣味的化學(xué)組成,即使分離和測定幾十種乃至上百種組成成分也不再是難事,遺憾的是,化學(xué)成分與香氣類型和強(qiáng)度的關(guān)系還很少被人們理解和掌握。因此,人們期待用儀器來代替人對香氣類型與強(qiáng)弱等特征進(jìn)行客觀公正的評價(jià)和量化描述。正是在這種情況下,機(jī)器嗅覺方法日益受到人們的重視。
機(jī)器嗅覺研究的發(fā)展趨勢之一是追求氣敏器件的高靈敏度和高選擇性。隨著材料科學(xué)和制造工藝的進(jìn)步,目前,單個(gè)金屬氧化物半導(dǎo)體氣敏器件的靈敏度已達(dá)1.0×10-9V/V。機(jī)器嗅覺的生理學(xué)原型是,生物對氣味的辨別能力是大量嗅細(xì)胞、嗅神經(jīng)和大腦中樞共同作用的結(jié)果,是一種整體效應(yīng)。具體到人來說,一個(gè)鼻腔內(nèi)約有5.0×107個(gè)嗅感受器細(xì)胞,生存期僅22天左右,單個(gè)嗅細(xì)胞的靈敏度與選擇性并不高,但人卻能對多種氣味進(jìn)行辨別,據(jù)說有經(jīng)驗(yàn)的專家能辨別4,000多種氣味。人的這種能力絕不是靠單個(gè)嗅細(xì)胞就能實(shí)現(xiàn)的。值得注意的是,人對香氣香型與強(qiáng)弱等特征進(jìn)行評價(jià)時(shí)未必知道它們的組成及濃度,甚至評定人員自己未必具有分析化學(xué)等專業(yè)知識。從這個(gè)意義上講,人的嗅覺系統(tǒng)是機(jī)器嗅覺系統(tǒng)的一個(gè)很好的原型。機(jī)器嗅覺方法正是利用多個(gè)氣敏傳感器對復(fù)雜氣味的組成成分都有響應(yīng)卻又互不相同這一特點(diǎn),才得以借助多元數(shù)據(jù)分析方法對多種氣味進(jìn)行識別和整體質(zhì)量定性分析。因此,機(jī)器嗅覺研究的另一個(gè)主要發(fā)展趨勢是,在單個(gè)敏感器件具有必要的靈敏度和選擇性的前提下,用響應(yīng)范圍較寬且重疊的多個(gè)傳感器組成陣列,著重利用數(shù)據(jù)分析方法來提高測試系統(tǒng)的選擇性與重復(fù)性,并把傳感器陣列響應(yīng)這一多維信號轉(zhuǎn)換成與人的感官感受相一致的結(jié)果。這涉及到精密測量與控制、計(jì)算機(jī)、多元數(shù)據(jù)分析、分析化學(xué)、食品、香料香精等領(lǐng)域,具有重要的理論意義。
機(jī)器嗅覺技術(shù)的長處在于能快速準(zhǔn)確地對氣味進(jìn)行定性分析,可以憑香氣確定物品的類別、質(zhì)量等級、真假、新鮮程度、生產(chǎn)過程控制、配方調(diào)整等,部分代替人來做這些既艱苦又繁瑣的工作。例如,有毒有害氣味的監(jiān)測就可以讓機(jī)器嗅覺系統(tǒng)來做。1990年代中期之前,機(jī)器嗅覺研究主要集中在簡單氣味的類別與濃度估計(jì)上;今天,研究對象集中在氣味整體特征的分析與評價(jià)上。例如,奶制品腐敗過程監(jiān)測;水果和咖啡香氣質(zhì)量及成熟程度判定;水產(chǎn)品和肉制品新鮮程度確定;潔凈水與廢水區(qū)分;環(huán)境空氣有害物質(zhì)檢測;毒品識別;酒與茶質(zhì)量評定;疾病診斷,等等。若能做到不需要濃縮、冷凝等繁瑣的預(yù)處理過程,且使用條件不苛刻,機(jī)器嗅覺技術(shù)的應(yīng)用前景將十分廣闊。
現(xiàn)在,機(jī)器嗅覺技術(shù)的能力還十分有限,大多數(shù)研究還處于實(shí)驗(yàn)室階段。法國的αFOX智能電子鼻和英國的AROMA-Scan氣味掃描儀近幾年進(jìn)入我國市場后沒有站住腳這一事實(shí)說明,機(jī)器嗅覺理論與實(shí)踐還有待于進(jìn)一步發(fā)展與完善。與機(jī)器嗅覺有關(guān)的文獻(xiàn)檢索和專利查新結(jié)果如下(1)文獻(xiàn)。1990年以前只有60多篇,到2000年為500多篇,截止到現(xiàn)在已達(dá)1,500多篇。這說明機(jī)器嗅覺的實(shí)質(zhì)性研究工作是近幾年才展開的。(2)專利。所有20多項(xiàng)專利都是20世紀(jì)90年代中期以后申請的,顯示國際上已開始重視機(jī)器嗅覺領(lǐng)域的知識產(chǎn)權(quán)保護(hù)。(3)技術(shù)標(biāo)準(zhǔn)。通過對IHS國際標(biāo)準(zhǔn)數(shù)據(jù)庫進(jìn)行檢索,未發(fā)現(xiàn)與機(jī)器嗅覺有關(guān)的產(chǎn)品技術(shù)標(biāo)準(zhǔn),表明機(jī)器嗅覺技術(shù)的研究還有待深入和成熟。國內(nèi)的浙江大學(xué)、大連理工大學(xué)、復(fù)旦大學(xué)、中科院電子所、吉林大學(xué)等單位近幾年也開展了這方面的研究。截止到現(xiàn)在,國內(nèi)發(fā)表的機(jī)器嗅覺相關(guān)論文僅100余篇,這說明國內(nèi)對機(jī)器嗅覺相關(guān)理論與應(yīng)用研究還有待于進(jìn)一步深入。
對氣味的類別進(jìn)行判斷是必要的,根據(jù)香料香精、食品、環(huán)保等行業(yè)的實(shí)際情況,更重要的是對多種復(fù)雜氣味類別、強(qiáng)度和關(guān)鍵成分的同時(shí)估計(jì)。這種同時(shí)估計(jì)問題僅靠提高傳感器的選擇性是無法解決的。例如,釀造酒的主體香成分有50種左右,如果酒的香氣變了,人們要求機(jī)器嗅覺方法能判斷是哪些成分發(fā)生了變化,變化了多少。實(shí)際生活中,屬于這一類型的問題很多,如香精香型和強(qiáng)度與配方的關(guān)系;裝修涂料乃至空氣質(zhì)量與甲醛、苯、總揮發(fā)性有機(jī)物的關(guān)系;等等。這些問題的數(shù)學(xué)涵義是,在傳感器陣列響應(yīng)這一高維測量空間里,一種復(fù)雜氣味的強(qiáng)度與某一成分含量的函數(shù)關(guān)系是一條復(fù)雜曲線,與兩種及其以上成分含量的函數(shù)關(guān)系是一個(gè)復(fù)雜曲面;多種復(fù)雜氣味的強(qiáng)度與某一成分的函數(shù)關(guān)系是多條復(fù)雜曲線,與兩種及其以上成分的函數(shù)關(guān)系是多個(gè)復(fù)雜曲面,而且,這些復(fù)雜曲線或曲面可能相交。可以想象,解決多種香料香精、多種釀制品等諸如此類的復(fù)雜氣味類別、強(qiáng)度和關(guān)鍵成分同時(shí)估計(jì)問題,包括神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)在內(nèi)的多元數(shù)據(jù)分析方法將面臨極大的困難和挑戰(zhàn)。
解決大規(guī)模復(fù)雜氣味類別與強(qiáng)度的同時(shí)確定問題可以有以下三種途徑 (A)將這種同時(shí)估計(jì)問題看成多輸入多輸出分類問題。這種做法是把一種氣味的一個(gè)濃度點(diǎn)看成一個(gè)類別,分類器的輸出單元與濃度點(diǎn)一一對應(yīng)。當(dāng)氣味種類和濃度很多時(shí),分類器的輸出單元也很多。這樣一來,分類器結(jié)構(gòu)往往很龐大,學(xué)習(xí)時(shí)間很長。更重要的是,這種處理方法無法有效解決新出現(xiàn)濃度點(diǎn)的預(yù)測問題。例如,若一個(gè)樣本恰好位于兩個(gè)已知濃度點(diǎn)的中間,怎么辦?因此,這種分析方法只適用于氣味類別數(shù)與濃度點(diǎn)較少的場合。面對多種復(fù)雜氣味類別與強(qiáng)度量化這樣的高維大樣本多類別分類問題,需要提出有效的任務(wù)分解方法、分類器結(jié)構(gòu)優(yōu)化方法與快速學(xué)習(xí)算法。
(B)將這種同時(shí)估計(jì)問題看成多輸入多輸出函數(shù)逼近問題。這種處理方式首先遇到的一個(gè)問題是,在定義域內(nèi),對任意一個(gè)輸入向量,無論是多個(gè)多對一函數(shù)逼近模型還是一個(gè)多對多函數(shù)逼近模型都將會給出多個(gè)預(yù)測輸出。如果一個(gè)輸出單元代表一種氣味及其強(qiáng)度,我們能說一個(gè)待定樣品既可能是某種強(qiáng)度的某種氣味,又可能是另一種強(qiáng)度的某種氣味嗎?例如,對一個(gè)樣本x,那個(gè)代表甲醇的逼近模型輸出單元說它是100ppm(百萬分之一)的甲醇,另一個(gè)代表乙醇的輸出單元說它是1000ppm的乙醇,這樣的結(jié)果顯然是十分荒謬的。20世紀(jì)90年代初出現(xiàn)的分類器集成模型及其組合策略為提高分類器的推廣能力開辟了新的途徑,但是,不僅最大、最小、平均、積、和、大多數(shù)投票等規(guī)則不能直接應(yīng)用于函數(shù)逼近模型的組合,而且線性和二次等“弱”多元多項(xiàng)式模型的逼近能力也不夠。為此,我們必須對適當(dāng)階次的多元多項(xiàng)式、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等模型的逼近能力進(jìn)行研究,提出函數(shù)逼近集成模型和新的組合策略。發(fā)明人在這方面已做了一些開創(chuàng)性的工作(參見發(fā)明專利ZL03141537.7一種基于模塊化組合神經(jīng)網(wǎng)絡(luò)的機(jī)器嗅覺氣味識別方法和發(fā)明專利200610023183.4機(jī)器嗅覺氣味類別與強(qiáng)度同時(shí)確定方法<公開號1801136>)。
(C)將這種同時(shí)估計(jì)問題看成多輸入多輸出分類與函數(shù)逼近串聯(lián)問題。這種方法是先確定一個(gè)樣本的類別,然后確定它的強(qiáng)度。由于異構(gòu)、手性、極性、官能團(tuán)等現(xiàn)象的存在,結(jié)構(gòu)相似的成分可能有完全不同的氣味,反之亦然。也就是說,測量空間相鄰的樣本可能屬于完全不同的類別,測量空間相距很遠(yuǎn)的樣本又有可能屬于同一類別。再考慮到多種復(fù)雜氣味強(qiáng)度與兩種及其以上成分的函數(shù)關(guān)系是多個(gè)復(fù)雜曲面這一影響因素,一種氣味在測量空間形成的分布區(qū)域?qū)⑹謴?fù)雜,給分類器設(shè)計(jì)帶來很大困難。該方法遇到的另一個(gè)問題是過擬合,因而實(shí)際預(yù)測精度并不理想。
因此,解決多種復(fù)雜氣味類別、強(qiáng)度和關(guān)鍵成分同時(shí)估計(jì)問題涉及特征提取、大規(guī)模學(xué)習(xí)任務(wù)分解、不平衡樣本集的虛擬平衡、分類器選擇與結(jié)構(gòu)優(yōu)化、函數(shù)逼近模型選擇與結(jié)構(gòu)優(yōu)化、組合策略等內(nèi)容,既具有重要的理論意義,又具有廣闊的應(yīng)用前景,是本發(fā)明的重點(diǎn)。這一問題的解決不僅將使機(jī)器嗅覺方法具有同時(shí)確定多種復(fù)雜氣味的香型與強(qiáng)度的能力,而且給圖像類別及其大小與顏色深淺、語音類別及其強(qiáng)弱等需要同時(shí)確定類別與“位置”的應(yīng)用領(lǐng)域提供有效的解決方法。
綜上所述,本發(fā)明以香料香精、釀造酒、醬油的質(zhì)量評定為應(yīng)用背景,重點(diǎn)研究面向大規(guī)模復(fù)雜氣味類別與強(qiáng)度量化問題的模式識別模型和機(jī)器嗅覺實(shí)現(xiàn)方法,建立基于機(jī)器嗅覺的香氣質(zhì)量量化評價(jià)體系,具有重要的理論意義和廣闊的應(yīng)用前景。
發(fā)明專利《一種嗅覺模擬裝置及其嗅覺模擬測試方法》(批準(zhǔn)號ZL02111046.8)和《一種小型自動(dòng)化機(jī)器嗅覺儀器與氣味分析方法》(申請?zhí)?00710036264.4)使用機(jī)器嗅覺裝置檢測氣味,得到多維響應(yīng)信號,沒有涉及氣味類別、強(qiáng)度或關(guān)鍵成分濃度問題。發(fā)明專利《一種基于模塊化組合神經(jīng)網(wǎng)絡(luò)的機(jī)器嗅覺氣味識別方法》(批準(zhǔn)號ZL03141537.7)將濃度估計(jì)問題轉(zhuǎn)化為分類問題,沒有涉及氣味類別與濃度的同時(shí)估計(jì)問題。發(fā)明專利《機(jī)器嗅覺氣味類別與強(qiáng)度同時(shí)確定方法》(申請?zhí)?00610023183.4,公開號1801136)將多種氣味類別與強(qiáng)度的同時(shí)確定問題看成是多個(gè)函數(shù)逼近問題,并由多個(gè)函數(shù)逼近模型集合體一一加以解決,其缺點(diǎn)是,多個(gè)函數(shù)逼近模型集合體結(jié)構(gòu)過于復(fù)雜,待定參數(shù)過多,分類和強(qiáng)度估計(jì)精度不夠高。本發(fā)明克服了上述缺點(diǎn)。
發(fā)明內(nèi)容
本發(fā)明是在現(xiàn)有的《一種基于模塊化組合神經(jīng)網(wǎng)絡(luò)的機(jī)器嗅覺氣味識別方法》(參見專利批準(zhǔn)號ZL03141537.7)、《機(jī)器嗅覺氣味類別與強(qiáng)度同時(shí)確定方法》(參見專利申請?zhí)?00610023183.4)和《一種小型自動(dòng)化機(jī)器嗅覺儀器與氣味分析方法》(參見專利申請?zhí)?00710036264.4)的基礎(chǔ)上,為了使機(jī)器嗅覺儀器能夠?qū)Υ笠?guī)模復(fù)雜氣味的類別、強(qiáng)度和關(guān)鍵成分同時(shí)估計(jì)而提出的一種基于并—串聯(lián)神經(jīng)網(wǎng)絡(luò)的模式識別方法。本發(fā)明提出的模式識別模型具有學(xué)習(xí)速度快、推廣性能好、結(jié)構(gòu)簡單、待定參數(shù)少、分類正確率高、氣味強(qiáng)度和關(guān)鍵成分預(yù)測精度高的優(yōu)點(diǎn)。
機(jī)器嗅覺儀器的分析對象是大量液態(tài)、固態(tài)、膏狀物質(zhì)產(chǎn)生的頂空揮發(fā)氣樣品,或常溫下的氣態(tài)樣品。這些頂空揮發(fā)氣或氣態(tài)樣品既可以是單一化學(xué)成分的,也可以是由復(fù)雜化學(xué)成分組成的。這些樣品來自于多種氣味,而且,來自于同一氣味的多個(gè)樣品其濃度是變化的。機(jī)器嗅覺儀器用氣敏傳感器陣列對大規(guī)模氣味樣品進(jìn)行測量,得到大量高維響應(yīng)向量或?qū)W習(xí)樣本,即得到大規(guī)模訓(xùn)練集。這些訓(xùn)練集用于確定模式識別模型的結(jié)構(gòu)和參數(shù)。在結(jié)構(gòu)和參數(shù)確定之后,根據(jù)氣敏傳感器陣列產(chǎn)生的高維響應(yīng)向量,模式識別模型可以迅速確定一個(gè)氣味樣品的類別、強(qiáng)度和關(guān)鍵成分濃度。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案之一是 模式識別模型是一個(gè)兩層串聯(lián)結(jié)構(gòu)。第一層為分類器層,用于確定一個(gè)待測樣品的類別;第二層是函數(shù)逼近模型層,用于確定一個(gè)待測樣品的強(qiáng)度或關(guān)鍵化學(xué)成分濃度。
設(shè)機(jī)器嗅覺儀器用m個(gè)氣敏傳感器組成的陣列測量了N個(gè)氣味樣品,則得到N行m列的響應(yīng)矩陣X∈RN×m,稱之為原始訓(xùn)練集,即X的樣本數(shù)為N,維數(shù)為m,來自于n種氣味{ω1,...,ωj,....,ωn},或X={X(1),X(2),...,X(j),...,X(n)}。
本發(fā)明采用的技術(shù)方案之二是第一層—分類器層由多個(gè)單輸出單隱層神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成。一個(gè)單輸出單隱層神經(jīng)網(wǎng)絡(luò)分類器j代表一種氣味ωj,通過學(xué)習(xí)形成復(fù)雜決策邊界,以便將所代表的氣味樣本X(j)與所有其他類別的樣本X(~j)分開。n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)與n種氣味一一對應(yīng)。為此,本發(fā)明將一個(gè)n種氣味識別問題轉(zhuǎn)化為n個(gè)兩種氣味識別問題,也就是將一個(gè)n類問題{ω1,...,ωj,...,ωn}轉(zhuǎn)化為n個(gè)兩類問題{ωj,~ωj),j=1,2,...,n。
本發(fā)明采用的技術(shù)方案之三是第二層—函數(shù)逼近模型層由多個(gè)單輸出單隱層神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,一個(gè)單輸出單隱層神經(jīng)網(wǎng)絡(luò)逼近模型j代表一種氣味ωj,通過學(xué)習(xí)擬合氣敏傳感器陣列的響應(yīng)X(j)與所代表的氣味的強(qiáng)度和關(guān)鍵成分濃度C(j)之間的非線性關(guān)系。n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)與n種氣味一一對應(yīng)。為此,本發(fā)明將一個(gè)n種氣味的強(qiáng)度估計(jì)問題轉(zhuǎn)化為n個(gè)多輸入—單輸出函數(shù)逼近問題,也就是將一個(gè)m輸入n輸出函數(shù)逼近問題{X,C}∈RN×(m+n)轉(zhuǎn)化為n個(gè)m輸入—單輸出函數(shù)逼近問題{X(j),C(j)}∈RNj×(m+1),j=1,2,...,n。這里,C∈RN×n為期望濃度矩陣,C(j)∈RN×1為氣味ωj的期望濃度向量。
分類器層和函數(shù)逼近模型層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)均通過學(xué)習(xí)機(jī)器嗅覺儀器對大量氣味樣品的測量而得到的訓(xùn)練樣本集所決定。
本發(fā)明采用的技術(shù)方案之四是一個(gè)單輸出單隱層神經(jīng)網(wǎng)絡(luò)分類器j通過以下步驟確定其結(jié)構(gòu)和參數(shù) (1)形成最經(jīng)濟(jì)的訓(xùn)練子集Ξ(j),包括如下步驟 (1-a)產(chǎn)生一個(gè)初始超維斜橢球Θj0。Θj0的中心μj與X(j)的均值重合,其大小rmac(j)以恰好把來自氣味ωj的所有訓(xùn)練樣本X(j)包圍在內(nèi)為準(zhǔn)。
(1-b)計(jì)算被包含在Θj0內(nèi)且來自于~ωj的訓(xùn)練樣本數(shù)N~j0。
(1-c)確定擴(kuò)展超維斜橢球Θj的半徑Rmin(j)。被包含在Θj0內(nèi)且來自于~ωj的樣本數(shù)N~j0越少,則Θj越大;反之,Θj越小。
(1-d)生成最終的訓(xùn)練子集Ξ(j),由包含在Θj內(nèi)的所有樣本X(j)和X(~j)組成。
(2)選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)分類器j的輸入節(jié)點(diǎn)數(shù)為m,隱節(jié)點(diǎn)數(shù)為
輸出節(jié)點(diǎn)數(shù)為1,隱節(jié)點(diǎn)和輸出節(jié)點(diǎn)的活化函數(shù)為3(1+exp(-_/3))-1,輸入分量成比例變化到
的范圍內(nèi),目標(biāo)輸出dp(j)采用{0,3)編碼,在第τ個(gè)迭代步的平均平方和誤差為Ej(τ)。
(3)確定權(quán)值修正方式。神經(jīng)網(wǎng)絡(luò)j采用批學(xué)習(xí)方式。在解決一個(gè)兩類問題Ξ(j)={X(j),X(~j)}時(shí),對應(yīng)于來自較小類別的樣本xp(j),權(quán)值修正分量Δw(j)(τ)等于誤差梯度分量_Ej(τ)/_wp(j)(τ)乘以一個(gè)放大因子λj=N~j/Nj;反之,權(quán)值修正分量Δw(j)(τ)等于_Ej(τ)/_wp(j)(τ)。
(4)修正神經(jīng)網(wǎng)絡(luò)的實(shí)際輸出。如果樣本xp在初始斜橢球Θj0之外,神經(jīng)網(wǎng)絡(luò)分類器j的實(shí)際輸出yp(j)被乘以一個(gè)與斜橢球中心μj和Mahalanobis半徑rmax(j)j、Rmin(j)有關(guān)的修正量,否則yp(j)保持不變。
(5)重復(fù)(1)~(4),直到n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)分類器的結(jié)構(gòu)與參數(shù)都被確定為止。
本發(fā)明采用的技術(shù)方案之五是一個(gè)單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j通過以下步驟確定其結(jié)構(gòu)和參數(shù) (1)任務(wù)分解,形成學(xué)習(xí)樣本子集{X(j),c(j))。在將一個(gè)n種氣味的強(qiáng)度估計(jì)問題轉(zhuǎn)化為n個(gè)函數(shù)逼近問題后,神經(jīng)網(wǎng)絡(luò)j的訓(xùn)練子集只有來自氣味ωj的Nj個(gè)樣本所組成,即{X(j),C(j)}∈RNj×(m+1)。C(j)為氣味ωJ的期望濃度向量。
(2)數(shù)據(jù)預(yù)處理。輸入特征分量等于氣敏傳感器的響應(yīng)(電壓值)成比例變換到
的范圍內(nèi),期望輸出tp(j)為先取氣味濃度cp(j)(ppm)的常用對數(shù)值lg(cp(j)),然后成比例變換到
的范圍內(nèi),即如果(去離子水的頂空揮發(fā)氣濃度),定義 (3)選擇神經(jīng)網(wǎng)絡(luò)j的結(jié)構(gòu)和活化函數(shù)。單隱層神經(jīng)網(wǎng)絡(luò)j結(jié)構(gòu)為m-s-1,隱節(jié)點(diǎn)數(shù)由公式
確定,隱單元和輸出單元的活化函數(shù)均為f(_)=3(1+exp(-_/3))-1。
(4)確定權(quán)值修正方式。神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j采用誤差反傳學(xué)習(xí)算法、鏈?zhǔn)角髮?dǎo)規(guī)則和批學(xué)習(xí)方式,輸入單元i(i=0,1,2,...,m)與隱單元h(h=0,1,2,...,s)之間權(quán)值whi(j)和隱單元h與輸出單元j之間權(quán)值wjh通過學(xué)習(xí)確定。神經(jīng)網(wǎng)絡(luò)j實(shí)際輸出的數(shù)學(xué)表達(dá)式為 這里,xpi(j)為氣味ωj中第p個(gè)樣本的第i個(gè)輸入分量。
(5)重復(fù)(1)~(4),直到n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型的結(jié)構(gòu)與參數(shù)都被確定為止。
本發(fā)明采用的技術(shù)方案之六是對一個(gè)類別與強(qiáng)度待定的樣本xp,其類別由分類器層輸出值最大的單輸出神經(jīng)網(wǎng)絡(luò)j所確定,然后,其強(qiáng)度由函數(shù)逼近模型層對應(yīng)的單輸出神經(jīng)網(wǎng)絡(luò)j所確定。也就是說,第一層的所有n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)都要給出自己關(guān)于xp的類別預(yù)測,xp屬于輸出最大的神經(jīng)網(wǎng)絡(luò)分類器j所代表的氣味;在xp的類別由第一層輸出值最大的神經(jīng)網(wǎng)絡(luò)分類器j確定之后,其強(qiáng)度只需要第二層第j個(gè)單輸出神經(jīng)網(wǎng)絡(luò)逼近模型給出預(yù)測即可。
由于本發(fā)明采用了以上技術(shù)方案,因此具有以下的效果 1.解決了機(jī)器嗅覺技術(shù)對大規(guī)模氣味類別與強(qiáng)度同時(shí)確定所面臨的模式識別問題。
2.與函數(shù)逼近模型集合體相比,本發(fā)明提出的并—串聯(lián)神經(jīng)網(wǎng)絡(luò)模型具有結(jié)構(gòu)簡單、學(xué)習(xí)速度快、推廣能力強(qiáng)、分類和強(qiáng)度預(yù)測精度高的優(yōu)點(diǎn)。
3.發(fā)展了任務(wù)分解方法,建立了簡單有效的最經(jīng)濟(jì)訓(xùn)練子集的確定方法。
4.解決了一對多的任務(wù)分解方法產(chǎn)生的樣本不平衡問題,從而使得單輸出神經(jīng)網(wǎng)絡(luò)分類器具有良好的推廣性能。
圖1是本發(fā)明-一種并-串聯(lián)模式識別方法及其在機(jī)器嗅覺中的應(yīng)用,將氣味樣品轉(zhuǎn)換為訓(xùn)練和測試樣本的機(jī)器嗅覺儀器結(jié)構(gòu)示意圖。該機(jī)器嗅覺儀器組成單元為,測試箱1、恒溫杯2、自動(dòng)進(jìn)樣升降機(jī)構(gòu)3、計(jì)算機(jī)與顯示器4、氧氣或干燥空氣瓶5。詳細(xì)說明請參見發(fā)明專利《一種小型自動(dòng)化機(jī)器嗅覺儀器與氣味分析方法》(申請?zhí)?00710036260.4)。
圖2是本發(fā)明-一種機(jī)器嗅覺儀器對一個(gè)氣味樣品進(jìn)行測試以得到一個(gè)響應(yīng)分量的工作流程圖,包括環(huán)境空氣大流量沖洗(傳感器初步恢復(fù))、氧氣小流量沖洗(傳感器精密標(biāo)定)、平衡、頂空采樣(傳感器響應(yīng))、環(huán)境空氣小流量沖洗(傳感器初步恢復(fù))并給出被測氣味類別、強(qiáng)度及關(guān)鍵成分含量的分析結(jié)果、環(huán)境空氣大流量沖洗(傳感器初步恢復(fù))這些步驟。詳細(xì)說明請參見發(fā)明專利《一種小型自動(dòng)化機(jī)器嗅覺儀器與氣味分析方法》(申請?zhí)?00710036260.4)。
圖3是本發(fā)明一機(jī)器嗅覺儀器的其中一個(gè)氣敏傳感器對去離子水、0.1ppm甲苯、1.0ppm甲苯頂空揮發(fā)氣的響應(yīng)曲線(電壓值),數(shù)據(jù)記錄從平衡狀態(tài)開始直至大流量環(huán)境空氣沖洗50秒止。
圖4是本發(fā)明-一種機(jī)器嗅覺儀器中的氣敏傳感器陣列(由16個(gè)氣敏傳感器組成)分別對1.0ppm甲苯頂空揮發(fā)氣測試而得到的響應(yīng)樣本直方圖(電壓最大值)。
圖5是本發(fā)明-一種機(jī)器嗅覺儀器中的氣敏傳感器陣列(由16個(gè)氣敏傳感器組成)分別對0.1ppm甲苯頂空揮發(fā)氣測試而得到的響應(yīng)樣本直方圖(電壓最大值)。
圖6是本發(fā)明-一種機(jī)器嗅覺儀器中的氣敏傳感器陣列(由16個(gè)氣敏傳感器組成)分別對去離子水、0.1ppm甲苯、1.0ppm甲苯頂空揮發(fā)氣的測試而得到的響應(yīng)樣本直方圖(電壓最大值)。
圖7是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)神經(jīng)網(wǎng)絡(luò)模式識別模型結(jié)構(gòu)圖。
圖8是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法的第一層-神經(jīng)網(wǎng)絡(luò)分類器層的結(jié)構(gòu)設(shè)計(jì)過程。
圖9是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法的第二層-神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型層的結(jié)構(gòu)設(shè)計(jì)過程。
圖10是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,在設(shè)計(jì)第一層-神經(jīng)網(wǎng)絡(luò)分類器層的結(jié)構(gòu)時(shí),任務(wù)分解和最經(jīng)濟(jì)訓(xùn)練子集的確定過程。
圖11是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,并-串聯(lián)神經(jīng)網(wǎng)絡(luò)模型的決策過程。
圖12是本發(fā)明-一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,一個(gè)應(yīng)用實(shí)例-機(jī)器嗅覺儀器對4種液體呈香物質(zhì)共1050個(gè)樣品頂空揮發(fā)氣響應(yīng)數(shù)據(jù)陣的主成分分析圖。
具體實(shí)施例方式 下面結(jié)合附圖對本發(fā)明作進(jìn)一步的詳細(xì)描述。
本發(fā)明對氣味測試用的機(jī)器嗅覺儀器結(jié)構(gòu)如附圖1所示,其特點(diǎn)是,由測試箱1、恒溫杯2、自動(dòng)進(jìn)樣升降機(jī)構(gòu)3、計(jì)算機(jī)與顯示器4、氧氣或干燥空氣瓶5共5大部分所組成。本發(fā)明主要解決附圖1右邊虛框內(nèi)的模式識別問題。
請參見附圖1和附圖2,為了對大規(guī)模氣味進(jìn)行類別判斷和強(qiáng)度估計(jì),一種機(jī)器嗅覺儀器對氣味的測試包括如下步驟 a,開機(jī),儀器預(yù)熱30分鐘時(shí),計(jì)算機(jī)將氣敏傳感器對環(huán)境空氣的響應(yīng)狀態(tài)記為初始狀態(tài)。
b,操作人員將10毫升液態(tài)、膏狀或固態(tài)樣品放入容積為150毫升的玻璃試瓶內(nèi),蓋上硅橡膠瓶蓋。
c,操作人員將玻璃試瓶放入恒溫杯內(nèi),按下計(jì)時(shí)鍵,樣品開始加熱,計(jì)算機(jī)開始計(jì)時(shí)。被測樣品在加熱元件的作用下,準(zhǔn)確恒溫30分鐘。
d,在恒溫30分鐘后,計(jì)算機(jī)發(fā)出指令,自動(dòng)進(jìn)樣升降機(jī)構(gòu)使恒溫杯上升,固定在測試箱上的進(jìn)樣針因此穿過硅橡膠瓶蓋,接觸到頂空揮發(fā)氣。
e,在電磁閥的作用下,頂空揮發(fā)氣進(jìn)氣管道打開,氧氣和環(huán)境進(jìn)氣管道斷開,流量計(jì)開始計(jì)量。微型真空泵將頂空揮發(fā)氣吸入氣敏傳感器陣列環(huán)形工作室,使之迅速掠過傳感器敏感膜表面后從排氣口排出。當(dāng)頂空揮發(fā)氣累積采樣量達(dá)到50毫升時(shí),采樣進(jìn)氣管道斷開,采樣過程結(jié)束。然后,環(huán)境空氣小流量進(jìn)入,傳感器進(jìn)入初步恢復(fù)階段。
f,各個(gè)氣敏傳感器對被測氣味因此產(chǎn)生敏感響應(yīng),這些敏感響應(yīng)通過高精度數(shù)據(jù)采集卡得到一個(gè)量化的多維響應(yīng)向量; g,該向量經(jīng)計(jì)算機(jī)數(shù)據(jù)處理后,10秒之內(nèi)即可得到被測氣味的類別、整體強(qiáng)度或簡單成分氣體濃度估計(jì)值,并通過顯示器顯示出來。
h,氣味分析結(jié)果顯示后,操作人員取走恒溫杯,環(huán)境空氣通過進(jìn)樣針大流量進(jìn)入環(huán)形傳感器工作室。操作人員為下一次測量做準(zhǔn)備。
i,重復(fù)b~h,進(jìn)行多次采樣,一個(gè)完整的采樣過程持續(xù)290秒。
除步驟b、c和h外,整個(gè)操作過程由儀器自動(dòng)完成,從而有效避免了人為操作誤差的影響。機(jī)器嗅覺儀器通過對氣味樣品的一次測量,得到一個(gè)維數(shù)為m的響應(yīng)向量即氣味樣本。
請參見附圖3,機(jī)器嗅覺儀器中的一個(gè)氣敏傳感器對去離子水、0.1ppm甲苯、1.0ppm甲苯揮發(fā)氣的響應(yīng)曲線。根據(jù)附圖3,同一個(gè)氣敏傳感器對來自同一種氣味但濃度變化的樣品的響應(yīng)曲線可能是變化的。
請參見附圖4、附圖5和附圖6,取氣敏傳感器陣列對多個(gè)氣味樣品響應(yīng)曲線的最大值,可得到氣敏傳感器陣列對去離子水、0.1ppm甲苯、1.0ppm甲苯揮發(fā)氣多個(gè)響應(yīng)向量的直方圖。顯然,由于三者濃度不同,相應(yīng)的響應(yīng)向量之間的差異是顯著的,這些差異就是模式識別方法對氣味類別與濃度進(jìn)行估計(jì)的依據(jù)。
請參見附圖7,根據(jù)一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并一串聯(lián)模式識別方法,本發(fā)明提出了一種并—聯(lián)模式識別模型。其中,第一層—分類器層由n個(gè)單輸出的單隱層神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,與n種氣味一一對應(yīng),用于確定氣味類別;第二層—函數(shù)逼近模型層由n個(gè)單輸出的單隱層神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,與n種氣味一一對應(yīng),用于確定氣味強(qiáng)度及其關(guān)鍵成分的濃度。
請參見附圖8,根據(jù)一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并—串聯(lián)模式識別方法,本發(fā)明提出了第一層—分類器層各單輸出神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)過程。一個(gè)單輸出神經(jīng)網(wǎng)絡(luò)代表一種氣味。根據(jù)附圖8,一個(gè)單輸出神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)形成決策邊界,負(fù)責(zé)將所代表的氣味與所有其他氣味分開。經(jīng)過任務(wù)分解1,原始訓(xùn)練集X被分解為n個(gè)訓(xùn)練子集,用于確定n個(gè)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù)。一個(gè)訓(xùn)練子集只由來自于被代表氣味的樣本和與之相鄰的來自于其他氣味的部分樣本所組成。
請參見附圖9,根據(jù)一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,本發(fā)明提出了第二層一函數(shù)逼近模型層各單輸出神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)過程。一個(gè)單輸出神經(jīng)網(wǎng)絡(luò)代表一種氣味。根據(jù)附圖9,一個(gè)單輸出神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)擬合傳感器陣列響應(yīng)與所代表氣味強(qiáng)度和關(guān)鍵成分濃度之間的函數(shù)關(guān)系。經(jīng)過任務(wù)分解2,原始訓(xùn)練集X被分解為n個(gè)訓(xùn)練子集,用于確定n個(gè)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與參數(shù)。一個(gè)訓(xùn)練子集只由來自于被代表氣味的樣本所組成。
請參見附圖10,根據(jù)一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,本發(fā)明提出了確定在單輸出神經(jīng)網(wǎng)絡(luò)分類器j的結(jié)構(gòu)與參數(shù)時(shí),訓(xùn)練子集Ξ(j)的形成過程。根據(jù)附圖10a,我們首先生成一個(gè)超維斜橢球Θj0。Θj0以來自氣味ωj的訓(xùn)練樣本X(j)的均值μj為中心,其大小由恰好將X(j)全部包圍所確定。與此同時(shí),在Θj0內(nèi),肯定也有來自其他氣味~ωj的訓(xùn)練樣本。請參見附圖10b,根據(jù)Θj0內(nèi)來自氣味ωj和來自~ωj的樣本數(shù)之比,我們由Θj0產(chǎn)生一個(gè)擴(kuò)展斜橢球Θj。Θj與Θj0的中心相同,所有半軸的方向也相同。訓(xùn)練子集Ξ(j)由被包含在Θj內(nèi)的所有樣本所組成。
請參見附圖11,根據(jù)一種面向大規(guī)模氣味類別與強(qiáng)度同時(shí)確定的并-串聯(lián)模式識別方法,本發(fā)明提出了并-串聯(lián)神經(jīng)網(wǎng)絡(luò)模型的決策過程。對一個(gè)待定樣本x,其類別由第一層n個(gè)分類器中輸出最大的神經(jīng)網(wǎng)絡(luò)所確定。設(shè)第j個(gè)神經(jīng)網(wǎng)絡(luò)分類器的輸出為最大,則x屬于氣味ωj;隨后,x的強(qiáng)度和關(guān)鍵成分濃度僅由第二層對應(yīng)的第j個(gè)神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型所確定。因此,為了確定一個(gè)待定樣本的類別與強(qiáng)度,第一層所有n個(gè)神經(jīng)網(wǎng)絡(luò)分類器均須參加決策,但第二層只須一個(gè)神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型參加決策即可。
利用本發(fā)明,機(jī)器嗅覺方法可有效解決成千上萬種氣味類別與強(qiáng)度的同時(shí)估計(jì)問題。與發(fā)明專利《一種基于模塊化組合神經(jīng)網(wǎng)絡(luò)的機(jī)器嗅覺氣味識別方法》(申請?zhí)?3141537.7)和《機(jī)器嗅覺氣味類別與強(qiáng)度同時(shí)確定方法》(申請?zhí)?00610023183.4)相比,本發(fā)明提出的并一串聯(lián)模式識別模型具有結(jié)構(gòu)簡單、待定參數(shù)少、學(xué)習(xí)速度快、推廣能力強(qiáng)、分類和強(qiáng)度預(yù)測精度高的優(yōu)點(diǎn)。
讓我們用一個(gè)實(shí)例來說明本發(fā)明的具體實(shí)施方式
和有效性。
4種液態(tài)呈香物質(zhì)為乙醇、乙酸乙酯、己酸乙酯和乳酸乙酯,分別用去離子水稀釋成4-6種濃度,如表1所示。每一種濃度配置50個(gè)樣品,每個(gè)液態(tài)樣品體積為15毫升。一個(gè)液態(tài)樣品放置于容積為150毫升的恒溫瓶內(nèi)恒溫30分鐘。請參見圖1,機(jī)器嗅覺儀器的氣敏傳感器陣列由TGS800,TGS812,TGS813,TGS816,TGS821,TGS822,TGS823,TGS824,TGS825,TGS826,TGS830,TGS831,TGS832,TGS842,TGS880,TGS883T共16個(gè)氣敏傳感器組成。機(jī)器嗅覺儀器的測量流程請參見圖2,測量各個(gè)液態(tài)樣品的頂空揮發(fā)氣,共得到23×50=1150樣本,每個(gè)樣本的維數(shù)為m=16。這就是說,我們得 表1 乙醇、乙酸乙酯、己酸乙酯和乳酸乙酯共4種呈香物質(zhì)經(jīng)去離子水稀釋后的濃度 表2 4個(gè)訓(xùn)練子集大小和4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)分類器的學(xué)習(xí)參數(shù) 到一個(gè)1150行16列的響應(yīng)數(shù)據(jù)陣。圖12為這1150個(gè)樣本數(shù)據(jù)的主成分分析圖。圖12表明,各種氣味在測量空間的分布不一定是線性的,而且類與類之間也不一定是線性可分的。我們從每一種濃度的50個(gè)樣本中選取40個(gè)作為訓(xùn)練樣本,其余10個(gè)作為測試樣本。這樣一來,原始訓(xùn)練集共有23×40=920個(gè)樣本,測試集共有23×10=230個(gè)樣本。這里,去離子水被看作一種濃度0.1ppm。
根據(jù)本發(fā)明,我們先用4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)解決4種氣味的分類問題,然后再用4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)解決4種氣味的濃度估計(jì)即函數(shù)逼近問題。
4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)分類器的隱節(jié)點(diǎn)數(shù)均為
訓(xùn)練子集Ξ(j)的樣本數(shù)如表2所示,依次為442、508、597和748,平均樣本數(shù)為573.75,只占原始訓(xùn)練樣本數(shù)的573.75/920=62.36%。采用2.6G CPU、256M內(nèi)存的個(gè)人計(jì)算機(jī),令學(xué)習(xí)因子η=0.003,4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)分類器的學(xué)習(xí)時(shí)間總共為7.89秒,平均誤差平方根均小于0.1。如果4個(gè)訓(xùn)練子集的樣本數(shù)均為920,則學(xué)習(xí)時(shí)間為84.3409秒。前者比后者的學(xué)習(xí)速度提高10.69倍,分類正確率相同。
4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型的隱節(jié)點(diǎn)數(shù)均為
訓(xùn)練子集樣本數(shù)依次為280、200、280和280。這里,4個(gè)訓(xùn)練子集均以去離子水為基點(diǎn)。學(xué)習(xí)因子仍為η=0.003,4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)的學(xué)習(xí)總時(shí)間為26.52秒,對訓(xùn)練子集常用對數(shù)濃度的平均誤差平方根在0.015~0.029之間。
4個(gè)單輸出神經(jīng)網(wǎng)絡(luò)分類器的實(shí)際輸出經(jīng)修正后,對所有230個(gè)測試樣本的分類正確率為100%,對濃度的估計(jì)誤差在10%以內(nèi),須記憶的參數(shù)等價(jià)于83個(gè)16維的樣本。表3列出了本發(fā)明和專利ZL03141537.7、200610023183.4學(xué)習(xí)與預(yù)測結(jié)果的比較。由表3我們可以看出,對這個(gè)應(yīng)用實(shí)例,與其他2個(gè)發(fā)明專利相比,本發(fā)明提出的并—串聯(lián)模式識別模型具有學(xué)習(xí)數(shù)度快,分類正確率高,濃度預(yù)測精度高,模式識別模型結(jié)構(gòu)簡單,綜合性能好這樣一系列優(yōu)點(diǎn)。
表3本發(fā)明和專利ZL03141537.7、200610023183.4學(xué)習(xí)與預(yù)測結(jié)果比較
權(quán)利要求
1、一種并-串聯(lián)模式識別方法,其特征在于,第一層-分類器層由多個(gè)單輸出神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,第二層-函數(shù)逼近模型層由多個(gè)單輸出神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,然后,分類器層與函數(shù)逼近模型層串聯(lián)組成并-串聯(lián)模式識別模型。這種基于神經(jīng)網(wǎng)絡(luò)的并-串聯(lián)模式識別模型用于機(jī)器嗅覺儀器對大規(guī)模氣味類別與強(qiáng)度的同時(shí)估計(jì)。
設(shè)機(jī)器嗅覺儀器用m個(gè)氣敏傳感器組成的陣列測量了一個(gè)來自氣味ωj且濃度為cp(j)的樣品p,則得到一個(gè)維數(shù)為m的響應(yīng)向量若機(jī)器嗅覺儀器測量了N個(gè)氣味樣品,則得到響應(yīng)矩陣或原始訓(xùn)練集X∈RN×m,即訓(xùn)練集的樣本數(shù)為N,維數(shù)為m。這N個(gè)樣品來自于n種氣味{ω1,...,ωj,...,ωn},且來自于同一種氣味ωj的樣品其強(qiáng)度是變化的。
2、根據(jù)權(quán)利要求1所述的方法,其特征在于,分類器層由多個(gè)單輸出神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成,一個(gè)n種氣味識別問題被轉(zhuǎn)化為n個(gè)兩種氣味識別問題,并由n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)——加以解決。
3、根據(jù)權(quán)利要求2所述的方法,其特征在于,單輸出神經(jīng)網(wǎng)絡(luò)分類器j代表一種氣味ωj,負(fù)責(zé)解決一個(gè)兩類問題{ωj,~ωj},形成非線性決策邊界,將來自氣味ωj的樣本集X(j)與來自其他類別~ωj的所有樣本X(~j)分開。神經(jīng)網(wǎng)絡(luò)分類器j的結(jié)構(gòu)是單隱層的,輸入節(jié)點(diǎn)數(shù)為m,隱節(jié)點(diǎn)數(shù)為
輸出節(jié)點(diǎn)數(shù)為1。
4、根據(jù)權(quán)利要求2所述的方法,其特征在于,在確定單輸出神經(jīng)網(wǎng)絡(luò)分類器j的權(quán)值與閾值時(shí),訓(xùn)練子集Ξ(j)={X(j),X~(j)}由來自ωj的所有樣本X(j)和來自~ωj的一小部分樣本X(~j)所組成。Ξ(j)的具體形成過程如下
a)產(chǎn)生一個(gè)初始超維斜橢球Θj0。Θj0的中心μj與X(j)的均值重合,其大小恰好把來自ωj的所有訓(xùn)練樣本X(j)包圍。設(shè)X(j)的樣本數(shù)為Nj,協(xié)方差矩陣為∑j,Θj0的最大Mahalanobis半徑rmax(j)為
如果協(xié)方差陣∑j奇異,則將之加上一個(gè)m×m的正態(tài)隨機(jī)方陣0.005N(0,1),即∑j←∑j+0.005N(0,1),然后再按公式(1)求rmax(j)。
b)計(jì)算被包含Θj0內(nèi)且來自于~ωj的樣本數(shù)N~j0。設(shè)第p個(gè)訓(xùn)練樣本xp_X(j)且xp∈X,N~j0由下列循環(huán)所確定
N~j0=0.
For p=1N-Nj
If
N~j0←N~j0+1.
End
c)擴(kuò)展Θj0,形成超維斜橢球Θj,確定Θj的半徑Rmin(j)。本發(fā)明提出確定Rmin(j)的依據(jù)是,被包含在Θj0內(nèi)且來自于~ωj的樣本數(shù)N~j0越少,Θj越大;反之,Θj越小。確定Rmin(j)的具體條件如下
If Nj/N~j0>1.0
Else
End
d)生成最終的訓(xùn)練子集Ξ(j)。Ξ(j)由包含在Θj內(nèi)的所有訓(xùn)練樣本組成。假設(shè)xp_X(j)且xp∈X,Ξ(j)由下列循環(huán)所生成
Ξ(j)(Nj)=X(j).
k=Nj.
For p=1N-Nj
If
Ξ(j)(k+1)←Ξ(j)(k)+xp,
k←k+1.
End
N(j)=k.
N~j=N(j)-Nj.
最終地,Ξ(j)={X(j),X(~j)}∈R(Nj+N~j)×m共包含N(j)=Nj+N~j個(gè)m維樣本,即由來自ωj的所有訓(xùn)練樣本X(j)和來自~ωj的部分樣本X(~j)所組成。這里,Nj為來自~ωj的樣本數(shù)。一般地,N~j>Nj。
5、根據(jù)權(quán)利要求2所述的方法,其特征在于,單輸出神經(jīng)網(wǎng)絡(luò)分類器j在學(xué)習(xí)Ξ(j)以確定其權(quán)值與閾值時(shí),對應(yīng)于來自較小類別的樣本xp,在第τ個(gè)迭代步,權(quán)值修正分量Δw(j)(τ)等于誤差梯度_Ej(τ)/_wp(j)(τ)乘以一個(gè)放大倍數(shù)λj=N~j/Nj。如果λj<0,則令λj=1。神經(jīng)網(wǎng)絡(luò)分類器j采用批學(xué)習(xí)方式,隱節(jié)點(diǎn)和輸出節(jié)點(diǎn)的活化函數(shù)為3(1+exp(-_/3))-1,輸入分量xpi成比例變化到
的范圍內(nèi),目標(biāo)輸出dp(j)采用{0,3}編碼,平均平方和誤差為Ej(τ)。
這里,yp(j)為單輸出神經(jīng)網(wǎng)絡(luò)分類器j對樣本xp∈Ξ(j)的實(shí)際輸出。設(shè)N~j>Nj,在第τ次學(xué)習(xí)時(shí),權(quán)值修正分量Δw(j)(τ)由下列循環(huán)所決定
Δw(j)(τ)=0.
Forp=1N(j),
If
Else
End。
6、根據(jù)權(quán)利要求2所述的方法,其特征在于,單輸出神經(jīng)網(wǎng)絡(luò)分類器j的作用由生成訓(xùn)練子集Ξ(j)的初始超維斜橢球Θj0和擴(kuò)展超維斜橢球Θj限制在局部范圍內(nèi)。本發(fā)明的具體做法是,如果樣本xp在Θj0之外,神經(jīng)網(wǎng)絡(luò)分類器j的實(shí)際輸出yp(j)被乘以一個(gè)與超維斜橢球中心μj和Mahalanobis半徑rmax(j)、Rmin(j)有關(guān)的修正量,否則yp(j)保持不變。于是,本發(fā)明提出如下判斷條件
If
Else
End
這里,ρp(j)是神經(jīng)網(wǎng)絡(luò)j對樣本xp修正的實(shí)際輸出。顯然,當(dāng)xp在Θj之外時(shí),
7、根據(jù)權(quán)利要求1所述的方法,其特征在于,函數(shù)逼近模型層由多個(gè)單輸出神經(jīng)網(wǎng)絡(luò)并聯(lián)所組成。n種氣味的強(qiáng)度估計(jì)問題由n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)一一加以解決。
8、根據(jù)權(quán)利要求7所述的方法,其特征在于,單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j代表一種氣味ωj,負(fù)責(zé)擬合傳感器陣列對來自ωj的所有不同強(qiáng)度樣品的響應(yīng)X(j)與強(qiáng)度C(j)之間的非線性關(guān)系。神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j的結(jié)構(gòu)是單隱層的,輸入節(jié)點(diǎn)數(shù)為m,隱節(jié)點(diǎn)數(shù)為
輸出節(jié)
點(diǎn)數(shù)為1。在確定單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j的權(quán)值與閾值時(shí),訓(xùn)練樣本子集僅由來自氣味ωj的樣本X(j)所組成。
9、根據(jù)權(quán)利要求7所述的方法,其特征在于,單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j在學(xué)習(xí)X(j)以確定其權(quán)值與閾值時(shí),采用批學(xué)習(xí)方式,隱節(jié)點(diǎn)和輸出節(jié)點(diǎn)的活化函數(shù)為f(_)=3(1+exp(-_/3))-1,輸入分量xpi(j)成比例變化到
的范圍內(nèi),目標(biāo)輸出tp(j)為
這里,cp(j)是氣味ωj第p個(gè)樣本xp(j)的強(qiáng)度或濃度,單位為ppm(百萬分之一)。單輸出神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j對X(j)的平均平方利誤差為
這里,ξp(j)為神經(jīng)網(wǎng)絡(luò)函數(shù)逼近模型j對樣本的實(shí)際輸出。
10、根據(jù)權(quán)利要求1所述的方法,其特征在于,分類器層的單輸出神經(jīng)網(wǎng)絡(luò)與函數(shù)逼近模型層的單輸出神經(jīng)網(wǎng)絡(luò)一一對應(yīng),即分類器層的單輸出神經(jīng)網(wǎng)絡(luò)j與函數(shù)逼近模型層的單輸出神經(jīng)網(wǎng)絡(luò)j均代表同一種氣味ωj。
11、根據(jù)權(quán)利要求1所述的方法,其特征在于,對一個(gè)類別與強(qiáng)度待定的樣本xp,其類別由分類器層輸出值最大的單輸出神經(jīng)網(wǎng)絡(luò)j所決定,然后,其強(qiáng)度由函數(shù)逼近模型層對應(yīng)的單輸出神經(jīng)網(wǎng)絡(luò)j所決定。即
本發(fā)明-一種并-串聯(lián)模式識別方法及其在大規(guī)模氣味類別與強(qiáng)度同時(shí)確定中的應(yīng)用具有結(jié)構(gòu)簡單、待定參數(shù)少、學(xué)習(xí)速度快、分類和函數(shù)逼近精度高的優(yōu)點(diǎn)。應(yīng)用本發(fā)明,機(jī)器嗅覺儀器能夠?qū)崿F(xiàn)對成千上萬種氣味類別與強(qiáng)度的實(shí)時(shí)估計(jì)。
全文摘要
一種并-串聯(lián)模式識別方法及其在機(jī)器嗅覺中的應(yīng)用,其特點(diǎn)是,將大規(guī)模氣味類別與強(qiáng)度同時(shí)確定問題先看作分類問題,然后看作函數(shù)逼近問題,分別由分類器層和函數(shù)逼近模型層串聯(lián)組成的模型予以解決,包括以下4個(gè)實(shí)施步驟。(1)分類器層n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)確定n種氣味的類別,一一對應(yīng)。一個(gè)網(wǎng)絡(luò)的訓(xùn)練子集由所代表氣味的所有樣本和相鄰氣味的部分樣本組成。(2)函數(shù)逼近模型層n個(gè)單輸出神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)確定n種氣味的強(qiáng)度,一一對應(yīng)。一個(gè)網(wǎng)絡(luò)的訓(xùn)練子集由所代表氣味的所有樣本組成。(3)不平衡訓(xùn)練子集的虛擬平衡。(4)n+1個(gè)單輸出神經(jīng)網(wǎng)絡(luò)進(jìn)行決策。利用本發(fā)明,機(jī)器嗅覺儀器可有效解決成千上萬種氣味類別與強(qiáng)度的同時(shí)估計(jì)問題。
文檔編號G06N3/02GK101101299SQ20071004260
公開日2008年1月9日 申請日期2007年6月25日 優(yōu)先權(quán)日2007年6月25日
發(fā)明者高大啟, 劉芳君, 孫建立 申請人:華東理工大學(xué)