本發(fā)明涉及農(nóng)產(chǎn)品價格預(yù)測方法。更具體地說,本發(fā)明涉及一種基于GEP算法的小白菜價格預(yù)測方法。
背景技術(shù):
:由于眾多現(xiàn)有的農(nóng)業(yè)電子商務(wù)網(wǎng)所提供的小白菜價格數(shù)據(jù)多樣化,現(xiàn)有小白菜價格預(yù)測算法無法適應(yīng)網(wǎng)站所提供多類型數(shù)據(jù),不能準(zhǔn)確即時反應(yīng)小白菜價格變化。GEP技術(shù)是借鑒生物遺傳的基因表達(dá)規(guī)律提出的知識發(fā)現(xiàn)新技術(shù),該技術(shù)的特點(diǎn)是:(1)它們在“雜交-變異-新種群-選擇”的進(jìn)化論思想方面相似;(2)GA是用簡單編碼解決簡單問題,GP是用復(fù)雜編碼解決復(fù)雜問題,GEP則是用簡單編碼解決復(fù)雜問題;(3)GEP融合了GA和GP的優(yōu)點(diǎn);(4)GEP的先天優(yōu)勢使得組合爆炸和早熟容易克服;(5)基因表達(dá)式編程不需對結(jié)果公式形狀做主觀假定,而認(rèn)為真理在訓(xùn)練數(shù)據(jù)中,以基本變量和運(yùn)算符為遺傳物質(zhì),通過遺傳、變異,逐代進(jìn)化出更接近事物本質(zhì)的公式。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的一個目的是解決至少上述問題,并提供至少后面將說明的優(yōu)點(diǎn)。本發(fā)明還有一個目的是提供一種基于GEP算法的小白菜價格預(yù)測方法。為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了一種基于GEP算法的小白菜價格預(yù)測方法,包括以下步驟:步驟一,采集目標(biāo)地區(qū)的小白菜L天的價格數(shù)據(jù),抽取第i天到第j天之間的價格數(shù)據(jù)用多種函數(shù)模型進(jìn)行擬合出多個價格預(yù)測函數(shù);步驟二,抽取第m天到第n天之間的價格數(shù)據(jù),計(jì)算步驟一得到的多個價格預(yù)測函數(shù)的適應(yīng)度值,適應(yīng)度值的計(jì)算公式為:其中,yt表示第t天根據(jù)各價格預(yù)測函數(shù)算出的預(yù)測價格,dt為第t天的實(shí)際價格,K為預(yù)測價格與對應(yīng)時間的實(shí)際價格差的最大值;步驟三,計(jì)算適應(yīng)度值最大的價格預(yù)測函數(shù)的復(fù)相關(guān)系數(shù),復(fù)相關(guān)系數(shù)的計(jì)算公式為:其中,yt表示第t天根據(jù)適應(yīng)度值最大的價格預(yù)測函數(shù)算出的預(yù)測價格,dt為第t天的實(shí)際價格,為第m天到第n天之間適應(yīng)度值最大的價格預(yù)測函數(shù)算出的預(yù)測價格的平均值;步驟四,將步驟二得到的適應(yīng)度值最大的價格預(yù)測函數(shù)與步驟三得到的復(fù)相關(guān)系數(shù)相乘,即得小白菜價格預(yù)測函數(shù);其中,[m,n]與[i,j]的范圍不相同。優(yōu)選的是,在本發(fā)明中1≤i<j<m<n≤L。優(yōu)選的是,在本發(fā)明中連續(xù)采集天數(shù)L≥180,(j-i+1):(n-m+1)=11:5。優(yōu)選的是,在本發(fā)明中函數(shù)模型包括:LINEST函數(shù)、LOGEST函數(shù)、TREND函數(shù)、GROWTH函數(shù)、FROECAST函數(shù)。優(yōu)選的是,在本發(fā)明中L天中每日價格數(shù)據(jù)為多個農(nóng)產(chǎn)品網(wǎng)站同日的小白菜價格數(shù)據(jù)的平均值。優(yōu)選的是,在本發(fā)明中單個農(nóng)產(chǎn)品網(wǎng)站的當(dāng)日價格數(shù)據(jù)通過以下步驟得到:步驟a,每日間隔30s從目標(biāo)農(nóng)產(chǎn)品網(wǎng)站采集一次價格,然后將所有價格按照時間順序排序;步驟b,按組距和組數(shù)對步驟a中的經(jīng)過排序的價格進(jìn)行分組,組距為每日的價格的最大值與最小值之差除以組數(shù),組數(shù)k的計(jì)算公式為:k=1+3.322lgs;其中,s為步驟a中采集的每日價格的數(shù)量,k取其數(shù)值的整數(shù)部分;步驟c,用每組價格內(nèi)包含的價格的數(shù)量除以每日價格的數(shù)量,得每組價格內(nèi)包含的價格的數(shù)量占每日價格數(shù)量的比例;步驟d,選取步驟c中比例在0.00135~1之間的分組,計(jì)算所有選取的分組中所有價格的平均值,即為農(nóng)產(chǎn)品網(wǎng)站的當(dāng)日價格數(shù)據(jù)。優(yōu)選的是,在本發(fā)明中在所述步驟一中,L天的價格數(shù)據(jù)在抽取前經(jīng)過3o·準(zhǔn)則提取,具體方法如下:計(jì)算出L天價格數(shù)據(jù)的均值μ與標(biāo)準(zhǔn)差o·,然后剔除L天價格數(shù)據(jù)中分布在(μ-3o·,μ+3o·)范圍以外的數(shù)據(jù)。本發(fā)明至少包括以下有益效果:1、本發(fā)明對小白菜價格預(yù)測的準(zhǔn)確度較現(xiàn)有的小白菜價格預(yù)測算法更高。2、本發(fā)明中的核心函數(shù)關(guān)系式由GEP技術(shù)自動產(chǎn)生,具有人工干預(yù)少,自動化程度高的特點(diǎn)。3、通過對數(shù)據(jù)分析經(jīng)驗(yàn)的積累,可以自動優(yōu)化算法,極大程度上提高了預(yù)測精度。本發(fā)明的其它優(yōu)點(diǎn)、目標(biāo)和特征將部分通過下面的說明體現(xiàn),部分還將通過對本發(fā)明的研究和實(shí)踐而為本領(lǐng)域的技術(shù)人員所理解。具體實(shí)施方式下面結(jié)合實(shí)施例對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實(shí)施。實(shí)施例1:步驟一,采集廣西常樂地區(qū)2015年全年的價格數(shù)據(jù),以2015年1月1號為第1天,抽取第1天到第90天之間的價格數(shù)據(jù)如表1所示,用LINEST函數(shù)和LOGEST函數(shù)模型進(jìn)行擬合出函數(shù)表達(dá)式分別為:y=1.471+0.036x1-0.034x2,其中,x1為待測天數(shù),x2為小白菜需求量。步驟二,抽取第244天到第273天之間的價格數(shù)據(jù)如表2所示,計(jì)算步驟一得到的兩個價格預(yù)測函數(shù)的適應(yīng)度值,適應(yīng)度值的計(jì)算公式為:其中,yt表示第t天根據(jù)各價格預(yù)測函數(shù)算出的預(yù)測價格,dt為第t天的實(shí)際價格,K為預(yù)測價格與對應(yīng)時間的實(shí)際價格差的最大值。Y=1.471+0.036x1-0.034x2的適應(yīng)度值為0.885,的適應(yīng)度值為0.903.步驟三,計(jì)算適應(yīng)度值最大的價格預(yù)測函數(shù)的復(fù)相關(guān)系數(shù),復(fù)相關(guān)系數(shù)的計(jì)算公式為:其中,yt表示第t天根據(jù)適應(yīng)度值最大的價格預(yù)測函數(shù)算出的預(yù)測價格,dt為第t天的實(shí)際價格,為第244天到第365天之間適應(yīng)度值最大的價格預(yù)測函數(shù)算出的預(yù)測價格的平均值。由復(fù)相關(guān)系數(shù)的計(jì)算公式可得計(jì)算結(jié)果為R=0.954。步驟四,將步驟二得到的適應(yīng)度值最大的價格預(yù)測函數(shù)與步驟三得到的復(fù)相關(guān)系數(shù)相乘,即得小白菜價格預(yù)測函數(shù)為說明本方法的有效性,分別用本方法和基于TGA算法的小白菜預(yù)測方法對廣西常樂地區(qū)2016上半年的價格進(jìn)行預(yù)測,實(shí)際價格以農(nóng)村聯(lián)合合作社的價格為準(zhǔn),本方法的準(zhǔn)確率為90%,而基于TGA算法的小白菜預(yù)測方法的準(zhǔn)確率為70%。表1(表中數(shù)據(jù)按從左到右順序與天數(shù)對應(yīng))1.6341.6651.6531.6781.6871.4541.4431.3431.4481.4691.2771.2451.2321.3461.3381.3271.0431.0131.4661.4781.4691.4771.5061.5431.5331.5441.5141.2531.5761.5901.8901.86618451.7901.7991.7561.7741.6881.7031.7001.7431.7621.7681.7871.8101.8851.8901.9301.9461.9561.9671.9882.0122.0142.1132.1332.2152.2262.2322.1032.0002.0542.0161.8831.8671.8981.8541.8301.7811.7721.1311.6651.6801.6891.6121.6031.6231.5771.5441.4631.4871.4851.4901.5001.4701.5211.5221.5001.5331.529表2(表中數(shù)據(jù)按從左到右順序與天數(shù)對應(yīng))1.7431.7681.7561.8671.8981.8541.7621.7681.7871.6871.6651.6801.6891.6341.6651.6531.5901.2531.5761.5901.5771.5441.4631.4771.5061.5431.5331.5441.5141.522實(shí)施例2在實(shí)施例1的基礎(chǔ)上,使用本發(fā)明的方法對廣西常樂地區(qū)2016年上半年的小白菜價格進(jìn)行預(yù)測,其中,步驟一中的價格數(shù)據(jù)采集自中國農(nóng)業(yè)信息網(wǎng)、新農(nóng)村商網(wǎng)、農(nóng)博網(wǎng)、阿里巴巴和環(huán)球農(nóng)業(yè)網(wǎng),2015年每日價格數(shù)據(jù)為上述網(wǎng)站同日的小白菜價格數(shù)據(jù)的平均值,與實(shí)際市場價格誤差在0.02%,數(shù)據(jù)準(zhǔn)確率較高。實(shí)施例3在實(shí)施例2的基礎(chǔ)上,對每日采集的價格數(shù)據(jù)先做處理,以中國農(nóng)業(yè)信息網(wǎng)為例:步驟a,計(jì)算機(jī)每隔30s從網(wǎng)站上保存一次價格數(shù)據(jù),當(dāng)日就可以得到2880個價格數(shù)據(jù),然后將所有價格按照時間順序排序。步驟b,將2880代入k=1+3.322lgs,得到組數(shù)k=12,再將該日價格的最大值與最小值之差除以組數(shù)12得到組距,根據(jù)組距和組數(shù)對步驟a中的經(jīng)過排序的價格進(jìn)行分組。步驟c,用每組價格內(nèi)包含的價格的數(shù)量除以2880,得每組價格內(nèi)包含的價格的數(shù)量占該日價格數(shù)量的比例。步驟d,選取步驟c中比例在0.00135~1之間的分組,計(jì)算所有選取的分組中所有價格的平均值,即為農(nóng)產(chǎn)品網(wǎng)站的當(dāng)日價格數(shù)據(jù)。原始數(shù)據(jù)經(jīng)過選取后,異常數(shù)據(jù)點(diǎn)被剔除,提高了擬合得到的函數(shù)的準(zhǔn)確度。通過對比處理與未處理的數(shù)據(jù)進(jìn)行擬合得到的函數(shù)分別進(jìn)行小白菜價格預(yù)測,發(fā)現(xiàn)處理后的數(shù)據(jù)擬合得到的函數(shù)預(yù)測準(zhǔn)確度高出2%。實(shí)施例4在實(shí)施例1的基礎(chǔ)上,對步驟一中2015年的價格數(shù)據(jù)進(jìn)行3o·準(zhǔn)則提取,具體方法如下:計(jì)算第1天至第243天價格數(shù)據(jù)的均值1.633與標(biāo)準(zhǔn)差0.134,然后剔除第1天至第243天價格數(shù)據(jù)中分布在(1.231,2.035)范圍以外的數(shù)據(jù)。原始數(shù)據(jù)經(jīng)過選取后,異常數(shù)據(jù)點(diǎn)被剔除,提高了擬合得到的函數(shù)的準(zhǔn)確度。通過對比處理與未處理的數(shù)據(jù)進(jìn)行擬合得到的函數(shù)分別進(jìn)行小白菜價格預(yù)測,發(fā)現(xiàn)處理后的數(shù)據(jù)擬合得到的函數(shù)預(yù)測準(zhǔn)確度高出5%。盡管本發(fā)明的實(shí)施方案已公開如上,但其并不僅僅限于說明書和實(shí)施方式中所列運(yùn)用,它完全可以被適用于各種適合本發(fā)明的領(lǐng)域,對于熟悉本領(lǐng)域的人員而言,可容易地實(shí)現(xiàn)另外的修改,因此在不背離權(quán)利要求及等同范圍所限定的一般概念下,本發(fā)明并不限于特定的細(xì)節(jié)。當(dāng)前第1頁1 2 3