一種國際投資指數(shù)數(shù)據(jù)處理分析方法和系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機應(yīng)用技術(shù)領(lǐng)域,特別涉及一種國際投資指數(shù)數(shù)據(jù)處理分析方法和系統(tǒng)。
【背景技術(shù)】
[0002]應(yīng)用計算機技術(shù)對投資數(shù)據(jù)進行處理運算,以衡量投資可實施性,是目前計算機技術(shù)領(lǐng)域的一個重要分支。
[0003]而如何根據(jù)復(fù)雜多變的投資原始數(shù)據(jù),得到較為準確的投資可實施性的預(yù)測結(jié)果,也是該領(lǐng)域研宄的一個重要課題。目前,對于投資數(shù)據(jù)進行量化處理并得到量化指標的工具較少,其中有的僅能在很小的領(lǐng)域范圍內(nèi)進行測算,應(yīng)用范圍較狹窄。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種國際投資指數(shù)數(shù)據(jù)處理分析方法,以解決上述問題。
[0005]本發(fā)明實施例提供了一種國際投資指數(shù)數(shù)據(jù)處理分析方法,包括步驟:
[0006]步驟A,獲取全局變量,讀取待分析的包含各模塊信息的文件;
[0007]步驟B,基于主成分分析法計算各模塊主成分值并輸出顯示;
[0008]步驟C,將各模塊中的變量傳遞給1git模型,求解各模塊賦值結(jié)果并輸出顯示;
[0009]步驟D,根據(jù)所述主成分值和各模塊賦值結(jié)果綜合計算得出投資指數(shù)。
[0010]其中,所述步驟B包括步驟:
[0011]寫入標準化數(shù)據(jù);
[0012]計算相關(guān)系數(shù)矩陣以及特征值和特征向量;
[0013]計算載荷矩陣并歸類,通過累計貢獻率計算主成分值并輸出顯示。
[0014]其中,所述步驟B之后步驟C之前還包括步驟:
[0015]計算歸約結(jié)果;
[0016]通過載荷矩陣對變量進行歸類總結(jié)。
[0017]其中,所述步驟C包括步驟:
[0018]獲取用戶定義的每個模塊的變量;
[0019]計算每個模塊中傳遞給1git模型的變量;
[0020]求解1git模型,計算增長率得出賦值結(jié)果并輸出顯示。
[0021]其中,所述步驟A之前還包括步驟:
[0022]提示用戶定義運算規(guī)則參數(shù),包括定義EVA_Strategy為均值+/- —個標準差或者是否大于等于O ;定義Probit-1ogit模型分析時引入的變量個數(shù)Variable Number ;以及定義PCA Strategy為累計貢獻度大于等于85%或者特征值大于I。
[0023]本發(fā)明還提供一種國際投資指數(shù)數(shù)據(jù)處理分析系統(tǒng),包括讀取數(shù)據(jù)模塊、主成分分析模塊、1git模型測算模塊和結(jié)果輸出模塊;
[0024]讀取數(shù)據(jù)模塊,用于獲取全局變量,讀取待分析的包含各模塊信息的文件;
[0025]主成分分析模塊,用于基于主成分分析法計算各模塊主成分值并輸出顯示;
[0026]1git模型測算模塊,用于將各模塊中的變量傳遞給1git模型,求解各模塊賦值結(jié)果并輸出顯示;
[0027]結(jié)果輸出模塊,用于根據(jù)主成分值和各模塊賦值結(jié)果綜合計算得出投資指數(shù)。
[0028]其中主成分分析模塊,用于:
[0029]寫入標準化數(shù)據(jù);計算相關(guān)系數(shù)矩陣以及特征值和特征向量;計算載荷矩陣并歸類,通過累計貢獻率計算主成分值并輸出顯示。
[0030]其中1git模型測算模塊,用于:
[0031]計算歸約結(jié)果;通過載荷矩陣對變量進行歸類總結(jié);獲取用戶定義的每個模塊的變量;計算每個模塊中傳遞給1git模型的變量;求解1git模型,計算增長率得出賦值結(jié)果并輸出顯不。
[0032]其中,還包括預(yù)定義模塊;
[0033]所述預(yù)定義模塊,用于提示用戶定義運算規(guī)則參數(shù),包括定義EVA_Strategy為均值+/_ —個標準差或者是否大于等于O ;定義Probit-1ogit模型分析時引入的變量個數(shù)Variable Number ;以及定義PCA Strategy為累計貢獻度大于等于85%或者特征值大于I。
[0034]本發(fā)明實施例提供的一種國際投資指數(shù)數(shù)據(jù)處理分析方法,主要基于主成分分析和Probit-1ogit方法測算不同國家和地區(qū)國際投資的績效估值,其適應(yīng)性較強,應(yīng)用范圍廣,且測算準確度相對較高。
【附圖說明】
[0035]圖1為本發(fā)明提供的國際投資指數(shù)數(shù)據(jù)處理分析方法的一個實施例的流程圖;
[0036]圖2為本發(fā)明實施例提供的國際投資指數(shù)數(shù)據(jù)處理分析系統(tǒng)的結(jié)構(gòu)示意圖;
[0037]圖3為本發(fā)明實施例提供的啟動程序后準備計算的操作界面;
[0038]圖4為程序標準化數(shù)據(jù)的寫入后的界面;
[0039]圖5為顯示政治模塊和宏觀經(jīng)濟模塊的計算數(shù)值的界面;
[0040]圖6為顯示主成分分析法的各個模塊的主成分值的概率結(jié)果之一的界面;
[0041]圖7為顯示概率法的模塊I和模塊2的賦值結(jié)果的界面;
[0042]圖8為顯示最終運算結(jié)果的界面。
【具體實施方式】
[0043]本發(fā)明實施例提供了一種國際投資指數(shù)數(shù)據(jù)處理分析方法,利用蒙特卡洛模擬和幾何布朗運動理論推斷國際投資數(shù)據(jù)中要素的波動率與投資收益和市場趨勢正相關(guān)的原理,通過主成分分析和Probit-1ogit方法來測算各映射因子的權(quán)重和概率。
[0044]蒙特卡羅(Monte Carlo)方法,又稱隨機抽樣或統(tǒng)計試驗方法,傳統(tǒng)的經(jīng)驗方法由于不能逼近真實的物理過程,很難得到滿意的結(jié)果,而蒙特卡羅方法由于能夠真實地模擬實際物理過程,故解決問題與實際非常符合,可以得到很圓滿的結(jié)果。
[0045]其基本原理與思考:當所要求解的問題是某種事件出現(xiàn)的概率,或者是某個隨機變量的期望值時,它們可以通過某種“試驗”的方法,得到這種事件出現(xiàn)的頻率,或者這個隨機變數(shù)的平均值,并用它們作為問題的解。這就是蒙特卡羅方法的基本思想。蒙特卡羅方法通過抓住事物運動的幾何數(shù)量和幾何特征,利用數(shù)學(xué)方法來加以模擬,即進行一種數(shù)字模擬實驗。它是以一個概率模型為基礎(chǔ),按照這個模型所描繪的過程,通過模擬實驗的結(jié)果,作為問題的近似解??梢园衙商乜_解題歸結(jié)為三個主要步驟:構(gòu)造或描述概率過程;實現(xiàn)從已知概率分布抽樣;建立各種估計量。
[0046]解題步驟:
[0047]I)構(gòu)造或描述概率過程
[0048]對于本身就具有隨機性質(zhì)的問題,主要是正確描述和模擬這個概率過程,對于本來不是隨機性質(zhì)的確定性問題,比如計算定積分,就必須事先構(gòu)造一個人為的概率過程,它的某些參量正好是所要求問題的解。即要將不具有隨機性質(zhì)的問題轉(zhuǎn)化為隨機性質(zhì)的問題。
[0049]2)實現(xiàn)從已知概率分布抽樣
[0050]構(gòu)造了概率模型以后,由于各種概率模型都可以看作是由各種各樣的概率分布構(gòu)成的,因此產(chǎn)生已知概率分布的隨機變量(或隨機向量),就成為實現(xiàn)蒙特卡羅方法模擬實驗的基本手段,這也是蒙特卡羅方法被稱為隨機抽樣的原因。最簡單、最基本、最重要的一個概率分布是(0,1)上的均勻分布(或稱矩形分布)。隨機數(shù)就是具有這種均勻分布的隨機變量。隨機數(shù)序列就是具有這種分布的總體的一個簡單子樣,也就是一個具有這種分布的相互獨立的隨機變數(shù)序列。產(chǎn)生隨機數(shù)的問題,就是從這個分布的抽樣問題。在計算機上,可以用物理方法產(chǎn)生隨機數(shù),但價格昂貴,不能重復(fù),使用不便。另一種方法是用數(shù)學(xué)遞推公式產(chǎn)生。這樣產(chǎn)生的序列,與真正的隨機數(shù)序列不同,所以稱為偽隨機數(shù),或偽隨機數(shù)序列。不過,經(jīng)過多種統(tǒng)計檢驗表明,它與真正的隨機數(shù),或隨機數(shù)序列具有相近的性質(zhì),因此可把它作為真正的隨機數(shù)來使用。由已知分布隨機抽樣有各種方法,與從(0,1)上均勻分布抽樣不同,這些方法都是借助于隨機序列來實現(xiàn)的,也就是說,都是以產(chǎn)生隨機數(shù)為前提的。由此可見,隨機數(shù)是實現(xiàn)蒙特卡羅模擬的基本工具。
[0051]3)建立各種估計量
[0052]一般說來,構(gòu)造了概率模型并能從中抽樣后,即實現(xiàn)模擬實驗后,就要確定一個隨機變量,作為所要求的問題的解,稱它為無偏估計。建立各種估計量,相當于對模擬實驗的結(jié)果進行考察和登記,從中得到問題的解。
[0053]本發(fā)明實施例通過主成分分析和Probit-1ogit方法來測算各映射因子的權(quán)重和概率。
[0054]主成分分析方法(PrincipalComponent Analysis,PCA),
[0055]它是將多個變量通過線性變換以選出較少個數(shù)重要變量的一種多元統(tǒng)計分析方法。
[0056]主成分分析是設(shè)法將原來眾多具有一定相關(guān)性(比如P個指標),重新組合成一組新的互相無關(guān)的綜合指標來代替原來的指標。
[0057]主成分分析,是考察多個變量間相關(guān)性一種多元統(tǒng)計方法,研宄如何通過少數(shù)幾個主成分來揭示多個變量間的內(nèi)部結(jié)構(gòu),即從原始變量中導(dǎo)出少數(shù)幾個主成分,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān),通常數(shù)學(xué)上的處理就是將原來P個指標作線性組合,作為新的綜合指標。
[0058]具體做法就是用Fl (選取的第一個線性組合,即第一個綜合指標)的方差來表達,即Var(Fl)越大,表示Fl包含的信息越多。因此在所有的線性組合中選取的Fl應(yīng)該是方差最大的,故稱Fl為第一主成分。如果第一主成分不足以代表原來P個指標的信息,再考慮選取F2即選第二個線性組合,為了有效地反映原來信息,F(xiàn)l已有的信息就不需要再出現(xiàn)在F2中,用數(shù)學(xué)語言表達就是要求Cov (Fl,F(xiàn)2) = 0,則稱F2為第二主成分,依此類推可以構(gòu)造出第三、第四,……,第P個主成分。
[0059]具體步驟:Fp= ali*ZXl+a2i*ZX2+......+api*ZXp
[0060]其中ali,a2i,……,api (i = 1,……,m)為X的協(xié)方差陣Σ的特征值所對應(yīng)的特征向量,ZXl, ZX2,……,ZXp是原始變量經(jīng)過標準化處理的值,因為在實際應(yīng)用中,往往存在指標的量綱不同,所以在計算之前須先消除量綱的影響,而將原始數(shù)據(jù)標準化,本發(fā)明實施例所采用的數(shù)據(jù)就存在量綱影響。
[0061]主成分分析法的計算步驟:
[0062]A= (ai j)pXm = (al,a2,...am,),
[0063]Rai = λ i ai,
[0064]R為相關(guān)系數(shù)矩陣,λ 1、ai是相應(yīng)的特征值和單位特征向量,λ?彡λ2彡…^ λ P 多 O。
[0065]一般地,進行主成分分析主要步驟如下:指標數(shù)據(jù)標準化;指標之間的相關(guān)性判定;確定主成分個數(shù)m ;主成分Fi表達式;主成分Fi命名。
[0066]Logit模型(Logit model,也譯作“評定模型”,“分類評定模型”,又作Logisticregress1n,“邏輯回歸”)是離散選擇法模型之一,Logit模型是最早的離散選擇模型,也是目前應(yīng)用最廣的模型。是社會學(xué)、生物統(tǒng)計學(xué)、臨床、數(shù)量心理學(xué)、計量經(jīng)濟學(xué)、市場營銷等統(tǒng)計實證分析的常用方法。
[0067]其邏輯分布(Logisticdistribut1n)公式如下:
[0068]P (Y = 11X = X) = exp (χ,β ) / (1+exp (x,β ))
[0069]其中參數(shù)β常用極大似然估計。
[0070]應(yīng)用Logit模型的原