專利名稱:一種軟件成本置信區(qū)間預測方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種基于軟件成本測定,預測出軟件成本置信區(qū)間的方法和系統(tǒng),屬于計算機軟件開發(fā)技術(shù)領(lǐng)域。
背景技術(shù):
軟件項目成本的測定對于任何一個公司,組織進行投資決策,資源協(xié)調(diào)具有非常重要的意義。軟件項目可行性分析,成本計劃和進度計劃以及風險管理等,均建立在各個階段的成本測定上。因此軟件項目的成本測定是軟件項目管理研究的重要問題。目前軟件成本測定研究工作主要基于軟件成本測定的鼻祖Boehm提出了 CoCoMol 和CoCoMoII模型effort = SIZEb *(Y\EM,)
i
5
b+^^ 17effort = a * SIZE * EM1)
i求解該模型主要使用回歸算法獲得a和b的值。在此基礎(chǔ)上發(fā)展出了一系列cocomo家族的測定方法C0INC0M0,DBA C0C0M0, C0QUALM0 iDAVE, C0PLIM0、C0PSEM0、C0RADM0、C0PR0M0、C0C0TS,C0SYSM0, C0S0SIM0等。于此同時還有使用cocomo數(shù)據(jù),將各類已經(jīng)成熟的機器學習模型移植過來,如神經(jīng)網(wǎng)絡(luò),SVR, CART,casebase,專家判定法等方法進行軟件成本測定。研究人員和項目管理者最關(guān)心的則是,如何選擇最適合自己數(shù)據(jù)的模型?這涉及到一個目前有個研究最熱的問題模型精確度的比較。評測模型的精度指標通常是基于 MREmagnitude relative erro,相對誤差絕對值),如 MMRE (MRE 的樣本,均值),PRED (N) (averagepercentage of estimates that were within N percent of the actual values,估算結(jié)果在實際結(jié)果N個百分點內(nèi)的平均百分比).和std_MRE (MRE的方差)。計算公式如下
predicted . - actual t
權(quán)利要求
1.一種軟件成本置信區(qū)間預測方法,包括步驟1)數(shù)據(jù)預處理模塊從項目管理數(shù)據(jù)庫獲取已知軟件項目過程數(shù)據(jù)和成本信息,按照每一行為一項軟件過程數(shù)據(jù),經(jīng)過數(shù)據(jù)預處理,通過配置項指定各個過程數(shù)據(jù)和成本信息在第幾列,形成數(shù)據(jù)矩陣X ;成本信息形成列向量Y ;2)數(shù)據(jù)抽樣模塊從矩陣X、Y中抽取數(shù)據(jù),按照成本測定模型的配置參數(shù),輸入核心模型模塊中的一測定模型,由測定模型訓練出模型參數(shù),并輸入待測的軟件過程數(shù)據(jù),計算出成本測定值Y’ ;3)區(qū)間計算模塊調(diào)用區(qū)間預測算法模塊,根據(jù)測定值Y’和已知成本值Y計算軟件成本的置信區(qū)間,獲得預測區(qū)間。
2.如權(quán)利要求1所述的預測方法,其特征在于,所述步驟1)數(shù)據(jù)矩陣X每一行包括各個驅(qū)動因子和軟件規(guī)模,其中軟件規(guī)模的值是經(jīng)過log運算處理后的值。
3.如權(quán)利要求1所述的預測方法,其特征在于,所述步驟1)成本信息經(jīng)過log運算處理后形成列向量Y。
4.如權(quán)利要求1所述的預測方法,其特征在于,所述步驟幻核心模型模塊包括多個成本測定模型,按照以下方法進行模型比較,選定成本測定模型4-1)切分數(shù)據(jù)矩陣X和Y,抽取N對作為訓練集合,抽取N對作為測試集合;4-2)每一對訓練集合,使用加正則項的最小二乘,并計算beta估算值的協(xié)方差矩陣, 獲得成本測定模型參數(shù)如下β a2mcdv0).994-3)使用N個測試集合和獲得的N對參數(shù)#,斤2和05H勿,計算獲得N個MMRE,PRED, var(MRE),4-4)使用比較算法,選取最優(yōu)一組參數(shù),作為模型參數(shù)保存。
5.如權(quán)利要求1所述的預測方法,其特征在于,所述步驟3)區(qū)間預測算法包括基于回歸模型的區(qū)間預測方法和基于直方圖的區(qū)間預測方法。
6.如權(quán)利要求1所述的預測方法,其特征在于,所述基于回歸模型的區(qū)間預測方法為計算已有軟件成本值Y和測定值Y’之間差值的方差;按照所得的差值的方差計算軟件成本的置信區(qū)間,獲得預測的區(qū)間。
7.如權(quán)利要求1所述的預測方法,其特征在于,所述基于直方圖的區(qū)間預測方法為計算已有軟件成本值Y和測定值Y’之間的相對誤差或者相對誤差絕對值;在相對誤差的直方圖上,指定置信度C,截取對稱的中間C部分,在相對誤差絕對值直方圖上截取前C部分,保留邊界值p_up和p_down,獲得預測的區(qū)間。
8.一種軟件成本置信區(qū)間預測系統(tǒng),其特征在于,包括數(shù)據(jù)預處理模塊,用于從項目管理數(shù)據(jù)庫獲取已知軟件項目過程數(shù)據(jù)和成本信息,按照每一行為一項軟件過程數(shù)據(jù),經(jīng)過數(shù)據(jù)預處理,通過配置項指定各個過程數(shù)據(jù)和成本信息在第幾列,形成數(shù)據(jù)矩陣X ;成本信息形成列向量Y ;數(shù)據(jù)抽樣模塊用于從X、Y矩陣中抽取數(shù)據(jù),輸入核心模型模塊進行訓練;核心模型模塊包括不同模型和訓練算法,將輸入的X、Y矩陣數(shù)據(jù)訓練出選用模型的參數(shù),并計算出成本的測定值;區(qū)間計算模塊利用成本測定值和已有成本值,根據(jù)置信區(qū)間算法計算最終的預測區(qū)間。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,還包括模型比較模塊,用于比較核心模型模塊中包括模型的精確度。
10.如權(quán)利要求8所述的系統(tǒng),其特征在于,還包括命中率計算模塊用于計算成本實際值落入預測區(qū)間的命中率;圖形化顯示模塊,用于將預測區(qū)間以圖形化顯示。
全文摘要
本發(fā)明提供了一種軟件成本置信區(qū)間預測方法和系統(tǒng),包括從項目管理數(shù)據(jù)庫獲取已知軟件項目過程數(shù)據(jù)和成本信息,按照每一行為一項軟件過程數(shù)據(jù),經(jīng)過數(shù)據(jù)預處理,通過配置項指定各個過程數(shù)據(jù)和成本信息在第幾列,形成數(shù)據(jù)矩陣X;成本信息形成列向量Y;從X、Y矩陣中抽取數(shù)據(jù),輸入核心模型模塊進行訓練;根據(jù)輸入的X、Y矩陣數(shù)據(jù)訓練出選用模型的參數(shù),并計算出成本的測定值;利用成本測定值和已有成本值,根據(jù)置信區(qū)間計算方法,得到最終的預測區(qū)間。本發(fā)明的區(qū)間預測方法實驗命中率高,實際應用對工作量測定有著極其重要和可信任的指導作用;本發(fā)明的系統(tǒng)對研究人員添加新的模型,添加新的區(qū)間算法,添加新的模型評測方法極為方便。
文檔編號G06F9/44GK102156641SQ20111009987
公開日2011年8月17日 申請日期2011年4月20日 優(yōu)先權(quán)日2011年4月20日
發(fā)明者楊葉, 楊達, 解浪 申請人:中國科學院軟件研究所