分類模型的生成方法及裝置、系統(tǒng)容量的預(yù)估方法及裝置的制造方法
【專利說明】分類模型的生成方法及裝置、系統(tǒng)容量的預(yù)估方法及裝置 【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)軟件測試技術(shù)領(lǐng)域,尤其涉及一種分類模型的生成方法及裝 置、系統(tǒng)容量的預(yù)估方法及裝置。 【【背景技術(shù)】】
[0002] 目前,對于如電子商務(wù)平臺以及其他實時流量受活動等影響強(qiáng)烈的互聯(lián)網(wǎng)軟件而 言,在活動期間服務(wù)器上軟件系統(tǒng)的性能表現(xiàn)會影響用戶體驗、品牌口碑甚至運營收入。因 此,有必要對承載軟件系統(tǒng)的實際的生產(chǎn)環(huán)境的系統(tǒng)容量進(jìn)行預(yù)估,以獲得生產(chǎn)環(huán)境的性 能瓶頸,進(jìn)而可以對生產(chǎn)環(huán)境的進(jìn)行優(yōu)化調(diào)整。
[0003] 如果通過對測試環(huán)境進(jìn)行壓力測試來獲取系統(tǒng)容量,雖然成本比較低,但是數(shù)據(jù) 的可信度也比較低。因此現(xiàn)有技術(shù)中都是對實際的生產(chǎn)環(huán)境進(jìn)行壓力測試來預(yù)估系統(tǒng)容量 的。然而,對實際的生產(chǎn)環(huán)境進(jìn)行壓力測試存在故障風(fēng)險較高、成本較大且效率較低等諸多 缺陷,所以目前如何更好的實現(xiàn)生產(chǎn)環(huán)境的系統(tǒng)容量數(shù)據(jù)是亟待解決的問題。 【
【發(fā)明內(nèi)容】
】
[0004] 有鑒于此,本發(fā)明實施例提供了一種分類模型的生成方法及裝置、系統(tǒng)容量的預(yù) 估方法及裝置,用以解決現(xiàn)有技術(shù)中對生產(chǎn)環(huán)境進(jìn)行壓力測試導(dǎo)致的故障風(fēng)險較高、成本 較大且效率較低的問題。
[0005] 本發(fā)明實施例的一方面,提供一種分類模型的生成方法,包括:
[0006] 采集生產(chǎn)環(huán)境的系統(tǒng)數(shù)據(jù)和測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0007] 分別從所述生產(chǎn)環(huán)境的系統(tǒng)數(shù)據(jù)和所述測試環(huán)境的系統(tǒng)數(shù)據(jù)中提取特征向量;
[0008] 生成系統(tǒng)容量與系統(tǒng)容量級別的對應(yīng)關(guān)系;
[0009] 對提取出的特征向量、生產(chǎn)環(huán)境的系統(tǒng)容量數(shù)據(jù)、測試環(huán)境的系統(tǒng)容量數(shù)據(jù)和所 述對應(yīng)關(guān)系進(jìn)行機(jī)器學(xué)習(xí),以生成分類模型。
[0010] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述生產(chǎn)環(huán) 境的系統(tǒng)數(shù)據(jù)包括:生產(chǎn)環(huán)境的系統(tǒng)運行性能數(shù)據(jù)、生產(chǎn)環(huán)境的系統(tǒng)部署數(shù)據(jù)和生產(chǎn)環(huán)境 的系統(tǒng)配置數(shù)據(jù)中至少一個。
[0011] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述測試環(huán) 境的系統(tǒng)數(shù)據(jù)包括:測試環(huán)境的系統(tǒng)運行性能數(shù)據(jù)、測試環(huán)境的系統(tǒng)部署數(shù)據(jù)和測試環(huán)境 的系統(tǒng)配置數(shù)據(jù)中至少一個。
[0012] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,從系統(tǒng)數(shù)據(jù) 中提取特征向量的方法包括:
[0013] 對所述系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)格式的標(biāo)準(zhǔn)化處理,所述系統(tǒng)數(shù)據(jù)為所述生產(chǎn)環(huán)境的系 統(tǒng)數(shù)據(jù)或者所述測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0014] 對經(jīng)過標(biāo)準(zhǔn)化處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行去噪處理;
[0015] 利用降維算法,對經(jīng)過去噪處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行降維處理,獲得所述系統(tǒng)數(shù) 據(jù)的特征向量。
[0016] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,對提取出的 特征向量、生產(chǎn)環(huán)境的系統(tǒng)容量數(shù)據(jù)、測試環(huán)境的系統(tǒng)容量數(shù)據(jù)和所述對應(yīng)關(guān)系進(jìn)行機(jī)器 學(xué)習(xí),以生成分類模型,包括:
[0017] 根據(jù)從測試環(huán)境的系統(tǒng)數(shù)據(jù)中提取出的特征向量、從實際環(huán)境的系統(tǒng)數(shù)據(jù)中提取 出的特征向量、各系統(tǒng)容量數(shù)據(jù),生成第一數(shù)據(jù)集和第二數(shù)據(jù)集;
[0018] 獲得未標(biāo)定數(shù)據(jù)集和第一權(quán)重向量;
[0019] 利用分類算法對所述第一數(shù)據(jù)集、所述第二數(shù)據(jù)集、所述未標(biāo)定數(shù)據(jù)集和所述第 一權(quán)重向量進(jìn)行機(jī)器學(xué)習(xí),以生成分類模型;
[0020] 利用所述分類模型在第二數(shù)據(jù)集上誤差,并根據(jù)所述誤差重新計算權(quán)重向量,以 獲得第二權(quán)重向量;
[0021 ]利用所述第二權(quán)重向量重新生成分類模型,直到達(dá)到指定的迭代次數(shù)達(dá)時停止; [0022]輸出所述分類模型。
[0023]本發(fā)明實施例的一方面,提供一種系統(tǒng)容量的預(yù)估方法,包括:
[0024]采集測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0025] 根據(jù)所述測試環(huán)境的系統(tǒng)數(shù)據(jù),并利用分類模型,獲得生產(chǎn)環(huán)境的系統(tǒng)容量級別; 其中,所述分類模型為利用上述分類模型的生成方法獲得的。
[0026] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,根據(jù)所述測 試環(huán)境的系統(tǒng)數(shù)據(jù),并利用分類模型,獲得生產(chǎn)環(huán)境的系統(tǒng)容量級別,包括;
[0027] 對所述系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)格式的標(biāo)準(zhǔn)化處理;
[0028]對經(jīng)過標(biāo)準(zhǔn)化處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行去噪處理;
[0029]利用降維算法,對經(jīng)過去噪處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行降維處理,獲得所特征向量;
[0030] 根據(jù)從所述系統(tǒng)數(shù)據(jù)提取出的特征向量,并利用分類模型,獲得生產(chǎn)環(huán)境的系統(tǒng) 容量級別。
[0031] 本發(fā)明實施例的一方面,提供一種分類模型的生成裝置,包括:
[0032] 數(shù)據(jù)采集模塊,用于采集生產(chǎn)環(huán)境的系統(tǒng)數(shù)據(jù)和測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0033] 特征提取模塊,用于分別從所述生產(chǎn)環(huán)境的系統(tǒng)數(shù)據(jù)和所述測試環(huán)境的系統(tǒng)數(shù)據(jù) 中提取特征向量;
[0034] 級別處理模塊,用于生成系統(tǒng)容量與系統(tǒng)容量級別的對應(yīng)關(guān)系;
[0035] 模型生成模塊,用于對提取出的特征向量、生產(chǎn)環(huán)境的系統(tǒng)容量數(shù)據(jù)、測試環(huán)境的 系統(tǒng)容量數(shù)據(jù)和所述對應(yīng)關(guān)系進(jìn)行機(jī)器學(xué)習(xí),以生成分類模型。
[0036] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述生產(chǎn)環(huán) 境的系統(tǒng)數(shù)據(jù)包括:生產(chǎn)環(huán)境的系統(tǒng)運行性能數(shù)據(jù)、生產(chǎn)環(huán)境的系統(tǒng)部署數(shù)據(jù)和生產(chǎn)環(huán)境 的系統(tǒng)配置數(shù)據(jù)中至少一個。
[0037] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述測試環(huán) 境的系統(tǒng)數(shù)據(jù)包括:測試環(huán)境的系統(tǒng)運行性能數(shù)據(jù)、測試環(huán)境的系統(tǒng)部署數(shù)據(jù)和測試環(huán)境 的系統(tǒng)配置數(shù)據(jù)中至少一個。
[0038] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述特征提 取模塊,具體用于:
[0039] 對所述系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)格式的標(biāo)準(zhǔn)化處理,所述系統(tǒng)數(shù)據(jù)為所述生產(chǎn)環(huán)境的系 統(tǒng)數(shù)據(jù)或者所述測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0040] 對經(jīng)過標(biāo)準(zhǔn)化處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行去噪處理;
[0041] 利用降維算法,對經(jīng)過去噪處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行降維處理,獲得所述系統(tǒng)數(shù) 據(jù)的特征向量。
[0042] 如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述模型生 成模塊,具體用于:
[0043] 根據(jù)從測試環(huán)境的系統(tǒng)數(shù)據(jù)中提取出的特征向量、從實際環(huán)境的系統(tǒng)數(shù)據(jù)中提取 出的特征向量、各系統(tǒng)容量數(shù)據(jù),生成第一數(shù)據(jù)集和第二數(shù)據(jù)集;
[0044] 獲得未標(biāo)定數(shù)據(jù)集和第一權(quán)重向量;
[0045] 利用分類算法對所述第一數(shù)據(jù)集、所述第二數(shù)據(jù)集、所述未標(biāo)定數(shù)據(jù)集和所述第 一權(quán)重向量進(jìn)行機(jī)器學(xué)習(xí),以生成分類模型;
[0046] 利用所述分類模型在第二數(shù)據(jù)集上誤差,并根據(jù)所述誤差重新計算權(quán)重向量,以 獲得第二權(quán)重向量;
[0047] 利用所述第二權(quán)重向量重新生成分類模型,直到達(dá)到指定的迭代次數(shù)達(dá)時停止; [0048]輸出所述分類模型。
[0049] 本發(fā)明實施例的一方面,提供一種系統(tǒng)容量的預(yù)估裝置,包括:
[0050] 數(shù)據(jù)采集模塊,用于采集測試環(huán)境的系統(tǒng)數(shù)據(jù);
[0051] 容量預(yù)估模塊,用于根據(jù)所述測試環(huán)境的系統(tǒng)數(shù)據(jù),并利用分類模型,獲得生產(chǎn)環(huán) 境的系統(tǒng)容量級別;其中,所述分類模型為利用上述分類模型的生成裝置獲得的。
[0052]如上所述的方面和任一可能的實現(xiàn)方式,進(jìn)一步提供一種實現(xiàn)方式,所述裝置還 包括:特征提取模塊,用于對所述系統(tǒng)數(shù)據(jù)進(jìn)行數(shù)據(jù)格式的標(biāo)準(zhǔn)化處理;以及,對經(jīng)過標(biāo)準(zhǔn) 化處理的所述系統(tǒng)數(shù)據(jù)進(jìn)行去噪處理;以及,利用降維算法,對經(jīng)過去噪處理的所述系統(tǒng)數(shù) 據(jù)進(jìn)行降維處理,獲得所特征向量;
[0053]所述容量預(yù)估模塊,具體用于:根據(jù)從所述系統(tǒng)數(shù)據(jù)提取出的特征向量,并利用分 類模型,獲得生產(chǎn)環(huán)境的系統(tǒng)容量級別。
[0054]由以上技術(shù)方案可以看出,本發(fā)明實施例具有以下有益效果:
[0055] 本發(fā)明實施例所提供的技術(shù)方案中,利用生產(chǎn)環(huán)境的系統(tǒng)數(shù)據(jù)和測試環(huán)境的系統(tǒng) 數(shù)據(jù)以及壓力測試后的系統(tǒng)容量數(shù)據(jù),生成用于估算生產(chǎn)環(huán)境的系統(tǒng)容量等級的分類模 型。與現(xiàn)有技術(shù)中,對實際的生產(chǎn)環(huán)境進(jìn)行壓力測試來獲取系統(tǒng)容量的方式相比,本發(fā)明實 施例由于避免使用測試環(huán)境的壓力測試數(shù)