本發(fā)明涉及建模過程與模型穩(wěn)定性探索,具體涉及一種樹類模型結(jié)構(gòu)評估方法、裝置和設(shè)備。
背景技術(shù):
1、樹類模型中,一般會提供subsample參數(shù),通過限制每棵樹的樣本使用量,來降低模型結(jié)果的方差-variance。在對樹類模型進(jìn)行探索時(shí),在進(jìn)行迭代訓(xùn)練時(shí),會產(chǎn)生大量訓(xùn)練組合,無法對訓(xùn)練組合進(jìn)行優(yōu)化,導(dǎo)致訓(xùn)練時(shí)間長,訓(xùn)練難度大。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種樹類模型結(jié)構(gòu)評估方法、裝置和設(shè)備,以克服目前在迭代訓(xùn)練時(shí)無法對訓(xùn)練組合進(jìn)行優(yōu)化,導(dǎo)致訓(xùn)練時(shí)間長,訓(xùn)練難度大的問題。
2、為實(shí)現(xiàn)以上目的,本發(fā)明采用如下技術(shù)方案:
3、第一方面,本申請?zhí)峁┝艘环N樹類模型結(jié)構(gòu)評估方法,包括:
4、獲取待評估樣本;
5、根據(jù)所述待評估樣本生成備選組合;
6、獲取基模型,通過所述備選組合對所述基模型進(jìn)行訓(xùn)練,添加相似度懲罰并計(jì)算訓(xùn)練完成后的所述基模型的模型ks均值,根據(jù)所述模型ks均值確定優(yōu)秀組合;
7、根據(jù)所述優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合,直到到達(dá)預(yù)設(shè)迭代輪次后,確定最終的優(yōu)秀組合,并保存模型效果。
8、進(jìn)一步的,以上所述的方法,在所述根據(jù)所述待評估樣本生成備選組合之前,還包括:
9、根據(jù)所述待評估樣本的按渠道特性,對所述待評估樣本進(jìn)行分組并編號。
10、進(jìn)一步的,以上所述的方法,所述獲取基模型,通過所述備選組合對所述基模型進(jìn)行訓(xùn)練,添加相似度懲罰并計(jì)算訓(xùn)練完成后的所述基模型的模型ks均值,根據(jù)所述模型ks均值確定優(yōu)秀組合,包括:
11、獲取基模型,通過所述備選組合對所述基模型進(jìn)行訓(xùn)練;
12、計(jì)算訓(xùn)練完成后的所述基模型的模型ks均值,并根據(jù)所述相似度懲罰,確定最終的所述模型ks均值;
13、根據(jù)最終的所述模型ks均值,進(jìn)行預(yù)設(shè)次數(shù)的篩選,確定預(yù)設(shè)數(shù)量的優(yōu)秀組合。
14、進(jìn)一步的,以上所述的方法,所述根據(jù)所述優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合,直到到達(dá)預(yù)設(shè)迭代輪次后,確定最終的優(yōu)秀組合,并保存模型效果,包括:
15、對基模型訓(xùn)練結(jié)果進(jìn)行緩存;
16、根據(jù)所述優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合;
17、根據(jù)所述新的備選組合對所述基模型進(jìn)行訓(xùn)練,并根據(jù)緩存的所述基模型訓(xùn)練結(jié)果,生成新的基模型訓(xùn)練結(jié)果;
18、計(jì)算所述新的備選組合的模型ks均值,并確定新的優(yōu)秀組合,完成第二輪次的迭代;
19、確定當(dāng)前迭代次數(shù)是否達(dá)到預(yù)設(shè)輪次;
20、若是,則保存模型效果。
21、第二方面,本申請?zhí)峁┝艘环N樹類模型結(jié)果評估模型,包括:
22、樣本獲取模塊,用于獲取待評估樣本;
23、備選組合生成模塊,用于根據(jù)所述待評估樣本生成備選組合;
24、優(yōu)秀組合確定模塊,用于獲取基模型,通過所述備選組合對所述基模型進(jìn)行訓(xùn)練,添加相似度懲罰并計(jì)算訓(xùn)練完成后的所述基模型的模型ks均值,根據(jù)所述模型ks均值確定優(yōu)秀組合,根據(jù)所述優(yōu)秀組合通過所述備選組合生成模塊進(jìn)行迭代再次生成新的備選組合;
25、模型效果保存模塊,用于到達(dá)預(yù)設(shè)迭代輪次后,確定最終的優(yōu)秀組合,并保存模型效果。
26、第三方面,本申請?zhí)峁┝艘环N樹類模型結(jié)構(gòu)評估設(shè)備,包括處理器和存儲器,所述處理器與存儲器相連:
27、其中,所述處理器,用于調(diào)用并執(zhí)行所述存儲器中存儲的程序;
28、所述存儲器,用于存儲所述程序,所述程序至少用于執(zhí)行以上任一項(xiàng)所述的樹類模型結(jié)構(gòu)評估方法。
29、本發(fā)明的有益效果為:
30、本申請首先獲取待評估樣本,根據(jù)待評估樣本生成備選組合,獲取基模型,通過備選組合對基模型進(jìn)行訓(xùn)練,添加相似度懲罰并計(jì)算訓(xùn)練完成后的基模型的模型ks均值,根據(jù)模型ks均值確定優(yōu)秀組合,根據(jù)優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合,直到到達(dá)預(yù)設(shè)迭代輪次后,確定最終的優(yōu)秀組合,并保存模型效果。在本申請中,通過添加相似度懲罰并計(jì)算訓(xùn)練完成后的基模型的模型ks均值,根據(jù)模型ks均值確定優(yōu)秀組合,根據(jù)優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合,從而有選擇的剔除掉了效果不好的次序組合,解決了目前在迭代訓(xùn)練時(shí)無法對訓(xùn)練組合進(jìn)行優(yōu)化,導(dǎo)致訓(xùn)練時(shí)間長,訓(xùn)練難度大的問題。
1.一種樹類模型結(jié)構(gòu)評估方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述根據(jù)所述待評估樣本生成備選組合之前,還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取基模型,通過所述備選組合對所述基模型進(jìn)行訓(xùn)練,添加相似度懲罰并計(jì)算訓(xùn)練完成后的所述基模型的模型ks均值,根據(jù)所述模型ks均值確定優(yōu)秀組合,包括:
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述優(yōu)秀組合進(jìn)行迭代再次生成新的備選組合,直到到達(dá)預(yù)設(shè)迭代輪次后,確定最終的優(yōu)秀組合,并保存模型效果,包括:
5.一種樹類模型結(jié)果評估模型,其特征在于,包括:
6.一種樹類模型結(jié)構(gòu)評估設(shè)備,其特征在于,包括處理器和存儲器,所述處理器與存儲器相連: