1.一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,所述漏洞代碼數(shù)據(jù)集中包括多個(gè)代碼中間件;對應(yīng)地,對所述漏洞代碼數(shù)據(jù)集進(jìn)行預(yù)處理,得到預(yù)處理后漏洞代碼數(shù)據(jù)集,包括:
3.根據(jù)權(quán)利要求1所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,所述預(yù)處理后漏洞代碼數(shù)據(jù)集中包括多個(gè)去重后代碼中間件;對應(yīng)地,基于所述預(yù)處理后漏洞代碼數(shù)據(jù)集構(gòu)建得到程序依賴圖集,包括:
4.根據(jù)權(quán)利要求3所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,構(gòu)建得到程序依賴圖后,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,根據(jù)所述程序依賴圖集創(chuàng)建得到樣本數(shù)據(jù)集,包括:
6.根據(jù)權(quán)利要求1所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,所述預(yù)訓(xùn)練大語言模型采用deepseek-coder-6.7b-instruct大語言模型,所述deepseek-coder-6.7b-instruct大語言模型的頂部設(shè)置有分類頭;所述輕量級微調(diào)方法采用p-tuning微調(diào)方法。
7.根據(jù)權(quán)利要求1所述的一種基于大語言模型的軟件安全漏洞智能挖掘方法,其特征在于,所述漏洞挖掘結(jié)果包括漏洞標(biāo)簽預(yù)測結(jié)果及指定漏洞信息;對應(yīng)地,基于所述軟件安全漏洞智能挖掘模型和所述cwe漏洞庫對所述待測代碼進(jìn)行漏洞挖掘處理,得到漏洞挖掘結(jié)果,包括:
8.一種基于大語言模型的軟件安全漏洞智能挖掘系統(tǒng),其特征在于,用于實(shí)現(xiàn)如權(quán)利要求1至7中任意一項(xiàng)所述的基于大語言模型的軟件安全漏洞智能挖掘方法;所述基于大語言模型的軟件安全漏洞智能挖掘系統(tǒng)包括: