国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種基于唯密文的密碼算法識別方法和系統(tǒng)的制作方法

      文檔序號:9751172閱讀:1576來源:國知局
      一種基于唯密文的密碼算法識別方法和系統(tǒng)的制作方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及密碼算法識別技術(shù)領(lǐng)域,尤其涉及一種基于唯密文的密碼算法識別方法和系統(tǒng)。
      【背景技術(shù)】
      [0002]信息的保密通信、安全存貯、完整性保護、鑒別、簽名和驗證等都離不開密碼算法的使用,密碼算法是信息保密技術(shù)的核心,密碼算法的安全性有著不可估量的重要作用。Kerckhoffs對密碼分析的基本假設(shè)中,闡述了密碼分析者已知密碼算法及其實現(xiàn)的全部細節(jié),現(xiàn)有的密碼分析技術(shù)也幾乎都建立在算法已知的基礎(chǔ)上。但在輿情分析中,我們獲得的信息就只有密文,這些密文對于密碼分析者來講,采用的密碼算法都是未知的。但是有一點可以確認,使用者基本上不是專業(yè)的密碼學(xué)工作者,所以他們采用的密碼算法一般都采用公開的密碼算法。要對這些加密算法未知的密文進行解密,首當(dāng)其沖就必須對密文所采用的密碼算法進行識別。
      [0003]目前國內(nèi)外主要是利用軟件逆向分析技術(shù)對密碼算法進行識別,研究內(nèi)容一般是提取出密碼算法的軟件實現(xiàn)特征(包括密碼算法的二進制特征、韻律特征、統(tǒng)計特征、語法特征和語義特征等),并在此基礎(chǔ)上建立密碼算法識別模型,構(gòu)建密碼算法特征數(shù)據(jù)庫。但存在很大局限性:
      (I)基本上是從電子設(shè)備中應(yīng)用軟件的二進制可執(zhí)行代碼入手,因此需提取出目標(biāo)二進制文件中包含密碼算法的模塊。對于代碼混淆的軟件,常常只能識別部分密碼函數(shù),難以識別出具體的密碼算法名稱。
      [0004](2)需對大量匯編代碼進行人工分析,自動化分析的水平低,工作量大。
      [0005](3)需要得到目標(biāo)軟件。
      [0006]通過軟件逆向分析對密碼算法進行識別的技術(shù)在只有密文可知的情形下是無能為力的,因此基于唯密文的密碼算法識別技術(shù)凸顯了其重要性和實用前景。目前該技術(shù)才處于起步階段,在國內(nèi)尚無公開的關(guān)于這方面的研究成果,在國外也僅有少部分學(xué)者進行過相關(guān)研究。但目前國外公開的基于唯密文的密碼算法識別技術(shù)研究仍存在以下不足:
      (I)僅僅做了一些探索性的理論研究,很多實驗密文數(shù)據(jù)不符合實際情形,例如實驗中所有的密文對應(yīng)同一密鑰,且沒有嚴(yán)格限制測試所用的密文文件尺寸。
      [0007](2)所識別密碼算法未具體說明算法參數(shù),僅僅是按算法名稱來識別密碼算法。事實上,例如AES算法按密鑰長度(128bit,192bit和256bit)可分為三類,RC5算法按字長值(16,32和64)也可分為三類。
      [0008](3)基本上只是對少數(shù)的幾種分組密碼算法進行識別,未發(fā)現(xiàn)拓展其他有價值的研究內(nèi)容。

      【發(fā)明內(nèi)容】

      [0009]針對現(xiàn)有技術(shù)中的密碼算法識別方法存在的上述問題,本發(fā)明公開了一種基于唯密文的密碼算法識別方法和系統(tǒng)。
      [0010]本發(fā)明公開了一種基于唯密文的密碼算法識別方法,其具體包括如下五個步驟:步驟一:確定出需要對哪幾種密碼算法進行識別,然后對應(yīng)這些需要進行識別的密碼算法,分別生成密文文件,各密碼算法對應(yīng)的密文文件的大小和數(shù)量保持一致;步驟二:對所生成的密文文件按照一定規(guī)則提取其二進制密文數(shù)據(jù)特征,所提取的密文特征具有可識別性;步驟三:確定了提取規(guī)則,按照步驟二得到密文文件的特征,并篩選出關(guān)鍵特征,將關(guān)鍵特征作為密碼算法識別模型的特征匹配數(shù)據(jù)庫,結(jié)合機器學(xué)習(xí)中的識別算法,建立初步的識別模型;步驟四:對應(yīng)各密碼算法,分別重新生成一些密文文件,同樣按照步驟二、三的特征提取篩選規(guī)則,得到這些新的密文的關(guān)鍵特征,進而作為識別模型的輸入,對密碼算法進行初步區(qū)分識別;步驟五:經(jīng)過多次優(yōu)化,最終得到一個穩(wěn)定的識別模型,直接用于基于唯密文信息的密碼算法識別。
      [0011]更進一步地,上述提取其二進制密文數(shù)據(jù)特征的方法具體包括以下步驟:首先將密文文件中的密文分割成多個大小相同的密文塊,然后按提取規(guī)則對每個密文塊進行特征提取。
      [0012]更進一步地,上述特征提取的過程具體為:對于每一個密文塊,將每8位二進制密文表示為一個O?255的數(shù)值,那么該密文文件的特征為一個257維的向量,該向量的前256維分量分別表示出現(xiàn)O?255的頻次,最后一維表示該密文塊的類別屬性,即用數(shù)值表示該密文對應(yīng)于哪一種密碼算法。
      [0013]更進一步地,上述特征提取的過程具體為:對于每一個密文塊,以128位密文為一個分組,統(tǒng)計所有分組中128個位置各位置出現(xiàn)I的頻次之和,構(gòu)成一個129維的向量,前128維表示所有分組各位置出現(xiàn)I的頻次之和,第129維表示密文塊的密碼算法類別。
      [0014]更進一步地,上述篩選出關(guān)鍵特征的方法具體包括以下的步驟:尋找多維特征的一個中心點,設(shè)置一個距離閾值,根據(jù)與這個中心點的距離來篩選出關(guān)鍵特征,將離中心點較遠的特征去掉。
      [0015]更進一步地,上述優(yōu)化識別模型的具體步驟為:觀察識別算法中的參數(shù)設(shè)置,密文特征以及識別效果這三者間的關(guān)系,進而對識別模型進行優(yōu)化。
      [0016]更進一步地,上述識別算法參數(shù),密文特征和識別效果之間的關(guān)系確定過程為:(I)生成用于對識別模型進行參數(shù)調(diào)整的密文文件;(2)先選定一類密文特征,篩選出關(guān)鍵特征,然后在調(diào)整算法參數(shù)過程中觀察識別率,直至獲得較高識別率;(3)選取其他類別密文特征,按同樣方式調(diào)整算法參數(shù);(4)根據(jù)識別效果,選擇密文特征類別和識別算法參數(shù)的最優(yōu)組合。
      [0017]本發(fā)明還公開了一種基于唯密文的密碼算法識別系統(tǒng),其具體包括密碼算法確定單元、密文特征提取單元、初步模型建立單元和模型優(yōu)化單元;所述密碼算法確定單元用于確定出需要對哪幾種密碼算法進行識別,然后對應(yīng)這些需要進行識別的密碼算法,分別生成密文文件,各密碼算法對應(yīng)的密文文件的大小和數(shù)量保持一致;所述密文特征提取單元用于對所生成的密文文件按照一定規(guī)則提取其二進制密文數(shù)據(jù)特征,所提取的密文特征具有可識別性;所述初步模型建立單元用于將關(guān)鍵特征作為密碼算法識別模型的特征匹配數(shù)據(jù)庫,結(jié)合機器學(xué)習(xí)中的識別算法,建立初步的識別模型;所述模型優(yōu)化單元用于對應(yīng)各密碼算法,分別重新生成一些密文文件,同樣進行特征提取和篩選,得到這些新的密文的關(guān)鍵特征,進而作為識別模型的輸入,對初步的識別模型進行優(yōu)化,最終得到一個穩(wěn)定的識別模型,直接用于基于唯密文信息的密碼算法識別。
      [0018]通過采用以上的技術(shù)方案,本發(fā)明的有益效果為:本發(fā)明提出一種基于唯密文的密碼算法識別技術(shù),主要解決如下的技術(shù)問題:
      (I)密文數(shù)據(jù)中的特征提取技術(shù)
      對于一個安全強度較高的密碼算法,通常對應(yīng)的二進制密文中O和I的分布是比較均衡的,提取出密文數(shù)據(jù)中與眾不同的特征是關(guān)鍵和難點。因此,構(gòu)建一種密文特征信息提取規(guī)則對密文數(shù)據(jù)進行預(yù)處理,進而提取出關(guān)鍵特征,是本發(fā)明首要解決的關(guān)鍵問題。
      [0019](2)密碼算法正確識別率提升技術(shù)
      盡管當(dāng)前有些識別技術(shù)能夠識別出一些公開密碼算法,但其正確識別率并不高,尤其是對于那些使用不同密鑰加密的密文,正確識別率更低。目前國外文獻資料上基于唯密文的密碼算法識別大部分運用的僅僅只是統(tǒng)計方法,少部分運用了Adaboost,以及計算較復(fù)雜的人工神經(jīng)網(wǎng)絡(luò)算法,在ECB模式下的識別率大約為80%,甚至更低。本發(fā)明結(jié)合信息論,統(tǒng)計分析,最優(yōu)化理論以及機器學(xué)習(xí)方法,從多種密碼算法對應(yīng)的大量密文中提取特征并建立特征匹配庫,進而進行基于唯密文的密碼算法識別。在ECB工作模式下,對五類常見分組密碼(AES,DES,3DES,BLOWFISH和RC5)的密文進行多次算法識別測試,當(dāng)密文文件大于100KB以上時,識別率能達到90%以上。如果密碼算法數(shù)量減少,識別率將進一步地提高。因此,提高密碼算法正確識別率是本發(fā)明突破的關(guān)鍵技術(shù)。
      [0020](3)密文數(shù)據(jù)較少時的密碼算法識別技術(shù)
      目前通過密文對密碼算法進行識別的研究基本上都基于訓(xùn)練樣本和測試樣本足夠多、足夠大的前提,從而能更好地提取密文中的模式和特征。在理論研究過程中,可以產(chǎn)生任意多的訓(xùn)練樣本和測試樣本,而在實際應(yīng)用中,測試樣本由截獲到的密文經(jīng)過分割得到。如果截獲到的密文數(shù)據(jù)較少,會直接導(dǎo)致測試樣本數(shù)目減少和測試樣本長度變短。測試樣本數(shù)目減少會導(dǎo)致識別結(jié)果不可靠,測試樣本長度變短會導(dǎo)致密文
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1