国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種號碼發(fā)現(xiàn)方法及系統(tǒng)的制作方法_2

      文檔序號:9912685閱讀:來源:國知局
      的號碼發(fā)現(xiàn)系統(tǒng)的一種結(jié)構(gòu)示意圖;
      [0049] 圖3是根據(jù)本發(fā)明實(shí)施例提供的號碼發(fā)現(xiàn)系統(tǒng)的另一種結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0050] 為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例的方案,下面結(jié)合附圖和實(shí)施 例的方式對本發(fā)明作進(jìn)一步的詳細(xì)說明。以下實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不 能解釋為對本發(fā)明的限制。
      [0051]為了更好地理解本發(fā)明,下面首先對現(xiàn)有技術(shù)中聲紋識別技術(shù)進(jìn)行簡單說明。聲 紋識別(Voiceprint Recognition,VPR),也稱為說話人識別(Speaker Recognition),有兩 類,即說話人辨認(rèn)(Speaker Identification)和說話人確認(rèn)(Speaker Verification)。前 者用以判斷某段語音是若干人中的哪一個所說的,是"多選一"問題;而后者用以確認(rèn)某段 語音是否是指定的某個人所說的,是"一對一判別"問題。不同的任務(wù)和應(yīng)用會使用不同的 聲紋識別技術(shù),如縮小刑偵范圍時可能需要辨認(rèn)技術(shù),而銀行交易時則需要確認(rèn)技術(shù)。不管 是辨認(rèn)還是確認(rèn),都需要先對說話人的聲紋進(jìn)行建模,這就是所謂的"訓(xùn)練"或"學(xué)習(xí)"過程, 聲紋模型可以包括以下任意一種:說話人因子向量模型、高斯混合模型、隱馬爾可夫模型、 動態(tài)時間規(guī)整模型或向量量化模型等。
      [0052]在對說話的人辨認(rèn)方面,根據(jù)待識別的說話人是否在注冊的說話人集合內(nèi),說話 人辨認(rèn)可以分為開集(open-set)辨認(rèn)和閉集(close-set)辨認(rèn)。前者假定待識別說話人可 以在集合外,而后者假定待識別說話人在集合內(nèi)。顯然,開集辨認(rèn)需要有一個對集外說話人 的"拒識問題",而且閉集辨認(rèn)的結(jié)果要好于開集辨認(rèn)結(jié)果。本質(zhì)上講,說話人確認(rèn)和開集說 話人辨認(rèn)都需要用到拒識技術(shù),為了達(dá)到很好的拒識效果,通常需要訓(xùn)練一個假冒者模型 或背景模型,以便在拒識時有可比較的對象,閾值容易選定。而建立背景模型的好壞直接影 響到拒識甚至聲紋識別的性能。一個好的背景模型,往往需要通過預(yù)先采集好的若干說話 人的數(shù)據(jù),通過某種算法去建立。
      [0053]聲紋識別主要有三個關(guān)鍵問題,一是聲紋特征提取,二是模式匹配,即模式識別, 三是相似度規(guī)整。其中,聲紋特征可以是感知線性預(yù)測系數(shù)(Perceptual Linear PrediCtive,PLP),它是受人的聽覺系統(tǒng)研究成果推動而導(dǎo)出的聲學(xué)特征,通過對人的聽覺 機(jī)理的研究發(fā)現(xiàn),當(dāng)兩個頻率相近的音調(diào)同時發(fā)出時,人只能聽到一個音調(diào),當(dāng)然也可以是 梅爾頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient,MFCC)、線性預(yù)測系數(shù)(linear prediction Coefficient,LPC)等聲紋特征。解決前兩個關(guān)鍵問題的技術(shù)已相對成熟,但是 對于相似度規(guī)整技術(shù),現(xiàn)有技術(shù)中隨著非目標(biāo)人數(shù)據(jù)達(dá)到一定量時,相似度規(guī)整效果的提 升就趨于穩(wěn)定,無法再進(jìn)一步地提升聲紋識別的準(zhǔn)確性。
      [0054]本發(fā)明提供的號碼發(fā)現(xiàn)方法及系統(tǒng),通過從獲取的目標(biāo)人已知使用號碼及候選測 試號碼的相關(guān)信息中提取各號碼的通話信息,然后根據(jù)候選測試號碼的通話信息與外界導(dǎo) 入的目標(biāo)人相關(guān)信息和/或目標(biāo)人的已知使用號碼的通話信息的關(guān)聯(lián)度對所述相似度得分 進(jìn)行規(guī)整,使得對相似度得分的規(guī)整不僅僅依賴于上述假冒者模型或背景模型,可以進(jìn)一 步地提升聲紋識別的準(zhǔn)確性。
      [0055] 為了更好的理解本發(fā)明的技術(shù)方案和技術(shù)效果,以下將結(jié)合流程圖和具體的實(shí)施 例進(jìn)行詳細(xì)的描述。
      [0056] 如圖1所示,是本發(fā)明實(shí)施例提供的號碼發(fā)現(xiàn)方法的流程圖,包括以下步驟:
      [0057]步驟S01,根據(jù)收集的目標(biāo)人的語音數(shù)據(jù)構(gòu)建目標(biāo)人聲紋模型。
      [0058] 語音數(shù)據(jù)為通過具有麥克風(fēng)的設(shè)備收集的語音數(shù)據(jù),可以是說話人實(shí)時的發(fā)音, 也可以是通過錄音設(shè)備等保存的語音數(shù)據(jù),當(dāng)然,還可以是通訊設(shè)備,例如移動電話、遠(yuǎn)程 電話會議系統(tǒng)等手段傳播的語音數(shù)據(jù)。
      [0059] 在本實(shí)施例中,所述目標(biāo)人指實(shí)際應(yīng)用中需要進(jìn)行號碼發(fā)現(xiàn)的人,號碼發(fā)現(xiàn)屬于 說話人辨認(rèn)技術(shù)的范圍,簡單說即從大量使用號碼中發(fā)現(xiàn)目標(biāo)人使用的號碼。目標(biāo)人語音 數(shù)據(jù)的收集可以從其日常說話中自動獲取,如通話語音,也可以是專門進(jìn)行目標(biāo)人語音數(shù) 據(jù)錄制,對此本實(shí)施例不作限定。
      [0060] 在實(shí)際應(yīng)用中,所述語音數(shù)據(jù)的聲紋特征,可以是PLP特征,當(dāng)然也可以是MFCC、 LPC等聲紋特征。所述目標(biāo)人聲紋模型的構(gòu)建,采用現(xiàn)有技術(shù),如首先提取目標(biāo)人語音數(shù)據(jù) 的聲紋特征,如PLP特征,再基于聲紋特征構(gòu)建聲紋模型,如當(dāng)下較為流行的說話人因子向 量(ivector)〇
      [0061] 在一個具體實(shí)施例中,說話人因子向量I的表達(dá)式如式(2)所示:
      [0062] M=m+TI (2)
      [0063] 其中,Μ為從目標(biāo)人的語音中提取的均值超矢量,m為通用背景模型的均值,T為因 子載荷矩陣;通用背景模型為通過EM算法訓(xùn)練得到的混合高斯模型;通用背景模型及因子 載荷矩陣的獲取同現(xiàn)有技術(shù),在此不再詳述。
      [0064] 需要說明的是,所述聲紋模型還可以為高斯混合模型、隱馬爾可夫模型、動態(tài)時間 規(guī)整模型、向量量化模型等,具體視使用效果而定。
      [0065] 步驟S02,獲取目標(biāo)人的已知使用號碼和候選測試號碼以及各號碼的通話信息。
      [0066] 在本實(shí)施例中,所述候選測試號碼按照預(yù)設(shè)條件選取;所述預(yù)設(shè)條件包括以下任 意一個或多個:號碼的地域信息、使用年限、使用頻率、某個時段的有效語音時長、是否擁有 指定和/或共同的聯(lián)系人
      [0067] 在一個具體實(shí)施例中,根據(jù)目標(biāo)人的已知使用號碼的話單信息,選取在某一周期T 內(nèi)與目標(biāo)人的已知使用號碼a通話的所有話單A,并將與目標(biāo)人的已知使用號碼a通話次數(shù) 大于η的所有話單記為A'。待發(fā)現(xiàn)的候選測試號碼的通話信息,選取符合一定條件的待測試 號碼作為候選測試號碼,而候選測試號碼使用人的通話語音數(shù)據(jù)作為候選測試號碼的通話 信息。所述候選測試號碼選取的條件,可以包括在周期Τ內(nèi)選取有效語音時長大于時長閾值 1^的測試號碼作為候選測試號碼,記為Β。
      [0068] 步驟S03,提取所述候選測試號碼的使用人的聲紋特征。
      [0069] 在本實(shí)施中,通過各候選測試號碼獲取該號碼相應(yīng)說話人的語音數(shù)據(jù),例如通過 撥打該號碼進(jìn)行電話錄音或運(yùn)營商提供的通話錄音等,當(dāng)然,也可以通過找到該號碼使用 人以獲取語音數(shù)據(jù);然后從獲取的各候選測試號碼的語音數(shù)據(jù)中提取聲紋特征,例如通過 公式(2)獲取各候選測試號碼的使用人的語音數(shù)據(jù)的說話人因子向量。
      [0070] 步驟S04,計算過程:計算各候選測試號碼的使用人的聲紋特征與目標(biāo)人聲紋模型 的相似度得分。
      [0071] 在本實(shí)施例中,根據(jù)說話人因子向量計算各候選測試號碼的使用人的聲紋特征與 目標(biāo)人聲紋模型的相似度得分,具體地,可以根據(jù)各說話人因子向量之間的距離來判斷說 話人因子向量之間的相似度,例如,KLD距離,歐式距離,cos相關(guān)度距離等,本實(shí)施例采用 cos相關(guān)度距離進(jìn)行說明。
      [0072]在一個具體實(shí)施例中,計算各候選測試號碼使用人的說話人因子向量與目標(biāo)人的 說話人因子向量兩兩之間的COS相關(guān)度距咼ClQ,C2Q,C3Q,...,其中,ClQ,C2Q,C3Q分別為第1、第 2、第3候選測試號碼的使用人的聲紋特征與目標(biāo)人λ聲紋模型之間的cos相關(guān)度距離,當(dāng)cos 相關(guān)度距離越大,則代表這兩個號碼的使用人的語音信號特征越相似。具體數(shù)學(xué)公式如式 (3)所示:
      [0073] I U I * /t I
      [0074] 在其他實(shí)施例中,還可以通過采用概率線性鑒別分析PLDA技術(shù)以去除信道的干擾 信息,從而提升判斷語音信號類之間相似度的準(zhǔn)確性。
      [0075] 當(dāng)然,還可以根據(jù)其他計算各候選測試號碼使用人與目標(biāo)人聲紋的相似度得分的 方法獲取相似度得分,在此不做限定。
      [0076]步驟S05,計算過程結(jié)束后,基于候選測試號碼的通話信息與目標(biāo)人的已知使用號 碼的通話信息和/或外界導(dǎo)入的目標(biāo)人相關(guān)信息的關(guān)聯(lián)度對所述相似度得分進(jìn)行規(guī)整。 [0077]在本實(shí)施例中,所述基于候選測試號碼的通話信息與目標(biāo)人的已知使用號碼的通 話信息和/或外界導(dǎo)入的目標(biāo)人相關(guān)信息的關(guān)聯(lián)度對所述相似度得分進(jìn)行規(guī)整,包括以下 任意一個或多個步驟:將各相似度得分乘以預(yù)設(shè)的函數(shù)以擴(kuò)大候選測試號碼的使用人的聲 紋特征與目標(biāo)人聲紋模型的相似度得分的
      當(dāng)前第2頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1