一種基于音視頻文件的用戶行為認證方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及計算機技術(shù)領(lǐng)域,尤其涉及一種基于音視頻文件的用戶行為認證方法和裝置。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的廣泛發(fā)展,用戶可以通過互聯(lián)網(wǎng)實現(xiàn)各種業(yè)務(wù)操作。比如:用戶可以通過互聯(lián)網(wǎng)進行交流通信,用戶也可以通過互聯(lián)網(wǎng)進行財務(wù)借貸等。要實現(xiàn)上述業(yè)務(wù),服務(wù)提供方往往需要先對用戶的行為進行認證,比如:通過用戶的行為認證用戶是否已經(jīng)清楚了解業(yè)務(wù)操作的規(guī)定等。
[0003]相關(guān)技術(shù)中,用戶可以上傳一段音視頻文件,然后由服務(wù)提供方基于該音視頻文件對用戶的行為進行認證。然而,目前服務(wù)提供方通常采用人工認證的方式,效率較低,且成本較高。因此,一種基于音視頻文件的用戶行為自動認證方案是亟待提供的。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本申請?zhí)峁┮环N基于音視頻文件的用戶行為認證方法和裝置。
[0005]具體地,本申請是通過如下技術(shù)方案實現(xiàn)的:
[0006]一種基于音視頻文件的用戶行為認證方法,所述方法包括:
[0007]判斷用戶上傳的音視頻文件的視頻是否滿足認證條件;
[0008]如果所述音視頻文件的視頻滿足所述認證條件,則將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本;
[0009]根據(jù)所述音視頻文件對應的待認證文本對用戶行為進行認證。
[0010]進一步地,所述判斷用戶上傳的音視頻文件的視頻是否滿足認證條件,包括:
[0011]從所述音視頻文件中提取多張圖片;
[0012]判斷所述多張圖片的背景的相似度是否大于等于第一閾值;
[0013]如果所述多張圖片的背景的相似度大于等于所述第一閾值,則確認所述音視頻文件的視頻滿足所述認證條件。
[0014]進一步地,所述將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本,包括:
[0015]根據(jù)預設(shè)的第一分割規(guī)則將所述音視頻文件的音頻分為N個音頻片段,N為大于I的自然數(shù);
[0016]將所述音頻片段中的音頻轉(zhuǎn)換為對應的初始文本;
[0017]組合所述N個音頻片段對應的N個初始文本,以得到所述音視頻文件對應的待認證文本。
[0018]進一步地,在將所述音頻片段中的音頻識別為對應的初始文本之后,所述方法還包括:
[0019]根據(jù)預設(shè)的第二分割規(guī)則從所述音視頻文件的音頻中提取出N-1個校驗音頻片段;
[0020]將所述校驗音頻片段中的音頻轉(zhuǎn)換為對應的校驗文本;
[0021]根據(jù)所述N-1個校驗文本判斷所述N個音頻片段對應的N個初始文本是否準確;
[0022]如果所述N個音頻片段對應的N個初始文本準確,則組合所述N個音頻片段對應的N個初始文本。
[0023]進一步地,所述根據(jù)所述音視頻文件對應的待認證文本對用戶行為進行認證,包括:
[0024]計算所述音視頻文件對應的待認證文本和預設(shè)的認證文本的文本相似度;
[0025]當所述文本相似度大于等于預設(shè)的第二閾值時,確認用戶認證通過。
[0026]一種基于音視頻文件的用戶行為認證裝置,所述裝置包括:
[0027]判斷單元,用于判斷用戶上傳的音視頻文件的視頻是否滿足認證條件;
[0028]轉(zhuǎn)換單元,用于在所述音視頻文件的視頻滿足所述認證條件時,將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本;
[0029]認證單元,用于根據(jù)所述音視頻文件對應的待認證文本對用戶行為進行認證。
[0030]進一步地,所述判斷單元,具體用于從所述音視頻文件中提取多張圖片,判斷所述多張圖片的背景的相似度是否大于等于第一閾值,并在所述多張圖片的背景的相似度大于等于所述第一閾值時,確認所述音視頻文件的視頻滿足所述認證條件。
[0031]進一步地,所述轉(zhuǎn)換單元,具體用于根據(jù)預設(shè)的第一分割規(guī)則將所述音視頻文件的音頻分為N個音頻片段,N為大于I的自然數(shù);將所述音頻片段中的音頻轉(zhuǎn)換為對應的初始文本;組合所述N個音頻片段對應的N個初始文本,以得到所述音視頻文件對應的待認證文本。
[0032]進一步地,所述裝置還包括:
[0033]校驗單元,用于在將所述音頻片段中的音頻識別為對應的初始文本之后,根據(jù)預設(shè)的第二分割規(guī)則從所述音視頻文件的音頻中提取出N-1個校驗音頻片段;將所述校驗音頻片段中的音頻轉(zhuǎn)換為對應的校驗文本;根據(jù)所述N-1個校驗文本判斷所述N個音頻片段對應的N個初始文本是否準確;
[0034]所述轉(zhuǎn)換單元,具體在所述N個音頻片段對應的N個初始文本準確時,組合所述N個音頻片段對應的N個初始文本。
[0035]進一步地,所述認證單元,具體計算所述音視頻文件對應的待認證文本和預設(shè)的認證文本的文本相似度,并當所述文本相似度大于等于預設(shè)的第二閾值時,確認用戶認證通過。
[0036]由以上描述可以看出,本申請可以在確認用戶上傳的音視頻文件的視頻滿足認證條件后,將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本,并根據(jù)所述待認證文本對用戶行為進行認證,從而可以基于音視頻文件對用戶行為進行自動認證,節(jié)省人力資源,提高認證效率。
【附圖說明】
[0037]圖1是本申請一示例性實施例中一種基于音視頻文件的用戶行為認證方法的流程圖。
[0038]圖2是本申請一示例性實施例中另一種基于音視頻文件的用戶行為認證方法的流程圖。
[0039]圖3是本申請一示例性實施例中一種終端結(jié)構(gòu)示意圖。
[0040]圖4是本申請一示例性實施例中一種基于音視頻文件的用戶行為認證裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0041]這里將詳細地對示例性實施例進行說明,其示例表示在附圖中。下面的描述涉及附圖時,除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本申請相一致的所有實施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本申請的一些方面相一致的裝置和方法的例子。
[0042]在本申請使用的術(shù)語是僅僅出于描述特定實施例的目的,而非旨在限制本申請。在本申請和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應當理解,本文中使用的術(shù)語“和/或”是指并包含一個或多個相關(guān)聯(lián)的列出項目的任何或所有可能組合。
[0043]應當理解,盡管在本申請可能采用術(shù)語第一、第二、第三等來描述各種信息,但這些信息不應限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如,在不脫離本申請范圍的情況下,第一信息也可以被稱為第二信息,類似地,第二信息也可以被稱為第一信息。取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當……時”或“響應于確定”。
[0044]針對上述問題,本申請?zhí)峁┮环N基于音視頻文件的用戶行為的自動認證方案。
[0045]圖1是本申請一示例性實施例中一種基于音視頻文件的用戶行為認證方法的流程圖。
[0046]請參考圖1,本申請?zhí)峁┮环N基于音視頻文件的用戶行為認證方法,所述方法可以應用在終端上,包括有以下步驟:
[0047]步驟101,判斷用戶上傳的音視頻文件的視頻是否滿足認證條件。
[0048]在本實施例中,可以從用戶上傳的音視頻文件中隨機提取出多張圖片,然后判斷所述多張圖片的背景的相似度是否大于等于預設(shè)的第一閾值,當所述多張圖片的背景的相似度大于等于所述第一閾值時,可以確認所述音視頻文件的視頻滿足所述認證條件。
[0049]步驟102,如果所述音視頻文件的視頻滿足所述認證條件,則將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本。
[0050]在本實施例中,可以在所述視音頻文件的視頻滿足所述認證條件時,將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本。具體地,可以通過語音識別方法將所述音頻轉(zhuǎn)換為對應的待認證文本。為了提高音頻轉(zhuǎn)換的準確度,也可以將所述音頻分為多個音頻片段,然后分別將每個音頻片段的音頻轉(zhuǎn)換為對應的初始文本,通過組合各個初始文本以得到所述音頻對應的待認證文本。當然,本領(lǐng)域技術(shù)人員也可以采用其他方法將所述音視頻文件的音頻轉(zhuǎn)換為對應的待認證文本,本申請對此不作特殊限制。
[0051]步驟103,根據(jù)所述音視頻文件對應的待認證文本對用戶行為進行認證。
[0052]在本實施例中,可以將所述音視頻文件對應的待認證文本與預設(shè)的認證文本進行匹配,比如:計算所述待認