一種雙聲道語音的搶插話分析方法
【專利摘要】本發(fā)明公開了一種雙聲道語音的搶插話分析方法,通過語音活動檢測技術(shù)針對兩個聲道的錄音流進(jìn)行有效語音端點(diǎn)檢測,找出來整個語音中從幾秒到幾秒說過話;根據(jù)兩個聲道錄音的有效語音端點(diǎn),將每個片段的端點(diǎn)時間統(tǒng)一處理,通過時間點(diǎn)、聲道、端點(diǎn)類型三個屬性統(tǒng)一描述,并將所有端點(diǎn)平鋪到時間軸上;從前往后遍歷所有時間點(diǎn),對端點(diǎn)類型是否為開始位置端點(diǎn)和結(jié)束位置端點(diǎn)進(jìn)行分析。該雙聲道語音的搶插話分析方法能夠在兩個或者多個角色之間發(fā)生搶話、插話時需要能夠及時的捕捉到這一現(xiàn)象,并進(jìn)行后續(xù)處理,避免了搶話和插話不禮貌的通話方式,為客服服務(wù)提供了優(yōu)質(zhì)的保障。
【專利說明】
一種雙聲道語音的搶插話分析方法
技術(shù)領(lǐng)域
[0001]本發(fā)明屬于客服通話技術(shù)領(lǐng)域,尤其涉及一種雙聲道語音的搶插話分析方法。
【背景技術(shù)】
[0002]語音客服是指主要以移動電話的形式進(jìn)行的客服服務(wù),客服服務(wù)過程中,兩個或者多個角色之間經(jīng)常發(fā)生搶話、插話的問題。其中搶話指兩個角色之間,一個角色剛剛說完,另一個角色緊接著就說話,中間沒有時間間隔,這在交談中是一種不禮貌的方式,會被對方認(rèn)為是唐突、不認(rèn)真。插話指兩個角色之間,一個角色正在說話,另一個角色直接插話表述自己的意見,這在交談中是更為不禮貌的方式。這種搶話、插話的現(xiàn)象已經(jīng)嚴(yán)重影響了客服服務(wù)的質(zhì)量水平。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的在于提供一種雙聲道語音的搶插話分析方法,旨在解決客服過程中出現(xiàn)的搶話、插話的問題。
[0004]本發(fā)明是這樣實(shí)現(xiàn)的,該雙聲道語音的搶插話分析方法包括以下步驟:
[0005]步驟一、通過語音活動檢測技術(shù)針對兩個聲道的錄音流進(jìn)行有效語音端點(diǎn)檢測,找出來整個語音中從幾秒到幾秒說過話;
[0006]步驟二、根據(jù)兩個聲道錄音的有效語音端點(diǎn),將每個片段的端點(diǎn)時間統(tǒng)一處理,通過時間點(diǎn)、聲道、端點(diǎn)類型三個屬性統(tǒng)一描述,并將所有端點(diǎn)平鋪到時間軸上;
[0007]步驟三、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話的開始端點(diǎn),后一個端點(diǎn)為角色B說話的結(jié)束端點(diǎn),此為插話現(xiàn)象。
[0008]步驟四、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話結(jié)束的端點(diǎn),后一個端點(diǎn)為角色B說話的開始端點(diǎn),且兩個端點(diǎn)的時間邊界差小于200ms,即為搶話現(xiàn)象。
[0009]本發(fā)明還采取如下技術(shù)措施:
[0010]在步驟一中的有效語音端點(diǎn)包含開始時間、結(jié)束時間、說話人三個屬性。
[0011]步驟二中端點(diǎn)類型包括開始和結(jié)束。
[0012]對端點(diǎn)類型的分析方法包括以下步驟:
[0013]步驟一、檢查端點(diǎn)類型;
[0014]步驟二、如果為開始位置端點(diǎn),則判斷棧頂是否包含開始位置;
[0015]步驟三、若棧頂包含開始位置,則判斷開始時間位置是否和該開始位置的角色相同;
[0016]步驟四、若相同,則說明數(shù)據(jù)出錯,不可能一個人沒有說完話,又重新開始說話;
[0017]步驟五、若不同,則說明發(fā)生插話,記錄該插話信息,并將棧頂端點(diǎn)彈出;
[0018]步驟六、若棧頂不包含開始位置,則將開始位置壓棧,將端點(diǎn)位置加I,并繼續(xù)循環(huán);
[0019]步驟七、如果為結(jié)束位置端點(diǎn),則判斷棧頂是否包含開始位置;
[0020]步驟八、若棧頂包含開始位置,則判斷開始時間位置是否和該結(jié)束位置的角色是否相同;
[0021]步驟九、若相同,則說明是正常端點(diǎn),沒有發(fā)生插話,記錄該結(jié)束位置時間點(diǎn);
[0022]步驟十、若不同,則說明數(shù)據(jù)錯誤,前面發(fā)生了插話確并沒有記錄;
[0023]步驟十一、若棧頂不包含開始位置,則看前一個端點(diǎn)的結(jié)束位置和開始位置是否在200ms以內(nèi),是則發(fā)生搶話,記錄搶話發(fā)生時間,并將棧頂端點(diǎn)彈出;
[0024]步驟十二、將所有搶插話信息整理并記錄,其中每段搶插話包含開始時間、結(jié)束時間、類型,搶插話方向。
[0025]本發(fā)明具有的優(yōu)點(diǎn)和積極效果是:該雙聲道語音的搶插話分析方法能夠在兩個或者多個角色之間發(fā)生搶話、插話時需要能夠及時的捕捉到這一現(xiàn)象,并進(jìn)行后續(xù)處理,避免了搶話和插話不禮貌的通話方式,為客服服務(wù)提供了優(yōu)質(zhì)的保障。
【附圖說明】
[0026]圖1是本發(fā)明實(shí)施例提供的雙聲道語音的搶插話分析方法流程圖;
[0027]圖2是本發(fā)明實(shí)施例提供的對端點(diǎn)類型的分析方法流程圖。
【具體實(shí)施方式】
[0028]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合實(shí)施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0029]下面結(jié)合附圖1、2及具體實(shí)施例對本發(fā)明的應(yīng)用原理作進(jìn)一步描述。
[0030]該雙聲道語音的搶插話分析方法包括以下步驟:
[0031]S101、通過語音活動檢測技術(shù)針對兩個聲道的錄音流進(jìn)行有效語音端點(diǎn)檢測,找出來整個語音中從幾秒到幾秒說過話;
[0032]S102、根據(jù)兩個聲道錄音的有效語音端點(diǎn),將每個片段的端點(diǎn)時間統(tǒng)一處理,通過時間點(diǎn)、聲道、端點(diǎn)類型三個屬性統(tǒng)一描述,并將所有端點(diǎn)平鋪到時間軸上;
[0033]S103、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話的開始端點(diǎn),后一個端點(diǎn)為角色B說話的結(jié)束端點(diǎn),此為插話現(xiàn)象。
[0034]S104、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話結(jié)束的端點(diǎn),后一個端點(diǎn)為角色B說話的開始端點(diǎn),且兩個端點(diǎn)的時間邊界差小于200ms,即為搶話現(xiàn)象。
[0035]在SlOl中的有效語音端點(diǎn)包含開始時間、結(jié)束時間、說話人三個屬性。
[0036]S102中端點(diǎn)類型包括開始和結(jié)束。
[0037]對端點(diǎn)類型的分析方法包括以下步驟:
[0038]S201、檢查端點(diǎn)類型;
[0039]S202、如果為開始位置端點(diǎn),則判斷棧頂是否包含開始位置;
[0040]S203、若棧頂包含開始位置,則判斷開始時間位置是否和該開始位置的角色相同;
[0041]S204、若相同,則說明數(shù)據(jù)出錯,不可能一個人沒有說完話,又重新開始說話;
[0042]S205、若不同,則說明發(fā)生插話,記錄該插話信息,并將棧頂端點(diǎn)彈出;
[0043]S206、若棧頂不包含開始位置,則將開始位置壓棧,將端點(diǎn)位置加I,并繼續(xù)循環(huán);
[0044]S207、如果為結(jié)束位置端點(diǎn),則判斷棧頂是否包含開始位置;
[0045]S208、若棧頂包含開始位置,則判斷開始時間位置是否和該結(jié)束位置的角色是否相同;
[0046]S209、若相同,則說明是正常端點(diǎn),沒有發(fā)生插話,記錄該結(jié)束位置時間點(diǎn);
[0047]S210、若不同,則說明數(shù)據(jù)錯誤,前面發(fā)生了插話確并沒有記錄;
[0048]S211、若棧頂不包含開始位置,則看前一個端點(diǎn)的結(jié)束位置和開始位置是否在200ms以內(nèi),是則發(fā)生搶話,記錄搶話發(fā)生時間,并將棧頂端點(diǎn)彈出;
[0049]S212、將所有搶插話信息整理并記錄,其中每段搶插話包含開始時間、結(jié)束時間、類型(搶話或者插話),搶插話方向(誰搶插話了誰)。
[0050]該雙聲道語音的搶插話分析方法能夠在兩個或者多個角色之間發(fā)生搶話、插話時需要能夠及時的捕捉到這一現(xiàn)象,并進(jìn)行后續(xù)處理,避免了搶話和插話不禮貌的通話方式,為客服服務(wù)提供了優(yōu)質(zhì)的保障。
[0051]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種雙聲道語音的搶插話分析方法,其特征在于,該雙聲道語音的搶插話分析方法包括以下步驟: 步驟一、通過語音活動檢測技術(shù)針對兩個聲道的錄音流進(jìn)行有效語音端點(diǎn)檢測,找出來整個語音中從幾秒到幾秒說過話; 步驟二、根據(jù)兩個聲道錄音的有效語音端點(diǎn),將每個片段的端點(diǎn)時間統(tǒng)一處理,通過時間點(diǎn)、聲道、端點(diǎn)類型三個屬性統(tǒng)一描述,并將所有端點(diǎn)平鋪到時間軸上; 步驟三、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話的開始端點(diǎn),后一個端點(diǎn)為角色B說話的結(jié)束端點(diǎn),此為插話現(xiàn)象。 步驟四、緊挨著的兩個端點(diǎn),其中前一個端點(diǎn)為角色A說話結(jié)束的端點(diǎn),后一個端點(diǎn)為角色B說話的開始端點(diǎn),且兩個端點(diǎn)的時間邊界差小于200ms,即為搶話現(xiàn)象。2.如權(quán)利要求1所述的雙聲道語音的搶插話分析方法,其特征在于,在步驟一中的有效語音端點(diǎn)包含開始時間、結(jié)束時間、說話人三個屬性。3.如權(quán)利要求1所述的雙聲道語音的搶插話分析方法,其特征在于,步驟二中端點(diǎn)類型包括開始和結(jié)束。4.如權(quán)利要求1所述的雙聲道語音的搶插話分析方法,其特征在于,對端點(diǎn)類型的分析方法包括以下步驟: 步驟一、檢查端點(diǎn)類型; 步驟二、如果為開始位置端點(diǎn),則判斷棧頂是否包含開始位置; 步驟三、若棧頂包含開始位置,則判斷開始時間位置是否和該開始位置的角色相同; 步驟四、若相同,則說明數(shù)據(jù)出錯,不可能一個人沒有說完話,又重新開始說話; 步驟五、若不同,則說明發(fā)生插話,記錄該插話信息,并將棧頂端點(diǎn)彈出; 步驟六、若棧頂不包含開始位置,則將開始位置壓棧,將端點(diǎn)位置加I,并繼續(xù)循環(huán); 步驟七、如果為結(jié)束位置端點(diǎn),則判斷棧頂是否包含開始位置; 步驟八、若棧頂包含開始位置,則判斷開始時間位置是否和該結(jié)束位置的角色是否相同; 步驟九、若相同,則說明是正常端點(diǎn),沒有發(fā)生插話,記錄該結(jié)束位置時間點(diǎn); 步驟十、若不同,則說明數(shù)據(jù)錯誤,前面發(fā)生了插話確并沒有記錄; 步驟十一、若棧頂不包含開始位置,則看前一個端點(diǎn)的結(jié)束位置和開始位置是否在200ms以內(nèi),是則發(fā)生搶話,記錄搶話發(fā)生時間,并將棧頂端點(diǎn)彈出; 步驟十二、將所有搶插話信息整理并記錄,其中每段搶插話包含開始時間、結(jié)束時間、類型,搶插話方向。
【文檔編號】G10L25/48GK105895116SQ201610209686
【公開日】2016年8月24日
【申請日】2016年4月6日
【發(fā)明人】劉郁松, 何國濤, 李全忠, 蒲瑤
【申請人】普強(qiáng)信息技術(shù)(北京)有限公司