一種語速自動調(diào)節(jié)的方法及終端的制作方法

文檔序號：10513498閱讀：596來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種語速自動調(diào)節(jié)的方法及終端的制作方法
【專利摘要】本發(fā)明公開了一種語速自動調(diào)節(jié)的方法，包括：獲取輸入的語音信息；提取所述語音信息的語音特征信息；從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度；可見該方法能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，以適應(yīng)各種用戶的需求；即實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度，且可以用于通話以及程序播放等場合適應(yīng)性強。本發(fā)明還公開了一種終端，能夠?qū)崿F(xiàn)根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度。
【專利說明】
一種語速自動調(diào)節(jié)的方法及終端
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及通信技術(shù)領(lǐng)域，特別涉及一種語速自動調(diào)節(jié)的方法及終端。
【背景技術(shù)】
[0002]由于人們的聽力水平的不同，同樣語速的播放內(nèi)容對一部分人來說會覺得語速很快以至于聽不清楚，對另一部分人來說會覺得語速很慢以至于覺得在浪費時間。因此，終端中的播放內(nèi)容的語速需要根據(jù)人們的實際需求進行設(shè)定。
[0003]現(xiàn)有技術(shù)中，在用戶手機客戶端應(yīng)用程序增加語速調(diào)節(jié)控件，使得用戶選擇調(diào)節(jié)語速，選定語速等級，手機按照用戶設(shè)定調(diào)節(jié)語速等級播放語音內(nèi)容。但是上述方法也存在一下缺點:首先，語速的調(diào)節(jié)雖然分為幾個等級，但是需要人手動預(yù)設(shè)，不能動態(tài)的調(diào)節(jié)即不能夠自適應(yīng)的對語速進行調(diào)節(jié)。其次，語速調(diào)節(jié)僅限于手機客戶端軟件播放的內(nèi)容，不能在通話時實時的調(diào)節(jié)語速。最后，不能自適應(yīng)其他種類語言，根據(jù)通話雙方的語種進行語速調(diào)節(jié)。因此，如何自適應(yīng)對語速進行調(diào)節(jié)，是本領(lǐng)域技術(shù)人員需要解決的技術(shù)問題。

【發(fā)明內(nèi)容】

[0004]本發(fā)明的目的是提供一種語速自動調(diào)節(jié)的方法及終端，能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度。
[0005]為解決上述技術(shù)問題，本發(fā)明提供一種語速自動調(diào)節(jié)的方法，包括:
[0006]獲取輸入的語音信息；
[0007]提取所述語音信息的語音特征信息；
[0008]從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；
[0009]根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。
[0010]其中，所述提取所述語音信息的語音特征信息，包括:
[0011 ]識別所述語音信息的語種特征信息;和/或，
[0012]提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。
[0013]其中，所述語音信息為本端用戶的語音信息，該方法還包括:
[0014]獲取所述本端用戶的體征信息；
[0015]從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度，包括:
[0016]從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度。
[0017]其中，將從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度之后，還包括:
[0018]利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。
[0019]其中，根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度，包括:
[0020]通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度。
[0021]本發(fā)明還提供一種終端，包括:
[0022]語音信息獲取模塊，用于獲取輸入的語音信息；
[0023]語音特征提取模塊，用于提取所述語音信息的語音特征信息；
[0024]播放速度確定模塊，用于從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；
[0025]播放速度調(diào)節(jié)模塊，用于根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。
[0026]其中，所述語音特征提取模塊包括:
[0027]第一語音特征提取單元，用于識別所述語音信息的語種特征信息;和/或，
[0028]第二語音特征提取單元，用于提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。
[0029]其中，所述語音信息為本端用戶的語音信息，該終端還包括:
[0030]體征信息獲取模塊，用于獲取所述本端用戶的體征信息。
[0031 ] 其中，所述終端還包括:
[0032]機器學(xué)習(xí)模塊，用于利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。
[0033]其中，所述播放速度調(diào)節(jié)模塊具體為通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度的模塊。
[0034]本發(fā)明所提供的語速自動調(diào)節(jié)的方法，包括:獲取輸入的語音信息;提取所述語音信息的語音特征信息;從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度;根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度；
[0035]可見該方法能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，以適應(yīng)各種用戶的需求；即實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度，且該方法可以用于用戶通話以及程序播放等場合，提高了該方法的適應(yīng)性。本發(fā)明還提供了一種終端，具有上述有益效果，在此不再贅述。
【附圖說明】
[0036]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)提供的附圖獲得其他的附圖。
[0037]圖1為本發(fā)明實施例所提供的語速自動調(diào)節(jié)的方法的流程圖；
[0038]圖2為本發(fā)明實施例所提供的終端的結(jié)構(gòu)框圖；
[0039]圖3為本發(fā)明實施例所提供的另一終端的結(jié)構(gòu)框圖；
[0040]圖4為本發(fā)明實施例所提供的又一終端的結(jié)構(gòu)框圖。
【具體實施方式】
[0041]本發(fā)明的核心是提供一種語速自動調(diào)節(jié)的方法及終端，能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度。
[0042]為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚，下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。
[0043]請參考圖1，圖1為本發(fā)明實施例所提供的語速自動調(diào)節(jié)的方法的流程圖；本實施例中的執(zhí)行主體為終端，該終端可以是手機;該方法可以包括:
[0044]S100、獲取輸入的語音信息；
[0045]其中，這里語音信息的獲取可以是對通話業(yè)務(wù)及能夠?qū)崿F(xiàn)語音播放功能業(yè)務(wù)的應(yīng)用程序的監(jiān)聽來實現(xiàn)；即可以是本端用戶打電話或者接電話時的語音信息，也可以是對端用戶打電話或者接電話時的語音信息，也可以是具有語音播放功能的應(yīng)用程序播放的語音?目息O
[0046]S110、提取所述語音信息的語音特征信息；
[0047]其中，這里提取的語音特征信息的種類以及種類的數(shù)量都可以根據(jù)用戶實際需要進行確認，只要可以依據(jù)語音信息中具有的該語音特征信息來對應(yīng)按照預(yù)設(shè)標(biāo)準調(diào)節(jié)獲取的語音信息的播放速度即可。即能夠通過語音信息中的語音特征信息按照預(yù)設(shè)標(biāo)準調(diào)節(jié)其播放語速實現(xiàn)語速自動調(diào)節(jié)即可。例如，這里的語音特征信息可以包括情緒、語種、語音特征、語速、語調(diào)等特征信息。
[0048]S120、從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；
[0049]其中，當(dāng)確認需要進行提取的語音特征信息后，用戶可以預(yù)先設(shè)置對應(yīng)每種語音特征信息相應(yīng)的播放速度，或者幾種語音特征信息共同確定對應(yīng)的一個播放速度;這里可以在語音數(shù)據(jù)庫中以對應(yīng)列表的形式將上述對應(yīng)關(guān)系進行存儲，也可以利用映射表的形式將上述對應(yīng)關(guān)系進行存儲。用戶還可以根據(jù)實際情況的變化對語音數(shù)據(jù)庫中保存的對應(yīng)關(guān)系進行修改、刪除、增加等修改，以保證設(shè)定的語音特征信息相對應(yīng)的播放速度為最新的，能夠滿足用戶的實際需求。
[0050]這里查詢語音數(shù)據(jù)庫，還可以包括將提取的語音特征信息與語音數(shù)據(jù)庫中對應(yīng)的該類語音特征信息的范圍區(qū)間進行對比，判斷提取的語音特征信息的數(shù)值位于哪個范圍，進而確認該范圍對應(yīng)的預(yù)設(shè)播放速度。用戶也可以根據(jù)實際需求對語音特征信息的范圍區(qū)間進行修改，也可以對每個范圍對應(yīng)的預(yù)設(shè)播放速度進行修改，以適應(yīng)用戶的個性化需求，提尚用戶體驗。
[0051 ] S130、根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。
[0052]其中，根據(jù)得到的播放速度對語音信息進行調(diào)節(jié)，以達到該播放速度。這里并不對具體的語音信息調(diào)節(jié)的方法進行限定，只要可以將獲取的語音信息調(diào)節(jié)到對應(yīng)的播放速度進行播放即可。下面提供一種具體的語速調(diào)節(jié)過程:通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度。即通過插值或者抽剪對數(shù)字信號重新采樣，從而拉長或縮短語音的時間尺度，達到改變語速的目的。
[0053]例如，在人們使用手機的過程中，通話是一個基本業(yè)務(wù)，也是一個很重要的功能。但是有些人說話語速比較快，有的人聽力又不好，這種情況下溝通起來就比較困難。該方法在用戶使用手機進行通話的過程中，根據(jù)獲取的輸入語音信息對雙方通話時的情緒、語種、語音特征等語音特征信息進行采集并與語音數(shù)據(jù)庫中的信息進行比對，從而進行判斷，如果語速過快，或者對端有異常反饋，確認該語速對應(yīng)的播放速度，或者異常反饋對應(yīng)的播放速度，并通過插值或者抽剪對數(shù)字信號重新采樣，從而拉長或縮短語音的時間尺度，達到改變語速的目的。用戶使用手機時根據(jù)本端用戶或?qū)Χ擞脩羰褂檬謾C通話時使用的語言種類、情緒變化等因素，自動的調(diào)節(jié)從聽筒播放出來的聲音的速度。以適應(yīng)于各類人群的需求。
[0054]其中，可選的，利用機器學(xué)習(xí)算法對所述語音數(shù)據(jù)庫進行學(xué)習(xí)更新。
[0055]在終端中維護語音數(shù)據(jù)庫，可以對用戶的語音特征信息參數(shù)進行存儲，使機器學(xué)習(xí)算法將語音特征信息參數(shù)作為輸入進行學(xué)習(xí)實現(xiàn)對語音數(shù)據(jù)庫的更新?？梢愿鶕?jù)不同的用戶群體的長期使用習(xí)慣進行調(diào)節(jié)，而不是完全按照指導(dǎo)的原始設(shè)定數(shù)據(jù)來調(diào)節(jié)，具有更好的適應(yīng)性。
[0056]上述例子具體實現(xiàn)過程可以如下:
[0057]本端用戶即主叫端用戶急于表述某事或情緒激動時，其語音信息內(nèi)容所用的詞句符合數(shù)據(jù)庫中對用戶“急躁”這類定義，那么就會按照“急躁”對應(yīng)的播放速度降低獲取的輸入語音信息的語速。達到舒緩的目的，使得用戶可以更加高效與友好的使用手機通話功能。
[0058]再例如主叫端用戶使用英語時，根據(jù)語音特征信息判斷出這是英語，那么就會按照英語對應(yīng)的播放速度調(diào)節(jié)輸入語音信息的語速。這樣調(diào)節(jié)之后，被叫端用戶即對端用戶會聽到放慢后的語音信息，即可一定程度解決用戶在與非母語用戶溝通時聽力困難的問題。
[0059]基于上述技術(shù)方案，本發(fā)明實施例提的語速自動調(diào)節(jié)的方法，能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，以適應(yīng)各種用戶的需求；即實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度，且該方法可以用于用戶通話以及程序播放等場合，提高了該方法的適應(yīng)性強。使不同用戶可以根據(jù)自身需求自適應(yīng)語音播放速度，提升用戶感受。
[0060]基于上述實施例，該實施例可以根據(jù)輸入語音信息的語言種類自適應(yīng)的調(diào)節(jié)與各個語言種類相對應(yīng)語音信息播放速度；即能夠根據(jù)語言種類自適應(yīng)調(diào)節(jié)播放速度。優(yōu)選的，所述提取所述語音信息的語音特征信息具體為:
[0061 ]識別所述語音信息的語種特征信息。
[0062]其中，通過對獲取的輸入語音信息的識別，可以得到語音信息的語種特征信息該語種特征信息可以包括音頻參數(shù)，特征詞信息，根據(jù)該語種特征信息對應(yīng)的預(yù)設(shè)的播放速度，確定該語音信息播放的速度。這里可以用戶可以對任意語種都分別設(shè)置對應(yīng)的播放速度;或者對預(yù)定數(shù)量的語種分別設(shè)置對應(yīng)的播放速度;或者將語種分為幾大類別，僅針對每種類別設(shè)置對應(yīng)的播放速度，相對應(yīng)這里的語種特征信息可以是類別信息，或者是將得到語種在判斷該語種屬于哪一個類別，最后再確定對應(yīng)的播放速度;這種語種與播放速度的對應(yīng)關(guān)系可以通過對應(yīng)列表或者映射表實現(xiàn)。
[0063]其中，語種特征信息的識別方法可以通過用戶語種識別系統(tǒng)和語言文本翻譯系統(tǒng)合成用戶每種語言的“參考語音”、基于音段和音節(jié)的馬爾可夫模型、基音輪廓、共振峰矢量、聲學(xué)特征、方言性的音素和韻律特征、及其原始的語音聲波特征進行識別。使用的分類方法可以包括HMM、專家系統(tǒng)、聚類算法、二次分類、以及人工神經(jīng)網(wǎng)絡(luò)。
[0064]下面通過幾種具體的應(yīng)用場景對上述實施例進行說明:
[0065]將監(jiān)聽到終端中應(yīng)用程序存在輸入語音信息時，對獲取的語音信息進行識別，若判定該語種特征信息為英語時，確定用戶預(yù)設(shè)的英語對應(yīng)的播放速度，并將語音信息的語速調(diào)節(jié)為對應(yīng)的播放速度。其中英語僅為舉例。
[0066]在用戶進行通話時，可以僅檢測本端用戶的語音信息的語種，也可以僅檢測對端用戶的語音信息的語種，也可以檢測本端用戶及對端用戶的語音信息的語種；下面以最后一種情況為例進行說明:
[0067]開始時手機處于正常通信狀態(tài)，主被叫已經(jīng)接通。語音信息獲取模塊獲取輸入的語音信息;語音特征提取模塊對雙方的音頻參數(shù)以及關(guān)鍵詞句進行提取。播放速度確定模塊將提取到的音頻參數(shù)解析，查詢語音數(shù)據(jù)庫并進行語種判斷，根據(jù)語種確定用戶預(yù)設(shè)的播放速度。播放速度調(diào)節(jié)模塊對語音信息進行時間上的拉長或縮短處理。聽筒播放經(jīng)過處理的語音信息。雙方掛斷電話，通話完成。
[0068]該實施例用戶可以根據(jù)自身實際情況確定對每種語言的接收能力，合理設(shè)定播放速度，可以解決用戶在與非母語用戶溝通時聽力困難的問題。
[0069]基于上述任意實施例，該實施例主要用于用戶之間進行語音交流時，可能會出現(xiàn)語速過快，情緒激動等情況，為了能夠在這些情況下用戶之間的交流可以順利進行，根據(jù)用戶語音信息的語音特征信息確定用戶的狀態(tài)，確定該狀態(tài)下設(shè)定的播放速度；即能夠根據(jù)用戶說話狀態(tài)自適應(yīng)調(diào)節(jié)播放速度。優(yōu)選的，所述提取所述語音信息的語音特征信息具體為:
[0070]提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。
[0071]其中，這些需要首先確定每種語音特征信息對應(yīng)的或者反應(yīng)的用戶狀態(tài)，進行確定在該種狀態(tài)下應(yīng)該設(shè)置什么樣的播放速度。這里可以僅僅根據(jù)語速信息進行判定，也可以僅僅根據(jù)特征詞信息進行判定等，即語速信息，特征詞信息及音頻信息可以任意組合；
[0072]單個使用時，根據(jù)每種語音特征信息情況進行分類，并對分類后的每種情況設(shè)定對應(yīng)的播放速度，例如語速信息，用戶在急躁的情況下說話語速一般會過快，則當(dāng)語速信息超過一定值時即可以認為該用戶為急躁，將其語音信息設(shè)置為預(yù)定的急躁下的播放速度，當(dāng)然也可以將語速分為若干個語速范圍，并設(shè)置每個語速范圍下對應(yīng)的播放速度。
[0073]為了提高語速調(diào)節(jié)的準確性，優(yōu)選的可以將語速信息，特征詞信息及音頻信息結(jié)合使用，即根據(jù)三個特征的信息綜合來確定播放速度。例如，用戶在急躁的情況下說話語速一般會過快，會出現(xiàn)一些特定詞語(用戶可以根據(jù)自身的特點設(shè)定在自己急躁情況下的習(xí)慣性用詞)，并且聲音會高，若出現(xiàn)三者或者至少兩者即可以認為該用戶為急躁，將其語音信息設(shè)置為預(yù)定的急躁下的播放速度。
[0074]該實施例中的語速信息，特征詞信息及音頻信息可以任意與語種特征信息進行組合使用。如設(shè)置英語各個語速范圍下對應(yīng)的播放速度，漢語各個語速范圍下對應(yīng)的播放速度。
[0075]基于上述實施例，用戶能自適應(yīng)調(diào)節(jié)通話語速的問題。使不同用戶可以根據(jù)自身需求改變語音播放速度，提升用戶感受。
[0076]基于上述任意實施例，該實施例主要為了能夠更加準確的確定本端用戶的狀態(tài)，進而確定本端用戶在該狀態(tài)下的播放速度;能夠根據(jù)本端用戶說話狀態(tài)自適應(yīng)調(diào)節(jié)播放速度。即所述語音信息為本端用戶的語音信息，該方法還可以包括:
[0077]獲取所述本端用戶的體征信息；
[0078]相應(yīng)的從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度，包括:
[0079]從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度。
[0080]其中，上述實施例可以根據(jù)語速信息，特征詞信息及音頻信息確定用戶的狀態(tài)，為了更加準確的確定本端用戶是否處于該狀態(tài)下，還可以獲取本端用戶的體征信息，體征信息可以包括本端用戶的體溫，脈搏等。且體征信息的采集可以通過與終端相適應(yīng)的智能穿戴設(shè)備如智能手環(huán)等采集。
[0081]例如本端用戶即主叫端用戶急于表述某事或情緒激動時，其語音信息內(nèi)容所用的詞句符合數(shù)據(jù)庫中對用戶急躁這類定義，并且從智能手環(huán)采集到了用戶脈搏加快等信息，那么可以確定用戶處于急躁狀態(tài)，會按照急躁對應(yīng)的播放速度降低獲取的輸入語音信息的語速。達到舒緩的目的，使得用戶可以更加高效與友好的使用手機通話功能。具體過程可以如下:
[0082]手機處于正常通信狀態(tài)，主被叫已經(jīng)接通。采集用戶的語音信息，并通過智能手環(huán)采集用戶通話過程中的體溫、脈搏等信息。查詢語音數(shù)據(jù)庫信息，結(jié)合用戶通話過程中的體溫、脈搏變化與關(guān)鍵詞句即特征詞信息的使用，判斷用戶是否有情緒激動的狀況。并根據(jù)語速信息判斷是否需要調(diào)節(jié)。如果滿足調(diào)節(jié)的條件，則根據(jù)語音數(shù)據(jù)庫中的預(yù)設(shè)值來進行調(diào)節(jié)，確定新的播放速度。對語音信息數(shù)據(jù)進行時間上的拉長或縮短處理。聽筒播放經(jīng)過處理的語音數(shù)據(jù)。且可以將本次用戶的情緒變化信息和特征語句寫入語音數(shù)據(jù)庫，以優(yōu)化后續(xù)對情緒判斷的計算。
[0083]基于上述任意實施例，該實施例主要提高語音數(shù)據(jù)庫的準確性，因此，該方法還包括:
[0084]利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。
[0085]其中，在終端中維護語音數(shù)據(jù)庫，可以對用戶的音頻信息參數(shù)進行存儲，這樣指導(dǎo)就具備語速調(diào)節(jié)的學(xué)習(xí)功能。可以根據(jù)不同的用戶群體的長期使用習(xí)慣進行調(diào)節(jié)，而不是完全按照指導(dǎo)的原始設(shè)定數(shù)據(jù)來調(diào)節(jié)，具有更好的適應(yīng)性。具有學(xué)習(xí)功能，會不斷更新用戶常使用的關(guān)鍵性用語即特征詞信息，以優(yōu)化后續(xù)對與用戶情緒判斷的計算。
[0086]基于上述技術(shù)方案，本發(fā)明實施例提的語速自動調(diào)節(jié)的方法，能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)，以適應(yīng)各種用戶的需求；即實現(xiàn)了根據(jù)語音信息的內(nèi)容自適應(yīng)的調(diào)節(jié)播放速度，且該方法可以用于用戶通話以及程序播放等場合，提高了該方法的適應(yīng)性強。使不同用戶可以根據(jù)自身需求自適應(yīng)語音播放速度，提升用戶感受。
[0087]本發(fā)明實施例提供了語速自動調(diào)節(jié)的方法，能夠根據(jù)實時輸入的語音信息的語音特征信息，確定與該語音特征信息相對應(yīng)的預(yù)定的播放速度，根據(jù)該播放速度對輸入的語音信息的語速進行調(diào)節(jié)。
[0088]下面對本發(fā)明實施例提供的終端進行介紹，下文描述的終端與上文描述的語速自動調(diào)節(jié)的方法可相互對應(yīng)參照。
[0089]請參考圖2，圖2為本發(fā)明實施例所提供的終端的結(jié)構(gòu)框圖；該終端可以包括:
[0090]語音信息獲取模塊100，用于獲取輸入的語音信息；
[0091 ]語音特征提取模塊200，用于提取所述語音信息的語音特征信息；
[0092]播放速度確定模塊300，用于從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；
[0093]播放速度調(diào)節(jié)模塊400，用于根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。
[0094]可選的，所述語音特征提取模塊200包括:
[0095]第一語音特征提取單元，用于識別所述語音信息的語種特征信息;和/或，
[0096]第二語音特征提取單元，用于提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。
[0097]可選的，請參考圖3，所述語音信息為本端用戶的語音信息，該終端還包括:
[0098]體征信息獲取模塊500，用于獲取所述本端用戶的體征信息。
[0099]其中，這時播放速度確定模塊300具體為從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度的模塊。
[0100]可選的，請參考圖4，該終端還包括:
[0101]機器學(xué)習(xí)模塊600，用于利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。
[0102]可選的，播放速度調(diào)節(jié)模塊400具體為通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度的模塊。
[0103]其中，基于上述任意實施例，該終端具體可以為手機。
[0104]說明書中各個實施例采用遞進的方式描述，每個實施例重點說明的都是與其他實施例的不同之處，各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言，由于其與實施例公開的方法相對應(yīng)，所以描述的比較簡單，相關(guān)之處參見方法部分說明即可。
[0105]專業(yè)人員還可以進一步意識到，結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟，能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn)，為了清楚地說明硬件和軟件的可互換性，在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行，取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能，但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。
[0106]結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊，或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(R0M)、電可編程R0M、電可擦除可編程R0M、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
[0107]以上對本發(fā)明所提供的語速自動調(diào)節(jié)的方法及終端進行了詳細介紹。本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出，對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說，在不脫離本發(fā)明原理的前提下，還可以對本發(fā)明進行若干改進和修飾，這些改進和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。
【主權(quán)項】
1.一種語速自動調(diào)節(jié)的方法，其特征在于，包括: 獲取輸入的語音信息；提取所述語音信息的語音特征信息；從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。2.如權(quán)利要求1所述的語速自動調(diào)節(jié)的方法，其特征在于，所述提取所述語音信息的語音特征信息，包括: 識別所述語音信息的語種特征信息;和/或，提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。3.如權(quán)利要求1或2所述的語速自動調(diào)節(jié)的方法，其特征在于，所述語音信息為本端用戶的語音信息，該方法還包括: 獲取所述本端用戶的體征信息；從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度，包括: 從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度。4.如權(quán)利要求3所述的語速自動調(diào)節(jié)的方法，其特征在于，將從語音數(shù)據(jù)庫中查詢與所述語音特征信息及所述體征信息相對應(yīng)的所述語音信息的播放速度之后，還包括: 利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。5.如權(quán)利要求1所述的語速自動調(diào)節(jié)的方法，其特征在于，根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度，包括: 通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度。6.一種終端，其特征在于，包括: 語音信息獲取模塊，用于獲取輸入的語音信息；語音特征提取模塊，用于提取所述語音信息的語音特征信息；播放速度確定模塊，用于從語音數(shù)據(jù)庫中查詢與所述語音特征信息相對應(yīng)的所述語音信息的播放速度；播放速度調(diào)節(jié)模塊，用于根據(jù)所述播放速度調(diào)節(jié)所述語音信息播放的速度。7.如權(quán)利要求6所述的終端，其特征在于，所述語音特征提取模塊包括: 第一語音特征提取單元，用于識別所述語音信息的語種特征信息;和/或，第二語音特征提取單元，用于提取所述語音信息的語速信息，特征詞信息及音頻信息中至少一種。8.如權(quán)利要求6或7所述的終端，其特征在于，所述語音信息為本端用戶的語音信息，該終端還包括: 體征信息獲取模塊，用于獲取所述本端用戶的體征信息。9.如權(quán)利要求8所述的終端，其特征在于，還包括: 機器學(xué)習(xí)模塊，用于利用所述語音特征信息及所述體征信息，根據(jù)機器學(xué)習(xí)算法對語音數(shù)據(jù)庫中播放速度的對應(yīng)關(guān)系進行更新。10.如權(quán)利要求6所述的終端，其特征在于，所述播放速度調(diào)節(jié)模塊具體為通過插值或者抽剪對所述語音信息的數(shù)字信號重新采樣，調(diào)節(jié)所述語音信息的時間尺度達到所述播放速度的模塊。
【文檔編號】G10L15/26GK105869626SQ201610375868
【公開日】2016年8月17日
【申請日】2016年5月31日
【發(fā)明人】王曉軍
【申請人】宇龍計算機通信科技(深圳)有限公司

完整全部詳細技術(shù)資料下載