專利名稱:一種音頻數據變音系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及音頻數據處理領域,特別涉及一種對音頻數據進行變音處理 的系統(tǒng)。
背景技術:
音頻變音是對音頻數據進行后期處理的方法,例如,保持音頻數據音調不變而加快或減慢音頻節(jié)奏;保持音頻數據的節(jié)奏不變而提高或降低音頻數 據的音調;將音頻數據的固有音量放大或減小等等。音頻變音是音樂工作者、語音工作者在進行樂譜記錄、語音識別、制作 虛擬化人聲等工作中常用的技術手段。此外,在日常生活中,出于娛樂和對 個性化的追求等目的,對音頻數據進行變音/混音處理,如制作個性化手機 鈴音等需求也大量存在。但是,由于對音頻數據進行變音處理對處理平臺的硬件資源有較高的要 求,并不是任何保存有音頻數據的終端都能將音頻數據快速、有效地進行變 音處理。例如,由于缺乏相應的硬件資源,保存在手機等嵌入式設備中的音 頻數據通常無法在設備中直接進行變音處理。此外,由于缺乏專業(yè)的音頻處 理軟件和豐富的音頻素材,普通消費者即使將音頻數據傳送至個人電腦等硬 件資源相對豐富的平臺上,也很難對音頻數據進行滿足需求的變音處理 此外,由于音頻數據通常都是經過特定的算法壓縮后進行傳輸和保存, 如果缺乏對該壓縮算法的支持,普通的音頻處理軟件也無法對音頻數據進行 處理。發(fā)明內容本發(fā)明要解決的技術問題是,克服現有技術中對音頻數據進行變音處理
的方法的不足,提出一種借助網絡為用戶實現音頻數據變音的系統(tǒng),使任何 具備網絡通訊功能的終端都能夠及時地對音頻數據進行滿足需求的變音處 理。
為了解決上述問題,本發(fā)明提供一種音頻數據變音系統(tǒng),包含網絡接口單元,用于通過網絡接收和發(fā)送音頻數據,該系統(tǒng)還包含變音單元,用于將網絡^接口單元發(fā)送的音頻數據進行變音處理,并將變 音處理后的音頻數據發(fā)送至網絡接口單元;用戶管理單元,用于將通過網絡接口單元接收的音頻變音服務請求和變 音參數進行有效性審核,并通過網絡接口單元向用戶發(fā)送審核結果信息;所述網絡接口單元還用于接收和發(fā)送音頻變音服務請求、所述審核結果 信息和變音參數。此外,所述網絡接口單元為數字接口單元,用于通過數字包交換網絡接 收和發(fā)送所述音頻變音服務請求、審核結果信息、變音參數和數字語音數據; 該系統(tǒng)還包含編解碼單元,用于對數字語音信息進行解碼處理并將解碼處 理后的^:據發(fā)送至所述變音單元,此外編解碼單元還對經過變音處理后的音 頻數據進行編碼處理;所述變音單元通過編解碼單元接收所述音頻數據和發(fā) 送所述變音處理后的音頻數據。此外,所述網絡接口單元為語音接口 。此外,該系統(tǒng)還包含文件管理單元,與所述數字接口單元和編解碼單 元相連,用于將從數字接口單元接收到的音頻數據進行緩存或以文件方式保 存,并將緩存的或以文件方式保存的音頻數據發(fā)送至編解碼單元;此外,文 件管理單元將從編解碼單元接收的經過變音處理和編碼處理的音頻數據進 行緩存或以文件方式保存,并將緩存的或以文件方式保存的音頻數據發(fā)送至 數字接口單元。本發(fā)明通過將終端上的音頻數據上傳至網絡中的變音系統(tǒng),由網絡變音 系統(tǒng)對該音頻數據進行變音處理,并可將經過處理的音頻數據實時傳送至終
端,使得任何具備網絡訪問能力的終端都能以最快最便捷的方式對音頻數據 進行變音處理。
圖l是本發(fā)明音頻數據變音方法的流程圖;圖2是本發(fā)明音頻數據變音系統(tǒng)的系統(tǒng)結構示意圖。
具體實施方式
本發(fā)明的基本思路是,將終端上的音頻數據及相應的變音參數上傳至網 絡中的變音系統(tǒng),變音系統(tǒng)接收到完整的可變音數據單元后對音頻數據進行 解碼和變音處理。下面將結合附圖和實施例對本發(fā)明進行詳細的描述。圖l是本發(fā)明音頻數據變音方法的流程圖。如圖l所示,本發(fā)明的音頻數據變音方法包含如下步驟步驟l:終端向網絡中的變音系統(tǒng)發(fā)出音頻變音服務請求;上述終端可以是具有網絡訪問功能的個人電腦或個人數字助理(PDA )、 移動音頻擷取/播放裝置、移動電話等嵌入式裝置。上述音頻變音服務請求可以通過IP網絡以命令包的形式發(fā)出,也可以 通過電話網纟各結合IVR (Interactive Voice Response,交互式i吾音應答)系統(tǒng) 等方式發(fā)送至變音系統(tǒng)。音頻變音服務請求中可包含用戶名、密碼等用戶識別信息。步驟2:變音系統(tǒng)對接收到的音頻變音服務請求的有效性進行審核;對 于無效請求返回錯誤信息,本方法結束;若為有效請求,則發(fā)送變音服務請 求有效信息給終端;對音頻變音服務請求的審核包含對用戶名、密碼等用戶識別信息的審 核。例如,若用戶名、密碼不正確,或該用戶沒有申請變音服務,則該音頻
變音服務請求為無效請求。步驟3:終端接收到變音服務請求有效信息后,將變音參數發(fā)送至變音 系統(tǒng);上述變音參數包含變音服務類型,音頻參數,服務時間,回放參數等信息;變音服務類型可包含變調,變節(jié)奏,固有音量調整,降噪,淡入、淡 出、回聲等音頻特殊效果制作等。音頻參數與變音服務類型相關,如對于變調服務,音頻參數可包含音調 增加或降低的半音數;對于固有音量調整服務,音頻參數可包含音量增加或 降低的百分比;對于回聲制作服務,音頻參數可包含回聲延遲時間等。服務時間信息可包含服務開始時間,服務結束時間或服務時間長度等信自回放參數可包含回放方式,編碼格式等信息。例如,當回放方式選用文 件回放方式時,變音系統(tǒng)將經過變音處理的音頻數據保存成音頻文件,并在 適當的時候通過IP網絡發(fā)送至終端;若回放方式選用模擬回放方式,變音 系統(tǒng)將經過變音處理的音頻數據通過電話網絡發(fā)送至終端,終端可以將其以 模擬音頻數據方式進行播放。此外,回放方式還可以是實時模擬回放,即將 經過變音處理的數據以模擬語音數據的形式實時發(fā)送至終端;或實時數字回 放,即將經過變音處理的數據以數字語音數據的形式實時發(fā)送至終端。編碼 格式可以是G711U 、 G711A 、 G723、 G729等。步驟4:變音系統(tǒng)對接收到的變音參數進行有效性檢查,若變音參數錯 誤則返回參數錯誤信息;若參數正確有效則發(fā)送變音請求接受信息至終端.步驟5:終端接收到變音請求接受信息后,向變音系統(tǒng)發(fā)送音頻數據流;上述音頻數據流可以是通過IP網絡發(fā)送的數字音頻數據包,或者是通 過電話網絡發(fā)送的模擬音頻數據流。
步驟6:變音系統(tǒng)接收到完整可變音數據單元后,進行變音處理;上述完整可變音數據單元的大小與終端發(fā)送的音頻數據流的類型,變音 服務類型、音頻參數和服務時間有關。例如,當終端發(fā)送的音頻流為G7UU 、 G711A 、 G723、 G729等編碼格式的數據,則完整可變音數據單元的數據長 度至少要大于該音頻編碼格式的完整可解碼單元,即至少要接收到解碼所需 的所有參數,對音頻數據進行正確的解碼后對其進行變音處理;當終端發(fā)送 的音頻流為^t擬音頻數據,則完整可變音數據單元的時間小于或等于服務時 間;對于淡出效果制作,完整可變音數據單元包含的音頻數據要包含音頻段 落的尾端數據。步驟7:若回放方式是實時模擬回放或實時數字回放,則變音系統(tǒng)將經 過變音處理的音頻^t據發(fā)送至終端;變音系統(tǒng)在將經過變音處理的音頻數據發(fā)送至終端前,可根據變音參數 中指定的編碼格式對音頻數據進行編碼。步驟8:當滿足變音停止條件時停止變音處理;否則重復步驟5至步驟7;變音停止條件可以是音頻數據或音頻數據段落結束,用戶終止或暫停變 音操作,服務時間結束等。步驟9:變音系統(tǒng)根據回放參數對經過變音處理的音頻數據進行回放處理;回放處理可以是將經過變音處理的音頻數據通過電話網絡以模擬語音 的方式發(fā)送至終端;或將經過變音處理的音頻數據保存成音頻文件,并在適 當的時候通過IP網絡發(fā)送至終端指定的位置。
圖2是本發(fā)明音頻凄史據變音系統(tǒng)的系統(tǒng)結構示意圖。由圖2所示,本發(fā)明的音頻數據變音系統(tǒng)包含語音接口單元,用于通過PTSN (Public Tel印hone Switched Network, 公共電話交換網)接收和發(fā)送音頻變音服務請求、音頻變音服務請求應答信 息、變音參數和模擬語音數據;數字接口單元,用于通過IP (Internet Protocol,因特網協(xié)議)網絡等數 字包交換網絡接收和發(fā)送音頻變音服務請求、音頻變音服務請求應答信息、 變音參數和數字語音數據;用戶管理單元,用于對通過語音接口單元或數字接口單元接收的音頻變 音服務請求和變音參數進行有效性審核,并通過語音接口單元或數字接口單 元向用戶發(fā)送審核結果;編解碼單元,用于對數字語音信息進行解碼處理并對經過變音處理后的 音頻數據進行編碼處理;變音單元,與語音接口和編解碼單元相連,用于將語音接口單元或編解 碼單元發(fā)送的音頻數據流進行變音處理,并將處理后的數據發(fā)送至語音接口 單元或編解碼單元;文件管理單元,與數字接口單元和編解碼單元相連,用于將從數字接口 接收到的音頻數據進行緩存或以文件方式保存,并將緩存的或以文件方式保 存的音頻數據發(fā)送至編解碼單元;此外,文件管理單元將從編解碼單元接收 的經過變音處理和編碼處理的音頻數據進行緩存或以文件方式保存,并將緩 存的或以文件方式保存的音頻數據發(fā)送至數字接口 。
權利要求
1. 一種音頻數據變音系統(tǒng),包含網絡接口單元,用于通過網絡接收和發(fā)送音頻數據,其特征在于,該系統(tǒng)還包含變音單元,用于將網絡接口單元發(fā)送的音頻數據進行變音處理,并將變音處理后的音頻數據發(fā)送至網絡接口單元;用戶管理單元,用于將通過網絡接口單元接收的音頻變音服務請求和變音參數進行有效性審核,并通過網絡接口單元向用戶發(fā)送審核結果信息;所述網絡接口單元還用于接收和發(fā)送音頻變音服務請求、所述審核結果信息和變音參數。
2、 如權利要求1所述的音頻數據變音系統(tǒng),其特征在于,所述網絡接 口單元為數字接口單元,用于通過數字包交換網絡接收和發(fā)送所述音頻變音 服務請求、審核結果信息、變音參數和數字語音數據;該系統(tǒng)還包含編解碼單元,用于對數字語音信息進行解碼處理并將解碼處理后的數據 發(fā)送至所述變音單元,此外編解碼單元還對經過變音處理后的音頻數據進行 編碼處理;所述變音單元通過編解碼單元接收所述音頻數據和發(fā)送所述變音處理 后的音頻數據。
3、 如權利要求1所述的音頻數據變音系統(tǒng),其特征在于,所述網絡接 口單元為語音接口 。
4、 如權利要求2所述的音頻數據變音系統(tǒng),其特征在于,該系統(tǒng)還包含文件管理單元,與所述數字接口單元和編解碼單元相連,用于將從數字 接口單元接收到的音頻數據進行緩存或以文件方式保存,并將緩存的或以文 件方式保存的音頻數據發(fā)送至編解碼單元;此外,文件管理單元將從編解碼 單元接收的經過變音處理和編碼處理的音頻數據進行緩存或以文件方式保 存,并將緩存的或以文件方式保存的音頻數據發(fā)送至數字接口單元。
全文摘要
一種音頻數據變音系統(tǒng),包含網絡接口單元,用于通過網絡接收和發(fā)送音頻數據,該系統(tǒng)還包含變音單元,用于將網絡接口單元發(fā)送的音頻數據進行變音處理,并將變音處理后的音頻數據發(fā)送至網絡接口單元;用戶管理單元,用于將通過網絡接口單元接收的音頻變音服務請求和變音參數進行有效性審核,并通過網絡接口單元向用戶發(fā)送審核結果信息;所述網絡接口單元還用于接收和發(fā)送音頻變音服務請求、所述審核結果信息和變音參數。本發(fā)明通過將終端上的音頻數據上傳至網絡中的變音系統(tǒng),由網絡變音系統(tǒng)對該音頻數據進行變音處理,并可將經過處理的音頻數據實時傳送至終端,使得任何具備網絡訪問能力的終端都能以最快最便捷的方式對音頻數據進行變音處理。
文檔編號H04L12/00GK101212310SQ200610170580
公開日2008年7月2日 申請日期2006年12月26日 優(yōu)先權日2006年12月26日
發(fā)明者吳建軍, 東 王, 罡 鄭 申請人:中興通訊股份有限公司