一種錄音方法及裝置制造方法

文檔序號(hào)：6766928閱讀：181來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專(zhuān)利>信息存儲(chǔ)應(yīng)用技術(shù)

一種錄音方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種錄音方法及裝置，屬于音頻處理【技術(shù)領(lǐng)域】。方法流程包括：檢測(cè)語(yǔ)音聲源；對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離；獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果；將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。采用本發(fā)明，能夠?qū)⒄Z(yǔ)音聲源分離成獨(dú)立聲源，通過(guò)調(diào)整各獨(dú)立聲源的聲音效果，從而獲取理想的混音效果，達(dá)到在保證遠(yuǎn)距離錄音效果的同時(shí)避免近距離錄音的破音現(xiàn)象，有效的提高了各種環(huán)境下的錄音效果。
【專(zhuān)利說(shuō)明】一種錄音方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】，尤其涉及一種錄音方法及裝置。

【背景技術(shù)】
[0002] 在會(huì)議現(xiàn)場(chǎng)或采訪現(xiàn)場(chǎng)等場(chǎng)景中，都需要利用麥克風(fēng)進(jìn)行錄音。在進(jìn)行錄音的過(guò) 程中，人們通常希望能將主要發(fā)言人的講話清晰的錄制下來(lái)，因此當(dāng)麥克風(fēng)距離發(fā)言人較遠(yuǎn)時(shí)，需要調(diào)高麥克風(fēng)的放大系數(shù)以保證錄音效果，但是在大多數(shù)情況下，錄音現(xiàn)場(chǎng)的環(huán)境都不可能保持絕對(duì)的安靜，此時(shí)，如果錄音時(shí)有人近距離說(shuō)話，錄音就容易發(fā)生破音現(xiàn)象，使得錄音效果較差，降低了用戶體驗(yàn)。

【發(fā)明內(nèi)容】

[0003] 有鑒于此，本發(fā)明要解決的技術(shù)問(wèn)題是提供一種錄音方法及裝置，以解決現(xiàn)有技術(shù)錄音時(shí)對(duì)錄音現(xiàn)場(chǎng)的聲源不能遠(yuǎn)近兼顧，錄音效果差的缺陷。
[0004] 本發(fā)明解決上述技術(shù)問(wèn)題所采用的技術(shù)方案如下：
[0005] 根據(jù)本發(fā)明的一個(gè)方面，提供一種錄音方法，包括如下步驟：檢測(cè)語(yǔ)音聲源；對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離；獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；對(duì)存儲(chǔ)的每個(gè) 獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果；將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0006] 提供一種如上所述的方法，所述獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)，包括：獲取所述各獨(dú)立聲源的音頻信號(hào)；對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位，獲取各獨(dú)立聲源的方位信息；將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè)獨(dú) 立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0007] 提供一種如上所述的方法，所述對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果，包括：計(jì)算所述每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值；根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值，判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源；若是近場(chǎng)聲源，判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值，并在超過(guò)所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理；若不是近場(chǎng)聲源，判斷所述均方根值是否低于所述預(yù)設(shè)閥值，并在低于所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0008] 提供一種如上所述的方法，所述檢測(cè)語(yǔ)音聲源，包括：采用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法，對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
[0009] 提供一種如上所述的方法，所述對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離，包括：采用基于獨(dú) 立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
[0010] 根據(jù)本發(fā)明的另一個(gè)方面，提供一種錄音裝置，所述裝置包括：聲源檢測(cè)單元，用于檢測(cè)語(yǔ)音聲源；聲源分離單元，用于對(duì)所述聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離；數(shù)據(jù)處理單元，用于獲取所述聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；存儲(chǔ)單元，用于存儲(chǔ)所述數(shù)據(jù)處理單元獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；所述數(shù)據(jù)處理單元，還用于對(duì) 所述存儲(chǔ)單元存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析；音效調(diào)整單元，用于根據(jù)所述聲源處理單元的分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果；混音單元，用于對(duì)所述音效調(diào)整單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；所述存儲(chǔ)單元，還用于將所述混音單元混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0011] 提供一種如上所述的裝置，所述數(shù)據(jù)處理單元，還用于獲取所述各獨(dú)立聲源的音頻信號(hào)，并對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位，獲取各獨(dú)立聲源的方位信息；所述存儲(chǔ)單元，還用于將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0012] 提供一種如上所述的裝置，所述數(shù)據(jù)處理單元，還用于計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值，以及根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值，判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源，并在判斷所述獨(dú)立聲源為近場(chǎng)聲源時(shí)，判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值，在判斷所述獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源時(shí)，判斷所述均方根值是否低于所述預(yù)設(shè)閥值；所述音效調(diào)整單元，還用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源，且所述均方根值超過(guò)所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理，以及用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ) 音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源，且所述均方根值低于所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù) 據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0013] 提供一種如上所述的裝置，所述聲源檢測(cè)單元，還用于采用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法，對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
[0014] 提供一種如上所述的裝置，所述聲源分離單元，還用于采用基于獨(dú)立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
[0015] 本發(fā)明的錄音方法及裝置，能夠噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)，有效去除噪音，并且能夠?qū)?duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離，對(duì)分離出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，根據(jù)分析結(jié)果對(duì)各獨(dú)立聲源的音效進(jìn)行調(diào)整，使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效，再將處理后的各獨(dú)立聲源進(jìn)行混音處理，便能夠得到理想的錄音效果。同時(shí)也能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng) 聲源進(jìn)行區(qū)分，可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源減弱，并將遠(yuǎn)場(chǎng)聲源增強(qiáng)，在保證遠(yuǎn)距離錄音效果的同時(shí)能夠很好的避免近距離錄音的破音現(xiàn)象，有效的提高了各種環(huán)境下的錄首效果。

【專(zhuān)利附圖】

【附圖說(shuō)明】
[0016] 圖1為本發(fā)明實(shí)施例提供的一種錄音裝置的模塊結(jié)構(gòu)示意圖；
[0017] 圖2為本發(fā)明實(shí)施例提供的一種錄音方法的流程圖；
[0018] 圖3為圖2中步驟S203的流程圖；
[0019] 圖4為圖2中步驟S204的流程圖。

【具體實(shí)施方式】
[0020] 為了使本發(fā)明所要解決的技術(shù)問(wèn)題、技術(shù)方案及有益效果更加清楚、明白，以下結(jié) 合附圖和實(shí)施例，對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解，此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明，并不用于限定本發(fā)明。
[0021] 請(qǐng)參閱圖1，本發(fā)明提供了一種錄音裝置，該裝置包括聲源檢測(cè)單元110、聲源分離單元120、數(shù)據(jù)處理單元130、存儲(chǔ)單元140、音效調(diào)整單元150及混音單元160。
[0022] 聲源檢測(cè)單元110,用于檢測(cè)語(yǔ)音聲源。
[0023] 具體的，聲源檢測(cè)單元110可以采用如基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)（Voice Activity Detection，VAD)算法，該算法可檢測(cè)到噪聲環(huán)境下的語(yǔ)音聲源，并將語(yǔ)音聲源提取出來(lái)，從而有效去除嘈雜環(huán)境背景下的噪音，保留清晰的語(yǔ)音聲源。
[0024] 聲源分離單元120,用于對(duì)該聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離。
[0025] 具體的，可以采用如基于獨(dú)立分量分析的聲源分析方法分離出多個(gè)聲源中每一個(gè) 聲源的聲音，其充分利用在聲源之間聲源的源信號(hào)是獨(dú)立的這一事實(shí)。在獨(dú)立分量分析中，根據(jù)聲源數(shù)量使用維數(shù)等于麥克風(fēng)數(shù)量的線性濾波器，當(dāng)聲源的數(shù)量小于麥克風(fēng)的數(shù)量時(shí)，能夠完全恢復(fù)源信號(hào)；當(dāng)聲源數(shù)量超過(guò)麥克風(fēng)數(shù)量時(shí)，可以使用L1范數(shù)最小化方法。
[0026] 數(shù)據(jù)處理單元130,用于獲取該聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0027] 具體的，數(shù)據(jù)處理單元130首先獲取各獨(dú)立聲源的音頻信號(hào)，并對(duì)各獨(dú)立聲源進(jìn) 行聲源定位，獲取各獨(dú)立聲源的方位信息，將每個(gè)獨(dú)立聲源的音頻信號(hào)及方位信號(hào)作為一個(gè)獨(dú)立的語(yǔ)音信號(hào)。
[0028] 存儲(chǔ)單元140,用于存儲(chǔ)該數(shù)據(jù)處理單元130獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0029] 具體的，該存儲(chǔ)單元140將各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0030] 該數(shù)據(jù)處理單元130,還用于對(duì)該存儲(chǔ)單元140存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 進(jìn)行分析。
[0031] 具體的，數(shù)據(jù)處單元130通過(guò)如下方式對(duì)每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析：首先，根據(jù)每個(gè)語(yǔ)音數(shù)據(jù)的音頻信號(hào)計(jì)算預(yù)定時(shí)間窗內(nèi)的均方根值（Root Mean Square， RMS)，并根據(jù)該語(yǔ)音數(shù)據(jù)的方位信息和/或RMS值判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源室近場(chǎng) 聲源還是遠(yuǎn)場(chǎng)聲源。如果判斷出該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源，則判斷該均方根值是否超過(guò)預(yù)設(shè)閥值；如果判斷出該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源，則判斷該均方根值是否低于該預(yù)設(shè)閥值。
[0032] 需要說(shuō)明的是，遠(yuǎn)場(chǎng)聲源和近場(chǎng)聲源的定義依賴于所錄制聲源的相對(duì)位置。比如現(xiàn)場(chǎng)具有兩種聲源，這兩種聲源的方位不一樣那么必有相對(duì)遠(yuǎn)近之分，其中，遠(yuǎn)場(chǎng)聲源和近場(chǎng)聲源的定義依賴于所錄制聲源的相對(duì)位置。假設(shè)一個(gè)距離錄音裝置的距離為1米，另一個(gè)距離錄音裝置的距離為3米，則可以定義距離為1米的聲源為近場(chǎng)聲源，距離為3米的聲源為遠(yuǎn)場(chǎng)聲源。在實(shí)際應(yīng)用，近場(chǎng)聲源和遠(yuǎn)場(chǎng)聲源也可以結(jié)合音頻信號(hào)在預(yù)定的時(shí)間窗內(nèi) 的RMS值進(jìn)行定義。
[0033] 音效調(diào)整單元150,用于根據(jù)該聲源處理單元130的分析結(jié)果調(diào)整各獨(dú)立聲源的聲音效果。
[0034] 具體的，如果數(shù)據(jù)處理單元130判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源，且該均方根值超過(guò)該預(yù)設(shè)閥值，音效調(diào)整單元150對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理，防止進(jìn)場(chǎng)的獨(dú)立聲源的聲音超飽和導(dǎo)致失真；如果數(shù)據(jù)處理單元130判斷該語(yǔ)音數(shù)據(jù) 對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源，且該均方根值低于該預(yù)設(shè)閥值，音效調(diào)整單元150對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0035] 混音單元，用于對(duì)該音效調(diào)整單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理。
[0036] 該存儲(chǔ)單元，還用于將該混音單元混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0037] 具體的，存儲(chǔ)單元可以將混音后的音頻信號(hào)送入編碼模塊編碼成MP3或wav等文件格式進(jìn)行保存。
[0038] 需要說(shuō)明的是，本實(shí)施例的錄音裝置，不僅僅是用于在會(huì)議模式錄音，也適用于普通錄像、采訪等模式。并且該錄音裝置也可設(shè)置在移動(dòng)終端上。
[0039] 本實(shí)施例的錄音裝置，設(shè)有聲源檢測(cè)單元對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)，有效去除噪音；同時(shí)還設(shè)有聲源分離單元，對(duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離，再由處理單元對(duì)分離出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，進(jìn)而由音效調(diào)整單元根據(jù)分析結(jié)果對(duì)各獨(dú)立聲源的音效進(jìn)行調(diào)整，并能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng)聲源進(jìn)行區(qū)分，可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源減弱，并將遠(yuǎn)場(chǎng)聲源增強(qiáng)，使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效，最后由混音單元將處理后的各獨(dú)立聲源進(jìn)行混音處理，在保證遠(yuǎn)距離錄音效果的同時(shí)能夠很好的避免近距離錄音的破首現(xiàn)象，有效的提商了各種環(huán)境下的錄首效果。
[0040] 在上述錄音裝置實(shí)施例的基礎(chǔ)上，本發(fā)明還提供了一種錄音方法，請(qǐng)參閱圖2,方法流程包括：
[0041] S201、檢測(cè)語(yǔ)音聲源。
[0042] 具體的，本步驟可以采用如基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)（Voice Activity Detection，VAD)算法，該算法可檢測(cè)到噪聲環(huán)境下的語(yǔ)音聲源，并將語(yǔ)音聲源提取出來(lái)，從而有效去除嘈雜環(huán)境背景下的噪音，保留清晰的語(yǔ)音聲源。
[0043] S202、對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離。
[0044] 具體的，本步驟可以采用如基于獨(dú)立分量分析的聲源分析方法分離出多個(gè)聲源中每一個(gè)聲源的聲音，其充分利用在聲源之間聲源的源信號(hào)是獨(dú)立的這一事實(shí)。在獨(dú)立分量分析中，根據(jù)聲源數(shù)量使用維數(shù)等于麥克風(fēng)數(shù)量的線性濾波器，當(dāng)聲源的數(shù)量小于麥克風(fēng) 的數(shù)量時(shí)，能夠完全恢復(fù)源信號(hào)；當(dāng)聲源數(shù)量超過(guò)麥克風(fēng)數(shù)量時(shí)，可以使用L1范數(shù)最小化方法。
[0045] S203、獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0046] 具體的，請(qǐng)參閱圖3,該步驟包括：
[0047] S2031、獲取各獨(dú)立聲源的音頻信號(hào)；
[0048] S2032、對(duì)各獨(dú)立聲源進(jìn)行聲源定位，獲取各獨(dú)立聲源的方位信息；
[0049] S2033、將每個(gè)獨(dú)立聲源對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè) 獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0050] S204、對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整各獨(dú)立聲源的聲音效果。
[0051] 具體的，請(qǐng)參閱圖4,該步驟包括：
[0052] S2041、計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值；
[0053] S2042、根據(jù)該語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值，判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源，若是執(zhí)行步驟S2043,否則執(zhí)行步驟S2045 ;
[0054] S4043、判斷該均方根值是否超過(guò)預(yù)設(shè)閥值，并在超過(guò)該預(yù)設(shè)閥值時(shí)，執(zhí)行步驟 S2044 ；
[0055] S2044、對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理；
[0056] S2045、判斷該均方根值是否低于該預(yù)設(shè)閥值，并在低于該預(yù)設(shè)閥值時(shí)執(zhí)行步驟 S2046 ；
[0057] S2046、對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0058] S205、將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；
[0059] S206、將該混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0060] 具體的，本步驟可以將混音后的音頻信號(hào)送入編碼模塊編碼成MP3或wav等文件格式進(jìn)行保存
[0061] 本實(shí)施例的錄音方法，能夠?qū)υ胍舡h(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)，有效去除噪音，并且能夠?qū)?duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離，對(duì)分離出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，根據(jù) 分析結(jié)果對(duì)各獨(dú)立聲源的音效進(jìn)行調(diào)整，使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效，再將處理后的各獨(dú)立聲源進(jìn)行混音處理，便能夠得到理想的錄音效果。同時(shí)也能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng)聲源進(jìn)行區(qū)分，可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源減弱，并將遠(yuǎn)場(chǎng)聲源增強(qiáng)，在保證遠(yuǎn)距離錄音效果的同時(shí)能夠很好的避免近距離錄音的破音現(xiàn)象，有效的提高了各種環(huán)境下的錄音效果。
[0062] 以上參照【專(zhuān)利附圖】

【附圖說(shuō)明】了本發(fā)明的優(yōu)選實(shí)施例，并非因此局限本發(fā)明的權(quán)利范圍。本領(lǐng)域技術(shù)人員不脫離本發(fā)明的范圍和實(shí)質(zhì)內(nèi)所作的任何修改、等同替換和改進(jìn)，均應(yīng)在本發(fā)明的權(quán)利范圍之內(nèi)。
【權(quán)利要求】
1. 一種錄音方法，其特征在于，包括如下步驟：檢測(cè)語(yǔ)音聲源；對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離；獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果；將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)，包括：獲取所述各獨(dú)立聲源的音頻信號(hào)；對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位，獲取各獨(dú)立聲源的方位信息；將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè)獨(dú)立聲源的語(yǔ) 音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
3. 根據(jù)權(quán)利要求2所述的方法，其特征在于，所述對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 進(jìn)行分析，并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果，包括：計(jì)算所述每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值；根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值，判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源；若是近場(chǎng)聲源，判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值，并在超過(guò)所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理；若不是近場(chǎng)聲源，判斷所述均方根值是否低于所述預(yù)設(shè)閥值，并在低于所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
4. 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法，其特征在于，所述檢測(cè)語(yǔ)音聲源，包括：采用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法，對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
5. 根據(jù)權(quán)利要求4所述的方法，其特征在于，所述對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離，包括：采用基于獨(dú)立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
6. -種錄音裝置，其特征在于，所述裝置包括：聲源檢測(cè)單元，用于檢測(cè)語(yǔ)音聲源；聲源分離單元，用于對(duì)所述聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離；數(shù)據(jù)處理單元，用于獲取所述聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；存儲(chǔ)單元，用于存儲(chǔ)所述數(shù)據(jù)處理單元獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)；所述數(shù)據(jù)處理單元，還用于對(duì)所述存儲(chǔ)單元存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析；音效調(diào)整單元，用于根據(jù)所述聲源處理單元的分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果；混音單元，用于對(duì)所述音效調(diào)整單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理；所述存儲(chǔ)單元，還用于將所述混音單元混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
7. 根據(jù)權(quán)利要求6所述的裝置，其特征在于，所述數(shù)據(jù)處理單元，還用于獲取所述各獨(dú)立聲源的音頻信號(hào)，并對(duì)所述各獨(dú)立聲源進(jìn) 行聲源定位，獲取各獨(dú)立聲源的方位信息；所述存儲(chǔ)單元，還用于將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中，其中每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
8. 根據(jù)權(quán)利要求7所述的裝置，其特征在于，所述數(shù)據(jù)處理單元，還用于計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi) 的均方根值，以及根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值，判斷所述語(yǔ)音數(shù)據(jù) 對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源，并在判斷所述獨(dú)立聲源為近場(chǎng)聲源時(shí)，判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值，在判斷所述獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源時(shí)，判斷所述均方根值是否低于所述預(yù)設(shè)閥值；所述音效調(diào)整單元，還用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源，且所述均方根值超過(guò)所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理，以及用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源，且所述均方根值低于所述預(yù)設(shè)閥值時(shí)，對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
9. 根據(jù)權(quán)利要求6至8任一項(xiàng)所述的裝置，其特征在于，所述聲源檢測(cè)單元，還用于采用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法，對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
10. 根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述聲源分離單元，還用于采用基于獨(dú) 立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
【文檔編號(hào)】G11B20/10GK104123950SQ201410341500
【公開(kāi)日】2014年10月29日申請(qǐng)日期:2014年7月17日優(yōu)先權(quán)日:2014年7月17日
【發(fā)明者】孫麗申請(qǐng)人:深圳市中興移動(dòng)通信有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專(zhuān)利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：孫麗
技術(shù)所有人：深圳市中興移動(dòng)通信有限公司
我是此專(zhuān)利的發(fā)明人

該領(lǐng)域下的技術(shù)專(zhuān)家
如您需求助技術(shù)專(zhuān)家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
2、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
3、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
4、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
5、張老師：1.機(jī)械設(shè)計(jì)的應(yīng)力分析、強(qiáng)度校核的計(jì)算機(jī)仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專(zhuān)家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

反錄音裝置相關(guān)技術(shù)

相同的水下錄音裝置相關(guān)技術(shù)

檢測(cè)錄音及視頻裝置相關(guān)技術(shù)

裝置氣密性檢查方法相關(guān)技術(shù)

檢查裝置氣密性的方法相關(guān)技術(shù)

檢驗(yàn)裝置氣密性的方法相關(guān)技術(shù)

油氣回收裝置監(jiān)測(cè)方法相關(guān)技術(shù)

濕熱處理的方法和裝置相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種錄音方法及裝置制造方法