一種錄音方法及裝置制造方法
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種錄音方法及裝置,屬于音頻處理【技術(shù)領(lǐng)域】。方法流程包括:檢測(cè)語(yǔ)音聲源;對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離;獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù);對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果;將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理;將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。采用本發(fā)明,能夠?qū)⒄Z(yǔ)音聲源分離成獨(dú)立聲源,通過(guò)調(diào)整各獨(dú)立聲源的聲音效果,從而獲取理想的混音效果,達(dá)到在保證遠(yuǎn)距離錄音效果的同時(shí)避免近距離錄音的破音現(xiàn)象,有效的提高了各種環(huán)境下的錄音效果。
【專(zhuān)利說(shuō)明】一種錄音方法及裝置
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及音頻處理【技術(shù)領(lǐng)域】,尤其涉及一種錄音方法及裝置。
【背景技術(shù)】
[0002] 在會(huì)議現(xiàn)場(chǎng)或采訪現(xiàn)場(chǎng)等場(chǎng)景中,都需要利用麥克風(fēng)進(jìn)行錄音。在進(jìn)行錄音的過(guò) 程中,人們通常希望能將主要發(fā)言人的講話清晰的錄制下來(lái),因此當(dāng)麥克風(fēng)距離發(fā)言人較 遠(yuǎn)時(shí),需要調(diào)高麥克風(fēng)的放大系數(shù)以保證錄音效果,但是在大多數(shù)情況下,錄音現(xiàn)場(chǎng)的環(huán)境 都不可能保持絕對(duì)的安靜,此時(shí),如果錄音時(shí)有人近距離說(shuō)話,錄音就容易發(fā)生破音現(xiàn)象, 使得錄音效果較差,降低了用戶體驗(yàn)。
【發(fā)明內(nèi)容】
[0003] 有鑒于此,本發(fā)明要解決的技術(shù)問(wèn)題是提供一種錄音方法及裝置,以解決現(xiàn)有技 術(shù)錄音時(shí)對(duì)錄音現(xiàn)場(chǎng)的聲源不能遠(yuǎn)近兼顧,錄音效果差的缺陷。
[0004] 本發(fā)明解決上述技術(shù)問(wèn)題所采用的技術(shù)方案如下:
[0005] 根據(jù)本發(fā)明的一個(gè)方面,提供一種錄音方法,包括如下步驟:檢測(cè)語(yǔ)音聲源;對(duì)檢 測(cè)到的語(yǔ)音聲源進(jìn)行分離;獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù);對(duì)存儲(chǔ)的每個(gè) 獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果;將調(diào)整 后的各獨(dú)立聲源進(jìn)行混音處理;將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行 存儲(chǔ)。
[0006] 提供一種如上所述的方法,所述獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù), 包括:獲取所述各獨(dú)立聲源的音頻信號(hào);對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位,獲取各獨(dú)立聲 源的方位信息;將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中,其中每個(gè)獨(dú) 立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0007] 提供一種如上所述的方法,所述對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,并 根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果,包括:計(jì)算所述每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值;根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根 值,判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源;若是近場(chǎng)聲源,判斷所述均方根值 是否超過(guò)預(yù)設(shè)閥值,并在超過(guò)所述預(yù)設(shè)閥值時(shí),對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱 處理;若不是近場(chǎng)聲源,判斷所述均方根值是否低于所述預(yù)設(shè)閥值,并在低于所述預(yù)設(shè)閥值 時(shí),對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0008] 提供一種如上所述的方法,所述檢測(cè)語(yǔ)音聲源,包括:采用基于頻譜方差的語(yǔ)音活 動(dòng)檢測(cè)算法,對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
[0009] 提供一種如上所述的方法,所述對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離,包括:采用基于獨(dú) 立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
[0010] 根據(jù)本發(fā)明的另一個(gè)方面,提供一種錄音裝置,所述裝置包括:聲源檢測(cè)單元,用 于檢測(cè)語(yǔ)音聲源;聲源分離單元,用于對(duì)所述聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離; 數(shù)據(jù)處理單元,用于獲取所述聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù);存儲(chǔ)單元, 用于存儲(chǔ)所述數(shù)據(jù)處理單元獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù);所述數(shù)據(jù)處理單元,還用于對(duì) 所述存儲(chǔ)單元存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析;音效調(diào)整單元,用于根據(jù)所述聲 源處理單元的分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果;混音單元,用于對(duì)所述音效調(diào)整 單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理;所述存儲(chǔ)單元,還用于將所述混音單元混音處理 得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0011] 提供一種如上所述的裝置,所述數(shù)據(jù)處理單元,還用于獲取所述各獨(dú)立聲源的音 頻信號(hào),并對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位,獲取各獨(dú)立聲源的方位信息;所述存儲(chǔ)單元, 還用于將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中,其中每個(gè)獨(dú)立聲源的 語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0012] 提供一種如上所述的裝置,所述數(shù)據(jù)處理單元,還用于計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音 數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值,以及根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所 述均方根值,判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源,并在判斷所述獨(dú)立聲源 為近場(chǎng)聲源時(shí),判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值,在判斷所述獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源時(shí), 判斷所述均方根值是否低于所述預(yù)設(shè)閥值;所述音效調(diào)整單元,還用于在所述數(shù)據(jù)處理單 元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源,且所述均方根值超過(guò)所述預(yù)設(shè)閥值時(shí), 對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理,以及用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ) 音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源,且所述均方根值低于所述預(yù)設(shè)閥值時(shí),對(duì)所述語(yǔ)音數(shù) 據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0013] 提供一種如上所述的裝置,所述聲源檢測(cè)單元,還用于采用基于頻譜方差的語(yǔ)音 活動(dòng)檢測(cè)算法,對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
[0014] 提供一種如上所述的裝置,所述聲源分離單元,還用于采用基于獨(dú)立分量分析的 聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
[0015] 本發(fā)明的錄音方法及裝置,能夠噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè),有效去除噪音, 并且能夠?qū)?duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離,對(duì)分離出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,根 據(jù)分析結(jié)果對(duì)各獨(dú)立聲源的音效進(jìn)行調(diào)整,使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效,再將處 理后的各獨(dú)立聲源進(jìn)行混音處理,便能夠得到理想的錄音效果。同時(shí)也能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng) 聲源進(jìn)行區(qū)分,可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源減弱,并將遠(yuǎn)場(chǎng)聲源增強(qiáng),在保證遠(yuǎn)距 離錄音效果的同時(shí)能夠很好的避免近距離錄音的破音現(xiàn)象,有效的提高了各種環(huán)境下的錄 首效果。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0016] 圖1為本發(fā)明實(shí)施例提供的一種錄音裝置的模塊結(jié)構(gòu)示意圖;
[0017] 圖2為本發(fā)明實(shí)施例提供的一種錄音方法的流程圖;
[0018] 圖3為圖2中步驟S203的流程圖;
[0019] 圖4為圖2中步驟S204的流程圖。
【具體實(shí)施方式】
[0020] 為了使本發(fā)明所要解決的技術(shù)問(wèn)題、技術(shù)方案及有益效果更加清楚、明白,以下結(jié) 合附圖和實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅 用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0021] 請(qǐng)參閱圖1,本發(fā)明提供了一種錄音裝置,該裝置包括聲源檢測(cè)單元110、聲源分 離單元120、數(shù)據(jù)處理單元130、存儲(chǔ)單元140、音效調(diào)整單元150及混音單元160。
[0022] 聲源檢測(cè)單元110,用于檢測(cè)語(yǔ)音聲源。
[0023] 具體的,聲源檢測(cè)單元110可以采用如基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)算法,該算法可檢測(cè)到噪聲環(huán)境下的語(yǔ)音聲源,并將語(yǔ)音聲源提 取出來(lái),從而有效去除嘈雜環(huán)境背景下的噪音,保留清晰的語(yǔ)音聲源。
[0024] 聲源分離單元120,用于對(duì)該聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離。
[0025] 具體的,可以采用如基于獨(dú)立分量分析的聲源分析方法分離出多個(gè)聲源中每一個(gè) 聲源的聲音,其充分利用在聲源之間聲源的源信號(hào)是獨(dú)立的這一事實(shí)。在獨(dú)立分量分析中, 根據(jù)聲源數(shù)量使用維數(shù)等于麥克風(fēng)數(shù)量的線性濾波器,當(dāng)聲源的數(shù)量小于麥克風(fēng)的數(shù)量 時(shí),能夠完全恢復(fù)源信號(hào);當(dāng)聲源數(shù)量超過(guò)麥克風(fēng)數(shù)量時(shí),可以使用L1范數(shù)最小化方法。
[0026] 數(shù)據(jù)處理單元130,用于獲取該聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0027] 具體的,數(shù)據(jù)處理單元130首先獲取各獨(dú)立聲源的音頻信號(hào),并對(duì)各獨(dú)立聲源進(jìn) 行聲源定位,獲取各獨(dú)立聲源的方位信息,將每個(gè)獨(dú)立聲源的音頻信號(hào)及方位信號(hào)作為一 個(gè)獨(dú)立的語(yǔ)音信號(hào)。
[0028] 存儲(chǔ)單元140,用于存儲(chǔ)該數(shù)據(jù)處理單元130獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0029] 具體的,該存儲(chǔ)單元140將各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置 中,其中每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0030] 該數(shù)據(jù)處理單元130,還用于對(duì)該存儲(chǔ)單元140存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 進(jìn)行分析。
[0031] 具體的,數(shù)據(jù)處單元130通過(guò)如下方式對(duì)每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析: 首先,根據(jù)每個(gè)語(yǔ)音數(shù)據(jù)的音頻信號(hào)計(jì)算預(yù)定時(shí)間窗內(nèi)的均方根值(Root Mean Square, RMS),并根據(jù)該語(yǔ)音數(shù)據(jù)的方位信息和/或RMS值判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源室近場(chǎng) 聲源還是遠(yuǎn)場(chǎng)聲源。如果判斷出該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源,則判斷該均方根 值是否超過(guò)預(yù)設(shè)閥值;如果判斷出該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源,則判斷該均方 根值是否低于該預(yù)設(shè)閥值。
[0032] 需要說(shuō)明的是,遠(yuǎn)場(chǎng)聲源和近場(chǎng)聲源的定義依賴于所錄制聲源的相對(duì)位置。比如 現(xiàn)場(chǎng)具有兩種聲源,這兩種聲源的方位不一樣那么必有相對(duì)遠(yuǎn)近之分,其中,遠(yuǎn)場(chǎng)聲源和近 場(chǎng)聲源的定義依賴于所錄制聲源的相對(duì)位置。假設(shè)一個(gè)距離錄音裝置的距離為1米,另一 個(gè)距離錄音裝置的距離為3米,則可以定義距離為1米的聲源為近場(chǎng)聲源,距離為3米的聲 源為遠(yuǎn)場(chǎng)聲源。在實(shí)際應(yīng)用,近場(chǎng)聲源和遠(yuǎn)場(chǎng)聲源也可以結(jié)合音頻信號(hào)在預(yù)定的時(shí)間窗內(nèi) 的RMS值進(jìn)行定義。
[0033] 音效調(diào)整單元150,用于根據(jù)該聲源處理單元130的分析結(jié)果調(diào)整各獨(dú)立聲源的 聲音效果。
[0034] 具體的,如果數(shù)據(jù)處理單元130判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為近場(chǎng)聲源,且 該均方根值超過(guò)該預(yù)設(shè)閥值,音效調(diào)整單元150對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處 理,防止進(jìn)場(chǎng)的獨(dú)立聲源的聲音超飽和導(dǎo)致失真;如果數(shù)據(jù)處理單元130判斷該語(yǔ)音數(shù)據(jù) 對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源,且該均方根值低于該預(yù)設(shè)閥值,音效調(diào)整單元150對(duì)該語(yǔ)音 數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0035] 混音單元,用于對(duì)該音效調(diào)整單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理。
[0036] 該存儲(chǔ)單元,還用于將該混音單元混音處理得到的音頻信號(hào)按照預(yù)定的文件格式 進(jìn)行存儲(chǔ)。
[0037] 具體的,存儲(chǔ)單元可以將混音后的音頻信號(hào)送入編碼模塊編碼成MP3或wav等文 件格式進(jìn)行保存。
[0038] 需要說(shuō)明的是,本實(shí)施例的錄音裝置,不僅僅是用于在會(huì)議模式錄音,也適用于普 通錄像、采訪等模式。并且該錄音裝置也可設(shè)置在移動(dòng)終端上。
[0039] 本實(shí)施例的錄音裝置,設(shè)有聲源檢測(cè)單元對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè),有 效去除噪音;同時(shí)還設(shè)有聲源分離單元,對(duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離,再由處理單元對(duì)分離 出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,進(jìn)而由音效調(diào)整單元根據(jù)分析結(jié)果對(duì)各獨(dú)立聲源的 音效進(jìn)行調(diào)整,并能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng)聲源進(jìn)行區(qū)分,可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源 減弱,并將遠(yuǎn)場(chǎng)聲源增強(qiáng),使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效,最后由混音單元將處理后 的各獨(dú)立聲源進(jìn)行混音處理,在保證遠(yuǎn)距離錄音效果的同時(shí)能夠很好的避免近距離錄音的 破首現(xiàn)象,有效的提商了各種環(huán)境下的錄首效果。
[0040] 在上述錄音裝置實(shí)施例的基礎(chǔ)上,本發(fā)明還提供了一種錄音方法,請(qǐng)參閱圖2,方 法流程包括:
[0041] S201、檢測(cè)語(yǔ)音聲源。
[0042] 具體的,本步驟可以采用如基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)(Voice Activity Detection,VAD)算法,該算法可檢測(cè)到噪聲環(huán)境下的語(yǔ)音聲源,并將語(yǔ)音聲源提取出來(lái),從 而有效去除嘈雜環(huán)境背景下的噪音,保留清晰的語(yǔ)音聲源。
[0043] S202、對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離。
[0044] 具體的,本步驟可以采用如基于獨(dú)立分量分析的聲源分析方法分離出多個(gè)聲源中 每一個(gè)聲源的聲音,其充分利用在聲源之間聲源的源信號(hào)是獨(dú)立的這一事實(shí)。在獨(dú)立分量 分析中,根據(jù)聲源數(shù)量使用維數(shù)等于麥克風(fēng)數(shù)量的線性濾波器,當(dāng)聲源的數(shù)量小于麥克風(fēng) 的數(shù)量時(shí),能夠完全恢復(fù)源信號(hào);當(dāng)聲源數(shù)量超過(guò)麥克風(fēng)數(shù)量時(shí),可以使用L1范數(shù)最小化 方法。
[0045] S203、獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)。
[0046] 具體的,請(qǐng)參閱圖3,該步驟包括:
[0047] S2031、獲取各獨(dú)立聲源的音頻信號(hào);
[0048] S2032、對(duì)各獨(dú)立聲源進(jìn)行聲源定位,獲取各獨(dú)立聲源的方位信息;
[0049] S2033、將每個(gè)獨(dú)立聲源對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中,其中每個(gè) 獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
[0050] S204、對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果調(diào)整各獨(dú)立 聲源的聲音效果。
[0051] 具體的,請(qǐng)參閱圖4,該步驟包括:
[0052] S2041、計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值;
[0053] S2042、根據(jù)該語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值,判斷該語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的 獨(dú)立聲源是否為近場(chǎng)聲源,若是執(zhí)行步驟S2043,否則執(zhí)行步驟S2045 ;
[0054] S4043、判斷該均方根值是否超過(guò)預(yù)設(shè)閥值,并在超過(guò)該預(yù)設(shè)閥值時(shí),執(zhí)行步驟 S2044 ;
[0055] S2044、對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理;
[0056] S2045、判斷該均方根值是否低于該預(yù)設(shè)閥值,并在低于該預(yù)設(shè)閥值時(shí)執(zhí)行步驟 S2046 ;
[0057] S2046、對(duì)該語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
[0058] S205、將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理;
[0059] S206、將該混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
[0060] 具體的,本步驟可以將混音后的音頻信號(hào)送入編碼模塊編碼成MP3或wav等文件 格式進(jìn)行保存
[0061] 本實(shí)施例的錄音方法,能夠?qū)υ胍舡h(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè),有效去除噪音,并 且能夠?qū)?duì)檢測(cè)的語(yǔ)音聲源進(jìn)行分離,對(duì)分離出來(lái)的獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,根據(jù) 分析結(jié)果對(duì)各獨(dú)立聲源的音效進(jìn)行調(diào)整,使每個(gè)獨(dú)立聲源均能達(dá)到理想的音效,再將處理 后的各獨(dú)立聲源進(jìn)行混音處理,便能夠得到理想的錄音效果。同時(shí)也能夠?qū)鼒?chǎng)和遠(yuǎn)場(chǎng)聲 源進(jìn)行區(qū)分,可以根據(jù)實(shí)際情況有效的將近場(chǎng)聲源減弱,并將遠(yuǎn)場(chǎng)聲源增強(qiáng),在保證遠(yuǎn)距離 錄音效果的同時(shí)能夠很好的避免近距離錄音的破音現(xiàn)象,有效的提高了各種環(huán)境下的錄音 效果。
[0062] 以上參照【專(zhuān)利附圖】
【附圖說(shuō)明】了本發(fā)明的優(yōu)選實(shí)施例,并非因此局限本發(fā)明的權(quán)利范圍。本 領(lǐng)域技術(shù)人員不脫離本發(fā)明的范圍和實(shí)質(zhì)內(nèi)所作的任何修改、等同替換和改進(jìn),均應(yīng)在本 發(fā)明的權(quán)利范圍之內(nèi)。
【權(quán)利要求】
1. 一種錄音方法,其特征在于,包括如下步驟: 檢測(cè)語(yǔ)音聲源; 對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離; 獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù); 對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分析,并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的 聲音效果; 將調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理; 將所述混音處理得到的音頻信號(hào)按照預(yù)定的文件格式進(jìn)行存儲(chǔ)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取并存儲(chǔ)分離出來(lái)的各獨(dú)立聲源 的語(yǔ)音數(shù)據(jù),包括: 獲取所述各獨(dú)立聲源的音頻信號(hào); 對(duì)所述各獨(dú)立聲源進(jìn)行聲源定位,獲取各獨(dú)立聲源的方位信息; 將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中,其中每個(gè)獨(dú)立聲源的語(yǔ) 音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對(duì)存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù) 進(jìn)行分析,并根據(jù)分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效果,包括: 計(jì)算所述每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi)的均方根值; 根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值,判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲 源是否為近場(chǎng)聲源; 若是近場(chǎng)聲源,判斷所述均方根值是否超過(guò)預(yù)設(shè)閥值,并在超過(guò)所述預(yù)設(shè)閥值時(shí),對(duì)所 述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削弱處理; 若不是近場(chǎng)聲源,判斷所述均方根值是否低于所述預(yù)設(shè)閥值,并在低于所述預(yù)設(shè)閥值 時(shí),對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
4. 根據(jù)權(quán)利要求1至3任一項(xiàng)所述的方法,其特征在于,所述檢測(cè)語(yǔ)音聲源,包括: 采用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法,對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述對(duì)檢測(cè)到的語(yǔ)音聲源進(jìn)行分離,包 括: 采用基于獨(dú)立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
6. -種錄音裝置,其特征在于,所述裝置包括: 聲源檢測(cè)單元,用于檢測(cè)語(yǔ)音聲源; 聲源分離單元,用于對(duì)所述聲源檢測(cè)單元檢測(cè)到的語(yǔ)音聲源進(jìn)行分離; 數(shù)據(jù)處理單元,用于獲取所述聲源分離單元分離出來(lái)的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù); 存儲(chǔ)單元,用于存儲(chǔ)所述數(shù)據(jù)處理單元獲取的各獨(dú)立聲源的語(yǔ)音數(shù)據(jù); 所述數(shù)據(jù)處理單元,還用于對(duì)所述存儲(chǔ)單元存儲(chǔ)的每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)進(jìn)行分 析; 音效調(diào)整單元,用于根據(jù)所述聲源處理單元的分析結(jié)果調(diào)整所述各獨(dú)立聲源的聲音效 果; 混音單元,用于對(duì)所述音效調(diào)整單元調(diào)整后的各獨(dú)立聲源進(jìn)行混音處理; 所述存儲(chǔ)單元,還用于將所述混音單元混音處理得到的音頻信號(hào)按照預(yù)定的文件格式 進(jìn)行存儲(chǔ)。
7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于, 所述數(shù)據(jù)處理單元,還用于獲取所述各獨(dú)立聲源的音頻信號(hào),并對(duì)所述各獨(dú)立聲源進(jìn) 行聲源定位,獲取各獨(dú)立聲源的方位信息; 所述存儲(chǔ)單元,還用于將所述各獨(dú)立聲源的語(yǔ)音數(shù)據(jù)分別存儲(chǔ)到不同的存儲(chǔ)位置中, 其中每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)均包括音頻信號(hào)及方位信息。
8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于, 所述數(shù)據(jù)處理單元,還用于計(jì)算每個(gè)獨(dú)立聲源的語(yǔ)音數(shù)據(jù)的音頻信號(hào)在預(yù)設(shè)時(shí)間窗內(nèi) 的均方根值,以及根據(jù)所述語(yǔ)音數(shù)據(jù)的方位信息和/或所述均方根值,判斷所述語(yǔ)音數(shù)據(jù) 對(duì)應(yīng)的獨(dú)立聲源是否為近場(chǎng)聲源,并在判斷所述獨(dú)立聲源為近場(chǎng)聲源時(shí),判斷所述均方根 值是否超過(guò)預(yù)設(shè)閥值,在判斷所述獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源時(shí),判斷所述均方根值是否低于所 述預(yù)設(shè)閥值; 所述音效調(diào)整單元,還用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為 近場(chǎng)聲源,且所述均方根值超過(guò)所述預(yù)設(shè)閥值時(shí),對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效削 弱處理,以及用于在所述數(shù)據(jù)處理單元判斷所述語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的獨(dú)立聲源為遠(yuǎn)場(chǎng)聲源,且 所述均方根值低于所述預(yù)設(shè)閥值時(shí),對(duì)所述語(yǔ)音數(shù)據(jù)的音頻信號(hào)進(jìn)行音效增強(qiáng)處理。
9. 根據(jù)權(quán)利要求6至8任一項(xiàng)所述的裝置,其特征在于,所述聲源檢測(cè)單元,還用于采 用基于頻譜方差的語(yǔ)音活動(dòng)檢測(cè)算法,對(duì)噪音環(huán)境下的語(yǔ)音聲源進(jìn)行檢測(cè)。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述聲源分離單元,還用于采用基于獨(dú) 立分量分析的聲源分析方法將所述語(yǔ)音聲源分離為多個(gè)獨(dú)立聲源。
【文檔編號(hào)】G11B20/10GK104123950SQ201410341500
【公開(kāi)日】2014年10月29日 申請(qǐng)日期:2014年7月17日 優(yōu)先權(quán)日:2014年7月17日
【發(fā)明者】孫麗 申請(qǐng)人:深圳市中興移動(dòng)通信有限公司