一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法

文檔序號：2832087閱讀：339來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法
技術(shù)領(lǐng)域：
本發(fā)明屬于音頻處理技術(shù)領(lǐng)域，具體涉及一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法。
背景技術(shù)：
法院的法庭審理過程需要進(jìn)行現(xiàn)場錄音，庭審現(xiàn)場錄音對于提高庭審效率和案件審理質(zhì)量是非常重要的。法庭的審理要求全面、真實(shí)、客觀、公正，如果有音像資料作以佐證的話就更能直觀、有效的印證案件審理的真實(shí)過程，從而為后續(xù)的監(jiān)督檢查以及庭審資料調(diào)用提供方便。而且，音像資料的保存作為一種真實(shí)歷史的記錄，可以為未來法庭庭審工作的發(fā)展提供借鑒和參考。法庭的庭審過程一般都比較長，短則2 3個(gè)小時(shí)，長的可以花費(fèi)半天甚至一天的時(shí)間，而庭審的現(xiàn)場錄音是一個(gè)連續(xù)的過程，將最終形成一段時(shí)間很長的音頻文件法庭的審理都存在著一套比較規(guī)范的程序，我國的法庭審理過程一般包括如下步驟宣布開庭一核實(shí)當(dāng)事人身份并告知權(quán)利義務(wù)一法庭調(diào)查一舉證質(zhì)證一法庭辯論一法庭調(diào)解一宣判一閉庭。在進(jìn)行庭審音頻的聽取過程中，如果希望針對其中的某個(gè)環(huán)節(jié)聽取錄音，在音頻文件通過音頻播放軟件播放時(shí)，可以通過改變播放進(jìn)度的形式來選擇相應(yīng)的音頻片段，這是目前所有播放軟件都支持的功能。但是，這種改變播放進(jìn)度的形式一般只能以時(shí)間作為參考依據(jù)，收聽者首先要估計(jì)希望聽取的片段在什么時(shí)間點(diǎn)，然后再根據(jù)時(shí)間點(diǎn) 進(jìn)行查找，這樣就會比較繁瑣，特別是在音頻文件比較長的情況下查找的效率相對較低。由于法庭審理有著較規(guī)范的程序，因此，目前有一種做法是在庭審過程錄制完成后，由工作人員再從頭至尾瀏覽一遍整個(gè)音頻文件，并對庭審的每一個(gè)步驟加入音頻標(biāo)引，從而為后續(xù)的錄音提取提供方便。但這種方式不僅增加了工作人員的勞動強(qiáng)度，而且，耗時(shí) 較長，工作效率比較低下。

發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的缺陷，提供一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，按庭審環(huán)節(jié)將長時(shí)間的庭審錄音進(jìn)行實(shí)時(shí)標(biāo)引，以方便后續(xù)聽取時(shí)音頻片段的快速定位。本發(fā)明的技術(shù)方案如下一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，包括如下步驟(1)根據(jù)法庭庭審的規(guī)定環(huán)節(jié)，確定每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句；(2)在法庭現(xiàn)場音頻的錄制過程中，實(shí)時(shí)的捕捉法官所發(fā)出的語音信息；(3)語音識別裝置識別法官的語音信息，當(dāng)與每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句相符時(shí)，輸出語音識別結(jié)果信息；(4)通過語音識別結(jié)果信息觸發(fā)標(biāo)引操作，對音頻文件的對應(yīng)音頻幀進(jìn)行標(biāo)引關(guān) 聯(lián)。
進(jìn)一步，如上所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，在步驟(2)中使用數(shù)字化錄音裝置對整個(gè)庭審過程進(jìn)行不間斷的連續(xù)錄音，形成音頻文件，并將文件實(shí)時(shí)發(fā)送存儲在音頻服務(wù)器的存儲器中。進(jìn)一步，如上所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，在步驟(3)中，先將法官的語音信息由模擬信號轉(zhuǎn)換為數(shù)字信號，然后進(jìn)行特定語音信息的識別。進(jìn)一步，如上所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，在步驟(4)中，首先對語音識別裝置的語音識別結(jié)果信息進(jìn)行重復(fù)性檢測，通過檢測的語音識別結(jié)果信息用于觸發(fā)標(biāo)弓I操作。進(jìn)一步，如上所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，步驟 (4)中標(biāo)引關(guān)聯(lián)的具體方法為，建立一個(gè)XML文件，XML文件的內(nèi)容節(jié)點(diǎn)以庭審的規(guī)定環(huán)節(jié) 名稱命名，當(dāng)語音識別結(jié)果信息觸發(fā)標(biāo)引操作時(shí)，將當(dāng)前音頻幀與XML文件的當(dāng)前節(jié)點(diǎn)內(nèi) 容相對應(yīng)，實(shí)現(xiàn)標(biāo)引關(guān)聯(lián)。進(jìn)一步，如上所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其中，在音頻錄制結(jié)束后，將起標(biāo)引作用的XML文件與音頻文件整體打包。本發(fā)明的有益效果如下本發(fā)明通過對法官說出的特定語句進(jìn)行語音識別，從而了解法庭審理的進(jìn)程，確定每一個(gè)規(guī)定環(huán)節(jié)的開始時(shí)刻，通過信號觸發(fā)實(shí)時(shí)標(biāo)引的方式對庭審錄音進(jìn)行實(shí)時(shí)標(biāo)引，最終形成一個(gè)帶有庭審環(huán)節(jié)標(biāo)簽的音頻文件。通過在音頻播放器上設(shè)計(jì)一個(gè)簡單的插件，用于讀取標(biāo)引信息，就可以將庭審的環(huán)節(jié)標(biāo)簽顯示在播放器的進(jìn) 度欄，從而為庭審錄音的后續(xù)收聽定位提供了極大的方便。本發(fā)明原理簡單，易于實(shí)現(xiàn)，非常有助于庭審音頻文件的處理，并能夠減輕工作人員勞動強(qiáng)度，提高音頻文件的處理效率。

圖1為本發(fā)明的方法流程圖；圖2為語音識別的流程圖；圖3為實(shí)時(shí)標(biāo)引方式的原理圖。
具體實(shí)施例方式下面結(jié)合附圖和具體實(shí)施例對本發(fā)明進(jìn)行詳細(xì)的描述。本發(fā)明所提供的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，用于庭審錄音現(xiàn)場當(dāng)中，其主要功能是對法庭庭審的數(shù)字化音頻文件進(jìn)行實(shí)時(shí)的環(huán)節(jié)標(biāo)引，以便于后續(xù)音頻收聽中的快速定位，該方法的流程如圖1所示，包括如下步驟(1)根據(jù)法庭庭審的規(guī)定環(huán)節(jié)，確定每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句，例如，開庭時(shí)法官宣讀“現(xiàn)在開庭”，法庭辯論環(huán)節(jié)開始時(shí)法官宣讀“現(xiàn)在進(jìn)行法庭辯論”；(2)在法庭現(xiàn)場音頻的錄制過程中，實(shí)時(shí)的捕捉法官所發(fā)出的語音信息，本發(fā)明使用數(shù)字化錄音裝置對整個(gè)庭審過程進(jìn)行不間斷的連續(xù)錄音，形成音頻文件，并將文件實(shí)時(shí) 發(fā)送存儲在音頻服務(wù)器的存儲器中；(3)語音識別裝置識別法官的語音信息并進(jìn)行判斷，當(dāng)與每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句相符時(shí)，輸出語音識別結(jié)果信息；
4
(4)對語音識別裝置的語音識別結(jié)果信息進(jìn)行重復(fù)性檢測，通過檢測的語音識別結(jié)果信息用于觸發(fā)標(biāo)引操作，對音頻文件的對應(yīng)音頻幀進(jìn)行標(biāo)引關(guān)聯(lián)。本發(fā)明的語音識別裝置并不是對法官的所有話語都進(jìn)行識別，而是只針對特定語音信息進(jìn)行識別。由于庭審一般都有著比較規(guī)范的程序，在每個(gè)程序開始的時(shí)候，規(guī)定法官都要用標(biāo)準(zhǔn)語句進(jìn)行宣讀以表明現(xiàn)在進(jìn)入相應(yīng)程序，例如，開庭時(shí)法官宣讀“現(xiàn)在開庭”，法庭辯論環(huán)節(jié)開始時(shí)法官宣讀“現(xiàn)在進(jìn)行法庭辯論”。這樣，語音識別裝置可以預(yù)先設(shè)定好需要識別的特定語音信息是什么，只有當(dāng)捕捉到這些規(guī)定好的特定語音信息之后，才進(jìn)行語音信息的輸出。結(jié)合以上特點(diǎn)，語音識別裝置的語音識別流程如圖2所示，首先通過語音接收單元接收模擬語音信息，然后通過模數(shù)轉(zhuǎn)換單元將模擬信號轉(zhuǎn)換為數(shù)字信號，接下來由特定語音信息識別單元判斷語音信息是否為標(biāo)準(zhǔn)語句，如果是標(biāo)準(zhǔn)語句則通過語音信息輸出單元進(jìn)行輸出。另外，在具體的庭審過程中，由于某些不太規(guī)范的人為因素，特定語音信息識別單元很可能會捕捉到多次同一特定語音信息，并將該信息進(jìn)行了多次輸出。因此，有必要對語音識別裝置輸出的語音識別結(jié)果信息進(jìn)行重復(fù)性檢測，如果發(fā)現(xiàn)有重復(fù)的語音信號又一次被輸入時(shí)，將該信號截?cái)?，不發(fā)送給實(shí)時(shí)標(biāo)引模塊，這樣就保證了在一次庭審錄制過程中對于一個(gè)規(guī)定環(huán)節(jié)只標(biāo)引一次。實(shí)時(shí)標(biāo)引過程根據(jù)檢測合格的語音識別裝置的識別結(jié)果觸發(fā)標(biāo)引操作，對音頻文件的對應(yīng)音頻幀進(jìn)行標(biāo)引關(guān)聯(lián)。本發(fā)明中，將特定的語音信息作為標(biāo)引的觸發(fā)機(jī)制，音頻服務(wù)器中設(shè)置實(shí)時(shí)標(biāo)引模塊，并在實(shí)時(shí)標(biāo)引模塊中事先已經(jīng)定義了需要標(biāo)引的具體內(nèi)容，即每個(gè)庭審環(huán)節(jié)的名稱，一種具體的實(shí)施方式是，在實(shí)時(shí)標(biāo)引模塊中設(shè)置一個(gè)XML文件，XML 即為可擴(kuò)展的標(biāo)記語言(eXtensibleMarkup Language)，是一套定義語義標(biāo)記的規(guī)則，這些標(biāo)記可以將文檔分成許多部件并對這些部件加以標(biāo)識。如圖3所示，本發(fā)明的XML文件的內(nèi)容節(jié)點(diǎn)以庭審的規(guī)定環(huán)節(jié)名稱命名，當(dāng)實(shí)時(shí)標(biāo)引模塊收到一個(gè)語音識別結(jié)果信號時(shí)，即觸發(fā)了相應(yīng)的標(biāo)引操作，系統(tǒng)便將音頻文件中當(dāng)前音頻幀與XML文件的當(dāng)前節(jié)點(diǎn)內(nèi)容相對應(yīng)，實(shí)現(xiàn)標(biāo)引關(guān)聯(lián)。下一個(gè)語音識別結(jié)果信號來到時(shí)，再將這一時(shí)刻的音頻幀與依次排列的另一個(gè)節(jié)點(diǎn)內(nèi)容相對應(yīng)，實(shí)現(xiàn)下一個(gè)環(huán)節(jié)的標(biāo)引關(guān)聯(lián)。這一技術(shù)原理簡單，對于本領(lǐng)域的技術(shù)人員來說非常容易實(shí)現(xiàn)。針對上述標(biāo)引方式，在音頻服務(wù)器中，還設(shè)有一個(gè)音頻文件打包模塊，用于將起標(biāo) 引作用的XML文件與數(shù)字化錄音裝置生成的音頻文件整體打包。這樣，就形成了一個(gè)可以實(shí)際被媒體播放器讀取播放的完整的音頻文件。對于音頻播放器軟件來說，應(yīng)該針對上述標(biāo)引關(guān)聯(lián)專門設(shè)計(jì)一個(gè)播放插件，通過該插件，可以將庭審的環(huán)節(jié)標(biāo)簽顯示在播放器的進(jìn)度欄，這樣，在聽取音頻文件的時(shí)候，可以非常直觀的找到庭審的某個(gè)環(huán)節(jié)的音頻片段，便于收聽的迅速定位。例如，收聽者希望聽一下法庭辯論環(huán)節(jié)的情況，就可以拖動進(jìn)度欄游標(biāo)，將之放于“法庭辯論”的標(biāo)識處，播放軟件便可以迅速的根據(jù)該標(biāo)引信息，找到對應(yīng)的片段起點(diǎn)音頻幀，從該音頻幀開始播放，非常方便實(shí)用。上述功能插件的設(shè)計(jì)對于本領(lǐng)域的技術(shù)人員來說是現(xiàn)有技術(shù)，此處不再進(jìn)行過多的描述。本發(fā)明所述的方法并不限于具體實(shí)施方式
中所述的實(shí)施例，本領(lǐng)域技術(shù)人員根據(jù) 本發(fā)明的技術(shù)方案得出其他的實(shí)施方式，同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，包括如下步驟(1)根據(jù)法庭庭審的規(guī)定環(huán)節(jié)，確定每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句；(2)在法庭現(xiàn)場音頻的錄制過程中，實(shí)時(shí)的捕捉法官所發(fā)出的語音信息；(3)語音識別裝置識別法官的語音信息，當(dāng)與每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句相符時(shí)，輸出語音識別結(jié)果信息；(4)通過語音識別結(jié)果信息觸發(fā)標(biāo)引操作，對音頻文件的對應(yīng)音頻幀進(jìn)行標(biāo)引關(guān)聯(lián)。
2.如權(quán)利要求1所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其特征在于在步驟(2)中使用數(shù)字化錄音裝置對整個(gè)庭審過程進(jìn)行不間斷的連續(xù)錄音，形成音頻文件，并將文件實(shí)時(shí)發(fā)送存儲在音頻服務(wù)器的存儲器中。
3.如權(quán)利要求1所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其特征在于在步驟(3)中，先將法官的語音信息由模擬信號轉(zhuǎn)換為數(shù)字信號，然后進(jìn)行特定語音信息的識別。
4.如權(quán)利要求1所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其特征在于在步驟(4)中，首先對語音識別裝置的語音識別結(jié)果信息進(jìn)行重復(fù)性檢測，通過檢測的語音識別結(jié)果信息用于觸發(fā)標(biāo)引操作。
5.如權(quán)利要求4所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其特征在于步驟⑷中標(biāo)引關(guān)聯(lián)的具體方法為，建立一個(gè)XML文件，XML文件的內(nèi)容節(jié)點(diǎn)以庭審的規(guī)定環(huán)節(jié)名稱命名，當(dāng)語音識別結(jié)果信息觸發(fā)標(biāo)引操作時(shí)，將當(dāng)前音頻幀與XML文件的當(dāng)前節(jié)點(diǎn)內(nèi)容相對應(yīng)，實(shí)現(xiàn)標(biāo)引關(guān)聯(lián)。
6.如權(quán)利要求5所述的通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法，其特征在于在音頻錄制結(jié)束后，將起標(biāo)引作用的XML文件與音頻文件整體打包。
全文摘要
本發(fā)明屬于音頻處理技術(shù)領(lǐng)域，具體涉及一種通過特定語音觸發(fā)的法庭庭審音頻文件實(shí)時(shí)標(biāo)引方法。該方法根據(jù)法庭庭審的規(guī)定環(huán)節(jié)，確定每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句；在法庭現(xiàn)場音頻的錄制過程中，實(shí)時(shí)的捕捉法官所發(fā)出的語音信息；語音識別裝置識別法官的語音信息，當(dāng)與每個(gè)環(huán)節(jié)開始時(shí)法官的標(biāo)準(zhǔn)語句相符時(shí)，輸出語音識別結(jié)果信息；通過語音識別結(jié)果信息觸發(fā)標(biāo)引操作，對音頻文件的對應(yīng)音頻幀進(jìn)行標(biāo)引關(guān)聯(lián)。本發(fā)明按庭審環(huán)節(jié)將長時(shí)間的庭審錄音進(jìn)行實(shí)時(shí)標(biāo)引，以方便后續(xù)聽取時(shí)音頻片段的快速定位，并且能夠減輕工作人員勞動強(qiáng)度，提高音頻文件的處理效率。
文檔編號G10L15/28GK101833982SQ20091007982
公開日2010年9月15日申請日期2009年3月12日優(yōu)先權(quán)日2009年3月12日
發(fā)明者商文彬, 羊文廣, 羊美華, 黃瓊申請人:新奧特硅谷視頻技術(shù)有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載