国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      轉(zhuǎn)錄音頻信號的方法和設(shè)備的制作方法

      文檔序號:6500629閱讀:208來源:國知局
      專利名稱:轉(zhuǎn)錄音頻信號的方法和設(shè)備的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及用于將文檔的包含信號部分的音頻信號轉(zhuǎn)錄為包含文本部分的文本的方法,該文檔被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分。
      本發(fā)明進(jìn)一步涉及用于將文檔的包含信號部分的音頻信號轉(zhuǎn)錄為包含文本部分的文本的設(shè)備,該文檔被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分。
      本發(fā)明進(jìn)一步涉及適于轉(zhuǎn)錄音頻信號的計(jì)算機(jī)程序產(chǎn)品。
      本發(fā)明進(jìn)一步涉及運(yùn)行前一段中所述計(jì)算機(jī)程序產(chǎn)品的計(jì)算機(jī)。
      背景技術(shù)
      從專利文獻(xiàn)US5031113可以獲知這種方法、設(shè)備、計(jì)算機(jī)程序產(chǎn)品和計(jì)算機(jī)。
      在已知設(shè)備的情況下,借助于已知設(shè)備能夠執(zhí)行已知方法,并且已知設(shè)備是借助于處理已知計(jì)算機(jī)程序產(chǎn)品的已知計(jì)算機(jī)而實(shí)現(xiàn)的,文檔是基于音頻信號而產(chǎn)生的。在此期間,包含在音頻信號中的信號部分被識別為文本部分并被存儲。而且產(chǎn)生并存儲關(guān)系數(shù)據(jù),該關(guān)系數(shù)據(jù)表示信號部分和所識別的文本部分的時(shí)間(temporal)關(guān)系。借助于設(shè)備,能夠經(jīng)由揚(yáng)聲器以有聲方式再現(xiàn)音頻信號,并且能夠經(jīng)由監(jiān)視器以可視方式再現(xiàn)文檔。在音頻信號的有聲再現(xiàn)中,關(guān)系數(shù)據(jù)用于文本部分的同步視覺重點(diǎn)(synchronized visual emphasis),其表示各個信號部分的時(shí)間關(guān)系(temporal relation),在專家圈里稱為“同步重放”。
      在已知設(shè)備的情況下存在這樣的問題在文檔不僅包含通過轉(zhuǎn)錄產(chǎn)生的文本還包含諸如不可改變格式的域名或者圖片或者文本塊或者視聽對象之類的其他元素的情況下,在使用“同步重放”時(shí),并且實(shí)際上特別是在通過轉(zhuǎn)錄產(chǎn)生的文本由不是自己口述(dedicate)文本的雇員讀完和檢查的情況下會發(fā)生很大的困難,因?yàn)椴皇峭ㄟ^轉(zhuǎn)錄產(chǎn)生的這些其他元素不被考慮,或者不被充分考慮。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于消除在第一段中所述類型的方法的情況下所存在的問題,以及在第二段中所述類型的設(shè)備的情況下所存在的問題,以及在第三段中所述類型的計(jì)算機(jī)程序產(chǎn)品的情況下所存在的問題,以及在第四段中所述類型的計(jì)算機(jī)的情況下所存在的問題,并創(chuàng)建改進(jìn)的方法、改進(jìn)的設(shè)備、改進(jìn)的計(jì)算機(jī)程序產(chǎn)品和改進(jìn)的計(jì)算機(jī)。
      為了實(shí)現(xiàn)上述目的,在根據(jù)本發(fā)明的方法的情況下,可以預(yù)計(jì)依據(jù)本發(fā)明的特征,這樣就能夠以下述方式特征化本發(fā)明的方法。
      一種用于將文檔的包含信號部分的音頻信號轉(zhuǎn)錄為包含文本部分的文本的方法,該文檔被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分,該方法具有以下所列出的步驟,即將信號部分轉(zhuǎn)錄為文本部分,并產(chǎn)生表示各個至少一個信號部分和各個通過轉(zhuǎn)錄所獲得的至少一個文本部分之間的至少一個時(shí)間關(guān)系的時(shí)間數(shù)據(jù),并且識別文檔結(jié)構(gòu)并以關(guān)系數(shù)據(jù)描述所識別的文檔結(jié)構(gòu)。
      為了實(shí)現(xiàn)上述目的,在根據(jù)本發(fā)明的設(shè)備的情況下,可以預(yù)計(jì)依據(jù)本發(fā)明的特征,這樣就能夠以下述方式特征化根據(jù)本發(fā)明的設(shè)備一種用于將文檔的包含信號部分的音頻信號轉(zhuǎn)錄為包含文本部分的文本的設(shè)備,該文檔被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分,具有用于將信號部分轉(zhuǎn)錄為文本部分的轉(zhuǎn)錄裝置,并具有設(shè)計(jì)為產(chǎn)生關(guān)系數(shù)據(jù)的關(guān)系數(shù)據(jù)產(chǎn)生裝置,這些關(guān)系數(shù)據(jù)表示各個至少一個信號部分和各個通過轉(zhuǎn)錄所獲得的至少一個文本部分之間的至少一個時(shí)間關(guān)系,并且具有設(shè)計(jì)為識別文檔結(jié)構(gòu)的結(jié)構(gòu)識別裝置,并具有設(shè)計(jì)為用關(guān)系數(shù)據(jù)描述所識別的文檔結(jié)構(gòu)的結(jié)構(gòu)描述裝置。
      為了實(shí)現(xiàn)上述目的,在適于轉(zhuǎn)錄音頻信號的計(jì)算機(jī)程序產(chǎn)品的情況下,根據(jù)本發(fā)明可以預(yù)計(jì)的是,計(jì)算機(jī)程序產(chǎn)品能夠直接裝載到計(jì)算機(jī)的存儲器中并且包括軟件代碼部分,其中當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)利用該計(jì)算機(jī)根據(jù)能夠執(zhí)行根據(jù)本發(fā)明的方法。
      為了實(shí)現(xiàn)上述目的,在根據(jù)本發(fā)明的計(jì)算機(jī)的情況下,可以預(yù)計(jì)的是計(jì)算機(jī)具有計(jì)算單元和內(nèi)部存儲器,并運(yùn)行根據(jù)以上段落的計(jì)算機(jī)程序產(chǎn)品。
      通過提供根據(jù)本發(fā)明的措施所獲得的優(yōu)勢在于,要產(chǎn)生的文檔結(jié)構(gòu)不僅顯示在文檔本身中,也顯示在關(guān)系數(shù)據(jù)中,由此能夠產(chǎn)生相當(dāng)復(fù)雜的文檔并且更為重要的是能夠進(jìn)一步以視聽方式處理相當(dāng)復(fù)雜的文檔。
      通過提供如權(quán)利要求2或權(quán)利要求9所述的其他措施所獲得的更多優(yōu)勢在于在準(zhǔn)備作為模板的文檔中已存在的結(jié)構(gòu),例如由預(yù)定的表格域所給定的文檔結(jié)構(gòu),被以關(guān)系數(shù)據(jù)可靠地描述。
      通過提供如權(quán)利要求3或權(quán)利要求10所述的其他措施所獲得的更多優(yōu)勢在于只通過包含在要轉(zhuǎn)錄的音頻信號中的結(jié)構(gòu)指令識別的文檔結(jié)構(gòu)(例如因?yàn)樗鼈兪怯梢粋€人口述的)因此實(shí)際上被實(shí)時(shí)識別(即在轉(zhuǎn)錄期間被識別),并且被以關(guān)系數(shù)據(jù)可靠地描述。
      在根據(jù)本發(fā)明的解決方案的情況下,例如能夠預(yù)計(jì)的是,對于每個識別的文檔結(jié)構(gòu)元素產(chǎn)生具有關(guān)系數(shù)據(jù)的獨(dú)立文件,也就是產(chǎn)生關(guān)系數(shù)據(jù)的物理分組。如果另外預(yù)計(jì)根據(jù)權(quán)利要求4或權(quán)利要求11的措施將是特別有利的,因?yàn)槭褂盟鎏卣?,可以盡可能簡單并且可靠地實(shí)現(xiàn)分組為單個文件,這樣可以避免對多個文件的相對耗時(shí)處理。在這種情況下,關(guān)系數(shù)據(jù)的分組例如能夠通過借助于表示所識別的文檔結(jié)構(gòu)的結(jié)構(gòu)數(shù)據(jù)來標(biāo)記關(guān)系數(shù)據(jù)而發(fā)生。然而同樣能夠預(yù)計(jì)的是,結(jié)構(gòu)上合成整體(belong together)的關(guān)系數(shù)據(jù)被分到一個文件的多個部分中,每個部分被指定為所識別的文檔結(jié)構(gòu)的結(jié)構(gòu)元素。
      通過提供如權(quán)利要求5或者權(quán)利要求12所述的措施獲得的更多優(yōu)勢在于提高了識別文本部分的效率。這是個特別的情況,因?yàn)槔缭诒硎痉派鋵W(xué)家的報(bào)告的文檔情況下,在轉(zhuǎn)錄放射學(xué)家的行政指令的情況下,不需要放射線學(xué)的上下文,而是更為有限的涉及一般指令的上下文就足夠了。同樣應(yīng)用在報(bào)告的摘要被轉(zhuǎn)錄的情況下,并且例如實(shí)際上已經(jīng)提前知道了在摘要中將主要使用標(biāo)準(zhǔn)公式或者標(biāo)準(zhǔn)短語。同樣應(yīng)用在文檔中的結(jié)構(gòu)是通過不同語言給出的情況下,例如在各部分中使用。因此,例如在可提供第一語言模型或者第二語言模型的情況下,保證在自動選擇各個語言模型的情況下發(fā)生轉(zhuǎn)錄,并且如果適用,可根據(jù)由兩種不同語言、不同的編輯人員給出的結(jié)構(gòu),隨后進(jìn)一步有選擇地處理文檔。
      通過提供如權(quán)利要求6或者權(quán)利要求13所述的措施獲得的優(yōu)勢在于,通過轉(zhuǎn)錄產(chǎn)生的文檔的所有文本元素能夠沒有問題地并且最重要地以正確的序列連貫地再現(xiàn),而沒有文本元素被忽略。
      通過提供如權(quán)利要求7或者權(quán)利要求14所述的措施獲得的優(yōu)勢在于能夠?qū)崿F(xiàn)文本部分連貫的有聲再現(xiàn),一方面是通過轉(zhuǎn)錄音頻信號而產(chǎn)生的,而另一方面是通過除了轉(zhuǎn)錄音頻信號之外的方式產(chǎn)生的。以其他方式產(chǎn)生的這種文本部分能夠例如通過將文本手動輸入到文檔中或者通過插入預(yù)定文本元素或者文本對象,例如表格的域名,或者通過插入預(yù)定文本塊,或者通過校正通過轉(zhuǎn)錄而產(chǎn)生的文本而產(chǎn)生。
      參照下文所述的實(shí)施例本發(fā)明的這些和其他方面將顯而易見并且將被闡明。
      下面基于附圖所示的設(shè)計(jì)示例進(jìn)一步詳細(xì)描述本發(fā)明,然而本發(fā)明并不限制于此。


      圖1以方塊圖的形式示意性地顯示了根據(jù)本發(fā)明實(shí)施例的設(shè)備。
      圖2以純文本顯示了包含在借助于根據(jù)圖1的設(shè)備進(jìn)行處理的文檔中的一些信息。
      圖3以純文本顯示了相對于根據(jù)圖2的文檔結(jié)構(gòu)而劃分的關(guān)系數(shù)據(jù),再現(xiàn)文檔的音頻信號的信號部分和文本的文本部分之間的至少一個時(shí)間關(guān)系。
      具體實(shí)施例方式
      圖1所示的是設(shè)計(jì)為將文檔DO的包含信號部分SP的音頻信號AS轉(zhuǎn)錄為包含文本部分TP的文本的設(shè)備1。音頻信號表示說話者給出的口述。圖2所示的是預(yù)計(jì)用于再現(xiàn)信息的文檔DO,該信息至少部分地對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分TP。在當(dāng)前情況下,文檔DO具有不對應(yīng)于轉(zhuǎn)錄的文本部分TP的模板部分,例如預(yù)定的表格域名“作者(Author)”或者“日期(Date)”,其在文檔模板中是以固定方式設(shè)置的。
      設(shè)備1具有第一輸入IN1,在此能夠?qū)⒁纛l信號AS提供給設(shè)備。要注意的是如果設(shè)備1具有以非常熟知的方式設(shè)立的裝置,音頻信號AS也能夠以其他方式提供,例如借助于數(shù)據(jù)載體或者經(jīng)由數(shù)據(jù)網(wǎng)絡(luò)以數(shù)字表示的形式。
      設(shè)備1還具有第二輸入IN2,在此能夠?qū)⑻幚硇盘朩S提供給設(shè)備;這一點(diǎn)是以下要詳細(xì)描述的。
      設(shè)備1還具有轉(zhuǎn)錄裝置2,設(shè)計(jì)為接收音頻信號AS并用于將信號部分SP轉(zhuǎn)錄為文本部分TP。關(guān)于這一點(diǎn)要注意的是,相應(yīng)地調(diào)節(jié)音頻信號AS對于本領(lǐng)域的技術(shù)人員而言是顯而易見的,其中例如過濾器元件和轉(zhuǎn)換元件用于轉(zhuǎn)換為數(shù)字表示;這一點(diǎn)在此不做進(jìn)一步的詳細(xì)描述。對信號部分SP進(jìn)行轉(zhuǎn)錄考慮到說話者數(shù)據(jù)(未明確示于圖1中)和可選上下文而發(fā)生。上下文數(shù)據(jù)同樣沒有明確地示于圖1中,其表示可供選擇的多個上下文,其中每個上下文定義或者包括語言,語言模型和詞典。說話者數(shù)據(jù)代表各個說話者。基于所提供的音頻信號AS,轉(zhuǎn)錄裝置2設(shè)計(jì)為產(chǎn)生文本數(shù)據(jù)TXD,表示識別的文本部分TP。
      設(shè)備1還具有文檔數(shù)據(jù)存儲介質(zhì)3,設(shè)計(jì)并提供用于存儲文檔DO和打算用于文檔DO的模板數(shù)據(jù)TD,及文本數(shù)據(jù)TXD。轉(zhuǎn)錄裝置2設(shè)計(jì)為與文檔數(shù)據(jù)存儲介質(zhì)3一起工作以能夠?qū)⑽谋緮?shù)據(jù)TXD插入到文檔DO打算提供給該文本數(shù)據(jù)的區(qū)域。而且借助于文檔數(shù)據(jù)存儲介質(zhì)3能夠存儲表示被插入到文檔DO中的對象OO的對象數(shù)據(jù)OD;這一點(diǎn)下面將進(jìn)一步詳細(xì)描述。
      設(shè)備1還具有文檔處理裝置4,設(shè)計(jì)為經(jīng)由第二輸入IN2接收處理信號WS。考慮到處理信號WS,文檔處理裝置4還設(shè)計(jì)為產(chǎn)生并傳送處理數(shù)據(jù)WD,其被提供用于改變借助于對文檔數(shù)據(jù)存儲介質(zhì)3中的信號部分SP的轉(zhuǎn)錄所產(chǎn)生的文本部分TP。借助于文檔處理裝置4,例如圖2所示的、明顯被錯誤識別的文本部分TP能夠在時(shí)間標(biāo)記t93和t100之間被校正,示例為刪除文本標(biāo)記t93和t100之間的這些文本部分TP并將經(jīng)校正的文本部分TP’插入到文本標(biāo)記t100和t101之間。對于通過校正手段所獲得的其他文本部分TP’,在音頻信號AS中沒有對應(yīng)的信號部分SP,因?yàn)樗鼈兪鞘謩硬迦氲?。這同樣適用于圖2所示的對象OO。
      轉(zhuǎn)錄裝置2還設(shè)計(jì)為產(chǎn)生和傳送相關(guān)于音頻信號AS內(nèi)信號部分SP的時(shí)間tn中的開始點(diǎn)和時(shí)間tm中的結(jié)束點(diǎn)的信息,以及相關(guān)于表示借助于轉(zhuǎn)錄裝置2分別產(chǎn)生的文本部分TP數(shù)量的文本部分?jǐn)?shù)量WN的信息。
      設(shè)備1還具有設(shè)計(jì)為產(chǎn)生關(guān)系數(shù)據(jù)RD的關(guān)系數(shù)據(jù)產(chǎn)生裝置5,這些關(guān)系數(shù)據(jù)RD表示各個信號部分SP和各個至少一個轉(zhuǎn)錄的文本部分TP之間的時(shí)間關(guān)系。為此,關(guān)系數(shù)據(jù)產(chǎn)生裝置5設(shè)計(jì)為接收和處理相關(guān)于音頻信號AS內(nèi)信號部分SP的時(shí)間tn中的開始點(diǎn)和時(shí)間tm中的結(jié)束點(diǎn)的信息,以及相關(guān)于文本部分?jǐn)?shù)量WN的信息。關(guān)系數(shù)據(jù)產(chǎn)生裝置5還設(shè)計(jì)為傳送關(guān)系數(shù)據(jù)RD。
      設(shè)備1還具有設(shè)計(jì)為識別文檔DO結(jié)構(gòu)的結(jié)構(gòu)識別裝置6,下面將詳細(xì)描述。
      為了識別文檔DO結(jié)構(gòu),結(jié)構(gòu)識別裝置6具有設(shè)計(jì)為關(guān)于一結(jié)構(gòu)分析文檔DO的第一分析階段7。第一分析階段6[sic]設(shè)計(jì)為訪問文檔數(shù)據(jù)存儲介質(zhì)3并讀取和考慮模板數(shù)據(jù)TD。第一分析階段6[sic]設(shè)計(jì)為作為其分析的結(jié)果傳送第一分析數(shù)據(jù)AD1,該分析數(shù)據(jù)表示基于模板數(shù)據(jù)TD可識別的文檔DO結(jié)構(gòu)。在當(dāng)前情況下,該可識別結(jié)構(gòu)涉及存在預(yù)計(jì)用于輸入文本的兩個表格域,安置在兩個表格域名“作者(Author)”和“日期(Date)”的附近。然而可識別結(jié)構(gòu)也能夠通過圖片或者不可改變的文本段實(shí)現(xiàn)。對于這一點(diǎn)要注意的是,除了對于文檔用戶可視的結(jié)構(gòu)元素之外,在文檔的正常使用中甚至也考慮不可見的結(jié)構(gòu)元素,這是通過設(shè)置來定義的,例如在當(dāng)前字處理程序的情況下稱為所謂的書簽或者所謂的構(gòu)造,并且不被計(jì)算在通過文檔將為用戶再現(xiàn)的信息之內(nèi),因?yàn)樗鼈冎饕糜谂c輸入控制、輸出控制、或者文檔自動處理有關(guān)的方面。
      為了識別文檔DO的結(jié)構(gòu),結(jié)構(gòu)識別裝置5還具有第二分析階段8,設(shè)計(jì)為關(guān)于文檔DO的結(jié)構(gòu)分析所獲得的文本部分TP。第二分析階段8設(shè)計(jì)為接收由信號部分SP轉(zhuǎn)錄的文本數(shù)據(jù)TXD,并用于關(guān)于說話者發(fā)出的結(jié)構(gòu)指令分析文本數(shù)據(jù)TXD,其中結(jié)構(gòu)指令被預(yù)計(jì)用于或者適用于產(chǎn)生和/或改變和/或設(shè)定文檔DO中的結(jié)構(gòu)。這可以包括諸如給要被格式化為標(biāo)題的各條文本的口頭格式分配(諸如打算用于格式化標(biāo)題的標(biāo)題格式的分配),或者還插入、刪除或者重寫通過口述頭命令實(shí)現(xiàn)的文本部分TP。
      第二分析階段8還設(shè)計(jì)為有關(guān)借助于處理數(shù)據(jù)WD對文檔DO的當(dāng)前結(jié)構(gòu)進(jìn)行的修改,或者有關(guān)文檔DO中最近定義的結(jié)構(gòu)接收處理數(shù)據(jù)WD并分析處理數(shù)據(jù)WD。例如,這可以包括對標(biāo)題層次的修改或者插入或刪除諸如圖片、文本或者對象之類的元素,對于這些元素而言在音頻信號AS中不存在對應(yīng)的信號部分SP。同樣對于這一點(diǎn)要注意的是,第二分析階段8也能夠設(shè)計(jì)為訪問文檔數(shù)據(jù)存儲介質(zhì)3并用于分析通過語言或者手動處理產(chǎn)生的文檔DO的結(jié)構(gòu)。
      第二分析階段8類似于第一分析階段7設(shè)計(jì)為傳送表示分析結(jié)果的第二分析數(shù)據(jù)AD2。
      設(shè)備1還具有結(jié)構(gòu)描述裝置9,設(shè)計(jì)為接收第一分析數(shù)據(jù)AD1和第二分析數(shù)據(jù)AD2以及關(guān)系數(shù)據(jù)RD。結(jié)構(gòu)描述裝置9設(shè)計(jì)為借助于第一分析數(shù)據(jù)AD1和第二分析數(shù)據(jù)AD2用關(guān)系數(shù)據(jù)RD描述由分析數(shù)據(jù)AD1和AD2所表示或者識別的文檔DO的結(jié)構(gòu)。結(jié)構(gòu)描述裝置9還設(shè)計(jì)為傳送關(guān)于文檔DO結(jié)構(gòu)所構(gòu)造的關(guān)系數(shù)據(jù)SRD,在當(dāng)前情況下其表示圖3中所示的邏輯分組的關(guān)系數(shù)據(jù)RD。
      設(shè)備1還具有設(shè)計(jì)為存儲構(gòu)造的關(guān)系數(shù)據(jù)SRD的關(guān)系數(shù)據(jù)存儲介質(zhì)10。提供結(jié)構(gòu)描述裝置9來訪問關(guān)系數(shù)據(jù)存儲介質(zhì)10,其中構(gòu)造的關(guān)系數(shù)據(jù)SRD能夠存儲在關(guān)系數(shù)據(jù)存儲介質(zhì)10中,或者已經(jīng)存儲的關(guān)系數(shù)據(jù)SRD能夠被修改。
      在圖3中,以純文本再現(xiàn)的是對圖2所示的文檔DO構(gòu)造的關(guān)系數(shù)據(jù)SRD的描述。圖3顯示了逐行列出的條目,所述條目對應(yīng)于文檔DO的元素并借助于數(shù)字1到56來計(jì)數(shù)。第一列C1顯示了各個文檔條目的號碼。第二行[sic]C2顯示了音頻信號AS內(nèi)信號部分SP時(shí)間內(nèi)的各個起始點(diǎn),其對應(yīng)于經(jīng)由各個號碼的文檔DO的元素,例如由信號部分SP轉(zhuǎn)錄的文本部分TP。第三列C3顯示了上述音頻信號AS內(nèi)信號部分SP時(shí)間內(nèi)的各個結(jié)束點(diǎn)。從圖3中可以看出,借助構(gòu)造的關(guān)系數(shù)據(jù)表示的文檔條目不僅涉及借助于音頻信號AS的轉(zhuǎn)錄而產(chǎn)生的那些元素,也涉及以其他方式產(chǎn)生的那些元素,并且這些元素位于音頻信號AS的信號部分SP之間的文檔中,例如行4O和52的元素。對于各個文檔條目,列C4表示了對文檔DO中包含的結(jié)構(gòu)的從屬關(guān)系(affiliation)。這里要特別指出的是,即使是諸如在時(shí)間標(biāo)記t78和t79之間或者在時(shí)間標(biāo)記t100和t101之間記錄的那些文檔條目之類的文檔條目,都是以關(guān)系數(shù)據(jù)RD表示的,對于這些文檔條目不存在音頻信號AS,以便能夠日后保證(如果必要的話)對包括或者忽略這些元素的音頻信號AS的音頻再現(xiàn),或者(保證)能夠回顧信息和/或修改文檔。
      設(shè)備1還具有設(shè)計(jì)為存儲音頻數(shù)據(jù)AD的音頻數(shù)據(jù)存儲介質(zhì)11,所述音頻數(shù)據(jù)AD表示音頻信號AS并由轉(zhuǎn)錄裝置2傳送到音頻信號存儲介質(zhì)11。音頻數(shù)據(jù)AD以非常熟知的數(shù)字表示方式來表示音頻信號AS,其中能夠訪問信號部分SP以備之后用于考慮構(gòu)造的關(guān)系數(shù)據(jù)SRD來再現(xiàn)音頻信號AS。
      轉(zhuǎn)錄裝置2還可以依據(jù)所識別的文檔DO結(jié)構(gòu),也就是依據(jù)構(gòu)造的關(guān)系數(shù)據(jù)SRD而配置,其中在當(dāng)前情況下依據(jù)該結(jié)構(gòu)在三個不同上下文之間作出選擇。因此如果識別到我們在處理結(jié)構(gòu)元素“報(bào)告標(biāo)題”,則選擇第一上下文,以及如果是結(jié)構(gòu)元素“章節(jié)標(biāo)題”,則選擇第二上下文,以及如果是結(jié)構(gòu)元素“文本”,則選擇第三上下文。由此,可以保證一出現(xiàn)結(jié)構(gòu)元素“文本”,就提供具有最大詞法作用域(lexical scope)的上下文,這通常對于涉及結(jié)構(gòu)元素“報(bào)告標(biāo)題”或者“章節(jié)標(biāo)題”的信號部分SP的轉(zhuǎn)錄是不必要的。而且,如果識別的是它包括結(jié)構(gòu)元素“作者”,則選擇第四上下文-實(shí)質(zhì)上與名字相關(guān)。而且,如果識別的是它包括結(jié)構(gòu)元素“日期”,則選擇第五上下文-實(shí)質(zhì)上與詳細(xì)日期相關(guān)。
      對于這一點(diǎn)要注意的是,考慮到所識別的結(jié)構(gòu)、語言或者語言模型在不同說話者數(shù)據(jù)之間作出選擇。同時(shí)要提到的是,只有在所識別的結(jié)構(gòu)已經(jīng)到達(dá)構(gòu)造的關(guān)系數(shù)據(jù)SRD時(shí)對轉(zhuǎn)錄裝置2而言不需要考慮文檔DO的結(jié)構(gòu),而一旦這些識別的結(jié)構(gòu)由結(jié)構(gòu)識別裝置6例如直接傳送到轉(zhuǎn)錄裝置2,那么所述結(jié)構(gòu)已經(jīng)基于第一分析數(shù)據(jù)AD1和/或基于第二分析數(shù)據(jù)AD2被納入考慮。
      設(shè)備1還具有調(diào)整裝置12,設(shè)計(jì)為借助于構(gòu)造的關(guān)系數(shù)據(jù)SRD調(diào)整轉(zhuǎn)錄裝置2的各個上下文。為此,調(diào)整裝置12設(shè)計(jì)為從關(guān)系數(shù)據(jù)存儲介質(zhì)9讀取構(gòu)造的關(guān)系數(shù)據(jù)SRD,并且用于從文檔存儲介質(zhì)3讀取文本數(shù)據(jù)TXD,以及用于分析使用構(gòu)造的關(guān)系數(shù)據(jù)SRD的文本數(shù)據(jù)TXD,和/或用于在第一次產(chǎn)生并存儲文本數(shù)據(jù)TXD之后,借助于構(gòu)造的關(guān)系數(shù)據(jù)SRD分析對已經(jīng)記錄的文本數(shù)據(jù)TXD的修改。作為文本數(shù)據(jù)TXD的分析結(jié)果,調(diào)整裝置12設(shè)計(jì)為將改變或者調(diào)整信息CI傳送到轉(zhuǎn)錄裝置2,借助于該信息能夠調(diào)整各個上下文這樣今后對于轉(zhuǎn)錄而言能夠得到更好的結(jié)果。
      設(shè)備1還具有再現(xiàn)控制裝置13,設(shè)計(jì)為鑒于所識別的文檔DO結(jié)構(gòu)以與在文檔DO的文本部分TP的視覺再現(xiàn)情況下所轉(zhuǎn)錄的文本部分TP的視覺重點(diǎn)同步地實(shí)現(xiàn)音頻信號AS的信號部分SP的有聲再現(xiàn)。為此,再現(xiàn)控制裝置13設(shè)計(jì)為訪問存儲在關(guān)系數(shù)據(jù)存儲介質(zhì)10中的構(gòu)造的關(guān)系數(shù)據(jù)SRD,并用于訪問存儲在文檔存儲介質(zhì)3中的那些文本數(shù)據(jù)TXD,利用構(gòu)造的關(guān)系數(shù)據(jù)SRD將它們標(biāo)識為存在信號部分SP的那些文本數(shù)據(jù)TXD,其是利用音頻數(shù)據(jù)AD表示的。再現(xiàn)控制裝置13還設(shè)計(jì)為訪問音頻數(shù)據(jù)AD中的信號部分SP,這些信號部分SP被記錄在構(gòu)造的關(guān)系數(shù)據(jù)SRD中的各個時(shí)間標(biāo)記tn和tm限制在時(shí)間段內(nèi)。再現(xiàn)控制裝置13還設(shè)計(jì)為將表示各個信號部分SP的音頻數(shù)據(jù)AD同步傳送到第一再現(xiàn)設(shè)備14,并用于將時(shí)間順序相應(yīng)的文本顯示控制數(shù)據(jù)TDCD發(fā)送到第二再現(xiàn)設(shè)備15。利用文本顯示控制數(shù)據(jù)TDCD,首先能夠?qū)⑽臋nDO的信息傳送到第二再現(xiàn)設(shè)備15,該設(shè)備設(shè)計(jì)用于視覺再現(xiàn)該信息,而其次能夠定義各個文本部分TP的同步重點(diǎn),同時(shí)以音頻數(shù)據(jù)AD的形式將對應(yīng)于此的信號部分SP傳送到第一再現(xiàn)設(shè)備14。
      在當(dāng)前情況下,由具有集成揚(yáng)聲器的音頻放大器實(shí)現(xiàn)的第一再現(xiàn)設(shè)備14和由監(jiān)視器實(shí)現(xiàn)的第二再現(xiàn)設(shè)備15都分別經(jīng)由分配的信號輸出OUT1和OUT2連接到設(shè)備2。然而對于這一點(diǎn)要提出的是,兩個設(shè)備14和15也可以由經(jīng)由設(shè)備2的一個單個信號輸出連接到設(shè)備2的組合設(shè)備形成。而且,兩個設(shè)備14和15也可以集成在設(shè)備1中。
      設(shè)備1具有設(shè)計(jì)為將文本數(shù)據(jù)TXD合成到合成語音中的語音合成裝置16,這使得合成裝置可以為音頻信號AS中不存在信號部分SP的那些文本部分TP’實(shí)現(xiàn)有聲再現(xiàn)。語音合成裝置16在輸入端連接于再現(xiàn)控制裝置13,而在輸出端連接于信號輸出OUT1。
      再現(xiàn)控制裝置13還設(shè)計(jì)為與語音合成裝置16相協(xié)作,并且利用語音合成裝置16來實(shí)現(xiàn)其他文本部分TP’的有聲再現(xiàn),所述文本部分TP’是通過轉(zhuǎn)錄音頻信號AS所獲得的文本部分TP之外另外產(chǎn)生的,這些其他文本部分TP’位于通過轉(zhuǎn)錄文檔DO中的音頻信號AS所獲得的文本部分TP的鄰近。如果必要的話,通過對再現(xiàn)控制裝置13的監(jiān)視,如果這些其他文本部分TP’例如已經(jīng)到達(dá)文檔DO作為對象OO的組成部分或者通過校正,則可以在再現(xiàn)其他文本部分TP’期間執(zhí)行音頻信號AS的再現(xiàn)的中斷,如基于圖2所示。
      下面基于根據(jù)圖1的設(shè)備1的設(shè)計(jì)示例說明設(shè)備1的操作方法。
      根據(jù)應(yīng)用示例,假設(shè)商人口述關(guān)于商業(yè)計(jì)劃的報(bào)告。利用連接于第一輸入IN1的麥克風(fēng)產(chǎn)生音頻信號AS并提供至設(shè)備1。
      利用設(shè)備1能夠執(zhí)行轉(zhuǎn)錄音頻信號AS的方法。口述開始時(shí),圖2所示處于其最終處理狀態(tài)的文檔DO實(shí)質(zhì)上是空的,并且只具有預(yù)定的、不可改變的模板數(shù)據(jù)TD,表示預(yù)定的表格域名,并且實(shí)際在當(dāng)前情況下表示表格域名“作者(Author)”和“日期(Date)”。
      對于該方法,信號部分SP被轉(zhuǎn)錄為對應(yīng)的文本部分TP,并產(chǎn)生表示各個信號部分SP和各個至少一個轉(zhuǎn)錄的文本部分TP之間的當(dāng)前關(guān)系的關(guān)系數(shù)據(jù)RD。
      在當(dāng)前情況下,商人首先口述以下詞語“作者M(jìn)ichaelSchneider”。
      為了提高識別和轉(zhuǎn)錄處理,利用設(shè)備1識別文檔DO的結(jié)構(gòu)并且以關(guān)系數(shù)據(jù)RD描述識別的文檔DO的結(jié)構(gòu)。為此,由接收音頻信號AS開始,利用第一分析階段7分析文檔DO的結(jié)構(gòu)并確定存在兩個上述的表格域名。第一分析數(shù)據(jù)AD1表示該分析結(jié)果,其是通過產(chǎn)生構(gòu)造的關(guān)系數(shù)據(jù)SRD利用結(jié)構(gòu)描述裝置9以關(guān)系數(shù)據(jù)RD描述的,并且在轉(zhuǎn)錄裝置2的情況下被用來丟棄表示口語字“作者”的信號部分。而且,對于轉(zhuǎn)錄選擇第四上下文,其中只有一些已知姓名供以選擇。這促進(jìn)并提高了圖2所示的文本時(shí)間標(biāo)記t1到t4之間包含的字的轉(zhuǎn)錄。日期轉(zhuǎn)錄類似地進(jìn)行;這是利用幾個信號部分SP來表示的,使用第五上下文。這里,在時(shí)間標(biāo)記t5和t6之間出現(xiàn)的信號部分SP被集合在一起,因?yàn)樵谧R別到表示日期的結(jié)構(gòu)元素時(shí),轉(zhuǎn)錄裝置2應(yīng)用預(yù)定的日期格式。
      在口述表格域的條目之后,商人可以定義用于隨后文本的任何結(jié)構(gòu)。為了考慮這一點(diǎn),根據(jù)該方法,關(guān)于要產(chǎn)生的文檔DO的結(jié)構(gòu)分析所識別的文本部分TP,也就是文本數(shù)據(jù)TXD。因此例如商人口述了下列短語“報(bào)告標(biāo)題商業(yè)計(jì)劃報(bào)告(Report heading Business PlanReport)”。利用第二分析階段8,使用所識別的文本部分TP接著識別到這是涉及文檔DO的主標(biāo)題的結(jié)構(gòu)元素。
      因此,在時(shí)間標(biāo)記t7、t8和t9、t10和t11、t12之間識別的文本部分TP被分配了結(jié)構(gòu)元素“報(bào)告標(biāo)題”,如圖3所示,邏輯分組的關(guān)系數(shù)據(jù)RD作為構(gòu)造的關(guān)系數(shù)據(jù)SRD產(chǎn)生。
      在基于字“報(bào)告標(biāo)題”識別了該結(jié)構(gòu)元素之后,基于所識別的結(jié)構(gòu)元素,對于轉(zhuǎn)錄裝置2,配置轉(zhuǎn)錄裝置2以使用第二上下文,其包括每天的商業(yè)上下文中標(biāo)題的最普通表達(dá)。
      商人繼續(xù)口述“章節(jié)標(biāo)題介紹(chapter heading introduction)”,這同樣導(dǎo)致另一個結(jié)構(gòu)元素,即結(jié)構(gòu)元素“章節(jié)標(biāo)題(chapterheading)”被識別。在這種情況下,選擇第二上下文,然而其與涉及主標(biāo)題的上下文相比,具有更寬的詞法作用域。而且,與時(shí)間標(biāo)記t13和t14之間的信號部分SP對應(yīng)的識別的文本部分TP由結(jié)構(gòu)元素“章節(jié)標(biāo)題”標(biāo)記在關(guān)系數(shù)據(jù)存儲介質(zhì)9中。
      因?yàn)樵诮酉聛淼目谑龆陶Z中沒有出現(xiàn)其他口述的構(gòu)造指令,該指令由時(shí)間標(biāo)記t15到t44之間的信號部分SP表示,選擇包含最大詞典的上下文用于轉(zhuǎn)錄,并且這些信號部分SP的關(guān)系數(shù)據(jù)RD被分配了結(jié)構(gòu)元素“文本(text)”。
      之后,再次基于口述的文本識別結(jié)構(gòu)元素“章節(jié)標(biāo)題”,并且與時(shí)間標(biāo)記t45和t46之間的信號部分對應(yīng)的文本部分TP被邏輯上分配給該結(jié)構(gòu)元素。
      由于缺乏任何可識別的結(jié)構(gòu)元素,在時(shí)間標(biāo)記t47到t78的范圍內(nèi)要說的下一個句子被分配了結(jié)構(gòu)元素“文本”,其中再次將具有最大詞典的第三上下文應(yīng)用于轉(zhuǎn)錄。
      之后,商人將既有圖片又有文本的對象OO插入到文檔DO中;然而沒有音頻信號AS與該文本相對應(yīng),因?yàn)樗峭ㄟ^原文輸入產(chǎn)生的。在當(dāng)前情況下利用觸摸輸入裝置18,即連接于第二輸入IN2的鍵盤以及字處理介質(zhì)4實(shí)現(xiàn)插入對象OO。然而要提到的是,插入對象OO可以通過利用轉(zhuǎn)錄裝置2轉(zhuǎn)錄的口述命令來產(chǎn)生,并且識別為命令以及由設(shè)備1中的其他裝置(這里未示出)執(zhí)行。因此,在當(dāng)前情況下利用第二分析階段8識別插入對象OD[sic],并且在關(guān)系數(shù)據(jù)存儲介質(zhì)9中記錄該對象存在于時(shí)間標(biāo)記t78和t79之間。
      位于時(shí)間標(biāo)記t79和t100之間的下一個口述文本最初被分配給結(jié)構(gòu)元素“文本”。然而,在使用第三上下文的轉(zhuǎn)錄中,在時(shí)間標(biāo)記t93和t100之間出現(xiàn)錯誤,該錯誤由商人利用輸入裝置18校正。為此,刪除時(shí)間標(biāo)記t93和t100之間的文本部分TP,并且加入替換刪除的文本部分TP的新文本部分TP’并設(shè)置在時(shí)間標(biāo)記t101之前。借助于第二分析階段8在文檔DO中記錄或者識別該變化,并且利用結(jié)構(gòu)元素“跳過的文本(text to skip)”來標(biāo)記原來放在時(shí)間標(biāo)記t93和t100之間前面的文本部分TP,這樣在有聲再現(xiàn)存儲的音頻數(shù)據(jù)AD的情況下跳過這些文本部分TP。而且,利用結(jié)構(gòu)元素“插入的文本沒有音頻(text insertedno audio)”來標(biāo)記在時(shí)間標(biāo)記t101之前的手動輸入的其他文本部分TP’,該結(jié)構(gòu)元素定義了這樣的事實(shí)這是隨后校正或者修改過的口述文本,并且對于新添加的文本部分TP’沒有相應(yīng)的信號部分SP包含在存儲的音頻數(shù)據(jù)AD中。
      在口述中接著出現(xiàn)的信號部分SP由結(jié)構(gòu)元素“文本”表征在關(guān)系數(shù)據(jù)存儲介質(zhì)9中,因?yàn)闆]有其他結(jié)構(gòu)元素能夠利用結(jié)構(gòu)識別裝置5來識別,因此不能被分配。
      文本口述之后可能地校正口述的文本,根據(jù)該方法,商人啟動再現(xiàn)模式,借助于此能夠?qū)崿F(xiàn)對轉(zhuǎn)錄的音頻信號AS的準(zhǔn)確視聽追蹤,同步于分別由時(shí)間標(biāo)記tn和tm表示的信號部分SP所對應(yīng)的文本部分TP的視覺重點(diǎn),其中同步視聽再現(xiàn)文本部分TP和信號部分SP是利用構(gòu)造的關(guān)系數(shù)據(jù)SRD進(jìn)行的。由此可以實(shí)現(xiàn),例如對于視覺重點(diǎn)文檔OD的非口述元素被跳過或者忽略。
      根據(jù)該方法還可以保證,除了通過轉(zhuǎn)錄音頻信號AS產(chǎn)生的文本部分TP之外產(chǎn)生的其他文本部分TP’是利用能夠由合成裝置也就是語音合成裝置16產(chǎn)生的語音再現(xiàn)的。該方法還保證,如果其他文本部分被插入到通過轉(zhuǎn)錄產(chǎn)生的文本部分TP之間,則必要的話中斷在再現(xiàn)其他文本部分TP’的過程中再現(xiàn)音頻信號AS。
      由此可以實(shí)現(xiàn),根據(jù)文檔DO中校正或者插入的位置,也將它們考慮以正確順序或者以與通過轉(zhuǎn)錄而產(chǎn)生的文本部分TP的正確連接再現(xiàn)。
      在當(dāng)前情況下設(shè)備1是由具有計(jì)算單元和內(nèi)部存儲器、運(yùn)行計(jì)算機(jī)程序產(chǎn)品的計(jì)算機(jī)實(shí)現(xiàn)的,未示于圖1中。計(jì)算機(jī)程序產(chǎn)品存儲于計(jì)算機(jī)可讀數(shù)據(jù)載體或者介質(zhì)上,未示于圖1中,例如DVD或者CD或者非易失性半導(dǎo)體存儲器。計(jì)算機(jī)程序產(chǎn)品也能夠從計(jì)算機(jī)可讀介質(zhì)加載到計(jì)算機(jī)的內(nèi)部存儲器,這樣借助于計(jì)算機(jī),在計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行根據(jù)本發(fā)明用于將信號部分SP轉(zhuǎn)錄為文本部分TP的方法。
      對于這一點(diǎn)要注意的是,設(shè)備1也能夠通過分布于計(jì)算機(jī)網(wǎng)絡(luò)上、作為一個計(jì)算機(jī)系統(tǒng)運(yùn)行的多個計(jì)算機(jī)實(shí)現(xiàn),這樣設(shè)備1的各個功能就能夠例如由各個計(jì)算機(jī)接管。
      要注意的是,即使已經(jīng)以其他方式獲得的其他文本部分TP’位于通過轉(zhuǎn)錄獲得的文本部分TP的開始或者結(jié)尾,都保證同時(shí)再現(xiàn)文本部分TP和其他文本部分TP’。
      要注意的是,構(gòu)造的關(guān)系數(shù)據(jù)SRD也可以包括口述或者手動啟動的命令,由此另一個貢獻(xiàn)在于回顧能夠由文檔再現(xiàn)的信息的形成的能力。
      還要注意的是根據(jù)本發(fā)明的設(shè)備還可以被私人地使用或者用于醫(yī)療目的或者用于安全性管理領(lǐng)域,其中這種舉例并不是決定性的。
      關(guān)于信號部分SP和通過轉(zhuǎn)錄獲得的文本部分TP之間的分配,要注意的是例如口述詞語“今天(Today)”被識別為連貫的(coherent)信號部分SP,而來自幾個文本部分TP的即“2003年11月31日(31stNov.2003)”是通過轉(zhuǎn)錄產(chǎn)生的,這樣在當(dāng)前情況下關(guān)系數(shù)據(jù)RD再現(xiàn)一個單一信號部分SP和三個文本部分TP之間的時(shí)間關(guān)系。對于這一點(diǎn)還要注意的是,信號部分SP和通過轉(zhuǎn)錄獲得的文本部分TP之間的分配也能夠這樣規(guī)定,以便例如由至少三個信號部分SP(即表示字“31”和“十一月(November)”和“2003”的那些信號部分表示的)口述日期“31stNov.2003”集中在一起轉(zhuǎn)錄為一個單一文本部分TP,例如“今天(today)”或者“明天(tomorrow)”或者“昨天(yesterday)”,這樣在當(dāng)前情況下關(guān)系數(shù)據(jù)RD再現(xiàn)了三個信號部分SP和一個文本部分TP之間的時(shí)間關(guān)系。
      權(quán)利要求
      1.一種用于將文檔(DO)的包含信號部分(SP)的音頻信號(AS)轉(zhuǎn)錄為包含文本部分(TP)的文本的方法,該文檔(DO)被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分(TP),該方法具有以下所列出的步驟,即將信號部分(SP)轉(zhuǎn)錄為文本部分(TP),以及產(chǎn)生表示各個至少一個信號部分(SP)和各個通過轉(zhuǎn)錄所獲得的至少一個文本部分(TP)之間的至少一個時(shí)間關(guān)系的關(guān)系數(shù)據(jù)(RD),以及識別文檔(DO)的結(jié)構(gòu),以及以關(guān)系數(shù)據(jù)(RD)描述所識別的文檔(DO)的結(jié)構(gòu)。
      2.如權(quán)利要求1所述的方法,其中識別文檔(DO)的結(jié)構(gòu)通過分析文檔(DO)而進(jìn)行。
      3.如權(quán)利要求1所述的方法,其中識別文檔(DO)的結(jié)構(gòu)通過分析所識別的文本部分(TP)而進(jìn)行。
      4.如權(quán)利要求1所述的方法,其中描述所識別的文檔(DO)的結(jié)構(gòu)通過邏輯分組關(guān)系數(shù)據(jù)(RD)而進(jìn)行。
      5.如權(quán)利要求1所述的方法,其中提供用于轉(zhuǎn)錄文本部分(TP)的轉(zhuǎn)錄裝置(2)是依據(jù)所識別的結(jié)構(gòu)而配置的。
      6.如權(quán)利要求1所述的方法,其中有聲再現(xiàn)音頻信號(AS)的信號部分(SP)是在與具有文本部分(TP)的視覺再現(xiàn)的已轉(zhuǎn)錄的文本部分(TP)的視覺重點(diǎn)相同的時(shí)間進(jìn)行的,并且在此期間將所識別的文檔(DO)的結(jié)構(gòu)納入考慮。
      7.如權(quán)利要求3所述的方法,其中其他文本部分(TP’)是除了通過轉(zhuǎn)錄音頻信號(AS)所獲得的文本部分(TP)之外另外產(chǎn)生的,這些其他文本部分(TP’)位于通過轉(zhuǎn)錄文檔(DO)中的音頻信號(AS)所獲得的文本部分(TP)的鄰近,利用能夠由合成裝置產(chǎn)生的語音進(jìn)行再現(xiàn),以及其中必要的話在再現(xiàn)其他文本部分(TP’)的期間中斷音頻信號(AS)的再現(xiàn)。
      8.一種用于將文檔(DO)的包含信號部分(SP)的音頻信號(AS)轉(zhuǎn)錄為包含文本部分(TP)的文本的設(shè)備(1),該文檔(DO)被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分(TP),具有用于將信號部分(SP)轉(zhuǎn)錄為文本部分(TP)的轉(zhuǎn)錄裝置(2),以及具有設(shè)計(jì)為產(chǎn)生關(guān)系數(shù)據(jù)(RD)的關(guān)系數(shù)據(jù)產(chǎn)生裝置(5),這些關(guān)系數(shù)據(jù)(RD)表示各個至少一個信號部分(SP)和各個通過轉(zhuǎn)錄所獲得的至少一個文本部分(TP)之間的至少一個時(shí)間關(guān)系,以及具有設(shè)計(jì)為識別文檔(DO)結(jié)構(gòu)的結(jié)構(gòu)識別裝置(6),以及具有設(shè)計(jì)為以關(guān)系數(shù)據(jù)(RD)描述所識別的文檔(DO)結(jié)構(gòu)的結(jié)構(gòu)描述裝置(9)。
      9.如權(quán)利要求8所述的設(shè)備(1),其中結(jié)構(gòu)識別裝置(6)是利用設(shè)計(jì)為關(guān)于其結(jié)構(gòu)分析文檔(DO)的第一分析階段(7)來實(shí)現(xiàn)的。
      10.如權(quán)利要求8所述的設(shè)備(1),其中結(jié)構(gòu)識別裝置(6)是利用設(shè)計(jì)為關(guān)于文檔(DO)的結(jié)構(gòu)分析所獲得的文本部分(TP)的第二分析階段(8)來實(shí)現(xiàn)的。
      11.如權(quán)利要求8所述的設(shè)備(1),其中結(jié)構(gòu)描述裝置(9)設(shè)計(jì)為邏輯分組關(guān)系數(shù)據(jù)(RD)。
      12.如權(quán)利要求8所述的設(shè)備(1),其中轉(zhuǎn)錄裝置(2)能夠依據(jù)所識別的結(jié)構(gòu)而配置。
      13.如權(quán)利要求8所述的設(shè)備(1),其中提供再現(xiàn)控制裝置(13),設(shè)計(jì)為鑒于所識別的文檔(DO)的結(jié)構(gòu)在與在文本部分(TP)的視覺再現(xiàn)情況下所轉(zhuǎn)錄的文本部分(TP)的視覺重點(diǎn)相同的時(shí)間實(shí)現(xiàn)音頻信號(AS)的信號部分(SP)的有聲再現(xiàn)。
      14.如權(quán)利要求13所述的設(shè)備(1),其中提供設(shè)計(jì)用于將文本部分(TP,TP’)合成為語音的語音合成裝置(16),并且其中利用語音合成裝置(16),再現(xiàn)控制裝置(13)設(shè)計(jì)為實(shí)現(xiàn)對除了通過轉(zhuǎn)錄音頻信號所獲得的文本部分(TP)之外另外產(chǎn)生的其他文本部分(TP’)進(jìn)行有聲再現(xiàn),這些其他文本部分(TP’)位于通過轉(zhuǎn)錄文檔(DO)中的音頻信號(AS)所獲得的文本部分(TP)的鄰近,其中必要的話在再現(xiàn)其他文本部分(TP’)的期間中斷音頻信號(AS)的再現(xiàn)。
      15.一種適于轉(zhuǎn)錄音頻信號(AS)的計(jì)算機(jī)程序產(chǎn)品,其能夠直接加載到計(jì)算機(jī)的存儲器內(nèi)并包括軟件代碼部分,其中利用計(jì)算機(jī)在計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)能夠執(zhí)行如權(quán)利要求1所述的方法。
      16.如權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品,其中計(jì)算機(jī)程序產(chǎn)品存儲于計(jì)算機(jī)可讀介質(zhì)上。
      17.一種具有計(jì)算單元和內(nèi)部存儲器的計(jì)算機(jī),其運(yùn)行如權(quán)利要求15所述的計(jì)算機(jī)程序產(chǎn)品。
      全文摘要
      在用于將文檔(DO)的包含信號部分(SP)的音頻信號(AS)轉(zhuǎn)錄為包含文本部分(TP)的文本的方法,該文檔(DO)被預(yù)計(jì)用于信息的再現(xiàn),該信息至少部分對應(yīng)于通過轉(zhuǎn)錄所獲得的文本部分(TP),可以預(yù)計(jì)的是信號部分(SP)被轉(zhuǎn)錄為文本部分(TP),并產(chǎn)生表示各個至少一個信號部分(SP)和各個通過轉(zhuǎn)錄所獲得的至少一個文本部分(TP)之間的至少一個時(shí)間關(guān)系的關(guān)系數(shù)據(jù)(RD),以及識別文檔(DO)的結(jié)構(gòu),以及以關(guān)系數(shù)據(jù)(RD)描述所識別的文檔(DO)的結(jié)構(gòu)。
      文檔編號G06F17/21GK1886726SQ200480035051
      公開日2006年12月27日 申請日期2004年11月24日 優(yōu)先權(quán)日2003年11月28日
      發(fā)明者G·格羅鮑爾, M·帕佩, K·弗里姆龐-安沙哈 申請人:皇家飛利浦電子股份有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1