用于從第一自適應(yīng)數(shù)據(jù)處理版本轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本的方法

文檔序號：2830476閱讀：270來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于從第一自適應(yīng)數(shù)據(jù)處理版本轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本的方法
技術(shù)領(lǐng)域：
本發(fā)明總體涉及用于從數(shù)據(jù)處理器上的第一自適應(yīng)數(shù)據(jù)處理版本轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本的方法和系統(tǒng)，其中，所述第一自適應(yīng)數(shù)據(jù)處理版本采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù)調(diào)整的第一數(shù)據(jù)模型，所述第二自適應(yīng)數(shù)據(jù)處理版本采用至少一個受到連續(xù)調(diào)整的第二數(shù)據(jù)模型。此外，本發(fā)明涉及一種計算機程序產(chǎn)品，可以采用所述計算機程序產(chǎn)品執(zhí) 行這樣的從所述第一數(shù)據(jù)處理版本轉(zhuǎn)換至第二數(shù)據(jù)處理版本的方法。
背景技術(shù)：
本領(lǐng)域，尤其是字處理領(lǐng)域的一個己知的問題是，在從舊的(第一)處理軟件版本轉(zhuǎn)換到新的(第二)處理軟件版本時保持前向兼容性和后向兼容性。已知，與之相聯(lián)系的一種做法是，在采用可能部分不兼容的不同軟件
版本時，采用特定的識別位來保持?jǐn)?shù)據(jù)文件的完整性，例如，參考us
5983242A。而且，還已知，可以在數(shù)據(jù)文件中包含"水印"，以指示特定文
件是基于前一應(yīng)用程序版本的還是基于更新的應(yīng)用程序版本的；例如，參考US 6704432B。但是，這些已知技術(shù)涉及，當(dāng)諸如個人計算機之類的計算裝置的系統(tǒng)中存在不同的應(yīng)用軟件版本時，如何處理這種和同樣的數(shù)據(jù)的問題。
但是，當(dāng)在通過運行程序來處理大量的數(shù)據(jù)時采用了特定的自適應(yīng)數(shù) 據(jù)(adaptive data)模型的情況下，將基于校正后的結(jié)果對所述數(shù)據(jù)模型進行連續(xù)地"訓(xùn)練"，BP，調(diào)整(adapt)，這時，采用新的程序版本替代舊的程序版本將是一個嚴(yán)肅得多的問題，例如，在自動語音識別以及語音文件到文本文件的轉(zhuǎn)換領(lǐng)域內(nèi)就是這種情況。在基于語音識別輸入數(shù)據(jù)將語音數(shù)據(jù)轉(zhuǎn)換為文本文件時，已知將鑒于這些語音數(shù)據(jù)中的一些種類的數(shù)據(jù)是用戶相關(guān)的而采用特定的自適應(yīng)數(shù)據(jù)模型。具體而言，通常采用含有針對各個用戶的語音特征的聲學(xué)參考數(shù)據(jù)模型；此外，例如，可以采用語言數(shù)據(jù)模型來考慮取決于特定用戶的單詞變換的具體概率，因為作者可能經(jīng)常采用給定的單詞Y作為緊隨給定單詞X的詞；之后，數(shù)據(jù)模型可以以含有可識別的單詞的辭典為基礎(chǔ)，其中，所述辭典包括特定用戶如何發(fā)音的信息；并且，還有可能采用語法數(shù)據(jù)模型，其中，所述語法數(shù)據(jù)模型包含了涉及數(shù)字語法、日期語法等的數(shù)據(jù)。
在數(shù)據(jù)處理過程中，也就是說，在自動語音識別，以及將語音數(shù)據(jù)自動轉(zhuǎn)換為文本文件的過程中，將通過反饋環(huán)路對這些數(shù)據(jù)中的一些數(shù)據(jù)進行連續(xù)調(diào)整，通過這種連續(xù)的調(diào)整或訓(xùn)練，將顯著提高識別準(zhǔn)確度。例如，
通過這一基于所述處理結(jié)果的反饋，能夠?qū)⑿略~添加到辭典數(shù)據(jù)模型內(nèi)；可以對語言數(shù)據(jù)模型進行更新，從而使其越來越好地表現(xiàn)用戶的說話風(fēng)格；還能夠釆用新的語法表達(dá)更新語法；并且將對聲學(xué)參考數(shù)據(jù)模型中的語音進行更新，使之與用戶的具體發(fā)音更加相象。在而后通過聽語音文件，并閱讀與之相關(guān)的轉(zhuǎn)換后的文本文件而對經(jīng)過自動轉(zhuǎn)換的文件加以校正時，通過反饋能夠使所有的這些與數(shù)據(jù)模型相關(guān)的自適應(yīng)工作成為可能。
在其他數(shù)據(jù)處理系統(tǒng)中可能會遇到類似的情況，在所述系統(tǒng)中，將基于數(shù)據(jù)模型的采用來處理大量的數(shù)據(jù)，其中，將基于數(shù)據(jù)處理結(jié)果通過反饋環(huán)路對所述數(shù)據(jù)模型進行連續(xù)的自適應(yīng)調(diào)整，其中，所述系統(tǒng)一直不允許對新的模型進行預(yù)先訓(xùn)練，或者以前一直允許，但現(xiàn)在不允許對新的模型進行預(yù)先訓(xùn)練，例如，所述系統(tǒng)可以是帶有基于與算法相關(guān)的圖像數(shù)據(jù) 模型的數(shù)據(jù)處理的系統(tǒng)，例如，就衛(wèi)星圖像傳輸而言，就地圖創(chuàng)建而言等；基因分析領(lǐng)域的系統(tǒng)；相關(guān)語音數(shù)據(jù)領(lǐng)域的系統(tǒng)；或者將要基于自適應(yīng)數(shù) 據(jù)模型傳輸(image)大量圖像數(shù)據(jù)的任何其他領(lǐng)域內(nèi)的系統(tǒng)。
在這樣的自適應(yīng)數(shù)據(jù)模型系統(tǒng)中，將時常引入新的數(shù)據(jù)處理軟件版本，所述新的版本的優(yōu)點在于，相對于所采用的算法，例如用于執(zhí)行語音識別的算法有所改進，從而能夠得到更高的性能。但是，這些算法改變往往隱藏著下層數(shù)據(jù)模型的變化，乃至?xí)霈F(xiàn)全新的初始數(shù)據(jù)模型。原則上，只有在很少的情況下，能夠只是簡單地將數(shù)據(jù)模型轉(zhuǎn)換為適于新的軟件版本使用的新的數(shù)據(jù)模型。但是，在很多情況下，數(shù)據(jù)模型根本就是不可轉(zhuǎn)換的，或者預(yù)先調(diào)整數(shù)據(jù)模型根本就是不可行的，因為數(shù)據(jù)校正將耗費過多的勞動。也就是說，即使從原則上能夠?qū)?shù)據(jù)模型進行預(yù)先調(diào)整，這樣的預(yù)先調(diào)整也往往相當(dāng)耗時，并且需要復(fù)雜的升級程序。具體而言，就自動語音識別以及向文本文件的自動轉(zhuǎn)換而言，通常，采用大量的語音材料對
數(shù)據(jù)模型進行優(yōu)化，在出于遷移(migration)目的而實施新的語音識別軟件版本時，通常不可能保存這樣的語音材料。因此，在實施新的語音識別版本(或者通常為新的數(shù)據(jù)處理版本)的情況下，當(dāng)不能保持以前的得到了連續(xù)調(diào)整的數(shù)據(jù)模型時，以前得到的信息即在以前的數(shù)據(jù)處理當(dāng)中經(jīng)過調(diào)整的數(shù)據(jù)模型將丟失，因為必須以和新的(第二)數(shù)據(jù)處理軟件版本相關(guān)的初始數(shù)據(jù)模型作為開端；這意味著，這樣的系統(tǒng)的用戶將寧愿還是采用舊的 (第一)軟件版本，因為在這一軟件版本中，已經(jīng)基于連續(xù)調(diào)整的數(shù)據(jù)模型實現(xiàn)了相當(dāng)好的識別性能。如果現(xiàn)在轉(zhuǎn)換到新的軟件版本，那么在過渡時間內(nèi)這一質(zhì)量將喪失，因為已經(jīng)無法再使用經(jīng)過了連續(xù)調(diào)整的舊的數(shù)據(jù)模型，而在采用新的軟件版本中的新的改進算法時，又必須對新的初始數(shù)據(jù) 模型進行調(diào)整，直到將足夠的數(shù)據(jù)訓(xùn)練到新的數(shù)據(jù)模型中，從而至少達(dá)到足夠的性能為止。出于這一原因，很多用戶傾向于堅持采用舊的具有經(jīng)調(diào) 整的數(shù)據(jù)模型的軟件版本，因而新的軟件版本的推行和使用受到了阻滯，因為客戶能夠預(yù)期到識別性能的不足，但是拒絕轉(zhuǎn)換到新的軟件版本(盡管，從更長的時間周期上來看，由于這一新的版本采用了改進的算法，從而能夠?qū)崿F(xiàn)更佳的語音識別精確度等)。
從新的軟件版本的前景上來看，可能在原則上可以對數(shù)據(jù)模型進行調(diào) 整，但是應(yīng)當(dāng)記住，例如語音識別系統(tǒng)往往具有15000個連接用戶，而每一用戶都具有自己的數(shù)據(jù)模型。要想實施這樣的初始調(diào)整，從而使數(shù)據(jù)模型適于新的軟件版本，意味著(例如)要對每個用戶實施高達(dá)20MB的調(diào)整，而這又意味著大約300GB的調(diào)整數(shù)據(jù)總量，因而可能需要300GB的對應(yīng)磁盤空間。
因此，長期以來一直需要一種從舊的數(shù)據(jù)處理版本轉(zhuǎn)換到新的數(shù)據(jù)處理版本，而又不會因必須回退到初始數(shù)據(jù)模型而降低數(shù)據(jù)處理結(jié)果的質(zhì)量，相反其將恰如其分地轉(zhuǎn)換到新的軟件版本，從而獲得新版本的新改進算法優(yōu)勢的解決方案。

發(fā)明內(nèi)容
因而，本發(fā)明的一個目的在于提供用于從舊的或第一數(shù)據(jù)處理版本轉(zhuǎn) 換到新的或第二數(shù)據(jù)處理版本的方法和系統(tǒng)，其中，能夠在至少基本上不喪失第一版本中已經(jīng)獲得的一定質(zhì)量的結(jié)果的情況下，能夠從第一版本轉(zhuǎn) 換到第二版本。
此外，本發(fā)明的一個目的在于提供一種含有計算機程序的計算機程序產(chǎn)品，在將所述計算機程序加載到數(shù)據(jù)處理器內(nèi)時，所述計算機程序用于執(zhí)行根據(jù)本發(fā)明的用于在不降低性能的情況下從第一軟件版本轉(zhuǎn)換至第二軟件版本的方法。
根據(jù)本發(fā)明的第一方面，提供了一種用于從數(shù)據(jù)處理裝置上的第一自適應(yīng)數(shù)據(jù)處理版本轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本的方法，其中，所述第一自適應(yīng)數(shù)據(jù)處理版本采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù)調(diào)整的第一數(shù)據(jù)模型，所述第二自適應(yīng)數(shù)據(jù)處理版本也采用至少一個受到連續(xù)調(diào)整的第二數(shù)據(jù)模型，所述方法的特征在于，在第一階段內(nèi)，與所述第一數(shù)據(jù) 處理版本并行采用第二自適應(yīng)數(shù)據(jù)處理版本，從而連續(xù)調(diào)整與所述第一版本相關(guān)的至少一個第一數(shù)據(jù)模型以及與所述第二版本相關(guān)的至少一個第二數(shù)據(jù)模型，所述方法的特征還在于檢驗利用所述第二版本的數(shù)據(jù)處理的性能是否符合質(zhì)量標(biāo)準(zhǔn)，而后，在第二階段內(nèi)，一旦滿足了所述質(zhì)量標(biāo)準(zhǔn)，就輸出利用所述第二版本的數(shù)據(jù)處理結(jié)果，以供使用。
根據(jù)本發(fā)明的第二方面，本發(fā)明提供了一種包括數(shù)據(jù)處理器的系統(tǒng)，所述數(shù)據(jù)處理器具有第一數(shù)據(jù)處理版本，所述第一數(shù)據(jù)版本采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù)調(diào)整的第一數(shù)據(jù)模型來處理數(shù)據(jù)，所述系統(tǒng)的特征在于，所述數(shù)據(jù)處理器與所述第一數(shù)據(jù)處理版本并行運行第二數(shù)據(jù)處理版本，所述第二數(shù)據(jù)處理版本采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù) 調(diào)整的第二數(shù)據(jù)模型，還將所述數(shù)據(jù)處理器配置為，一旦通過對相應(yīng)的至少一個數(shù)據(jù)模型的連續(xù)調(diào)整使第二數(shù)據(jù)處理版本的結(jié)果具有足夠的質(zhì)量，那么就從輸出所述第一數(shù)據(jù)處理版本的數(shù)據(jù)處理結(jié)果轉(zhuǎn)換至第二數(shù)據(jù)處理版本的結(jié)果。
根據(jù)本發(fā)明的另一方面，提供了一種計算機程序產(chǎn)品，其具有記錄于其上的適于執(zhí)行根據(jù)本發(fā)明的轉(zhuǎn)換方法的計算機程序。具體而言，記錄于所述計算機程序產(chǎn)品上的計算機程序額外包括還適于執(zhí)行所述第二自適應(yīng) 數(shù)據(jù)處理版本的軟件。
本發(fā)明基于這樣的想法，將新的(即第二數(shù)據(jù)處理版本)配置到后臺 ("陰影"中)，從而對處于后臺的與新的版本相關(guān)的數(shù)據(jù)模型或新的數(shù)據(jù) 模型進行當(dāng)前調(diào)整，直到所述經(jīng)調(diào)整的數(shù)據(jù)模型(或多個數(shù)據(jù)模型)的性能等于或優(yōu)于與第一數(shù)據(jù)處理版本相關(guān)的以前的數(shù)據(jù)模型("繼承"的模型) 的性能為止。在第二版本能夠得到可比擬的或者更好的結(jié)果之前，向用戶提供基于以前的數(shù)據(jù)模型并且通過第一數(shù)據(jù)處理版本獲得的結(jié)果。能夠以完全自動的方式完成從第一版本和第一數(shù)據(jù)模型到第二版本和第二數(shù)據(jù)模型的轉(zhuǎn)換或切換，為此可以假設(shè)，采用給定的訓(xùn)練到與第二自適應(yīng)數(shù)據(jù)處理版本相關(guān)的數(shù)據(jù)模型內(nèi)的數(shù)據(jù)量作為預(yù)定標(biāo)準(zhǔn)，將經(jīng)調(diào)整的數(shù)據(jù)量與所述給定的數(shù)據(jù)量進行比較，在達(dá)到所述給定的數(shù)據(jù)量時，自動轉(zhuǎn)換至使用利用第二版本的數(shù)據(jù)處理的結(jié)果。這一解決方案是非常方便的，并且能夠使計算機節(jié)約時間的解決方案。但是，也可以基于直接的性能比較在兩個版本之間轉(zhuǎn)換，就此而言，一種尤為有利的方式是，在性能方面，使利用第二版本的數(shù)據(jù)處理的結(jié)果與利用第一版本的數(shù)據(jù)處理的結(jié)果進行自動比較，在所述第二版本的結(jié)果等于或優(yōu)于第一版本的結(jié)果時，自動轉(zhuǎn)換至使用第二版本的結(jié)果。
另一方面，還可以提供從第一版本到第二版本的強制轉(zhuǎn)換，就此而言，一種有用的做法是，如果相關(guān)于第一版本的結(jié)果對第二數(shù)據(jù)處理版本的性能進行了評估，并且在性能足夠的情況下，就強制轉(zhuǎn)換至使用第二版本的結(jié)果。
因而，本發(fā)明的系統(tǒng)的優(yōu)選實施例的特征在于，采用給定的訓(xùn)練到與第二自適應(yīng)數(shù)據(jù)處理版本相關(guān)的數(shù)據(jù)模型中的數(shù)據(jù)量作為預(yù)定質(zhì)量標(biāo)準(zhǔn)，采取手段將經(jīng)調(diào)整的數(shù)據(jù)量與所述給定的數(shù)據(jù)量進行比較，在達(dá)到所述給
定的數(shù)據(jù)量時，自動轉(zhuǎn)換至使用利用第二版本的數(shù)據(jù)處理的結(jié)果；或者采取手段對利用第二版本的數(shù)據(jù)處理的結(jié)果和利用第一版本的數(shù)據(jù)處理的結(jié) 果進行比較，在所述第二版本的結(jié)果優(yōu)于所述第一版本的結(jié)果時，自動轉(zhuǎn) 換至使用所述第二版本的結(jié)果。
本發(fā)明在與自動語音識別和從語音數(shù)據(jù)向?qū)⑹艿叫Ｕ奈谋疚募淖詣愚D(zhuǎn)換相關(guān)時尤為有用。就此而言，尤為有利的做法是，針對各個用戶連續(xù)調(diào)整諸如語音數(shù)據(jù)模型和語言數(shù)據(jù)模型的特定聲學(xué)參考數(shù)據(jù)模型；不過也可以為語言數(shù)據(jù)模型以及語法和辭典數(shù)據(jù)模型應(yīng)用連續(xù)調(diào)整，這本身是已知的。有利地，如上所述，還可以將本發(fā)明用于采用數(shù)據(jù)模型處理大量數(shù)據(jù)的其他數(shù)據(jù)處理，其中將通過基于數(shù)據(jù)處理結(jié)果的反饋對所述數(shù)據(jù)模型進行連續(xù)調(diào)整。

通過結(jié)合并參考附圖閱讀下文給出的對優(yōu)選實施例的詳細(xì)說明，本發(fā) 明的上述和其他方面、目的、特征和優(yōu)點將變得顯而易見。
圖1表示一種數(shù)據(jù)處理系統(tǒng)的示意性布置圖，具體而言，表示一種語音識別和自適應(yīng)系統(tǒng)的示意性布置圖，在所述系統(tǒng)中，將語音數(shù)據(jù)自動轉(zhuǎn) 換為文本文件，之后基于所接收到的聲音文件對所述文本文件進行校正，
并且其中采用了對應(yīng)的反饋來調(diào)整所存儲的數(shù)據(jù)模型；
圖2示意性地示出了第一和第二數(shù)據(jù)處理軟件版本的相互并行使用，其中，對相關(guān)數(shù)據(jù)模型進行并行調(diào)整，并且采用第一版本的數(shù)據(jù)處理的結(jié) 果，而第二版本將在后臺與第一版本并行運行，從而處于恰當(dāng)?shù)哪軌蛞宰?夠的規(guī)模調(diào)整與第二版本相關(guān)的數(shù)據(jù)模型的位置上；
圖3示出了說明根據(jù)本發(fā)明的方法的流程圖，所述方法涉及與第一版本并行運行第二數(shù)據(jù)處理版本，由此將采用第一版本的結(jié)果，直到第二版本的結(jié)果足夠為止；以及
圖4示意性地示出了用于與第一版本并行運行第二數(shù)據(jù)處理軟件版本、并且對于從第一版本向第二版本的轉(zhuǎn)換而言一旦采用所述第二版本就至少能夠獲得與第一版本相當(dāng)?shù)男阅艿南到y(tǒng)。
具體實施例方式
現(xiàn)在將參考示出了本發(fā)明的優(yōu)選實施例的附圖來詳細(xì)說明本發(fā)明，在附圖中，采用類似的附圖標(biāo)記表示類似的元件。
在圖1中，示出了數(shù)據(jù)處理系統(tǒng)1的示意性表示；具體而言，作為這樣的系統(tǒng)的例子，示出了系統(tǒng)l，其用于自動識別所記錄的聲音數(shù)據(jù)，并且將聲音文件轉(zhuǎn)換為文本文件，而后基于所述聲音文件對所述文本文件進行
人工校正。這一系統(tǒng)1包括多個記錄站2. 1. .. 2. i，這些記錄站統(tǒng)稱為附圖標(biāo)記2，例如，每一記錄站包括個人計算機(PC)，其具有音頻裝置(麥克風(fēng)、揚聲器；未示出)，以記錄并播放語音數(shù)據(jù)，在記錄之后，所述語音數(shù)據(jù)被作為聲音文件(語音文件)輸出至網(wǎng)絡(luò)3，例如，局域網(wǎng)/廣域網(wǎng)(LAN/WAN) 網(wǎng)絡(luò)3。此外，將識別/調(diào)整站4(具體而言，將4. 1...4.k)連接至這一網(wǎng)絡(luò) 3，在識別/調(diào)整站內(nèi)，對由記錄站2輸出并存儲在數(shù)據(jù)庫5內(nèi)的聲音文件進行自動識別，并轉(zhuǎn)換為文本文件，這是本領(lǐng)域公知的。而且，這些識別/ 調(diào)整站4可以包括PC。數(shù)據(jù)庫或文件服務(wù)器5含有聲音文件，此外還含有
識別后的文本文件以及校正后的文本文件。就自動獲得的文本文件的校正而言，提供了多個校正站6(仍然包括(例如)PC)，并將其連接至網(wǎng)絡(luò)3;通過采用這些校正站6，或具體而言6.1...6.1，將對自動獲得并存儲在數(shù)據(jù) 庫5內(nèi)的文本文件進行人工校正，這些人在執(zhí)行校正任務(wù)時，要聽對應(yīng)的聲音文件。之后，采用所提供的校正作為針對另一數(shù)據(jù)庫7中存儲的數(shù)據(jù) 模型的反饋，所述數(shù)據(jù)庫7含有數(shù)據(jù)庫元信息，尤其含有相應(yīng)的用戶特定數(shù)據(jù)模型，具體而言，所述數(shù)據(jù)模型可以是包括與用戶特定語音相關(guān)的數(shù) 據(jù)的聲學(xué)參考模型；具有用戶特異性，并且涉及針對各個用戶的單詞變換
的可能性的語言數(shù)據(jù)模型；語法數(shù)據(jù)模型；以及含有可識別單詞的辭典數(shù) 據(jù)模型，其包括各個用戶如何對所述可識別單詞發(fā)音的信息。將所有的這些數(shù)據(jù)模型都存儲在信息庫7內(nèi)。在下文中，將涉及這樣的數(shù)據(jù)模型，在稱其為"至少一個"數(shù)據(jù)模型或者"一"數(shù)據(jù)模型時，顯然實際上存在大
量這樣的數(shù)據(jù)模型，即對于大量的用戶中的每者都存在幾個模型。
就到目前為止已經(jīng)描述過的語音識別系統(tǒng)1而言，仍然是本領(lǐng)域已知的一種系統(tǒng)。
對于自動語音識別和轉(zhuǎn)換而言，識別調(diào)整站4采用(第一)軟件版本 (VI)，比較圖2，其采用了特定的V1算法以及存儲在數(shù)據(jù)庫7內(nèi)的相關(guān)V1
數(shù)據(jù)模型。如上文所述，在基于校正后的文本文件的反饋的文本文件的自動語音識別、轉(zhuǎn)換和校正過程中將對這些V1數(shù)據(jù)模型(dmi)進行連續(xù)調(diào)整。
該反饋可以包括涉及語言模型并且以改進的方式反映了各個用戶的說話風(fēng) 格的數(shù)據(jù)、適于更好地表現(xiàn)用戶發(fā)音的針對聲學(xué)參考數(shù)據(jù)模型的更新語音體系、用于更新語法數(shù)據(jù)模型的新的語法表達(dá)以及添加至辭典數(shù)據(jù)模型的新詞。由于這種對數(shù)據(jù)模型做出的連續(xù)調(diào)整，將提高識別準(zhǔn)確度。
然而，時常要實施新的數(shù)據(jù)處理版本(軟件版本)，在圖2中為(V2)，所述新的版本具有相對于所采用的、這里用來執(zhí)行自動語音識別和轉(zhuǎn)換的算法做出的改進。由于將要引入(例如)新的參數(shù)或變量的算法變化，還將采用新的下層數(shù)據(jù)模型(Dmi)，并且在大多數(shù)情況下，不可能將先前版本V1 采用的舊的數(shù)據(jù)模型Dmi轉(zhuǎn)換成新的第二版本V2采用的新的數(shù)據(jù)模型Dmi 。即使這種與VI模型相關(guān)的基于過去收集的數(shù)據(jù)的轉(zhuǎn)換或預(yù)先調(diào)整是可能的，這種轉(zhuǎn)換或預(yù)先調(diào)整也是相當(dāng)消耗時間和存儲空間的，并且非常復(fù)雜，尤其是在系統(tǒng)1中可能連接了 (例如)15000個用戶(對應(yīng)于15000個記錄站 2)的情況下。因此，盡管采用相關(guān)的V2數(shù)據(jù)模型的基于V2版本的識別性能將允許獲得比第一軟件版本VI更高的識別準(zhǔn)確度，但是用戶仍然傾向于堅持采用舊的軟件版本VI,因為通過過去的連續(xù)數(shù)據(jù)模型調(diào)整，此時的語音識別性能優(yōu)于軟件版本V2的性能，因為此時的軟件版本V2所基于的相關(guān)初始數(shù)據(jù)模型是沒有經(jīng)訓(xùn)練的數(shù)據(jù)的數(shù)據(jù)模型。如果以后新的(第二)V2 軟件版本將含有VI算法，并且將通過應(yīng)用所述VI算法而采用所述VI數(shù)據(jù) 模型，那么情況一樣，將無法從具有改進的V2算法的新的軟件版本V2中獲得任何益處。因此，實際上，到目前為止，不存在任何其他的能夠克服在一開始基于初始的V2數(shù)據(jù)模型的V2系統(tǒng)性能較差這一缺點而轉(zhuǎn)換至新的V2系統(tǒng)版本的可能性。
在圖2中，示意性地示出了如何基于VI數(shù)據(jù)模型dml. . dmi. .. dmn(其中，i=l...n)，通過第一處理版本V1執(zhí)行語音識別和轉(zhuǎn)換，其中，采用反饋環(huán)8對所述數(shù)據(jù)模型dmi連續(xù)調(diào)整，以提高識別性能。在9處輸出所述轉(zhuǎn)換結(jié)果(文本文件)。之后，根據(jù)本發(fā)明，采用對應(yīng)(初始)的數(shù)據(jù)模型 DM1... DMi... DMn與第一版本VI并行實現(xiàn)第二或新的軟件版本V2。通過采用反饋環(huán)8'，在與所述VI處理并行執(zhí)行采用所述V2版本的語音識別轉(zhuǎn)換時，也能夠?qū)@些V2數(shù)據(jù)模型DMi進行連續(xù)調(diào)整。但是，只有在數(shù)據(jù)模型 DMi得到了足夠調(diào)整之后開始，才從9'處輸出這一語音識別轉(zhuǎn)換的結(jié)果，因而所輸出的結(jié)果至少等同于采用第一版本V1在輸出9處得到的結(jié)果。
在圖2中，通過模塊10以虛線示意性地示出了通過采用VI數(shù)據(jù)模型dmi的數(shù)據(jù)而對新的V2數(shù)據(jù)模型DMi進行預(yù)先調(diào)整或轉(zhuǎn)換的原理上的可能性，其中的保留條件是，即使有的話，這樣的對數(shù)據(jù)模型的預(yù)先調(diào)整或轉(zhuǎn) 換只有在小規(guī)模上是可能的，這一點如上所述。因此，根據(jù)本發(fā)明執(zhí)行的并行數(shù)據(jù)模型調(diào)整，比較反饋環(huán)8和8'，在過渡時間之后，能夠在不降低識別性能的情況下從版本VI轉(zhuǎn)換至新的版本V2。
在圖3中示出了說明并行實現(xiàn)版本VI和V2，并且根據(jù)V2相關(guān)數(shù)據(jù)模型DM的調(diào)整級別而從第一版本VI轉(zhuǎn)換至第二版本V2的流程圖。為了簡單起見，只分別引用一個相應(yīng)的數(shù)據(jù)模型dm或DM，但是應(yīng)當(dāng)明白，如上所述，數(shù)據(jù)模型的數(shù)量大得多，例如，就自動語音識別轉(zhuǎn)換而言，每個用戶具有四個數(shù)據(jù)模型。
根據(jù)圖3，根據(jù)塊11安裝第一軟件版本VI。此外，根據(jù)塊12，安裝 Vl相關(guān)數(shù)據(jù)模型dro， #1代。
此后，記錄語音文件，比較塊13，而后將基于VI數(shù)據(jù)模型ttl自動識別這一聲音文件，并將其轉(zhuǎn)換為文本文件，之后對自動獲得的文本文件進行校正，并且在對文本文件執(zhí)行的校正的基礎(chǔ)上執(zhí)行對數(shù)據(jù)模型dmftl的調(diào) 整；隨后將所述文本文件傳送至輸出處；通過圖3中的塊14表示這些步驟。這里，應(yīng)當(dāng)指出，在這一例子中是相對于一個特定用戶在與這一用戶相關(guān) 的數(shù)據(jù)模型的基礎(chǔ)上執(zhí)行所述自動識別和轉(zhuǎn)換的，并且是在迄今可得的聲音/經(jīng)識別的/經(jīng)校正的文本三元組(text triple)的基礎(chǔ)上對數(shù)據(jù)模型dm
進行調(diào)整的。但是，如上所述，在所述系統(tǒng)中連接了大量的用戶，對于每一用戶而言，或者對于每一用戶特定的數(shù)據(jù)模型而言，都將包括對應(yīng)的數(shù) 據(jù)處理和調(diào)整。
顯而易見的是，沒有必要在每次自動識別聲音文件并將其轉(zhuǎn)換為文本文件，以及對對應(yīng)的文本文件予以校正時都對數(shù)據(jù)模型進行調(diào)整；取而代之，有可能積累很多這樣的語音/經(jīng)識別的/經(jīng)校正的文本三元組，并僅在獲得了預(yù)定量的調(diào)整數(shù)據(jù)之后對數(shù)據(jù)模型dm進行調(diào)整。
圖3中的塊15涉及現(xiàn)在已經(jīng)經(jīng)過了調(diào)整的數(shù)據(jù)模型(dmtt2代)的存在。
在下文中，將反復(fù)地重復(fù)根據(jù)塊13、 14、 15的步驟，并且可以假定所述過程結(jié)束于受到了良好訓(xùn)練的高代數(shù)據(jù)模型dm。
在這一階段，根據(jù)塊21安裝第二軟件版本V2，并且根據(jù)塊22實施與之相關(guān)的初始數(shù)據(jù)模型DM。之后，與具有更高代的數(shù)據(jù)模型dm的第一軟件版本V1并行運行這一第二軟件版本V2連同其數(shù)據(jù)模型DM。此時，對于特定用戶而言，根據(jù)塊23記錄了另一聲音文件，如上所述，根據(jù)塊14'，仍然采用版本VI以自動的方式再次識別這一語音文件并將其轉(zhuǎn)換為文本文件，并且可能根據(jù)塊15'獲得對版本VI的對應(yīng)數(shù)據(jù)模型dm的更新或調(diào)整。
在執(zhí)行這些步驟的同時，基于第二軟件版本V2和對應(yīng)的數(shù)據(jù)模型DM 對所述聲音文件進行自動識別，并將其轉(zhuǎn)換為文本文件，并且為由此獲得的文本文件提供在根據(jù)塊14'對所述文本文件加以校正時輸入的校正。通過所述的文本文件的校正還將實現(xiàn)對V2數(shù)據(jù)模型DM的調(diào)整，參考圖3中的塊25。但是，同樣在這里，也能夠在如上所述調(diào)整V2數(shù)據(jù)模型DM之前累積若干聲音/經(jīng)識別的/經(jīng)校正的文本三元組。之后，在步驟26中，檢驗更新后的V2數(shù)據(jù)模型是否是有利的，例如，這一點是基于訓(xùn)練到V2數(shù)據(jù)模型中的數(shù)據(jù)量判斷的。如果不存在益處，那么返回塊23，從而繼續(xù)所述的基于版本V1和V2的并行數(shù)據(jù)處理。但是，如果步驟26中的判斷表明現(xiàn)在可以通過采用新的軟件版本V2與現(xiàn)在已得到了足夠訓(xùn)練的數(shù)據(jù)模型DM相結(jié)合而獲得至少適合的結(jié)果(所述數(shù)據(jù)模型DM在前面的處理步驟中得到了連續(xù)調(diào)整)，那么繼續(xù)只采用版本V2進行數(shù)據(jù)處理，參考圖3中的塊27，并停止基于VI數(shù)據(jù)模型采用VI版本進行數(shù)據(jù)處理，參考圖3中的塊27'。現(xiàn)在將基于僅與對應(yīng)的更新的數(shù)據(jù)模型DM相結(jié)合的新的軟件版本V2繼續(xù) 數(shù)據(jù)處理，即，語音和文本文件的接收、識別、轉(zhuǎn)換和校正，參考圖3中步驟23、 24、 25的暗示。此外，顯然現(xiàn)在可以理所當(dāng)然地在系統(tǒng)的輸出(比較圖2中的輸出9')處提供采用版本V2和受到了連續(xù)更新的經(jīng)調(diào)整的V2數(shù) 據(jù)模型獲得的經(jīng)校正的文本文件。
圖4以類似于方框圖的形式示出了本系統(tǒng)，由此示出了系統(tǒng)4-7通過接口模塊31與網(wǎng)絡(luò)3的連接。之后，以示意性的方式示出了兩個分支，所述分支分別是針對軟件版本V1或V2的。根據(jù)模塊32.1和32.2，示出了聲學(xué)文件或語音文件的接收，而后在模塊33. 1和33. 2(仍然比較圖1中的站 4)中以自動識別和轉(zhuǎn)換繼之。分別基于分別存儲在數(shù)據(jù)庫7. 1和7.2中的數(shù)據(jù)模型dm和DM執(zhí)行這一語音文件的自動識別和轉(zhuǎn)換。應(yīng)當(dāng)提及的是，數(shù)據(jù)庫7. 1和7. 2可以是數(shù)據(jù)庫7的部分，如圖1所示。為了易于理解，簡化了圖4中的表示，其中未示出數(shù)據(jù)庫5中對語音文件(聲音文件)的存儲。
在下文中，在相應(yīng)的校正站6 (圖1)中，校正在自動識別和轉(zhuǎn)換模塊33. 1 或33. 2的輸出處獲得的經(jīng)轉(zhuǎn)換的文本文件，參考圖4中的模塊34. 1和34. 2 或者圖1中的站6。這里，應(yīng)當(dāng)指出，通過在具體的校正站6處執(zhí)行的同一校正工作將可以得到根據(jù)圖4所示的模塊34. 1和34. 2的文件校正。這一校正引發(fā)對數(shù)據(jù)庫7. 1中的數(shù)據(jù)模型dm和數(shù)據(jù)庫7. 2中的數(shù)據(jù)模型DM的調(diào)整；此外，在針對新的軟件版本V2的分支中，將計數(shù)器模塊35連接至校正模塊34. 2，從而在將對應(yīng)的更新信息提供給數(shù)據(jù)庫7. 2時對V2數(shù)據(jù)模型DM的經(jīng)訓(xùn)練(更新)的數(shù)據(jù)量進行計數(shù)(具體而言以千字節(jié)為單位)，并且將對應(yīng)的信息提供給判決和控制模塊36。所述判決和控制模塊36包括比較器模塊37，在比較器模塊37中，將所接收的針對數(shù)據(jù)模塊DM的調(diào)整量的數(shù)據(jù)與預(yù)定的并存儲的將要訓(xùn)練的數(shù)據(jù)量進行比較；一旦達(dá)到了這一預(yù)定數(shù)據(jù)量，模塊36就激活轉(zhuǎn)換模塊38，從而自動從V1結(jié)果輸出39. l轉(zhuǎn)換至 V2結(jié)構(gòu)輸出39. 2。在模塊40處提供相應(yīng)的經(jīng)校正的V2文本文件。
作為對從V1結(jié)果到V2結(jié)果的自動轉(zhuǎn)換的替代，可以在自動轉(zhuǎn)換之后，在校正之前比較所得到的相應(yīng)的文本文件，更優(yōu)選地，比較校正自動轉(zhuǎn)換的文本文件所需的校正數(shù)據(jù)量，如圖4中由虛線表示的37'處的比較器所示。另一種可能性是根據(jù)對相應(yīng)的VI和V2結(jié)果的評估而強制激活轉(zhuǎn)換模塊36，如圖4中的處于41處的虛線所示。
到目前為止，已經(jīng)描述了本發(fā)明的優(yōu)選實施例，但是仍然應(yīng)當(dāng)清楚，在本發(fā)明的范圍內(nèi)各種修改都是可能的。具體而言，本發(fā)明還適用于需要采用大量的數(shù)據(jù)的其他數(shù)據(jù)處理領(lǐng)域，尤其還適用于對數(shù)據(jù)模型進行更新，而且在所述領(lǐng)域中，鑒于以前的數(shù)據(jù)模型的數(shù)據(jù)不夠，或者這一預(yù)先訓(xùn)練可能過分耗費時間，或者因為VI數(shù)據(jù)模型根本就無法轉(zhuǎn)換為V2數(shù)據(jù)模型，因而不可能對新的初始數(shù)據(jù)模型進行預(yù)先訓(xùn)練。例如，可以將本發(fā)明應(yīng)用于對諸如接收來自衛(wèi)星的視頻信息的圖像數(shù)據(jù)、大量的聲音數(shù)據(jù)乃至基因序列數(shù)據(jù)進行處理的領(lǐng)域
在與圖1的系統(tǒng)進行比較時，作為備選實施例，還可以安裝獨立單元 42，在該單元中分別安裝并運行第二軟件版本V2，就在上述并行V1/V2操作的過渡吋間內(nèi)涉及基于V2版本的數(shù)據(jù)處理工作這一點而言，這樣能夠緩解識別/調(diào)整站4的負(fù)荷。當(dāng)然，這一修改意味著，在從V1版本轉(zhuǎn)換至V2 版本時，必須在相應(yīng)的識別/調(diào)整站4內(nèi)安裝或下載V2版本，從而能夠處理相應(yīng)的語音文件，其中，將采用版本V2和相關(guān)的數(shù)據(jù)模型DMi將所述語音文件自動轉(zhuǎn)換為文本文件。
應(yīng)當(dāng)注意，上述實施例旨在對本發(fā)明進行舉例說明，而不是對其做出限制，并且本領(lǐng)域技術(shù)人員能夠在不背離權(quán)利要求的范圍的情況下設(shè)計出很多備選的實施例。在權(quán)利要求中，不應(yīng)當(dāng)將任何放置在括號內(nèi)的附圖標(biāo) 記推斷為限制所述權(quán)利要求。"包括"一詞不排除權(quán)利要求中列舉的元件或步驟以外的元件或步驟的存在。元件前的單數(shù)冠詞不排除存在復(fù)數(shù)個這樣的元件?？梢酝ㄟ^包括幾個分立的元件的硬件，以及通過適當(dāng)編程的計算機實現(xiàn)本發(fā)明。在囊括了幾個部件的系統(tǒng)權(quán)利要求中，可以通過同一個計算機可讀軟件或硬件實現(xiàn)這些部件中的幾個。在互不相同的從屬權(quán)利要求中陳述的某些措施不表示不能有利地采用這些措施的組合。
權(quán)利要求
1、一種用于從數(shù)據(jù)處理器上的第一自適應(yīng)數(shù)據(jù)處理版本(V1)轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本(V2)的方法，其中，所述第一自適應(yīng)數(shù)據(jù)處理版本(V1)采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù)調(diào)整的第一數(shù)據(jù)模型(dm)，所述第二自適應(yīng)數(shù)據(jù)處理版本(V2)也采用至少一個受到連續(xù)調(diào)整的第二數(shù)據(jù)模型(DM)，所述方法的特征在于在第一階段內(nèi)，與所述第一數(shù)據(jù)處理版本(V1)并行采用所述第二自適應(yīng)數(shù)據(jù)處理版本(V2)，從而連續(xù)調(diào)整與所述第一版本(V1)相關(guān)的至少一個第一數(shù)據(jù)模型(dm)以及與所述第二版本(V2)相關(guān)的至少第二數(shù)據(jù)模型(DM)，所述方法的特征還在于檢驗利用所述第二版本(V2)的數(shù)據(jù)處理的性能是否符合質(zhì)量標(biāo)準(zhǔn)，而后，在第二階段內(nèi)，一旦滿足了所述質(zhì)量標(biāo)準(zhǔn)，就輸出利用所述第二版本(V2)的數(shù)據(jù)處理的結(jié)果，以供使用。
2、根據(jù)權(quán)利要求1所述的方法，其特征在于，采用給定的數(shù)據(jù)量作為所述質(zhì)量標(biāo)準(zhǔn)，將經(jīng)調(diào)整的數(shù)據(jù)量與所述給定的數(shù)據(jù)量進行比較，其中所述給定的數(shù)據(jù)量被訓(xùn)練到了與所述第二自適應(yīng)數(shù)據(jù)處理版本(V2)相關(guān)的第二數(shù)據(jù)模型(DM)內(nèi)，在達(dá)到所述給定的數(shù)據(jù)量時，自動轉(zhuǎn)換到采用利用所述第二版本(V2)的數(shù)據(jù)處理的結(jié)果。
3、根據(jù)權(quán)利要求1所述的方法，其特征在于，相關(guān)于所述第一版本的結(jié)果評估所述第二數(shù)據(jù)處理版本的性能，并且在取得足夠的性能的情況下，強制轉(zhuǎn)換至采用所述第二版本的結(jié)果。
4、根據(jù)權(quán)利要求1所述的方法，其特征在于，就性能而言，將利用所述第二版本(V2)的數(shù)據(jù)處理的結(jié)果與利用所述第一版本(VI)的數(shù)據(jù)處理的結(jié)果進行自動比較，并且在所述第二版本的結(jié)果等于或優(yōu)于所述第一版本的結(jié)果時，自動轉(zhuǎn)換至采用所述第二版本的結(jié)果。
5、根據(jù)權(quán)利要求1到4中的任何一項所述的方法，其特征在于，通過所述自適應(yīng)數(shù)據(jù)處理，基于聲學(xué)參考數(shù)據(jù)模型、語言數(shù)據(jù)模型、語法數(shù)據(jù) 模型和/或辭典數(shù)據(jù)模型識別語音數(shù)據(jù)并將所述語音數(shù)據(jù)自動轉(zhuǎn)換為文本文件，基于所述語音數(shù)據(jù)檢驗所述經(jīng)自動轉(zhuǎn)換的文本文件并且在有必要時對所述文本文件進行校正，從而實現(xiàn)所述數(shù)據(jù)模型的連續(xù)調(diào)整的反饋。
6、一種在其上記錄有計算機程序的計算機程序產(chǎn)品，所述計算機程序適于執(zhí)行根據(jù)權(quán)利要求1到5中的任何一項所述的方法。
7、根據(jù)權(quán)利要求6所述的計算機程序產(chǎn)品，其特征在于，所述計算機程序還包括適于執(zhí)行所述第二自適應(yīng)數(shù)據(jù)處理版本的軟件。
8、一種包括數(shù)據(jù)處理器(4;42)的系統(tǒng)，所述數(shù)據(jù)處理器具有采用至少一個第一數(shù)據(jù)模型(dm)來處理數(shù)據(jù)的第一數(shù)據(jù)處理版本(Vl)，所述第一數(shù) 據(jù)模型(dm)基于數(shù)據(jù)處理的結(jié)果受到連續(xù)調(diào)整，所述系統(tǒng)的特征在于，所述數(shù)據(jù)處理器使第二數(shù)據(jù)處理版本(V2)與所述第一數(shù)據(jù)處理版本并行運行，所述第二數(shù)據(jù)處理版本采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù) 調(diào)整的第二數(shù)據(jù)模型(DM)，而且，將所述數(shù)據(jù)處理器配置為，一旦通過對相應(yīng)的至少一個數(shù)據(jù)模型的連續(xù)調(diào)整而使所述第二數(shù)據(jù)處理版本的結(jié)果具有了足夠的質(zhì)量，那么就從輸出所述第一數(shù)據(jù)處理版本的數(shù)據(jù)處理的結(jié)果轉(zhuǎn)換至輸出所述第二數(shù)據(jù)處理版本的結(jié)果。
9、根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，采用給定的數(shù)據(jù)量作為預(yù)定的質(zhì)量標(biāo)準(zhǔn)，采用比較器(37， 38)將經(jīng)調(diào)整的數(shù)據(jù)量和給定的數(shù)據(jù)量進行比較，其中所述給定的數(shù)據(jù)量被訓(xùn)練到了與所述第二自適應(yīng)數(shù)據(jù)處理版本(V2)相關(guān)的第二數(shù)據(jù)模型(DM)內(nèi)，并在達(dá)到所述給定的數(shù)據(jù)量時，自動轉(zhuǎn)換至采用利用所述第二版本的數(shù)據(jù)處理的結(jié)果。
10、根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于第二比較器(37')，所述第二比較器(37')用于將利用所述第二版本的數(shù)據(jù)處理的結(jié)果與利用所述第一版本的數(shù)據(jù)處理的結(jié)果進行比較，并且在所述第二版本的結(jié)果優(yōu)于所述第一版本的結(jié)果時自動轉(zhuǎn)換至采用所述第二版本的結(jié)果。
全文摘要
本發(fā)明涉及用于從數(shù)據(jù)處理裝置上的第一自適應(yīng)數(shù)據(jù)處理版本(V1)轉(zhuǎn)換至第二自適應(yīng)數(shù)據(jù)處理版本(V2)的方法和系統(tǒng)，其中，所述第一自適應(yīng)數(shù)據(jù)處理版本(V1)采用至少一個基于數(shù)據(jù)處理結(jié)果受到連續(xù)調(diào)整的數(shù)據(jù)模型(dm)，所述第二自適應(yīng)數(shù)據(jù)處理版本(V2)也采用了至少一個受到連續(xù)調(diào)整的數(shù)據(jù)模型(DM)，所述方法和系統(tǒng)的特征在于，在第一階段內(nèi)，與所述第一數(shù)據(jù)處理版本(V1)并行采用第二自適應(yīng)數(shù)據(jù)處理版本(V2)，由此連續(xù)調(diào)整所述與第一版本(V1)相關(guān)的所述至少一個數(shù)據(jù)模型(dm)以及與所述第二版本(V2)相關(guān)數(shù)據(jù)模型(DM)，所述方法和系統(tǒng)的特征還在于檢驗利用所述第二版本(V2)的數(shù)據(jù)處理的性能以符合質(zhì)量標(biāo)準(zhǔn)，而后，在第二階段內(nèi)，一旦滿足了所述質(zhì)量標(biāo)準(zhǔn)，就輸出利用所述第二版本(V2)的數(shù)據(jù)處理的結(jié)果，以供使用。本發(fā)明還涉及其上記錄有計算機程序的計算機程序產(chǎn)品，所述程序用于執(zhí)行這樣的方法。
文檔編號G10L15/28GK101443732SQ200780017032
公開日2009年5月27日申請日期2007年5月9日優(yōu)先權(quán)日2006年5月12日
發(fā)明者J·翁弗里德申請人:皇家飛利浦電子股份有限公司

完整全部詳細(xì)技術(shù)資料下載