用于機器翻譯的設備和方法

文檔序號：6480824閱讀：314來源：國知局

專利名稱：用于機器翻譯的設備和方法
技術領域：
本發(fā)明涉及一種用于將已輸入的源語言語句翻譯成目標語言語句的機器翻譯設備和機器翻譯方法。
背景技術：
隨著自然語言處理技術的發(fā)展，機器翻譯設備得到了發(fā)展，這種設備接收以源語言表達的源語言語句的輸入、將輸入語句轉換成期望目標語言的語句并輸出轉換結果。例如，將日文表達的文本等翻譯成諸如英文或中文之類的另一種語言的機器翻譯設備己經(jīng)投入實際使用。為了以更高水平的精確度更忠實地翻譯源語言的輸入語句，這種機器翻譯設備需要包括能夠針對自然語言的多樣性和歧義找到充分的解決方案的機構。
例如，JP-A 2000-10974(特開)提出了一種技術，利用該技術，通過與用戶交互來補充源語言語句中缺少的格要素(case element)。該技術實現(xiàn) 了針對源語言語句翻譯期間出現(xiàn)的歧義提供解決方案并實現(xiàn)了高水平的精確度而不會造成分析錯誤的翻譯設備。
然而，有這樣一些情形，其中，即使源語言語句沒有分析歧義，該翻譯設備也不能夠產(chǎn)生充分反映源語言語句暗含目的的翻譯語句。例如，由于文化背景、措辭或語用的原因，任何源語言都有通常省略的某些單詞或短語。情況常常是省略這樣的單詞或短語不會導致源語言中的文法問題。于是，難以檢測到這種情況在翻譯涉及到省略這種單詞或短語的源語言語句時，翻譯語句未適當反映出源語言語句的暗含目的。
此外，一般而言，機器翻譯設備的用戶通常對目標語言了解不夠。于是，用戶極難檢査該設備輸出的翻譯語句以判定翻譯語句未恰當反映用戶目的并進一步再次輸入帶補充信息的源語言語句以獲得更適當?shù)姆g語句。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個方面，一種機器翻譯設備，其包括范例存儲單元，其彼此對應地存儲目標語言形式的多個目標語言范例和源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價
于所述多個源語言范例中對應一個源語言范例的含義；輸入接收單元，其接收所述源語言形式的輸入語句；搜索單元，其在所述范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例；翻譯單元，其通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所述搜索中找到的所述多個目標語言范例中的所述一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生反向翻譯語句；檢測單元，其檢測所述反向翻譯語句和所述輸入語句之間的多個差異部分；以及輸出單元，其輸出所述差異部分。
根據(jù)本發(fā)明的另一個方面，一種機器翻譯設備，其包括范例存儲單元，其彼此對應地存儲目標語言形式的多個目標語言范例和源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；輸入接收單元，其接收所述源語言形式的輸入語句；搜索單元，其在所述范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例；第一翻譯單元，其通過將所述搜索中找到的所述多個目標語言范例中的一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生第一反向翻譯語句；第二翻譯單元，其通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所產(chǎn)生的目標語言語句翻譯成所述源語言的形式來產(chǎn)生第二反向翻譯語句；檢測單元，其檢測所述第一反向翻譯語句和所述第二反向翻譯語句之間的差異部分；以及輸出單元，其輸出所述差異部分。
根據(jù)本發(fā)明的又一方面，一種機器翻譯方法，其包括接收源語言形式的輸入語句；在范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例，其中，所述范例存儲單元彼此對應地存儲目標語言形式的多個目標語言范例和所述源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句；通過將所述搜索中找到的所述多個目標語言范例中的所述一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生反向翻譯語句；檢測所述反向翻譯語句和所述輸入語句之間的差異部分；以及輸出所述差異部分。
根據(jù)本發(fā)明的又一方面，一種機器翻譯方法，其包括接收源語言形式的輸入語句；在范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例，其中，所述范例存儲單元彼此對應地存儲目標語言形式的多個目標語言范例和所述源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；通過將所述搜索中找到的所述多個目標語言
范例中的一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生第一反向翻譯語句；通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所產(chǎn)生的目標語言語句翻譯成所述源語言的形式來產(chǎn)生第二反向翻譯語句；檢測所述第一反向翻譯語句和所述第二反向翻譯語句之間的差異部分；以及輸出所述差異部分。

圖l是根據(jù)本發(fā)明實施例的機器翻譯設備的方框圖；圖2為示出了范例存儲單元中存儲的平行翻譯范例組的示范性數(shù)據(jù)結構的圖示；
圖3為示出了類似的平行翻譯范例列表范例的圖示；
圖4為解釋用于檢測源語言輸入語句和經(jīng)編輯的范例反向翻譯語句之間差異的過程的圖示；
圖5為解釋用于檢測反向翻譯輸入語句和經(jīng)編輯的范例反向翻譯語句之間差異的過程的圖示；
圖6為示出了其中存儲差異信息的差異信息列表范例的圖示；
9圖7為示出了建議語句范例的圖示；
圖8為示出了用戶差異信息范例的圖示；
圖9為示出了顯示屏范例的圖示；
圖10是根據(jù)該實施例的機器翻譯過程的總體流程的流程圖11是根據(jù)該實施例的差異檢測過程的總體流程的流程圖12是根據(jù)該實施例的建議語句產(chǎn)生過程的總體流程的流程圖13是根據(jù)該實施例的結果輸出過程的總體流程的流程圖14是根據(jù)該實施例的假設施加過程的總體流程的流程圖15是根據(jù)該實施例的更新過程的總體流程的流程圖16為示出了翻譯語句范例的圖示；
圖17為示出了編輯范例翻譯語句的范例的圖示；
圖18為示出了顯示屏范例的圖示；
圖19為示出了類似的平行翻譯范例列表范例的圖示；
圖20為示出了翻譯語句范例的圖示；
圖21為示出了差異信息列表的范例的圖示；
圖22為示出了顯示屏范例的圖示；
圖23為示出了顯示屏另一范例的圖示；以及
圖24為解釋根據(jù)該實施例的機器翻譯設備的硬件配置的圖示。
具體實施例方式
將參考附圖詳細描述根據(jù)本發(fā)明的機器翻譯設備和機器翻譯方法的示范性實施例。在接下來的部分中，將利用在日文和中文語言之間或日文和英文語言之間翻譯的范例來解釋本發(fā)明。然而，在翻譯過程中可用作目標語言的語言不限于這些語言。使用任何其他語言都是可接受的。
根據(jù)本發(fā)明實施例的機器翻譯設備搜索包括類似于源語言輸入語句的范例的平行翻譯范例組，通過將平行翻譯范例組中的目標語言范例翻譯成源語言所獲得的反向翻譯語句與輸入語句或與進一步將輸入語句翻譯成目標語言的結果翻譯成源語言所獲得的另一個反向翻譯語句進行比較來檢測差異部分(即差異)，并輸出所檢測到的差異。
如圖1所示，機器翻譯設備100包括輸入接收單元101;選擇接收單元102;翻譯控制單元110;輸出單元103和范例存儲單元120。翻譯控制
單元110是控制翻譯過程的構成要素，包括搜索單元lll、翻譯單元112、檢測單元113、產(chǎn)生單元114、假設施加單元115和更新單元116。接下來將詳細解釋每個構成要素的功能。
輸入接收單元101接收用戶提供的源語言形式的輸入語句(在下文中稱為"源語言輸入語句")。為了輸入源語言輸入語句，使用任何通用輸入模塊，例如鍵盤、定點裝置、手寫字符識別裝置和光學字符讀取器(OCR)都是可接受的。輸入接收單元101可以使用任何方法，只要其能夠執(zhí)行處理以最終獲得源語言輸入語句即可。例如，如下設置是可接受的輸入接收單元101接收用戶的發(fā)聲作為語音輸入，并作為對輸入進行的語音識別過程結果輸出源語言輸入語句。
范例存儲單元120中存儲平行翻譯范例組，每個平行翻譯范例組都由源語言語句和至少一種目標語言的語句構成，源語言語句是目標語言語句的翻譯，反之亦然。在本實施例的描述中，在所用的范例中每個平行翻譯范例組包括彼此對應保持的日文、中文和英文范例。彼此對應地保持范例
的語言數(shù)量不必一定是三個。換言之，另一種設置是可接受的彼此對應
地保持兩種語言或四種或更多語言的范例。在使用三種或更多語言范例的情況下，可以通過設置使用戶能夠動態(tài)選擇期望的目標語言。
在圖2中示出了存儲了六個平行翻譯范例組(即平行翻譯范例組201到 206)的范例。平行翻譯范例組201到206中的每一個都包含多種語言的范例。例如，平行翻譯范例組201包含日文語句207、中文語句208和英文語句209，每個語句都是其他語句的平行翻譯。
在下面的解釋中，將把每個平行翻譯范例組中的范例語句中與表達輸入接收單元101接收的源語言輸入語句的語言相同的語句稱為"范例源語句"，而將把指定為翻譯目標語言的語言的語句稱為"范例翻譯語句"。
可以利用任何通用存儲介質(zhì)，例如硬盤驅(qū)動器(HDD)、光盤、存儲卡和隨機存取存儲器(RAM)來配置范例存儲單元120。
返回到圖1的描述，搜索單元111在范例存儲單元120中搜索均包含類似于輸入接收單元101接收的源語言輸入語句的范例源語句的平行翻譯范例組。搜索單元111還將平行翻譯范例組存儲到類似的平行翻譯范例列
ii表中，同時根據(jù)它們的相似水平的次序設置它們。為了計算平行翻譯范例組的相似水平，使用通常使用的任何方法都是可接受的，例如在描述單詞的概念性的上級/從屬關系和同義詞關系的類屬詞典中測量單詞之間的距離的方法。
例如，搜索單元111使用在相關單詞完全匹配時具有最大值的指標作為表示單詞間相似水平的單詞與單詞相似水平。此外，搜索單元111利用任何廣為人知的方法，例如動態(tài)規(guī)劃方法來檢測使整個語句的單詞與單詞相似水平最大的單詞與單詞對應度。此外，搜索單元111將假想利用所檢測的單詞與單詞對應度獲得的單詞與單詞相似水平總和用作整個語句的相似水平。于是，通過進行搜索，搜索單元111找到按照整個語句相似水平降序排列的預定數(shù)量的平行翻譯范例組。
圖3為示出了類似的平行翻譯范例列表范例的圖示，該列表中存儲了搜索單元111進行處理的結果。如圖3所示，該類似平行翻譯范例列表中存儲了在搜索中發(fā)現(xiàn)的圖2中所示的一些平行翻譯范例組作為類似于源語言輸入語句的范例，同時按照它們的相似水平的順序設置它們。圖3中所示的為類似平行翻譯范例列表的范例，其中存儲了分別對應于圖2所示的平行翻譯范例組202、 203和201的平行翻譯范例組301、 302和303。
返回到圖1的描述，在輸出翻譯語句之前，在指定的字符串代表源語言語句的情況下，翻譯單元112將該語句翻譯成目標語言的語句，在指定的字符串代表目標語言語句的情況下，翻譯單元112將該語句翻譯成源語言語句。例如，在目標語言為中文且指定的字符串代表日文語句的情況下，翻譯單元112將日文語句翻譯成中文語句。另一方面，在指定字符串代表中文語句的情況下，翻譯單元112將中文語句翻譯成日文語句。
根據(jù)本實施例，響應于來自檢測單元113的請求(稍后解釋)，翻譯單元112通過將編輯范例翻譯語句獲得的經(jīng)編輯的范例翻譯語句(稍后詳細解釋)翻譯成源語言來產(chǎn)生經(jīng)編輯的范例反向翻譯語句。而且，響應于來自檢測單元113的請求，翻譯單元112通過將源語言輸入語句翻譯成目標語言產(chǎn)生目標語言語句，并通過將所產(chǎn)生的目標語言語句翻譯成源語言來產(chǎn)生反向翻譯輸入語句。在檢測單元113檢測經(jīng)編輯的范例反向翻譯語句和源語言輸入語句之間的差異、或經(jīng)編輯的范例反向翻譯語句和反向翻譯輸入語句之間的差異時，會參考經(jīng)編輯的范例反向翻譯語句。
翻譯單元112執(zhí)行的翻譯過程可以采用通常使用的任何機器翻譯方法，例如轉移法、基于范例的方法、基于統(tǒng)計的方法和中間語言方法。
檢測單元113檢測經(jīng)編輯的范例反向翻譯語句和源語言輸入語句之間
的差異、以及經(jīng)編輯的范例反向翻譯語句和反向翻譯輸入語句之間的差異。
更具體而言，首先，檢測單元113檢測源語言輸入語句和搜索單元111構造出的類似平行翻譯范例列表中存儲的平行翻譯范例組中包括的每個范例源語句之間的差異。之后，檢測單元113利用源語言輸入語句中表現(xiàn)出差異的單詞翻譯替換范例翻譯語句中對應于范例源語句中表現(xiàn)出差異的單詞的單詞，從而產(chǎn)生經(jīng)編輯的范例翻譯語句。此外，檢測單元113令翻譯單元112將經(jīng)編輯的范例翻譯語句翻譯成源語言來獲得經(jīng)編輯的范例反向翻譯語句。之后，檢測單元113檢測經(jīng)編輯的范例反向翻譯語句和源語言輸入語句之間的差異。然后檢測單元113將包括所檢測的差異的差異信息存儲到差異信息列表中，同時對應于差異信息保持比較過程中所用的平行翻譯范例組。
而且，檢測單元113令翻譯單元112將源語言輸入語句翻譯成目標語言來獲得目標語言語句。此外，檢測單元113令翻譯單元112將目標語言語句進一步翻譯成源語言來獲得反向翻譯輸入語句。之后，檢測單元113 檢測經(jīng)編輯的范例反向翻譯語句和反向翻譯輸入語句之間的差異。然后檢測單元113將包括所檢測的差異的差異信息存儲到差異信息列表中，同時對應于差異信息保持比較過程中所用的平行翻譯范例組。
接下來將解釋檢測單元113執(zhí)行的差異檢測過程的特定范例。圖4為示出了對以日文輸入的表達含義"我喜歡喝酒"的源語言輸入語句401進行的差異檢測過程范例的圖示。
應當指出，在日文中，在表達這種含義時，可能會從該語句中省略以 "osake"(意為"酒")為賓語的動詞"nomu"(意為"喝")。該源語言輸入語句401代表省略了動詞"nonm"(意為"喝")的日文語句。
在這種情形中，例如，作為搜索結果，搜索單元111找到對應于圖2 中所示的平行翻譯范例組201的平行翻譯范例組402。平行翻譯范例組402 包括相互不同的語言范例，每個范例都表示"我喜歡看電影"。應當指出，從在平行翻譯范例組402中包括的日文范例源語句403中省略了以單詞 "eiga"(意為"電影")為賓語的動詞"miru"(意為"看")。
因此，作為源語言輸入語句401和范例源語句403之間的差異，檢測單元113檢測到意為"酒"的日文單詞"osake" 411和意為"電影"的日文單詞"eiga" 412。然后，檢測單元113通過在范例翻譯語句404中以意為"酒"的中文單詞或英文單詞代替至少一個意為"電影"的加下劃線的單詞，來產(chǎn)生經(jīng)編輯的范例翻譯語句405。在圖4中示出了中文范例翻譯語句和英文范例翻譯語句；然而，只要檢測單元113對對應于指定目標語言的至少一個范例翻譯語句進行差異檢測過程就足夠了。
接下來，檢測單元113令翻譯單元112進一步翻譯經(jīng)編輯的范例翻譯語句405來產(chǎn)生經(jīng)編輯的范例反向翻譯語句406。之后，檢測單元113檢測源語言輸入語句401和經(jīng)編輯的范例反向翻譯語句406之間的差異413、并將包括所檢測的差異413的差異信息存儲到差異信息列表中，同時對應于該差異信息保持平行翻譯范例組402。
圖5為示出了對以日文輸入的表達含義"請不要忘記粘貼郵票"的源語言輸入語句501進行的差異檢測過程范例的圖示。
應當指出，在日文中，在表達這種含義時，可能會從該語句中省略以 "kitte"(意為"郵票")為賓語的動詞"ham"(意為"粘貼")。該源語言輸入語句501代表省略了動詞"haru"(意為"粘貼")的日文語句。
檢測單元113令翻譯單元112將源語言輸入語句501翻譯成目標語言來獲得目標語言語句502。此外，檢測單元113令翻譯單元112將目標語言語句502進一步翻譯成源語言來獲得反向翻譯輸入語句503。
另一方面，作為類似于源語言輸入語句501的范例，作為搜索結果，搜索單元111找到對應于圖2中所示的平行翻譯范例組204的平行翻譯范例組504。該平行翻譯范例組504包括相互不同語言的范例，每個范例都表示"請不要忘記買一本筆記本"。應當指出，從在平行翻譯范例組504中包括的日文范例源語句505中省略了以單詞"nooto"(意為"筆記本")為賓語的動詞"kau"(意為"買")o
因此，作為源語言輸入語句501和范例源語句505之間的差異，檢測單元113檢測到意為"郵票"的日文單詞"kitte" 511和意為"筆記本"
14的日文單詞"nooto" 512。然后，檢測單元113通過在范例翻譯語句506 中以意為"郵票"的中文單詞或英文單詞代替至少一個意為"筆記本"的加下劃線單詞，來產(chǎn)生經(jīng)編輯的范例翻譯語句507。
接下來，檢測單元113令翻譯單元112進一步翻譯經(jīng)編輯的范例翻譯語句507來產(chǎn)生經(jīng)編輯的范例反向翻譯語句508。之后，檢測單元113檢測源語言輸入語句501和經(jīng)編輯的范例反向翻譯語句508之間的差異513，并將包括所檢測的差異513的差異信息存儲到差異信息列表中，同時對應于該差異信息保持平行翻譯范例組504。
圖6為示出了在已經(jīng)獲得了包括圖3所示的三個平行翻譯范例組的類似平行翻譯范例列表的情況下包括三條對應于平行翻譯范例組的差異信息的差異信息列表范例的圖示。如圖6所示，對應于分別檢測到差異602、 605 和608的平行翻譯范例組603、 606和609分別保持諸條差異信息601、 604 和607。每條差異信息601、 604和607都包含均被置于符號"("和")" 之間且初始包括在源語言輸入語句中的短語。利用這些設置，用戶能夠容易地理解經(jīng)編輯的范例反向翻譯語句中具有差異的部分。
返回到圖1的描述，產(chǎn)生單元114通過向源語言輸入語句添加檢測到的差異來產(chǎn)生輸出語句。輸出語句是為用戶輸出的語句，以便針對包括補充信息的新的源語言語句提示候選者，該補充信息是機器翻譯設備獲得用戶期望的翻譯所需要的。在下面的解釋中，將把這種輸出語句稱為"建議語句"。
更具體而言，產(chǎn)生單元114通過將差異信息列表中包括的差異析取地設置到均設置于符號"("和")"之間且初始包括在源語言輸入語句中的部分間的位置中來產(chǎn)生建議語句。如圖7所示，產(chǎn)生單元114將設置于符號"{"和"}"之間且被析取地設置并同時彼此被符號"/"分隔的差異702、 703和704嵌入源語言輸入語句中表現(xiàn)出差異的部分中來產(chǎn)生建議語句 701。建議語句701是在已經(jīng)針對圖4所示的源語言輸入語句401獲得圖6 所示的差異信息列表情況下由產(chǎn)生單元114產(chǎn)生的建議語句的范例。
返回到圖1的描述，選擇接收單元102接收用戶從己經(jīng)由產(chǎn)生單元114 產(chǎn)生并由輸出單元103輸出的建議語句(稍后解釋)選擇的差異之一。而且，選擇接收單元102接收用戶執(zhí)行的用于結束翻譯過程的操作。選擇接收單
15元102要接收所選差異并接收結束翻譯過程的操作，可以使用任何通用輸入裝置，例如可以使用鍵盤和定點裝置。
例如，用戶利用定點裝置指到顯示如圖7所示已經(jīng)輸出的建議語句701 之內(nèi)的差異702的部分來選擇他/她意欲選擇的差異之一。結果，選擇接收單元102接收到所選的差異。選擇接收單元102將包括所選差異702的圖6 所示的該條差異信息601作為所選差異信息存儲到諸如隨機存取存儲器 (RAM)之類的存儲單元等(未示出)中。
在用戶希望用除建議語句中包含的差異之外的單詞或短語補充源語言輸入語句的情況下，選擇接收單元102接收用戶自己輸入的單詞或短語作為用戶差異信息并將所接收的用戶差異信息存儲到存儲單元中。如圖8所示，在用戶差異信息801中，將每一個均被設置于符號"("和")"之間且初始包括在源語言輸入語句中的短語添加到代表用戶已輸入的短語的差異802。
用戶差異信息與充當圖6所示的差異信息列表的要素的差異信息的不同之處在于，檢測到差異的平行翻譯范例組不是對應于用戶差異信息保持的。然而，用于存儲差異信息自身的存儲方法對用戶差異信息和差異信息而言是公共的。于是，對于用戶已經(jīng)選擇輸出差異之一以及用戶已經(jīng)自己輸入差異的兩種情形而言，要執(zhí)行的過程是彼此相同的。
另一種設置是可接受的，即配置選擇接收單元102，以便接收用戶的發(fā) 聲作為語音輸入，對所接收的語音進行語音識別處理并接收與語音識別處理結果匹配的差異作為所選差異。另一種設置是可接受的，其中，在用戶僅發(fā)出差異一部分的關鍵字的聲音時，選擇接收單元102判定已經(jīng)選擇了包括該關鍵字的差異。
假設施加單元115利用所選的差異信息或用戶差異信息產(chǎn)生新的源語言輸入語句并令翻譯單元112翻譯新產(chǎn)生的源語言輸入語句來獲得新的目
標語言語句o
例如，在用戶已經(jīng)針對圖7所示的建議語句701選擇了差異702的情況下，將圖6所示的該條差異信息601作為所選差異信息加以存儲。在這種情況下，假設施加單元115通過從該條差異信息601消除符號"("和")" 來產(chǎn)生新的源語言輸入語句。而且，基于該用戶差異信息，假設施加單元115以類似方式產(chǎn)生新的源語言輸入語句。
更新單元116更新位置設置，從而將對應于所選差異信息保持的平行翻譯范例組移動到已經(jīng)由搜索單元111產(chǎn)生的類似平行翻譯范例列表的頂部。
輸出單元103輸出源語言輸入語句、目標語言語句、建議語句以及類似平行翻譯范例列表的內(nèi)容?？梢岳猛ǔＪ褂玫娜魏畏椒▽崿F(xiàn)輸出單元 103使用的輸出方法，例如由顯示裝置(未示出)實現(xiàn)的圖像輸出、由打印裝置(未示出)輸出的打印輸出、由音頻合成裝置(未示出)實現(xiàn)的合成音頻輸出。此外，可以接受這樣的設置，即將這些輸出方法中的兩種或更多種集成到該機器翻譯設備中，從而根據(jù)需要改變要使用的輸出方法?？梢越邮?的另一種設置是組合使用這些輸出方法中的兩種或更多種。
如圖9所示，顯示屏包括向其中輸出源語言輸入語句的源語言輸入語句字段901;向其中輸出目標語言語句的目標語言語句字段902;向其中輸出建議語句的建議語句字段903;以及向其中輸出類似平行翻譯范例列表之內(nèi)的平行翻譯范例組的類似平行翻譯范例列表字段904。
接下來，將參考圖IO解釋如上所述配置的根據(jù)本實施例的機器翻譯設備100執(zhí)行的機器翻譯過程。首先，輸入接收單元101接收源語言輸入語句S(步驟SIOOI)。接下來，搜索單元111在范例存儲單元120中搜索例如均匹配或類似于源語言輸入語句S的范例并按照它們的相似水平的降序?qū)?范例存儲到類似平行翻譯范例列表Le中(步驟S1002)。
之后，翻譯單元112通過翻譯源語言輸入語句S來產(chǎn)生目標語言語句 T(步驟S1003)。此外，檢測單元113產(chǎn)生經(jīng)編輯的范例反向翻譯語句和反向翻譯輸入語句并執(zhí)行差異檢測過程，以通過將經(jīng)編輯的范例反向翻譯語句與源語言輸入語句進行比較以及與反向翻譯輸入語句進行比較來檢測差異(步驟S1004)。稍后將解釋差異檢測過程的細節(jié)。作為差異檢測過程的結果，輸出包括所檢測到的差異的差異信息列表Ld。
之后，參考所檢測到的差異，產(chǎn)生單元114執(zhí)行建議語句產(chǎn)生過程以產(chǎn)生要提供給用戶的建議語句(步驟S1005)。稍后將解釋建議語句產(chǎn)生過程的細節(jié)。
接下來，輸出單元103執(zhí)行結果輸出過程以向顯示裝置等輸出源語言輸入語句、目標語言語句和所產(chǎn)生的建議語句(步驟S1006)。稍后將解釋結
果輸出過程的細節(jié)。
之后，選擇接收單元102接收用戶的操作(步驟S1007)。選擇接收單元 102然后判斷所接收的操作是否是結束過程的操作(步驟S1008)。在所接收的操作是結束過程的操作的情況下(步驟S1008:是)，結束機器翻譯過程。
相反，在所接收的操作不是結束過程的操作的情況下(步驟S1008:否)，選擇接收單元102判斷是否已輸入差異(步驟S1009)。用于輸入差異的方法范例包括用戶利用定點裝置等從所顯示的建議語句中選擇差異的方法以及用戶自己輸入建議語句中未包括的差異的另一種方法。
在未輸入差異的情況下(步驟S1009:否)，該過程返回到用戶操作接收過程，從而重復該過程(步驟S1007)。
相反，在已經(jīng)輸入了差異的情況下(步驟S1009:是)，假設施加單元 115判斷輸入的差異是否包括在己經(jīng)作為差異檢測過程的結果輸出的差異信息列表中(步驟S1010)。在輸入的差異包括在差異信息列表中的情況下 (步驟S1010:是)，假設施加單元115向存儲單元中存儲包括輸入差異的差異信息作為所選差異信息H，并且還將用戶差異信息U設置為空白(步驟 SlOll)。
相反，在輸入差異未包括在差異信息列表中的情況下(步驟S1010:否)，
假設施加單元115產(chǎn)生包括輸入差異的用戶差異信息li并將所產(chǎn)生的用戶差異信息U存儲到存儲單元中。此外，假設施加單元115將所選的差異信息H設置成空白(步驟S1012)。
之后，通過參考己經(jīng)存儲的所選差異信息H或用戶差異信息U，假設施加單元115執(zhí)行假設施加過程以產(chǎn)生新的源語言輸入語句并通過翻譯新產(chǎn) 生的源語言輸入語句來獲得目標語言語句(步驟S1013)。稍后將解釋假設施加過程的細節(jié)。
接下來，更新單元116執(zhí)行更新過程以在顯示屏上更新顯示(步驟 S1014)。稍后將解釋更新過程的細節(jié)。
作為上述過程的結果，可以將重新將翻譯結果翻譯成源語言獲得的反向翻譯語句和源語言輸入語句之間的差異作為檢測翻譯結果是否恰當反映出源語言語句暗含目的所用的信息來輸出。因此，機器翻譯設備能夠利用
18用戶從輸出差異中選擇的差異翻譯新產(chǎn)生的源語言輸入語句。于是，機器翻譯設備能夠容易地獲得恰當反映該意圖的翻譯結果。
接下來將參考圖11解釋在步驟S1004執(zhí)行的差異檢測過程的細節(jié)。首先，檢測單元113令翻譯單元112將目標語言語句T翻譯成源語言來產(chǎn)生反向翻譯輸入語句Tb(步驟SllOl)。之后，檢測單元113從類似平行翻譯范例列表Le中獲得尚未被處理的平行翻譯范例組E(步驟S1102)。
接下來，檢測單元113檢測所獲得的平行翻譯范例組E中的范例源語句和源語言輸入語句S之間的差異部分(步驟S1103)。此外，檢測單元113
利用對應于范例源語句中的差異部分的翻譯單詞/短語替代對應于平行翻譯范例組E之內(nèi)范例翻譯語句中的差異部分的單詞或短語產(chǎn)生經(jīng)編輯的范例翻譯語句Em(步驟S1014)。在這種情況下，檢測單元113通過參考其中存儲了源語言單詞和目標語言單詞且同時彼此對應地保持單詞的詞典(未示出)等來獲得對應于范例源語句中的差異部分的翻譯單詞/短語。
之后，檢測單元113令翻譯單元112將經(jīng)編輯的范例翻譯語句Em翻譯成源語言來產(chǎn)生經(jīng)編輯的范例反向翻譯語句Et(步驟S1105)。接下來，檢測單元113檢測經(jīng)編輯的范例反向翻譯語句St和源語言輸入語句S之間的差異，產(chǎn)生包括檢測到的差異的差異信息并將所產(chǎn)生的差異信息存儲到差異信息列表Ld中(步驟S1106)。更具體而言，檢測單元113產(chǎn)生差異信息，在差異信息中將設置于符號"("和")"之間且初始包括在源語言輸入語句中的單詞或短語添加到所檢測到的差異中。此外，檢測單元113將所產(chǎn) 生的差異信息存儲到差異信息列表Ld中，同時對應于所產(chǎn)生的差異信息保持檢測出差異的平行翻譯范例組。
類似地，檢測單元113檢測經(jīng)編輯的范例反向翻譯語句Et和在步驟 S1101中產(chǎn)生的反向翻譯輸入語句Tb之間的差異，產(chǎn)生包括檢測到的差異的差異信息并將所產(chǎn)生的差異信息存儲到差異信息列表Ld中(步驟S1107)。
之后，檢測單元113判斷是否已經(jīng)處理了類似平行翻譯范例列表Le中的所有平行翻譯范例組(步驟S1108)。在尚未處理所有平行翻譯范例組的情況下(步驟S1108:否)，檢測單元113選擇下一個平行翻譯范例組并重復該過程(步驟S1102)。相反，在已經(jīng)處理過所有平行翻譯范例組的情況下(步驟S1108:是)，差異檢測過程結束。
19接下來，將參考圖12解釋在步驟S1005中執(zhí)行的建議語句產(chǎn)生過程的細節(jié)。
首先，產(chǎn)生單元114將源語言輸入語句S指定為要在顯示裝置等上顯示的建議語句P(步驟S1201)。之后，產(chǎn)生單元114從差異信息列表Ld中獲得一條尚未處理過的差異信息(步驟S1202)。接下來，產(chǎn)生單元114將所獲得的這條差異信息與建議語句P組合(步驟S1203)。更具體而言，產(chǎn)生單元114通過將該條差異信息中包括的差異插入建議語句P的對應位置中同時將差異設置于符號"("和")"之間來組合該條差異信息和建議語句P。在這種情況下，在產(chǎn)生單元114將多個差異插入相同位置時，產(chǎn)生單元114 利用符號"/"將插入的差異彼此分開。
接下來，產(chǎn)生單元114判斷是否已處理了差異信息列表Ld中的所有各條差異信息(步驟S1204)。在尚未處理所有各條差異信息的情況下(步驟 S1204:否)，產(chǎn)生單元114選擇下一條差異信息并重復該過程(步驟S1202)。相反，在己經(jīng)處理過所有各條差異信息的情況下(步驟S1204:是)，建議語句產(chǎn)生過程結束。
接下來將參考圖13解釋在步驟S1006執(zhí)行的結果輸出過程的細節(jié)。
首先，輸出單元103在顯示屏上的預定位置輸出源語言輸入語句S、目標語言語句T和建議語句P(步驟S1301)。之后，輸出單元103從類似平行翻譯范例列表Le中獲得尚未被處理的平行翻譯范例組(步驟S1302)。接下來，輸出單元103將所獲得的平行翻譯范例組輸出到顯示屏上的預定位置 (步驟S1303)。
之后，輸出單元103判斷是否已經(jīng)處理了類似平行翻譯范例列表Le中的所有平行翻譯范例組(步驟S1304)。在未處理過所有平行翻譯范例組的情況下(步驟S1304:否)，輸出單元103選擇下一個平行翻譯范例組并重復該過程(步驟S1302)。相反，在己經(jīng)處理過所有平行翻譯范例組的情況下(步驟S1304:是)，結果輸出過程結束。
接下來將參考圖14解釋在步驟S1013執(zhí)行的假設施加過程的細節(jié)。首先，假設施加單元115判斷所選的差異信息H是否為空白(步驟 S1401)。在所選差異信息H為空白的情況下(步驟S1401:是)，假設施加單元115基于用戶差異信息U產(chǎn)生新的源語言輸入語句S(步驟S1402)。更具體而言，假設施加單元115通過從用戶差異信息U去除符號"("和")"
來產(chǎn)生新的源語言輸入語句s。
相反，在所選差異信息H不是空白的情況下(步驟S1401:否)，假設施加單元115基于所選差異信息H產(chǎn)生新的源語言輸入語句S (步驟S1403)。
之后，假設施加單元115令翻譯單元112翻譯新產(chǎn)生的源語言輸入語句S來產(chǎn)生目標語言語句T(步驟S1404)，假設施加過程結束。
接下來，將參考圖15解釋在步驟S1014執(zhí)行的更新過程的細節(jié)。
首先，更新單元116判斷所選的差異信息H是否為空白(步驟S1501)。在所選差異信息H為空白的情況下(步驟S1501:是)，更新單元116結束該更新過程。
相反，在所選差異信息H不是空白的情況下(步驟S1501:否)，更新單元116基于已產(chǎn)生了哪些所選差異信息H獲得平行翻譯范例組Eh(步驟 S1502)。更具體而言，更新單元116從差異信息列表中獲得對應于與所選差異信息H匹配的該條差異信息保持的平行翻譯范例組Eh。
之后，更新單元116更新位置設置，使所獲得的平行翻譯范例組Eh位于類似平行翻譯范例列表Le的頂部(步驟S1503)，更新過程結束。
接下來將解釋根據(jù)本實施例的機器翻譯過程的特定范例。在以下解釋中，假設范例存儲單元120中存儲了如圖2所示的平行翻譯范例組。還假設源語言為日文，指定的目標語言為中文或英文。
首先，假設輸入接收單元101已接收到以日文輸入的表示含義"我喜歡喝酒"的如圖4所示的源語言輸入語句401(步驟S1001)。應當指出，如上所述，源語言輸入語句401省略了意為"喝"的動詞"nomu"。
搜索單元111在范例存儲單元120中搜索均類似于源語言輸入語句401 的范例。結果，搜索單元111獲得例如圖3所示的類似平行翻譯范例列表 Le(步驟S1002)。而且，翻譯單元112通過翻譯源語言輸入語句401例如產(chǎn) 生如圖16所示的中文語句1601或英文語句1602 (步驟S1003)。
中文語句1601和英文語句1602均具有"我喜歡被稱為酒的東西"這一含義。換言之，這些翻譯語句是不自然的翻譯語句，每句的含義均與用戶的意圖不同，因為未經(jīng)任何調(diào)整直接翻譯了省略動詞的源語言輸入語句 401。為了在這種情況下實現(xiàn)恰當反映用戶所說意圖的翻譯過程，繼續(xù)如下
所述進行該過程首先，檢測單元113執(zhí)行差異檢測過程(步驟S1004)。
例如，檢測單元113令翻譯單元112將作為中文語句1601和英文語句 1602之一的目標語言語句T翻譯成源語言，從而獲得與源語言輸入語句401 相同的反向翻譯輸入語句Tb(步驟S1101)。
類似平行翻譯范例列表Le中存儲如圖3所示的三個平行翻譯范例組。于是，在平行翻譯范例組E充當處理目標時，檢測單元113提取列在類似平行翻譯范例列表Le頂部的平行翻譯范例組301 (步驟S1102)。
平行翻譯范例組301中包括的范例源語句304和源語言輸入語句401 之間的差異為意為"牛奶"的日文單詞和意為"酒"的日文單詞。于是，檢測單元113利用意為"酒"的單詞替換平行翻譯范例組301中包括的范例翻譯語句305或范例翻譯語句306中使用的意為"牛奶"的單詞，從而產(chǎn)生經(jīng)編輯的范例翻譯語句Em(步驟S1104)。
圖17為示出了在上述過程中產(chǎn)生的經(jīng)編輯的范例翻譯語句的范例的圖示。在目標語言為中文的情況下，產(chǎn)生圖17所示的中文語句1701作為經(jīng) 編輯的范例翻譯語句Em。另一方面，在目標語言為英文的情況下，產(chǎn)生圖 17中所示的英文語句1702作為經(jīng)編輯的范例翻譯語句Em。
然后，檢測單元113令翻譯單元112將所產(chǎn)生的經(jīng)編輯的范例翻譯語句Em翻譯成日文來產(chǎn)生經(jīng)編輯的范例反向翻譯語句Et(步驟S1105)。結果，獲得了日文的經(jīng)編輯的范例反向翻譯語句Et，其包括源語言輸入語句401 中省略的意為"喝"的動詞"nomu"。
之后，檢測單元113檢測源語言輸入語句401和經(jīng)編輯的范例反向翻譯語句St之間的差異并將所檢測到的差異存儲到差異信息列表Ld中(步驟 S1106)。在本實例中，檢測單元113存儲如圖6所示的差異信息601，同時對應于差異信息601保持檢測出差異的平行翻譯范例組301。
作為上述過程的結果，已經(jīng)針對類似平行翻譯范例列表Le中包括的平行翻譯范例組中的第一個平行翻譯范例組完成了差異檢測過程。之后，針對類似平行翻譯范例列表Le中包括的所有平行翻譯范例組的每一個反復執(zhí) 行上述過程。結果，產(chǎn)生了如圖6所示的差異信息列表Ld。
接下來，產(chǎn)生單元114執(zhí)行建議語句產(chǎn)生過程(步驟S1005)。首先，產(chǎn)生單元114將源語言輸入語句401指定為建議語句P的初始值(步驟S1201)。之后，產(chǎn)生單元114執(zhí)行下述過程，依次將差異信息列表 Ld中存儲的每條差異信息嵌入建議語句P中。
在本實例中，差異信息列表Ld中存儲了三條差異信息，即如圖6所示的差異信息601、 604和607。產(chǎn)生單元114從差異信息列表Ld提取第一條差異信息(即差異信息601)(步驟S1202)。之后，產(chǎn)生單元114將差異信息 601中的差異602嵌入建議語句P中(步驟S1203)。在該階段，產(chǎn)生單元114 產(chǎn)生僅包括圖7所示建議語句701中的差異702的建議語句，差異702設置于符號"{"和"}"之間。
作為上述過程的結果，在差異信息列表Ld中包括的各條差異信息中，已經(jīng)完成了針對第一條差異信息的建議語句產(chǎn)生過程。之后，針對差異信息列表Ld中包括的所有各條差異信息的每一條反復執(zhí)行上述過程。結果，產(chǎn)生了如圖7所示的建議語句701。
接下來，輸出單元103執(zhí)行結果輸出過程(步驟S1006)。作為結果輸出過程的結果，輸出在迄今為止執(zhí)行的過程中已經(jīng)產(chǎn)生的源語言輸入語句S、目標語言語句T和建議語句P(步驟S1301)。而且，根據(jù)在類似平行翻譯范例列表Le中設置平行翻譯范例組的次序依次輸出列表中存儲的平行翻譯范例組(步驟S1302到S1303)。在本實例中，輸出單元103向如圖9所示的顯示屏上輸出源語言輸入語句S、目標語言語句T、建議語句P和平行翻譯范例組。如圖9所示，根據(jù)平行翻譯范例組在列表中的設置次序?qū)⑵叫蟹g 范例組輸出到類似平行翻譯范例列表字段904中。 '
之后，假設用戶已從存在的建議語句701選擇了差異702，且選擇接收單元102已經(jīng)接收到用戶的選擇(步驟S1007)。所接收到的操作不是結束過程的操作(步驟S1008:否)，且已經(jīng)輸入了差異(步驟S1009:是)。于是，假設施加單元115判斷輸入的差異是否包括在差異信息列表Ld中(步驟 SIOIO)。
在本實例中，所選的差異702與圖6所示的差異信息列表Ld中包括的各條差異信息中的差異信息601中包括的差異602匹配。于是，假設施加單元115將差異信息601作為所選差異信息H存儲到存儲單元中并將用戶差異信息U設置成空白(步驟S1011)。之后，執(zhí)行假設施加過程，從而基于已經(jīng)存儲的所選差異信息執(zhí)行恰
當反映用戶意圖的翻譯過程(步驟S1013)。
所選差異信息H中存儲圖6中所示的差異信息601 (步驟S1401:否)。于是，假設施加單元115基于差異信息601產(chǎn)生了新的源語言輸入語句S(步驟S1403)。更具體而言，假設施加單元115通過從差異信息601刪除符號 "("和")"來產(chǎn)生新的源語言輸入語句S。
接下來，假設施加單元115令翻譯單元112將新產(chǎn)生的源語言輸入語句S翻譯成目標語言來產(chǎn)生目標語言語句T(步驟S1404)。在本實例中，例如，假設施加單元115產(chǎn)生圖17中所示的中文語句1701和英文語句1702 之一作為目標語言語句T。
這些目標語言語句的每一句都是包括對目標對象"酒"采取的動作的表達方式，這與一開始在步驟S1003中獲得的中文語句1601或英文語句 1602不同。換言之，每一目標語言語句都是等價于用戶希望表達的源語言輸入語句內(nèi)容的翻譯語句。
之后，更新單元116執(zhí)行更新過程(步驟S1014)。
所選差異信息H中存儲圖6中所示的差異信息601 (步驟S1501:否)。于是，首先，更新單元116獲得對應于所選差異信息H保持的平行翻譯范例組Eh(步驟S1502)。然后，更新單元116設置位置設置，使所獲得的平行翻譯范例組Eh位于類似平行翻譯范例列表Le的頂部(步驟S1503)。在本實例中，因為位于列表頂部的圖3中的平行翻譯范例組301是對應于所選差異信息H保持的(參考圖6中所示的平行翻譯范例組603),因此列表中設置平行翻譯范例組的次序未變化。
作為上述過程的結果，完成了更新過程且再次調(diào)用結果輸出過程(步驟 S1006)。結果，顯示出如圖18所示的顯示屏。如圖18所示，向源語言輸入語句字段2001中輸出新的源語言輸入語句，利用該新的源語言輸入語句能夠獲得忠實反映出用戶表達意圖的翻譯語句。而且，向目標語言語句字段2002中輸出通過翻譯新的源語言輸入語句獲得的翻譯語句。在類似平行翻譯范例列表中設置平行翻譯范例組的次序己經(jīng)改變的情況下，按照改變后的次序向類似平行翻譯范例列表字段2003中輸出平行翻譯范例組。
作為上述過程的結果，完成了結果輸出過程。在用戶輸入結束過程的
24操作時(步驟S1008:是)，機器翻譯過程結束。
如上所述，根據(jù)本實施例，即使用戶對目標語言了解不夠多，用戶也
能夠在源語言中找到機器翻譯設備100要輸出充分反映用戶表達意圖的翻
譯語句所需的信息。而且，基于該信息，用戶能夠容易地產(chǎn)生可以產(chǎn)生恰當反映表達意圖的翻譯語句的源語言輸入語句。結果，能夠?qū)崿F(xiàn)在翻譯過
程中實現(xiàn)高水平精確度的機器翻譯設備100。
接下來將解釋根據(jù)本實施例的機器翻譯過程的另一特定范例。在下面的部分中，將解釋如下的過程范例，該過程是在輸出的建議語句不含恰當反映用戶意圖的信息、因此用戶自己輸入要用于補足建議語句的單詞或短語的情況下執(zhí)行的。
在下面的解釋中，使用了如下范例，其中輸入接收單元101接收到以日文輸入的圖5所示的表達含義"請不要忘記粘貼郵票"的源語言輸入語句501 (步驟S1001)。如上所述，源語言輸入語句501中省略了意為"粘貼" 的動詞"haru"。
搜索單元111在范例存儲單元120中搜索均類似于源語言輸入語句501 的范例，并且獲得例如圖19中所示的類似平行翻譯范例列表Le(步驟 S1002)。而且，翻譯單元112通過翻譯源語言輸入語句501例如產(chǎn)生如圖 20所示的中文語句2201和英文語句2202之一(步驟S1003)。
圖20中所示的中文語句2201和英文語句2202均具有含義"請不要忘記買(一張)郵票"。換言之，這些翻譯語句的每一句都補充了動作"買"，這與用戶的意圖不同。
為了在這種情況下實現(xiàn)恰當反映用戶所說意圖的翻譯過程，繼續(xù)如下所述進行該過程。從差異檢測過程到結果輸出過程(步驟S1004到S1006) 的過程與上述那些相同。于是將省略其詳細解釋。
圖21為示出了本范例中的差異檢測過程產(chǎn)生的差異信息列表Ld的范例的圖示。圖22為示出了本范例中的結果輸出過程輸出的顯示屏范例的圖示。如圖21和22所示，在本實例中，在搜索中未找到含有用戶希望表達的意為"粘貼"的動詞的平行翻譯范例組。于是，沒有顯示出含有意為"粘貼"的動詞的建議語句。然而，基于所顯示的建議語句，用戶能夠推測可以通過用動詞補充輸入語句來獲得適當?shù)姆g語句。
25假設在完成結果輸出過程之后，盡管在任何給出的建議語句中都不包括差異，但用戶輸入日文單詞來用意為"粘貼"的動詞補充該語句(步驟
S1007)。
該操作不是結束過程的操作(步驟S1008:否)，且已經(jīng)輸入了差異(步驟S1009:是)。于是，假設施加單元115判斷輸入的差異是否包括在差異信息列表Ld中(步驟S1010)。
在本實例中，輸入的差異不包括在差異信息列表Ld中(步驟S1010:否)。于是，假設施加單元115產(chǎn)生包括輸入差異的用戶差異信息U，將所產(chǎn)生的用戶差異信息U存儲到存儲單元中并將所選差異信息H設置成空白(步驟 S1012)。圖8中所示的用戶差異信息801代表在本實例中產(chǎn)生的用戶差異
"(曰息o
之后，執(zhí)行假設施加過程，從而能夠基于存儲的用戶差異信息801執(zhí) 行恰當反映用戶意圖的翻譯過程(步驟S1013)。
在本實例中，因為所選差異信息H是空白的(步驟S1401:是)，假設施加單元115基于用戶差異信息801產(chǎn)生新的源語言輸入語句S(步驟S1403)。更具體而言，假設施加單元115通過從用戶差異信息801刪除符號"("和 ")"來產(chǎn)生新的源語言輸入語句S。
接下來，假設施加單元115令翻譯單元112將新產(chǎn)生的源語言輸入語句S翻譯成目標語言來產(chǎn)生目標語言語句T(步驟S1404)。在本實例中，產(chǎn) 生圖20所示的中文語句2203和英文語句2204之一作為目標語言語句T。圖20中所示的中文語句2203和英文語句2204均為補充了用戶所意圖表達的動作"粘貼"的翻譯語句。
之后，更新單元116執(zhí)行更新過程(步驟S1014)。
在本實例中，所選差異信息H是空白的(步驟S1501:是)。于是，更新單元116執(zhí)行更新過程而不更新類似平行翻譯范例列表Le中的位置設置。
作為上述過程的結果，完成了更新過程并再次調(diào)用結果輸出過程(步驟 S1006)。結果，顯示出如圖23所示的顯示屏。如圖23所示，向源語言輸入語句字段2501中輸出新的源語言輸入語句，利用該新的源語言輸入語句能夠獲得忠實反映出用戶表達意圖的翻譯語句。而且，向目標語言語句字段2502中輸出通過翻譯新的源語言輸入語句獲得的翻譯語句。如上所述，即使用戶對目標語言了解不夠多，通過參考附于建議語句的缺失單詞或短語的類似表達和信息范例，用戶也能夠推測出機器翻譯設備要輸出充分反映用戶表達意圖的翻譯語句所需的信息。于是，用戶能夠容易地執(zhí)行操作來糾正源語言輸入語句。
在上述實施例中，更新單元116將產(chǎn)生了所選差異的平行翻譯范例組移動到類似平行翻譯范例列表的頂部，從而以較高優(yōu)先級在顯示屏上顯示平行翻譯范例組。除了這種設置之外，另一種可接受的設置是在之后執(zhí) 行的范例搜索過程中為產(chǎn)生了所選差異的平行翻譯范例組賦予較高優(yōu)先級。
在這種情況下，配置范例存儲單元120以在其中對應于平行翻譯范例組存儲表示平行翻譯范例組的優(yōu)先化程度的優(yōu)先級水平。在已經(jīng)在搜索中找到彼此具有相同相似水平的平行翻譯范例組的情況下，搜索單元111通過為具有較高優(yōu)先級水平的平行翻譯范例組賦予較高優(yōu)先級來執(zhí)行搜索。此外，更新單元116將分配給產(chǎn)生了所選差異的平行翻譯范例組的優(yōu)先級水平提高預定值。
利用這些設置，能夠找到更加適當?shù)钠叫蟹g范例組來從搜索中找到的平行翻譯范例組中檢測出適當?shù)牟町惒橛脩籼峁┧鶛z測的差異。
在上述實施例中，解釋了執(zhí)行如下兩種過程的范例通過將源語言輸入語句與經(jīng)編輯的范例反向翻譯語句進行比較來檢測差異的過程(例如步驟S1106);以及通過將反向翻譯輸入語句與經(jīng)編輯的范例反向翻譯語句進
行比較來檢測差異的過程(例如步驟S1107)。然而，用于檢測差異的方法不
限于該范例?？梢越邮艿牧硪环N設置是執(zhí)行以上兩種過程之一來檢測差異。在上述實施例中，在包括在建議語句中時輸出檢測到的差異，此外，通過基于用戶從建議語句選擇的差異對新產(chǎn)生的源語言輸入語句再次翻譯獲得恰當反映用戶意圖的翻譯語句。然而，用于輸出差異的方法不限于該范例中的方法。采用任何其他方法都是可接受的，只要該方法暗示能夠產(chǎn) 生至少通過補充差異來恰當反映用戶意圖的翻譯語句即可。例如，僅以列表形式輸出差異是可接受的設置。此外，用于執(zhí)行再次翻譯過程的方法不限于上述范例中的方法。例如，另一種設置是可接受的，其中，機器翻譯設備接收用戶通過參考輸出差異重新輸入的新源語言輸入語句并翻譯所接收的語句。
在上述具體范例中，如果假設在完成步驟S1006中的結果輸出過程之后，用戶已經(jīng)輸入日文單詞來為該語句補充意為"買"的動詞，該過程與不做任何調(diào)整地接受反向翻譯輸入語句的無變化語句，即在步驟S1001接收的源語言輸入語句的翻譯結果具有相同含義。如本文所述，通過進行差異比較過程來比較反向翻譯輸入語句和范例源語句，能夠確認機器翻譯設備輸出的翻譯結果是與用戶意圖忠實匹配的結果。
如上所述，在使用根據(jù)本實施例的機器翻譯設備時，能夠搜索包括類似于源語言輸入語句的范例的平行翻譯范例組，通過將平行翻譯范例組中包括的目標語言范例翻譯成源語言所獲得的反向翻譯語句與輸入語句或與進一步將輸入語句翻譯成目標語言的結果翻譯成源語言所獲得的另一個反向翻譯語句進行比較來檢測差異，并為用戶輸出所檢測到的差異。
換言之，利用積累了翻譯范例的基于范例的信息，能夠推測出說話者的意圖即為翻譯過程中所需的信息，只要僅忠實地翻譯出源語言語句的表面信息，說話者的意圖就很少反映在目標語言語句中。還可以為用戶提供這種信息，以提示用戶輸入補充信息。結果，能夠避免目標語言說話者接收到不同于用戶(即源語言說話者)意圖的一些內(nèi)容的情形。
接下來將參考圖24解釋根據(jù)本實施例的機器翻譯設備的硬件配置。
根據(jù)本實施例的機器翻譯設備包括諸如中央處理單元(CPU)51之類的控制裝置、諸如只讀存儲器(ROM) 52和隨機存取存儲器(RAM)之類53的存儲裝置、建立通往網(wǎng)絡的連接并進行通信的通信接口(I/F)54、諸如硬盤驅(qū)動器(HDD)和光盤(CD)驅(qū)動裝置之類的外存儲裝置、顯示裝置、諸如鍵盤和鼠標之類的輸入裝置、以及將這些構成單元彼此連接的總線61。該機器翻譯設備具有通用計算機可以使用的硬件配置。
可以通過在計算機可讀記錄介質(zhì)中以可安裝格式或可執(zhí)行格式記錄成文件來提供根據(jù)本實施例的機器翻譯設備執(zhí)行的機器翻譯計算機程序(在下文中稱為"機器翻譯程序")，所述計算機可讀記錄介質(zhì)例如為只讀光盤存儲器(CD-R0M)、軟磁盤(FD)、可記錄光盤(CE-R)和數(shù)字多用盤(DVD)等。
另一種設置是可接受的，即將根據(jù)本實施例的機器翻譯設備執(zhí)行的機器翻譯程序存儲在連接到像因特網(wǎng)的網(wǎng)絡的計算機中，從而經(jīng)網(wǎng)絡下載來提供機器翻譯程序。另一種設置是可接受的，其中，經(jīng)由像因特網(wǎng)那樣的網(wǎng)絡提供或分布由根據(jù)本實施例的機器翻譯設備執(zhí)行的機器翻譯程序。
此外，在另一種可接受的設置中，將根據(jù)本實施例的機器翻譯程序事
先集成到ROM等之中來加以提供。
根據(jù)本實施例的機器翻譯設備執(zhí)行的機器翻譯程序具有包括上述功能單元(例如輸入接收單元、選擇接收單元、翻譯控制單元和輸出單元)的模
塊配置。作為實際硬件配置，在CPU 51(即處理器)如上所述從存儲裝置讀取并執(zhí)行機器翻譯程序時將這些功能單元加載到主存儲裝置中，從而在主存儲裝置中產(chǎn)生這些功能單元。
權利要求
1、一種機器翻譯設備，其包括范例存儲單元，其彼此對應地存儲目標語言形式的多個目標語言范例和源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；輸入接收單元，其接收所述源語言形式的輸入語句；搜索單元，其在所述范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例；翻譯單元，其通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所述搜索中找到的所述多個目標語言范例中的所述一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生反向翻譯語句；檢測單元，其檢測所述反向翻譯語句和所述輸入語句之間的差異部分；以及輸出單元，其輸出所述差異部分。
2、根據(jù)權利要求1所述的設備，還包括產(chǎn)生單元，所述產(chǎn)生單元通過將所述差異部分添加到所述輸入語句來產(chǎn)生輸出語句，其中所述輸出單元輸出添加了所述差異部分的輸出語句。
3、根據(jù)權利要求1所述的設備，還包括選擇接收單元，所述選擇接收單元接收對輸出的所述差異部分中的一個差異部分的選擇，其中所述翻譯單元還通過將添加了所述差異部分中的所選擇的一個差異部分的輸入語句翻譯成所述目標語言的形式來產(chǎn)生所述目標語言語句，以及所述輸出單元還輸出所述目標語言語句。
4、根據(jù)權利要求3所述的設備，其中所述范例存儲單元還存儲與所述多個目標語言范例相對應的多個優(yōu)先級水平，所述多個優(yōu)先級水平分別表示所述多個目標語言范例優(yōu)先化的程度，所述搜索單元通過為所述多個目標語言范例中的一些目標語言范例賦予較高優(yōu)先級來執(zhí)行搜索，相比于所述多個目標語言范例中具有較低優(yōu)先級水平的其他目標語言范例，所述多個目標語言范例中的所述一些目標語言范例具有較高優(yōu)先級水平，以及所述設備還包括更新單元，所述更新單元將產(chǎn)生了包含所選差異部分的所述反向翻譯語句的目標語言范例的優(yōu)先級水平提高預定值。
5、根據(jù)權利要求1所述的設備，其中所述輸入接收單元還接收要添加到所述輸入語句的一個或多個單詞的輸入，所述翻譯單元還通過將添加了所接收的一個或多個單詞的所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生所述目標語言語句，以及所述輸出單元還輸出所述目標語言語句。
6、根據(jù)權利要求l所述的設備，其中所述范例存儲單元彼此對應地存儲所述多個目標語言范例和所述多個源語言范例，可以從所述多個源語言范例的每一個源語言范例中省略所述多個目標語言范例中對應一個目標語言范例所含的一個或多個單詞，以及所述檢測單元檢測從所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例省略的所述一個或多個單詞作為所述差異部分中的一個差異部分。
7、一種機器翻譯設備，其包括范例存儲單元，其彼此對應地存儲目標語言形式的多個目標語言范例和源語言形式的多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；輸入接收單元，其接收所述源語言形式的輸入語句；搜索單元，其在所述范例存儲單元中搜索所述多個目標語言范例中與所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例；第一翻譯單元，其通過將所述搜索中找到的所述多個目標語言范例中的一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生第一反向翻譯語句；第二翻譯單元，其通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所產(chǎn)生的目標語言語句翻譯成所述源語言的形式來產(chǎn)生第二反向翻譯語句；檢測單元，其檢測所述第一反向翻譯語句和所述第二反向翻譯語句之間的差異部分；以及輸出單元，其輸出所述差異部分。
8、根據(jù)權利要求7所述的設備，還包括產(chǎn)生單元，所述產(chǎn)生單元通過將所述差異部分添加到所述輸入語句來產(chǎn)生輸出語句，其中所述輸出單元輸出添加了所述差異部分的輸出語句。
9、根據(jù)權利要求7所述的設備，還包括選擇接收單元，所述選擇接收單元接收對所述差異部分中的一個差異部分的選擇，其中所述第二翻譯單元還通過將添加了所述差異部分中的所選擇的一個差異部分的輸入語句翻譯成所述目標語言的形式來產(chǎn)生所述目標語言語句，以及所述輸出單元還輸出所述目標語言語句。
10、根據(jù)權利要求9所述的設備，其中所述范例存儲單元還存儲與所述多個目標語言范例相對應的多個優(yōu)先級水平，所述多個優(yōu)先級水平分別表示所述多個目標語言范例優(yōu)先化的程度，所述搜索單元通過為所述多個目標語言范例中的一些目標語言范例賦予較高優(yōu)先級來執(zhí)行搜索，相比于所述多個目標語言范例中具有較低優(yōu)先級水平的其他目標語言范例，所述多個目標語言范例中的所述一些目標語言范例具有較高優(yōu)先級水平，以及所述設備還包括更新單元，所述更新單元將產(chǎn)生了包含所選差異部分的所述反向翻譯語句的目標語言范例的優(yōu)先級水平提高預定值。
11、根據(jù)權利要求7所述的設備，其中所述輸入接收單元還接收要添加到所述輸入語句的一個或多個單詞的輸入，所述第二翻譯單元還通過將添加了所接收的一個或多個單詞的所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生所述目標語言語句，以及所述輸出單元還輸出所述目標語言語句。
12、根據(jù)權利要求7所述的設備，其中所述范例存儲單元彼此對應地存儲所述多個目標語言范例和所述多個源語言范例，可以從所述多個源語言范例的每一個源語言范例中省略所述多個目標語言范例中對應一個目標語言范例所含的一個或多個單詞，以及所述檢測單元檢測從所述多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例省略的所述一個或多個單詞作為所述差異部分中的一個差異部分。
13、一種機器翻譯方法，其包括接收源語言形式的輸入語句；在范例存儲單元中搜索所述多個目標語言范例中與多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例，其中，所述范例存儲單元彼此對應地存儲目標語言形式的所述多個目標語言范例和所述源語言形式的所述多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句；通過將所述搜索中找到的所述多個目標語言范例中的所述一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生反向翻譯語句；檢測所述反向翻譯語句和所述輸入語句之間的差異部分；以及輸出所述差異部分。
14、一種機器翻譯方法，其包括接收源語言形式的輸入語句；在范例存儲單元中搜索所述多個目標語言范例中與多個源語言范例中匹配于或類似于所述輸入語句的一個源語言范例相對應的一個目標語言范例，其中，所述范例存儲單元彼此對應地存儲目標語言形式的所述多個目標語言范例和所述源語言形式的所述多個源語言范例，所述多個目標語言范例中的每一個目標語言范例的含義等價于所述多個源語言范例中對應一個源語言范例的含義；通過將所述搜索中找到的所述多個目標語言范例中的一個目標語言范例翻譯成所述源語言的形式來產(chǎn)生第一反向翻譯語句；通過將所述輸入語句翻譯成所述目標語言的形式來產(chǎn)生目標語言語句，并通過將所產(chǎn)生的目標語言語句翻譯成所述源語言的形式來產(chǎn)生第二反向翻譯語句；檢測所述第一反向翻譯語句和所述第二反向翻譯語句之間的差異部分；以及輸出所述差異部分。
全文摘要
本發(fā)明涉及用于機器翻譯的設備和方法。在一種機器翻譯設備中，在范例存儲單元中存儲目標語言形式的目標語言范例和源語言形式的源語言范例，同時彼此對應地保持目標語言范例和源語言范例。輸入接收單元接收所述源語言形式的輸入語句。搜索單元在所述范例存儲單元中搜索所述目標語言范例中對應于所述源語言范例中匹配或類似所述輸入語句的一個范例的一個范例。翻譯單元通過將所述搜索中找到的所述目標語言范例之一翻譯成所述源語言形式來產(chǎn)生反向翻譯語句。檢測單元檢測所述反向翻譯語句和所述輸入語句之間的差異部分。輸出單元輸出所述差異部分。
文檔編號G06F17/28GK101520777SQ200910007558
公開日2009年9月2日申請日期2009年2月23日優(yōu)先權日2008年2月28日
發(fā)明者知野哲朗, 釜谷聰史, 降幡建太郎申請人:株式會社東芝

完整全部詳細技術資料下載

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：釜谷聰史;知野哲朗;降幡建太郎
技術所有人：株式會社東芝
我是此專利的發(fā)明人

上一篇：用于顯示醫(yī)學圖像信息的裝置和方法以及成像系統(tǒng)的制作方法
上一篇：多粒度并行化編譯方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

基于統(tǒng)計的機器翻譯相關技術

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

用于機器翻譯的設備和方法