專利名稱::一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及各種語(yǔ)言機(jī)器翻譯,尤其是用于機(jī)器的數(shù)碼語(yǔ)言語(yǔ)義庫(kù)。
背景技術(shù):
:目前語(yǔ)言機(jī)器翻譯所使用的依據(jù)為字庫(kù)(GB2312)與詞庫(kù)(GB1375),詞庫(kù)的主要內(nèi)容來(lái)源是詞典,從編碼程序所使用的無(wú)論音碼、形碼、音形碼都是詞典的特征。而詞典,歷來(lái)是為人服務(wù)的,只作參考,判斷、選擇學(xué)習(xí)使用,以它為基礎(chǔ),就需要使機(jī)器具有像人一樣的思維判斷能力?,F(xiàn)有辦法是設(shè)置各種技術(shù)參數(shù),識(shí)別模塊和矢量模塊,由于語(yǔ)言是一門(mén)相當(dāng)復(fù)雜的科學(xué),專家們都說(shuō)是扯不斷理還亂,很難通過(guò)一些設(shè)置的語(yǔ)義樹(shù)、實(shí)量剪枝、虛量剪枝各種參數(shù)等技術(shù)過(guò)程解決所有的問(wèn)題,所以最終翻譯的效果可想而知。目前的機(jī)器智能有限,自然語(yǔ)言信息處理的主要目的是使機(jī)器懂得和理解人類的自然語(yǔ)言,也就是使機(jī)器能模擬人類的語(yǔ)言機(jī)制,而目前階段寄希望機(jī)器能達(dá)到與人類一樣智商是極不現(xiàn)實(shí)的。目前普遍采用的技術(shù)是提取原文與詞庫(kù)比對(duì)切分,根據(jù)詞生成語(yǔ)義單元表示庫(kù)(樹(shù))將識(shí)別詞展開(kāi)進(jìn)行語(yǔ)義分析、剪切、選擇最后確定語(yǔ)義,稱之謂基于語(yǔ)義翻譯。下面引用申請(qǐng)?zhí)?00310011433.X一段原文"提取原文一句根據(jù)語(yǔ)義單元表示庫(kù)(樹(shù)),對(duì)該句進(jìn)行分析,從而得到該句的句義表達(dá)式,根據(jù)語(yǔ)義單元表示庫(kù),將該句義表達(dá)式用目的的語(yǔ)種(目的語(yǔ)種詞庫(kù))的表達(dá)展開(kāi),將展開(kāi)后的句子作為譯文輸出"(說(shuō)明書(shū)第一頁(yè)第二十行開(kāi)始至二十三行)本段內(nèi)容揭示目前所有語(yǔ)言翻譯普遍采用的方法。眾所周知,語(yǔ)言是由詞組成的,詞是由音、形、義構(gòu)成的,其中音與形是各語(yǔ)種特征,而義是在各語(yǔ)種之間通用的,只有義的存在各語(yǔ)種之間才能互通。如果只把義存儲(chǔ)在機(jī)器內(nèi),任何語(yǔ)種只要把音與形貼上去,就成為任何語(yǔ)種的完整語(yǔ)言了。單純的義盡管能在各種語(yǔ)言之間隨意互換還遠(yuǎn)不能達(dá)到翻譯的目的,還要適用各語(yǔ)種自己的語(yǔ)言習(xí)慣,這就需要語(yǔ)種之間通過(guò)句法關(guān)系調(diào)整,而句法關(guān)系又需要每個(gè)詞詞性特征、語(yǔ)義特征、語(yǔ)言環(huán)境,沒(méi)有這些句法關(guān)系是無(wú)法實(shí)現(xiàn)的。針對(duì)上述情況,本發(fā)明提供了一種綜合解決方法。
發(fā)明內(nèi)容本發(fā)明的一個(gè)方面,提供用于機(jī)器語(yǔ)言翻譯的數(shù)碼語(yǔ)義庫(kù)的數(shù)碼,是由阿拉伯?dāng)?shù)碼組成、縱向分為若干個(gè)檔次,第一檔為兩位數(shù),從0099,第二檔為四位數(shù)從00009999,它是第一檔次任何一組數(shù)值擴(kuò)大100倍,以此類推,每增加一檔次都增兩位數(shù),具體表示如下:例第一檔次中的99在第二檔下分99009999,同樣第二檔次9999在第三檔次下分999900999999,如果共設(shè)九個(gè)檔次,那么共含有IOO億億個(gè)數(shù)碼組,也就說(shuō)可設(shè)100億億個(gè)語(yǔ)義點(diǎn)。也可以用字母表示或符號(hào)表示,第一檔M、AB、AC......,第二檔AAAA、AMB、MAC......,第三檔MAAM、AAAAAB、AAAAAC......。每檔次可以是1位數(shù),也可以是三位數(shù),位數(shù)少檔次多、位數(shù)多檔次少。本發(fā)明的另一個(gè)方面,提供的一種供機(jī)器語(yǔ)言翻譯應(yīng)用數(shù)碼語(yǔ)言語(yǔ)義庫(kù),語(yǔ)義庫(kù)內(nèi)的語(yǔ)義,沒(méi)有語(yǔ)音標(biāo)識(shí)語(yǔ)義,也沒(méi)有字型標(biāo)識(shí)語(yǔ)義,只有數(shù)碼組供機(jī)器識(shí)別、運(yùn)算,所以稱為機(jī)器數(shù)碼語(yǔ)言。以語(yǔ)義為識(shí)別目的的語(yǔ)義庫(kù),語(yǔ)義庫(kù)內(nèi)容是由若干個(gè)語(yǔ)義單元組成,每個(gè)語(yǔ)義單元只有一個(gè)語(yǔ)義,也就是本發(fā)明稱之謂基本語(yǔ)義點(diǎn)。由于沒(méi)有音碼、形碼,只有語(yǔ)義,所以本語(yǔ)義庫(kù)內(nèi)的基本語(yǔ)義點(diǎn)只要與任何一種語(yǔ)言的語(yǔ)義點(diǎn)相同,該語(yǔ)種相對(duì)應(yīng)的音、形即為該語(yǔ)種語(yǔ)言。本發(fā)明的另一個(gè)方面,提供了一種機(jī)器識(shí)別每個(gè)基本語(yǔ)義點(diǎn)的外部特征——即詞性特征、背景領(lǐng)域的方法,本發(fā)明對(duì)每個(gè)基本語(yǔ)義點(diǎn)都配有一組數(shù)碼,縱向的數(shù)碼排列設(shè)立若干個(gè)檔,第一檔兩位數(shù),在這范圍內(nèi)基本語(yǔ)義點(diǎn)代表最高領(lǐng)域和最大詞性區(qū),每增加兩位數(shù)為下一個(gè)檔次,在這一范圍內(nèi)基本語(yǔ)義點(diǎn)是上一檔次領(lǐng)域所屬范圍,其詞性特征為中詞性區(qū)或者小詞性區(qū),同檔次內(nèi)只有最后兩位數(shù)之間數(shù)值差,在這一范圍內(nèi)所有基本語(yǔ)義點(diǎn)、語(yǔ)義相近、詞性相同領(lǐng)域相同,因此彼此被稱為并列關(guān)系。模向不同檔次之間差別是第一位數(shù)不同,在這一范圍內(nèi),所有的基本語(yǔ)義點(diǎn)詞性不同領(lǐng)域不同,不同檔次之間關(guān)系被稱為交叉關(guān)系。把所有的基本語(yǔ)義點(diǎn)按詞性特征所屬領(lǐng)域、范圍、語(yǔ)義特征分門(mén)別類,按以上規(guī)則進(jìn)行有序列排序,組成機(jī)器數(shù)碼語(yǔ)義庫(kù),也就成為機(jī)器數(shù)碼語(yǔ)言。本發(fā)明的另一個(gè)方面,提供了一種供機(jī)器識(shí)別數(shù)碼語(yǔ)義庫(kù)所有的基本語(yǔ)義點(diǎn),同一格式內(nèi),對(duì)并排配備的兩種以上音、形不同的語(yǔ)種,機(jī)器會(huì)自動(dòng)在兩種以上語(yǔ)種間任意互換,由于基本語(yǔ)義點(diǎn)自身所顯示的詞性特征,所屬領(lǐng)域,背景環(huán)境完全一致,機(jī)器按設(shè)定語(yǔ)法規(guī)則、句法公式指令、進(jìn)行先后順序之間交換,達(dá)到符合各語(yǔ)種的自身語(yǔ)言習(xí)慣互譯。本發(fā)明的另一個(gè)方面,提供一種供機(jī)器識(shí)別數(shù)碼語(yǔ)義庫(kù)內(nèi)所有的基本語(yǔ)義點(diǎn)在數(shù)碼縱向、橫向檔次內(nèi)所標(biāo)示的位置顯示其詞性特征,其中按語(yǔ)法規(guī)則、把12種詞性在本庫(kù)內(nèi)設(shè)為大詞性區(qū),以名詞為例,在名詞大詞性區(qū)內(nèi)下分可移動(dòng)物與不可移動(dòng)物為中詞性區(qū),自動(dòng)與它動(dòng)為小詞性區(qū),自動(dòng)區(qū)所屬動(dòng)物、植物,其中動(dòng)物又分為人、禽、獸、昆蟲(chóng)、魚(yú)。在動(dòng)詞大詞性區(qū)下設(shè)及物詞區(qū)與不及物詞區(qū),及物中詞性區(qū)下設(shè)及可移動(dòng)詞區(qū)與及不可移動(dòng)詞區(qū),及可移動(dòng)小詞性區(qū)下設(shè)被趨動(dòng)詞詞區(qū)及驅(qū)動(dòng)詞詞區(qū)。動(dòng)詞作用與名詞區(qū)相關(guān),其中名詞自動(dòng)詞區(qū)是支配動(dòng)詞被趨動(dòng)詞詞區(qū),名詞不可移動(dòng)是接受被趨動(dòng)詞詞區(qū)。副詞大詞性區(qū)內(nèi)下分設(shè)程度、頻率等中詞性區(qū),以下又分設(shè)小詞性區(qū)等,其它九種以此類推。所有語(yǔ)義點(diǎn),根據(jù)其詞性與語(yǔ)義特征分別按以上方法一一分列,其目的使機(jī)器對(duì)所有基本語(yǔ)義點(diǎn)的詞性特征、語(yǔ)義特征、背景特征等所有的外圍關(guān)系、都有更確切了解,供機(jī)器在句法公式計(jì)算中更準(zhǔn)確的判斷與限定。本發(fā)明的另一個(gè)方面,提供一種機(jī)器識(shí)別的數(shù)碼語(yǔ)義庫(kù)內(nèi)的所有基本語(yǔ)義點(diǎn)的詞性標(biāo)識(shí),在語(yǔ)義庫(kù)內(nèi)所有的詞性區(qū)都分別標(biāo)示不同顏色,其目的就是當(dāng)個(gè)別短語(yǔ)無(wú)論通過(guò)句法公式識(shí)別、
背景技術(shù):
識(shí)別語(yǔ)言環(huán)境識(shí)別都相同,顯示幾種可能性都存在時(shí),這幾種句型同時(shí)顯示出來(lái),供輸入人員識(shí)別進(jìn)行二次手動(dòng)干預(yù)確認(rèn)。在錄入各種名稱時(shí)要對(duì)名稱詞語(yǔ)標(biāo)示名詞顏色輸入。本發(fā)明的另一個(gè)方面,提供了一種機(jī)器識(shí)別數(shù)碼語(yǔ)義庫(kù)內(nèi)的基本語(yǔ)義點(diǎn)的邏輯排序規(guī)律、方法與應(yīng)用關(guān)系??v向排列檔次內(nèi)為從屬關(guān)系,數(shù)碼位數(shù)多的從屬于位數(shù)少的檔次,是語(yǔ)言環(huán)境,背景關(guān)系判斷依據(jù)。同檔次內(nèi)數(shù)值之間差異為并列關(guān)系,所有的基本語(yǔ)義點(diǎn)各自外部特征完全一致,各自作用獨(dú)立??v向排列內(nèi)所有的基本語(yǔ)義點(diǎn)所對(duì)應(yīng)的數(shù)碼第一位數(shù)相同,第一位數(shù)不同為另一領(lǐng)域,不同領(lǐng)域之間的語(yǔ)義交叉為交叉關(guān)系,這種關(guān)系設(shè)置是根據(jù)大、中、小詞性區(qū)的詞性特征,設(shè)定可交叉區(qū)和不可交叉區(qū),可交叉區(qū)為交叉關(guān)系。不可交叉為對(duì)立關(guān)系,這就需要對(duì)每一個(gè)基本語(yǔ)義點(diǎn),仔細(xì)斟酌,綜合各方面因素歸類排列。本發(fā)明的另一個(gè)方面,提供了一種機(jī)器識(shí)別數(shù)碼語(yǔ)義庫(kù)內(nèi)的所有基本語(yǔ)義點(diǎn)的背景關(guān)系識(shí)別方法,通過(guò)縱向第一位數(shù)、前三位、五位、七位數(shù)碼相同可確定為背景關(guān)系中的語(yǔ)言環(huán)境,對(duì)句子形式增加一種識(shí)別方法,特別是針對(duì)詞性一樣,句子形式又一樣的詞,可以在句子的上下句中尋找同領(lǐng)域的背景,做優(yōu)先級(jí)確定,而這只需在前一位數(shù)或者前三位、五位數(shù)相同就可以確定背景、語(yǔ)言環(huán)境,機(jī)器優(yōu)先級(jí)選擇以相同位數(shù)多確定最佳優(yōu)先級(jí)。本發(fā)明另一個(gè)方面,提供了一種供機(jī)器識(shí)別數(shù)碼語(yǔ)義庫(kù)內(nèi)的所有的基本語(yǔ)義點(diǎn),在不同句子形式上的作用,由于所有基本語(yǔ)義點(diǎn)都是根據(jù)語(yǔ)法規(guī)則確定詞性特征,傳統(tǒng)的詞性已不能滿足本發(fā)明的句法要求,只有原有的詞性加以細(xì)劃,才能滿足新的句法,例被趨動(dòng)詞詞區(qū)的走、跑、至lj、來(lái)、去等,與名詞劃分中動(dòng)物、處所、時(shí)間、服飾、建材等各詞詞區(qū)在句法結(jié)合是不一致的,其中動(dòng)物名詞詞區(qū)是支配動(dòng)詞被趨動(dòng)詞詞區(qū)的,而處所各詞詞區(qū)只能接受動(dòng)詞被趨動(dòng)詞詞區(qū)。例副詞內(nèi)程度副詞和頻率副詞,前者只能修飾形容詞,后者只能與動(dòng)詞結(jié)合,所以確定特別是劃分中小詞性區(qū)特征及詞性間關(guān)系,在設(shè)句法公式,判斷識(shí)別語(yǔ)義是至關(guān)重要依據(jù)。確定背景環(huán)境是根據(jù)語(yǔ)義的從屬關(guān)系,設(shè)立新的句法公式。因?yàn)橐环N句法關(guān)系可對(duì)應(yīng)多種語(yǔ)義關(guān)系,一種語(yǔ)義關(guān)系也可通過(guò)多種句法關(guān)系表現(xiàn)。句法形式有限而語(yǔ)義無(wú)限,以有限的形式表達(dá)無(wú)限的內(nèi)容,必然產(chǎn)生一對(duì)多的結(jié)果,給機(jī)器在處理句法形式設(shè)立更多的可比性選擇、設(shè)置更多的唯一性選擇,是提高語(yǔ)言翻譯質(zhì)量的唯一方法。結(jié)合下面附圖,對(duì)本發(fā)明作進(jìn)一步說(shuō)明。圖1A、圖1B、圖1C是根據(jù)本發(fā)明通用數(shù)碼語(yǔ)義庫(kù)中截取的三個(gè)片斷,關(guān)于詞匯中的老字根據(jù)詞性特征、詞義特征進(jìn)行分解、直到不可再分解為止,形成多個(gè)獨(dú)立的語(yǔ)義,建立基本語(yǔ)義點(diǎn)的一個(gè)實(shí)例其中圖1A是動(dòng)詞詞區(qū)、圖1B為形容詞詞區(qū)、圖1C為副詞區(qū),圖中每個(gè)數(shù)碼組為一個(gè)獨(dú)立的基本語(yǔ)義點(diǎn),數(shù)碼下方所列,目前所示為中文,可以是任何語(yǔ)種相同義的音和形,也可以多種語(yǔ)言并列,括號(hào)所列為同義詞、所有同義詞只有一個(gè)基本語(yǔ)義點(diǎn),設(shè)立一個(gè)詞為優(yōu)先級(jí),死字為動(dòng)詞老的優(yōu)先級(jí),很字為程度詞區(qū)老字的優(yōu)先級(jí),經(jīng)常為頻率詞區(qū)老的優(yōu)先級(jí),許久為時(shí)態(tài)詞區(qū)老字的優(yōu)先級(jí)。在形容詞區(qū)及動(dòng)物詞區(qū)老字語(yǔ)義為年齡,及物稱詞區(qū)老字語(yǔ)義為陳舊,及植物詞區(qū)老字語(yǔ)義為過(guò)期。有少部分同義詞、因語(yǔ)法作用不同、在該同義詞下一檔次、另行設(shè)立數(shù)碼組和詞性代碼。圖2是根據(jù)本發(fā)明關(guān)于詞的三要素,義的功能特征展示,只有義才能體現(xiàn)出詞性特征、背景特征、句法特征,而音與形只是各種語(yǔ)言的外部特征。圖中音A與形A和音B與形B,說(shuō)明是A種語(yǔ)言或B種語(yǔ)言,它們的交換點(diǎn)必須是同一個(gè)義,只有保證在同一個(gè)義條件交換才能達(dá)到互通互譯準(zhǔn)確性。圖3是根據(jù)本發(fā)明數(shù)碼語(yǔ)義庫(kù)的片斷,其中數(shù)碼組代表基本語(yǔ)義點(diǎn),字母代表詞性區(qū),字母少代表詞性區(qū)大,字母組多代表詞性區(qū)相對(duì)小,從屬大詞性區(qū),圖中全部為名詞區(qū),其中自動(dòng)詞詞區(qū)范圍可支配動(dòng)詞區(qū)的被趨動(dòng)詞詞區(qū)范圍,例走、跑、去、到、瑕L爬……,名詞不可移動(dòng)詞區(qū)為接受動(dòng)詞詞區(qū)被趨動(dòng)詞區(qū)范圍,名詞可移動(dòng)詞區(qū)接受趨動(dòng)詞區(qū)、例搬、拿、運(yùn)、挪、裝、卸……。這就是語(yǔ)法規(guī)則形成的環(huán)環(huán)相扣的結(jié)果。數(shù)碼組位數(shù)少代表語(yǔ)義領(lǐng)域大,數(shù)碼組位數(shù)愈多代表語(yǔ)義領(lǐng)域愈小,圖中每一個(gè)數(shù)碼組只代表一個(gè)獨(dú)立語(yǔ)義的基本語(yǔ)義點(diǎn),它們領(lǐng)域大小,背景環(huán)境以及從屬關(guān)系,并列關(guān)系都體現(xiàn)在數(shù)碼語(yǔ)義庫(kù)的排列組合上。具體實(shí)施例方式本發(fā)明的重點(diǎn)是語(yǔ)義庫(kù)內(nèi)每一個(gè)基本點(diǎn)的外圍特征作了多方面標(biāo)示,其目的就供機(jī)器通過(guò)語(yǔ)法規(guī)則與句法指令,對(duì)每一個(gè)基本語(yǔ)義點(diǎn)的詞性特征,特別是小詞性特征,語(yǔ)義背景特征,在實(shí)施語(yǔ)言交換時(shí)能準(zhǔn)確判斷、識(shí)別,以附圖1關(guān)于老字的運(yùn)用可看出,在基本語(yǔ)義庫(kù)內(nèi)共有7個(gè)老字,這在常規(guī)分詞的切分中,無(wú)論橫向掃描、逆向掃描匹配,都只能找出7個(gè)字形完全相同的,最終無(wú)法判斷是哪一個(gè)。根據(jù)本發(fā)明的句法指令,例他太老了。根據(jù)句法公式,程度副詞的太、非常、很都只能與形容詞結(jié)合,只有形容詞及動(dòng)物詞區(qū)的老(年齡)一個(gè),其它6個(gè)都不能匹配,這就給機(jī)器根據(jù)句法指令自動(dòng)識(shí)別、判斷提供了一個(gè)唯一選擇過(guò)程。由于是多語(yǔ)種進(jìn)行交換,有些與語(yǔ)種之間存在差異,以中英文對(duì)照,英文的動(dòng)詞就存在人稱差異、時(shí)態(tài)差異、單、復(fù)數(shù)差異,無(wú)法與中文的直接對(duì)接交換,下面結(jié)合表1對(duì)本發(fā)明關(guān)于寫(xiě)字有關(guān)在中英文之間匹配互換具體實(shí)施方法,表中數(shù)碼語(yǔ)義點(diǎn)就是我們所說(shuō)的基本語(yǔ)義點(diǎn),中文1是在實(shí)際輸入中文時(shí)利用機(jī)器內(nèi)句法公式與語(yǔ)義庫(kù),按最長(zhǎng)匹配法在語(yǔ)義庫(kù)內(nèi),掃描找到字符串,匹配成功后找到與其對(duì)應(yīng)的中文4優(yōu)先級(jí),在同一數(shù)碼語(yǔ)義點(diǎn)選擇英文2交換成功。英文的優(yōu)先級(jí)5內(nèi)a為第一人稱、b為其它人稱、c為復(fù)數(shù)、d為單數(shù),是英文的句法特征,是句子翻譯中人稱關(guān)系,單復(fù)數(shù)關(guān)系不可折解、必不可少的獨(dú)立語(yǔ)義,只能一一列出,才能達(dá)到完整互換的目的。下面結(jié)合表2與表3對(duì)本發(fā)明關(guān)于語(yǔ)言環(huán)境、背景選擇的實(shí)施方法,作進(jìn)一步說(shuō)明。英文的bank從表3看詞性特征Mfa而表4詞性特征同樣為Mfa,由于它們的數(shù)碼語(yǔ)義點(diǎn)不是一個(gè),其2330401為銀行,404030203為河岸,從數(shù)碼結(jié)構(gòu)看銀行的背景全部為233,這就是本發(fā)明所說(shuō)的語(yǔ)言環(huán)境,因?yàn)橥ㄟ^(guò)句法關(guān)系,可在上下全面搜索凡是含有233的貨幣、財(cái)產(chǎn)、支票等與上下句有關(guān)的詞,就可以確定是銀行,語(yǔ)言背景環(huán)境起到關(guān)健作用。由于本發(fā)明對(duì)名詞、動(dòng)詞結(jié)合有多種限定,例被支配與接受。bank為名詞不可移動(dòng)、處所名詞詞區(qū)與河岸一樣接受趨動(dòng)動(dòng)詞,而銀行還要接受專用動(dòng)詞詞區(qū),存款、取款、轉(zhuǎn)賬、匯款等有關(guān)動(dòng)詞詞區(qū),專用詞區(qū)是機(jī)器從句法公式的最優(yōu)先級(jí)選擇的另一個(gè)依據(jù)。下面結(jié)合表4、表5對(duì)本發(fā)明一個(gè)句子中國(guó)人熱愛(ài)祖國(guó)具體實(shí)施過(guò)程作進(jìn)一步說(shuō)明,表4為截取部分?jǐn)?shù)碼語(yǔ)義庫(kù)針對(duì)每個(gè)數(shù)碼語(yǔ)義點(diǎn)分別匹配中文l、英文2、詞性3、中文優(yōu)先級(jí)4、英文優(yōu)先級(jí)5,其中中文語(yǔ)義碼1290505內(nèi)有中國(guó)人、華人,在中文優(yōu)先級(jí)4,其優(yōu)先級(jí)只有中國(guó)人,語(yǔ)義碼302060117中文內(nèi)有祖國(guó)、故國(guó),在中文優(yōu)先級(jí)4中是祖國(guó),說(shuō)明即使說(shuō)華人熱愛(ài)故國(guó),經(jīng)優(yōu)先級(jí)選擇也只會(huì)是中國(guó)人熱愛(ài)祖國(guó)。表5是本發(fā)明的句法公式,它是依據(jù)語(yǔ)法規(guī)則;詞性特征,特別是重點(diǎn)針對(duì)中、小詞性區(qū)、不同詞性在句子中的關(guān)系,設(shè)定的句法公式。從表5的句法公式看出,這是一個(gè)雙向語(yǔ)言翻譯,中譯英、英譯中,語(yǔ)義交換,語(yǔ)序排列,都是依靠不同的句法公式同步完成的。表l<table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>語(yǔ)義庫(kù)<table>tableseeoriginaldocumentpage16</column></row><table>表5<table>tableseeoriginaldocumentpage16</column></row><table>發(fā)明的意義本發(fā)明意義在于-1、建立適合機(jī)器自動(dòng)識(shí)別各種自然語(yǔ)言的一種機(jī)器數(shù)碼語(yǔ)言,這種數(shù)碼語(yǔ)言,只有語(yǔ)義,沒(méi)有供人識(shí)別的音與形,只能供機(jī)器應(yīng)用,所以稱作機(jī)器語(yǔ)言。這種機(jī)器語(yǔ)言必須包括各種自然語(yǔ)言所有的基本語(yǔ)義點(diǎn),對(duì)于各種自然語(yǔ)言的語(yǔ)義點(diǎn),經(jīng)過(guò)機(jī)器語(yǔ)言的自動(dòng)識(shí)別,把自然語(yǔ)言自動(dòng)換算成為機(jī)器語(yǔ)言,根據(jù)語(yǔ)種選擇指令,機(jī)器又會(huì)把機(jī)器語(yǔ)言按指令自動(dòng)換算出另一種自然語(yǔ)言。2、機(jī)器語(yǔ)言分析各種自然語(yǔ)言的語(yǔ)義時(shí),利用的是語(yǔ)法規(guī)則以及句法公式,其識(shí)別程度及準(zhǔn)確性,都會(huì)是準(zhǔn)確無(wú)誤的,除非句法指令存在錯(cuò)誤,或由人為造成的語(yǔ)義不準(zhǔn)確。機(jī)器語(yǔ)言憑借數(shù)碼語(yǔ)義具備的各種功能使機(jī)器達(dá)到像人一樣思維能力分析能力以及綜合判斷能力。3、機(jī)器語(yǔ)言,在識(shí)別每一個(gè)語(yǔ)義時(shí),從詞性定義分析,達(dá)到了語(yǔ)言專家級(jí)水平,它己經(jīng)不是簡(jiǎn)單的從名、動(dòng)、形、數(shù)、量、代等詞性定義分析,而是從更細(xì)致語(yǔ)法規(guī)則、句法公式功能分析,在語(yǔ)言環(huán)境及各種詞性的交叉運(yùn)用關(guān)系處理上,對(duì)每一個(gè)語(yǔ)義點(diǎn)的外圍所存在的特征,都能進(jìn)行準(zhǔn)確計(jì)算。這些特征是判斷語(yǔ)義點(diǎn)語(yǔ)義必不可少的,只有從外圍特征才能準(zhǔn)確判斷語(yǔ)義,因?yàn)槿祟惖恼Z(yǔ)言交流也是憑借上述條件識(shí)別語(yǔ)言的。權(quán)利要求1、一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是把所有詞匯根據(jù)詞性特征、語(yǔ)義特征進(jìn)行分解,形成不可再分解的基本語(yǔ)義點(diǎn),按語(yǔ)義特征,詞性特征、背景環(huán)境、句法關(guān)系,分門(mén)別類進(jìn)行有規(guī)律排序,在基本語(yǔ)義點(diǎn)上按同義詞關(guān)系配置兩種以上語(yǔ)言,利用機(jī)器在各語(yǔ)種之間進(jìn)行以基本語(yǔ)義點(diǎn)實(shí)行任意互換,按語(yǔ)法規(guī)則、句法公式指令,使機(jī)器以語(yǔ)義庫(kù)所配置的各語(yǔ)種語(yǔ)義、句法關(guān)系公式進(jìn)行順序上的交換,從而實(shí)現(xiàn)符合各語(yǔ)種的語(yǔ)言規(guī)律的自動(dòng)對(duì)譯。2、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述通用數(shù)碼語(yǔ)義庫(kù)的通用性,是指語(yǔ)義庫(kù)內(nèi)的數(shù)碼組、基本語(yǔ)義點(diǎn)、詞性語(yǔ)義分解,語(yǔ)義特征、詞性特征、背景環(huán)境、句法關(guān)系等所有結(jié)構(gòu)程序適應(yīng)任何語(yǔ)種。3、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述通用數(shù)碼語(yǔ)義庫(kù)的數(shù)碼,是指語(yǔ)義庫(kù)內(nèi)所有基本語(yǔ)義點(diǎn)分別配置數(shù)碼組,用以區(qū)別所有的數(shù)碼語(yǔ)義庫(kù)內(nèi)的基本語(yǔ)義點(diǎn),沒(méi)有一個(gè)是相同的,數(shù)碼組每增加兩位數(shù)為一個(gè)檔次,同一檔次內(nèi)第一位數(shù)碼相同,不同檔次第一數(shù)碼不同,同檔次內(nèi)第一檔前一位數(shù)相同,第二檔次前二位數(shù)相同,第三檔次前四位數(shù)相同,以此類推,無(wú)論設(shè)多少檔次、數(shù)碼組除最后兩位數(shù)不同,前面的數(shù)碼一定要與被擴(kuò)大的數(shù)碼組相同。同一檔次僅最后兩位數(shù)值不同,被確定并列關(guān)系,前兩位數(shù)不同,被確定從屬關(guān)系,第一位數(shù)碼不同,是不同檔次被確定為交叉關(guān)系,形成機(jī)器數(shù)碼語(yǔ)義庫(kù)。4、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述通用數(shù)碼語(yǔ)義庫(kù)的語(yǔ)義,是根據(jù)詞的三要素"音、形、義"之一的"義"為主體編制的,是在現(xiàn)有的詞匯中經(jīng)過(guò)分解,建立不可再分解的基本語(yǔ)義點(diǎn),把所有的基本語(yǔ)義點(diǎn)按照語(yǔ)義特征所屬領(lǐng)域,從屬關(guān)系分門(mén)別類進(jìn)行有規(guī)則排列,組成數(shù)碼語(yǔ)義庫(kù)。5、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述在基本語(yǔ)義點(diǎn),是按同義詞關(guān)系配置兩種以上語(yǔ)言,是根據(jù)每一個(gè)語(yǔ)義,其基本語(yǔ)義點(diǎn)只有一個(gè),詞并不一定是一個(gè),所有同義詞只有一個(gè)基本語(yǔ)義點(diǎn),所對(duì)應(yīng)語(yǔ)種也是同一語(yǔ)義的所有同義詞。6、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述的詞性詞義分解,是根據(jù)基本語(yǔ)義點(diǎn)的詞性,確立大詞性區(qū)、中詞性區(qū)、小詞性區(qū),以語(yǔ)法規(guī)則的十二種詞性為大詞性區(qū),對(duì)于在同一詞性區(qū)同一詞存在語(yǔ)義不同的基本語(yǔ)義點(diǎn),根據(jù)基本語(yǔ)義點(diǎn)的多少,設(shè)立若干個(gè)中詞性區(qū)和小詞性區(qū),使所有語(yǔ)義庫(kù)內(nèi)的基本語(yǔ)義點(diǎn)都既不存在重復(fù),也不存在缺少。7、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述語(yǔ)義特征及詞性特征,是根據(jù)基本語(yǔ)義點(diǎn)的詞性特征,是依據(jù)不同詞性的語(yǔ)法功能、結(jié)合的性質(zhì)確定的,語(yǔ)義特征是根據(jù)語(yǔ)義的從屬關(guān)系、并列關(guān)系、交叉關(guān)系、對(duì)立關(guān)系的性質(zhì)。根據(jù)詞性與語(yǔ)義兩方面特征,確定每一個(gè)基本語(yǔ)義點(diǎn),在通用語(yǔ)義庫(kù)應(yīng)排列的位置。8、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述詞性特征,是在通用數(shù)碼語(yǔ)義庫(kù)內(nèi)、詞性區(qū)的不同詞性、分別進(jìn)行色彩標(biāo)識(shí),每一種詞性標(biāo)注一種顏色,對(duì)于具有兩種詞性,動(dòng)名詞用原詞性顏色與可變后詞性兩種顏色、混合顏色標(biāo)識(shí)。9、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述背景環(huán)境是根據(jù)基本語(yǔ)義點(diǎn)的語(yǔ)義屬性,劃分若干個(gè)領(lǐng)域,使所有基本語(yǔ)義點(diǎn)都按語(yǔ)義屬性,語(yǔ)義的內(nèi)涵與外延的范圍,確立屬性領(lǐng)域,從屬關(guān)系,每一個(gè)基本語(yǔ)義從所屬范圍,確定背景環(huán)境。10、根據(jù)權(quán)利要求1所述的一種供機(jī)器語(yǔ)言翻譯的通用數(shù)碼語(yǔ)義庫(kù),其特征是其中所述句法關(guān)系,是根據(jù)基本語(yǔ)義點(diǎn)所屬詞性區(qū)的詞性,依照語(yǔ)法規(guī)則、編制句法公式,機(jī)器根據(jù)句法公式指令進(jìn)行自動(dòng)語(yǔ)言翻譯,每一種語(yǔ)言都有一種語(yǔ)法公式,兩種語(yǔ)言之間有相同、也有不相同的,不相同部分根據(jù)句法公式調(diào)整,經(jīng)過(guò)機(jī)器進(jìn)行順序交換。全文摘要本發(fā)明提供了一種機(jī)器語(yǔ)言,它可以把各種自然語(yǔ)言依據(jù)語(yǔ)法規(guī)則,句法公式標(biāo)準(zhǔn)指令,對(duì)各種自然語(yǔ)言進(jìn)行邏輯分析、判斷,切分成若干個(gè)語(yǔ)義點(diǎn),換算成為機(jī)器語(yǔ)言,又可以根據(jù)語(yǔ)種指令,把經(jīng)過(guò)切分換算后機(jī)器語(yǔ)言,按指令換算成為指令語(yǔ)言,根據(jù)新的句法公式進(jìn)行重新排列,以切換后的自然語(yǔ)言輸出。它可以使各種自然語(yǔ)言之間進(jìn)行翻譯,也可以使機(jī)器做指令性操作,通過(guò)語(yǔ)音識(shí)別技術(shù),利用機(jī)器強(qiáng)大的運(yùn)算功能,有助于提高機(jī)器智化能的服務(wù)型機(jī)器。文檔編號(hào)G06F17/30GK101303692SQ20081001190公開(kāi)日2008年11月12日申請(qǐng)日期2008年6月19日優(yōu)先權(quán)日2008年6月19日發(fā)明者徐文和申請(qǐng)人:徐文和