国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于對視力受損用戶音頻輸出多字節(jié)字符的方法和系統(tǒng)的制作方法

      文檔序號:2820374閱讀:317來源:國知局
      專利名稱:用于對視力受損用戶音頻輸出多字節(jié)字符的方法和系統(tǒng)的制作方法
      技術領域
      本發(fā)明一般涉及數(shù)據(jù)處理系統(tǒng),尤其涉及向視力受損用戶輸出多字節(jié)字符。
      部分上由于難以使用計算機進行工作或進行文字處理,盲人或視力受損者難以成為勞動力。為了把視力受損者納入到勞動力中,已經(jīng)開發(fā)了對用戶用聲音輸出數(shù)據(jù)的系統(tǒng)。在這些系統(tǒng)中,計算機把數(shù)據(jù)存儲到文件中,用戶可命令計算機在揚聲器上用聲音輸出數(shù)據(jù),從而用戶可以聽見數(shù)據(jù)。在聽多字節(jié)語言的數(shù)據(jù)時,用戶使用這樣的聲音輸出系統(tǒng)是困難的?!岸嘧止?jié)語言”是這樣的語言,其中為了唯一地確定語言中的每個字需要多于一個的字節(jié)。換言之,語言中存在多于28(256)個字。多字節(jié)語言的字被稱為多字節(jié)字符。例如中文、日文、朝鮮文等基于漢字的多字節(jié)語言大約具有40000個字。
      在基于漢字的語言中,語法元素被稱為“漢字”。術語“語法元素”指的是某給定自然語言中能構成部分講話的單元。例如,英語語言中的語法元素是單詞。就這點而論,每個漢字是類似于英語語言中的單詞的高級語言符號。即,自然語言趨于具有三個等級的語言元素。最低的一個等級取決于專用字母表并和口語的語音相關。例如,英語語言中的第一級和最低級語言元素由字母組成。第三級語言元素是最高等級,并包含著那些傳遞完整創(chuàng)意表達的語言元素。在英語語言中,第三級由句子構成。第二等級的語言元素指的是術語“語法元素”。第二等級是中間等級的語言元素,在英文中,第二級由單詞構成。在中文中,第二級由漢字構成。
      漢字通常由一個或多個偏旁構成?!捌浴笔菨h字的一個部分,非常類似于字母是單詞的一部分。經(jīng)常,偏旁本身就是一個漢字。例如,

      圖1描繪意思是“騎”的漢字102,它由二個偏旁104和106構成。類似地,意思是“錢”的漢字108由二個偏旁110、112構成,而意思是“樹”的漢字114由三個偏旁116、118、120構成。對于組成某漢字的各偏旁,通常把其中一個偏旁確定為是部首。部首通常是漢字中最左邊的偏旁。然而,當一個偏旁在另一個偏旁的上面時,通常上面的偏旁是部首。此外,當某個漢字由二個偏旁組成并且一個偏旁包圍另一個偏旁時,外圍的偏旁是部首。例如,漢字102的部首是意思為“馬”的偏旁104。漢字108的部首是意思是“金子”或“金屬”的偏旁110,而漢字114的部首是意思是“木”的偏旁116。從圖1中還可以看出,漢字的部首和該漢字的意思具有緊密的關系。
      在基于漢字的語言中,大約有210個用來表示該多字節(jié)語言中的所有語法元素或所有漢字的偏旁。圖2給出中文中最常使用的從1到210編號的偏旁表。
      為了方便說英語的人使用中文,使用一種周知的被稱為“Wade-Giles系統(tǒng)”的中文拼音系統(tǒng),以把漢字和偏旁變換成它們的語音的英文式表示。例如,參見圖1,漢字114的發(fā)音是“shu4”。這表示輔音“sh”和“you”中的“u”元音組合。數(shù)字“4”表示其發(fā)音應采用的特定聲調(diào),例如當說話者提問時常常使用升調(diào)。不理解中文的人利用Wade-Geles系統(tǒng)可以在語音上發(fā)出中文。
      由于基于漢字的語言中大約有40000個漢字,許多漢字組發(fā)音類似,但意思完全不同。這些漢字發(fā)音相同是由于它們在語音上相同。例如,下述漢字都發(fā)音成“wong”,但每個字具有不同的意思黃王皇蝗徨由于多字節(jié)語言中許多字發(fā)音雷同,當音頻輸出系統(tǒng)向視力受損用戶輸出多字節(jié)字符時,固有地存在著多義性的問題,這是由于發(fā)音或聲音不能唯一地標識某個字,而是對應用于若干字。從而,用戶常常不能完全理解音頻輸出標志哪些字,因此,用戶有時難以理解音頻輸出的含義。當數(shù)據(jù)是一個相當短的短語的一部分并且用戶不能從該短語的語境確定字的意思時,更加以難以推出音頻輸出的含義。在計算機命令中常會發(fā)現(xiàn)這樣的短語,用戶和計算機交互時常常會遇到它們。從而,多字節(jié)語言中固有的多義性阻礙視力受限的用戶使用計算機以融入到勞動大軍中。由于每個字具有不同的象形表示,有視力的人不具有這樣的問題,因為從其象形表示用戶可以確定具體的字,并進而確定該具體字的含義。由于有視力的人天天都看到字,這幫助他們加深字的差異和含義,從而記住成千上萬個字。但是視力受損的人得不到這樣的視覺強化。需要改進用于視力受損的人的多字節(jié)字符輸出系統(tǒng),以便把視力受損的人更好地納入到勞動大軍中。
      提供一種改進型的消除多字節(jié)字符的語音的多義性的音頻輸出系統(tǒng),從而視力受損的人可以唯一地辨識與輸出相關的各個字。通過采用一種輔助音頻通道該改進的音頻輸出系統(tǒng)消除多義性,該輔助音頻通道同時輸出一個或多個聲音,從而辨別從主音頻通道輸出的字。即,在主通道上輸出字的發(fā)音,并且同時在輔助通道上輸出辨別聲音。二個通道上二種聲音的組合無岐義地確定向聽者輸出的字。事實上,本系統(tǒng)對視力受損的聽者帶來形態(tài)的唯一性或清晰性,并使聽者加深理解相似發(fā)音字之間的含義差異。
      依據(jù)本發(fā)明的第一方面,提供一種通過多個音頻通道向設備的用戶無岐義地輸出聲音的方法。該方法在第一音頻通道上輸出主聲音,當主聲音和多種含義有關時主聲音試圖向用戶傳遞單個含義。幾乎在輸出主聲音的同時,該方法在第二音頻通道上輸出輔助聲音,以消除主聲音的多義性,使用戶確定單個含義。
      依據(jù)本發(fā)明的第二方面,在計算機系統(tǒng)中提供一種音頻播放文件中包含的某語言的語法元素。該方法讀文件以得到語法元素,其中每個語法元素具有一個含義。該方法還音頻播放描述語法元素的含義的聲音,其中聲音既不傳遞語法元素的視覺特征也不傳遞語法元素的音頻特征。
      依據(jù)本發(fā)明的第三方面,提供一種輸出多字節(jié)字符的計算機。該計算機包括聲音子系統(tǒng)、輔助存儲器和主存儲器。聲音子系統(tǒng)在主通道和輔助通道上音頻播放聲音。輔助存儲部件包含多字節(jié)字符到其語音的交換。和每個多字節(jié)字符對應的語音表示說出該多字節(jié)字符時的聲音。多個多字節(jié)是多義性字在于這些多義性字的發(fā)音是相同的。主存儲器包含一個閱讀程序,后者讀文件以檢索從多個多義性字中選出的一個。該閱讀程序還訪問上述的變換以得到該選定的多義性字的發(fā)音,在聲音子系統(tǒng)的主通道上音頻播放該選定多義性字的發(fā)音,并且在輔助通道上音頻播放無岐義的聲音以便從多個多義性字中辨別出選定的多義性字。
      圖1描述三個中文字以及它們的組成偏旁。
      圖2描述中文中使用的偏旁。
      圖3概述本發(fā)明的一種優(yōu)選實施例所使用的三種多義性消除模式。
      圖4描述本發(fā)明的一種優(yōu)選實施例的三種多義性消除模式的例子。
      圖5描述一種適用于實現(xiàn)本發(fā)明的一種優(yōu)選實施例的計算機系統(tǒng)。
      圖6A更詳細地描述圖5的數(shù)據(jù)庫。
      圖6B更詳細地描述圖5的聲音變換表。
      圖6C更詳細地描述圖5的帶含義聲音表。
      圖7描述圖5中所示的閱讀程序所執(zhí)行的各步驟的流程圖。
      圖8A和8B描述在獲得要在輔助音頻通道上播放的輔助聲音時要執(zhí)行的步驟的流程圖。
      提供一種改進型的音頻輸出系統(tǒng),其消除多字節(jié)的發(fā)音中的多義性,從而視力受損的用戶能夠唯一性地辨別和輸出相關的字。本發(fā)明的一種優(yōu)選實施例通過采用輔助音頻通道消除多義性,該輔助音頻通道同時輸出一個或多個辨別從主音頻通道輸出的某個字的聲音。即,在主通道上音頻輸出某字的發(fā)音,并且同時在輔助通道上輸出辨別聲音。二個通道上的二種聲音的組合無岐義地使聽者辨別正在輸出的字。事實上,本系統(tǒng)對視力受損的聽者帶來形態(tài)的唯一性和清晰性,并使聽者加深理解相似發(fā)音字之間的含義差異。
      本改進型的音頻輸出系統(tǒng)采用二個音頻通道,即主通道和輔助通道,以向視覺受損的用戶無岐義地輸出漢字聲音。主通道音頻輸出字的發(fā)音,而輔助通道輸出一個和多個聲音,從而消除掉主通道上播放的字的多義性。一種優(yōu)選實施例具有三種模式(多義性消除模式),用于利用輔助音頻通道實現(xiàn)為聽者消除掉多字節(jié)字符的發(fā)音輸出中的多義性的目標。熟練的技術人員當然會理解,可以把許多其它模式用作本發(fā)明的一部分。
      圖3描述一種優(yōu)選實施例采用的三種多義性消除模式的概要。如表300表示,第一多義性消除模式在主通道上以主話音語音地播出某個字并在輔助通道上以輔助話音語音地播出采用該字的短語。術語“語音地播出”指的是系統(tǒng)輸出偏旁、字、短語或其它語言元素的語音聲音,仿佛由人說出該語言元素。該音頻輸出系統(tǒng)利用三種不同的輸出話音消除語音輸出的多義性主話音、輔助話音和異常話音。例如,和主通道相關的主話音可能是女性話音,輔助話音可能是男性話音,而且,如后面所述,在需要異常話音的某些情況下,可能采用男性低調(diào)話音。通過采用多種話音,聽者可以從音頻輸出中得到更多的含義。例如,聽者會知道總是由女性話音說出字,并用男性話音提供附加信息以便消除字的多義性。用戶可配置輸出話音的類型,從而用戶可以改變?nèi)魏屋敵鲈捯舻哪信暫透叩驼{(diào)。熟練的技術人員可理解作為本發(fā)明的一部分可以采用男聲、女聲、高調(diào)低調(diào)的許多不同的組合。此外,熟練的技術人員可理解本發(fā)明可以控制輸出話音的其它品質。例如,某種輸出話音在揚聲器上播出時,可以表現(xiàn)成是移動或者表現(xiàn)成是靠近的或離開的。這種品質上的控制也用于向用戶提供更多的含義。
      如上面所述,在輔助音頻通道上第一多義性消除模式語音地播出短語,以便消除正在主音頻通道上語音地播出的字的多義性。在這種意義下,“短語”是在某雙字短語中應用該字,以使用戶通過利用該字在該短語中的語境辨別主通道上播出的字。由于在主音頻通道播出單個字的同時在輔助音頻通道上播出多字短語會放慢主通道,因此第一多義性消除模式的一種替代辦法是只在輔助音頻通道上播出短語中不同于主通道上播出的字的另一個字。以這種方式,該第一多義性消除模式的替代辦法可加快輸出處理。
      如表302中所示,第二多義性消除模式在主通道上以主話音語音地播出字,并且在常規(guī)情況下,在輔助通道上以輔助話音語音地播出該字的部首。輔助通道也具有某些例外使用,這將在后面說明。利用部首消除字的多義性是一種自然的辨別字的方法,因為部首和字的含義是緊密相關的,這可從圖1中的示例字和它們的部首看出。利用部首消除字的多義性的另一個好外是聽者可以確定具有類似偏旁(或相同字根)的字,其中盲人聽者是不能只從語音辨別出具有類似偏旁的字的。這種辨別各字之中的相同字根的能力使盲人聽者對語言具有更好的鑒別和理解。在第二多義性消除模式的替代辦法中,在正常情況下,輔助通道可以播出和部首的含義相關的有含義的聲音?!坝泻x的聲音”是和部首相關的聲音,該聲音傳遞偏旁的含義,但是該聲音并不和偏旁的其它視覺和聽覺特性(如它的象形表示或發(fā)音)相關聯(lián)。作為一個例子,對于圖1的木偏旁116,可以播出擊樹的聲音以對聽者傳遞有含義的聲音。
      如前面所述,除了正常使用輔助通道之外,在異常情況下可不同的使用輔助通道。由于第二多義性消除模式提供和部首相關的多義性消除聲音,存在著某些異常情況,在這些情況下單用多義性消除聲音不足以消除主通道上播出的字的多義性。當多個字發(fā)音相似并且同時具有相同的部首時會出現(xiàn)這些情況,后面會對此更詳細說明。在這些情況下,語音地播出這些字并且語音地播出部首對這些字的每一個產(chǎn)生完全相同的聲音,從而不能使用戶辨別這些字。通過在輔助通道上播出區(qū)分這些字的聲音,第二多義性消除模式處理這些異常情況。對于具有相同部首的多個發(fā)音相似的字之中的最常用字,以輔助話音語音地播出部首。字的常用性是通過它們在該語言(例如漢語)中通常如何頻繁使用確定的。備擇地,對于最常用的字,可播出其部首的有含義的聲音。相反,對于不那么最常用的字,第二多義性消除模式在輔助通道上以異常的話音語音地播出一個短語,從而用戶可根據(jù)該短語的語境辨別主通道所輸出的字。如前面所述,異常話音既和輔助話音不同也和主話音不同,從而聽者能區(qū)別出異常情況。
      表404中描述的第三多義性消除模式非常類似于第二多義性消除模式,即,主通道以主話音語音地播出字,并且,輔助通道在正常情況下或者以輔助話音語音地播出部首或播出部首的有含義的聲音。而且,對于具有相同部首的多個相似發(fā)音的字之中的最常用字,第三多義性消除模式語音地以輔助話音輸出部首(或部首的有含義的聲音)。但是,第二和第三多義性消除模式的不同在于用于處理不太常用的字的異常情況的方式。對于不太常用的字,輔助通道將播出和該字有關的或和其中帶有該字的周知短語有關的有含義的聲音。例如,對于圖1中的字114,有含義的聲音可能是把樹砍倒的聲音或者風穿過樹葉的聲音。作為另一個例子,對圖1的字108,第三多義性消除模式可能播出錢幣落下?lián)糁械匕宓穆曇?。第三多義性消除模式的一種替代方式是在各種情況(即正常情況和異常情況)播出字或短語的有含義的聲音。
      圖4描述“shih 4”Wade-Giles語音下所采用的三種多義性消除模式的例子。這些特定的語音映射成39個不同的字。對于這三種多義性消除模式,主音頻通道語音地播出字(即,shih 4)。下面說明的例子集中在輔助音頻通道的輸出上。為了消除從39個可能的字之中輸出的字的多義性(在列404中示出這些字中的一部分),第一多義性消除模式輸出和各個字相關的不同的雙字短語410。這些短語提供該字用法的示例,從而聽者可以根據(jù)該短語的語境辨別主音頻通道上播出的字。利用短語消除字的多義性是很重要的,這是由于對于不帶短語語境的口語者,通常單個字的本身不具有可辨認的含義。例如,字416本身是一個完全不能辨認的字,對于許多人而言未使用在短語中的該字不具有獨立的含義。從而,消除該字的多義性對聽者只傳遞極少的含義。但是,當在周知的短語,例如含義為“興趣”的短語418,中使用時,用戶根據(jù)該短語的語境可以無岐義地以有含義的方式確定該字。當在主通道上以主話音語音地播出其中的一個字(例如,416),第一多義性消除模式同時在輔助通道上語音地播出一個相應的短語(例如,418)以便消除該字的多義性。
      如前面所述,當在主通道語音地播出某字時,第二多義性消除模式在輔助通道上語音地播出部首以消除該字的多義性。然而,有時多個相似發(fā)音的字具有相同的部首,從而在這些情況下,在輔助通道上語音地播出部首對于從其它相似發(fā)音的字中辨別出主通道上播出的字起不了多少作用。在這樣的情況下,第二多義性消除模式語音地在輔助通道上播出一個短語以消除掉主通道上播出的字的多義性。圖4包括一些具有相同部首發(fā)音相似的字的例子。例如,字416和424具有相同的部首k’ou3,其含義是“口”。字420、426和428具有意思是“人”的相同部首jen2。字430、432、434、436和438具有相同的部首yen2(“言”),而字440和442都有意思是“移動”的相同部首ch’o4。如從列412中所看到的那樣,對于都具有相同偏旁的最常用字416、420、430、440,第二多義性消除模式在輔助通道上語音地播出部首(例如,444)。然而,對于具有相同偏旁的不太常用的字424、426、428、432、434、436、438、442,第二多義性消除模式在輔助通道上以異常話音播出列410中的相關短語(例如,446)。
      如上面所述,第三多義性消除模式在主通道上語音地播出字并且在輔助通道上語音地播出該字的部首。然而,在異常情況下,第三多義性消除模式播出帶有該字的某短語的有含義的聲音。列414描述當采用第三多義性消除模式時輔助通道上的示例輸出。如第二多義性消除模式那樣,當多個發(fā)音相似的字具有相同的部首時,第三多義性消除模式對最常用的字(例如,470、472、474和476)以輔助話音播出部首。然而,對于不太常用的字,第三多義性消除模式在輔助通道上播出有含義的聲音,以指示包含該字的某周知短語410的含義。替代地,若該字本身具有公認的含義,有含義的聲音可以以該字的含義為基礎。例如,對于字524,相關的短語的意思是“咬”,從而由第三多義性消除模式播出的有含義的聲音是某個人咬一口蘋果。作為另一個例子,用于字528的短語的意思是“侍者”,從而輔助通道上輸出的有含義的聲音是銀器掉下時發(fā)出的聲音。作為該技術的通則,當短語表示物體時,第三多義性消除模式播出該物體造成的聲音。例如,用于火車的字或短語會發(fā)出汽笛聲,用于小汽車的字或短語會發(fā)出撳喇叭聲,等等。
      作為第三多義性消除模式的替代辦法,可在各種情況下輸出短語的有含義的聲音,甚至在主通道沒有任何聲音的情況下。這種只輸出有含義的聲音而不語音地播出字的系統(tǒng),在試圖向不了解該語言的聽者傳遞詞的意思的情況下是有優(yōu)點的。
      圖5描述一種適用于實現(xiàn)本發(fā)明的優(yōu)選實施例的計算機。計算機500包括存儲器502、輔助存儲部件504、中央處理機(CPU)506、聲音子系統(tǒng)508、視頻顯示器510和輸入部件512。存儲器502包含優(yōu)選實施例的閱讀程序514,該程序負責讀出輔助存儲部件504中的文件516,并且負責在聲音子系統(tǒng)508上向用戶語音地播放該文件中的數(shù)據(jù)。輔助存儲部件504包含由閱讀程序514讀取的文件516;數(shù)據(jù)庫518,其包含多字節(jié)字符的字代碼對該字的語音變換;聲音變換表520,其把語音變換成聲音數(shù)據(jù),以使聲音子系統(tǒng)508發(fā)出適當?shù)穆曇?;帶含義聲音表521,其把字代碼變換成用于字和部首的有含義的聲音;以及諸如可從華盛頓州Redmod市的微軟公司購到的MICROSOFT WINDOWS 95的操作系統(tǒng)523,其管理聲音子系統(tǒng)508。聲音子系統(tǒng)508包括一個聲卡522和二個揚聲器524、525。聲卡522通過操作系統(tǒng)523從閱讀程序514接收數(shù)據(jù),并在二個揚聲器524、525上播出適當?shù)穆曇簟2僮飨到y(tǒng)523、聲卡522和揚聲器524、525可以同時播放二個音頻通道。盡管一種優(yōu)選實施例使用二個揚聲器,一個用于主音頻通道524,另一個用于輔助音頻通道525,熟練的技術人員可理解可在同一揚聲器上播放二個音頻通道。本發(fā)明的優(yōu)選實施例可應用下述系統(tǒng)中的對多字節(jié)字符的校對,該系統(tǒng)在共同未決的美國專利申請序號__中說明,該申請的題目是“從布萊葉盲文輸入部件無岐義地把多字節(jié)字符輸入到計算機中的方法和系統(tǒng)”,其和本文同日遞交并轉讓給同一受讓人,該申請從而是本文的參考資料。
      圖6A更詳細地描述數(shù)據(jù)庫516。數(shù)據(jù)庫516包含一些條目601和603,其中每條條目包含用于某特定漢字的信息。每條條目中的漢字是由字代碼602,例如Big 5字代碼,表示的。每條條目601、603包括相關字602的語音604,附加字606的字代碼,部首608的語音,以及是否存在聲音類似于該相關字并且部首相同的其它字的指示609。若存在這樣的其它字,則還存在該相關字是否是具有相同部首發(fā)音相似的各字之中的最常用字的指示(例如,611)。例如,用于條目601的指示611指出存在其它部首相同發(fā)音相似的字并且該相關字是最常用的。字的語音604是Wade-Giles語音,其用來確定發(fā)送到聲卡的恰當數(shù)據(jù),以在揚聲器上播出適當?shù)穆曇?。?06包含在含有字602的雙字短語中使用的另一個字的字代碼。即,閱讀程序所使用的短語(例如,第一多義性消除模式下)是雙字短語,其中主通道上輸出的字是該雙字中的一個,而另一個字和該字組合形成一個短語。在列606中指出該另一個字。列608包含第二、第三多義性消除模式中使用的部首的語音。
      圖6B更詳細地描述聲音變換表520。聲音變換表520包含一些條目,每條條目包括語音610和指針612,指針612指向聲卡引用的聲音數(shù)據(jù),聲卡使該語音的聲音在揚聲器上播出。聲音數(shù)據(jù)脫機地存儲在“WAV”文件中。WAV文件具有用于存儲聲音的周知文件格式,從而可把它發(fā)送到聲卡并在揚聲器上播出。當系統(tǒng)脫機時,數(shù)據(jù)存儲在WAV文件;然而在運行時,數(shù)據(jù)被裝入到存儲器中并在列612中存儲指向該數(shù)據(jù)的指針。請注意,未把指示語音聲調(diào)的數(shù)字存儲在聲音變換表520中。替代地,在把用于語音的聲音數(shù)據(jù)送到聲音子系統(tǒng)時,閱讀程序利用周知的技術修改聲音數(shù)據(jù)以得到適當?shù)穆曊{(diào)。一旦接收到聲音數(shù)據(jù),聲音子系統(tǒng)會以適當?shù)穆曊{(diào)播出適當?shù)恼Z音。
      圖6C更詳細地描述帶含義聲音表521。帶含義聲音表521包含從字代碼620到要為第三多義性消除模式中的字622播出的帶含義聲音的變換,以及為第二、第三多義性消除模式中使用的部首624播出的帶含義的聲音的變換。
      圖7描述閱讀程序執(zhí)行的步驟的流程圖。閱讀程序執(zhí)行的第一步驟是從輔助存儲部件上的文件讀出某個字(步驟702)。該文件是按字代碼存儲各字的,從而,在該步驟中,實際讀出一個字代碼。在讀出某個字代碼后,閱讀程序得到該字的語音(步驟704)。通過利用步驟702中接收到的字代碼作為數(shù)據(jù)庫516的索引訪問其中存儲著語音的該字的條目,閱讀程序得到該字的語音。接著,閱讀程序得到該語音的聲音數(shù)據(jù)(步驟706)。通過把數(shù)據(jù)庫條目中的語音變換成聲音變換表520中的語音,閱讀程序得到聲音數(shù)據(jù)。接著,閱讀程序得到該字的輔助聲音數(shù)據(jù)(步驟708)。在該步驟中,處理取決于所采用的具體多義性消除模式,并在下面參照圖8說明。
      獲取輔助聲音數(shù)據(jù)中執(zhí)行的第一步驟是判定是否采用第一多義性消除模式(步驟802)。若采用第一多義性消除模式,該字的輔助聲音數(shù)據(jù)是短語的聲音,從而閱讀程序訪問數(shù)據(jù)庫條目以得到短語中另一個字的字代碼,并且再訪問數(shù)據(jù)庫以得到另一個字的語音(步驟804)。在得到另一個字的語音后,閱讀程序既具有圖7步驟704得到的字的語音又具有另一個字的語音。然后閱讀程序訪問聲音變換表以得到另一個字的語音數(shù)據(jù)。
      若采用第二多義性消除模式(步驟806),閱讀程序訪問數(shù)據(jù)庫以判定該字是否具有其它部首相同發(fā)音相似的字(步驟808)。若不存在其它這樣的字,通過從數(shù)據(jù)庫訪問部首語音并訪問聲音變換表得到該部首語音的聲音數(shù)據(jù),閱讀程序得到該部首的輔助語音數(shù)據(jù)(步驟812)。替代地,輔助聲音數(shù)據(jù)可能是用于該部首的有含義的聲音。在這種情況下,訪問帶含義聲音表以獲得輔助聲音數(shù)據(jù)。然而,若存在部首相同聲音相似的多個字,閱讀程序判定該字是否是這些字中的最常用的字(步驟810)。若該字是最常用的,閱讀程序獲得該部首的聲音數(shù)據(jù)(步驟812)。若該字不是最常用的,閱讀程序如步驟804中所說明那樣得到短語的聲音數(shù)據(jù)。
      若判定未使用第二多義性消除模式(步驟806),閱讀程序明白正在使用第三多義性消除模式,并執(zhí)行由圖8B的步驟816-822反映的適當處理。若采用第三多義性消除模式,閱讀程序判定是否存在部首相同聲音相似的多個字(步驟816)。若不存在這樣的字,閱讀程序按步驟812中所述獲得部首的聲音數(shù)據(jù)(步驟820)。替代地,可在輔助通道上播出該部首的有含義的聲音。若采用這種替代辦法,可通過訪問帶含義聲音表得到輔助聲音數(shù)據(jù)。然而,若存在多個部首相同聲音相似的字,閱讀程序判定該字是否是最常用的(步驟818)。若該字是最常用的,閱讀程序得到該部首的聲音數(shù)據(jù)(步驟820)。若該字不是最常用的,閱讀程序利用字代碼訪問帶含義聲音表以得到該字的聲音數(shù)據(jù)(步驟822)。在執(zhí)行步驟812、814、820和822后,可得到輔助聲音數(shù)據(jù),并且因此處理返回。
      再參照圖7,在獲得輔助聲音數(shù)據(jù)后,閱讀程序在聲音子系統(tǒng)的主音頻通道上輸出該字的聲音數(shù)據(jù),并且在聲音子系統(tǒng)的輔助音頻通道上輸出輔助聲音數(shù)據(jù)(這是通過操作系統(tǒng)提供的周知功能達到的)(步驟710)。在輸出聲音數(shù)據(jù)時,若聲音數(shù)據(jù)代表語音,閱讀程序會適當?shù)卣{(diào)整聲調(diào)。接著,閱讀程序判定是否存在待讀的字(步驟712),若存在,處理繼續(xù)轉到步驟702。若不再存在待讀的字,處理結束。
      如上面所述的對輔助音頻通道的應用還可用于消除音頻輸出之外的其它輸出的多義性。在第一備擇的實施例中,系統(tǒng)通過布萊葉盲文I/O部件輸出多字節(jié)字符,以代替在主音頻通道上音頻輸出多字節(jié)字符。在共同未決的美國專利申請序號__中更詳細地說明這種相配的布萊葉盲文I/O部件,該申請的題目是“從布萊葉盲文輸出部件無岐義地把多字節(jié)字符輸入到計算機中的方法和系統(tǒng)”,其和本文同日遞交并轉讓給同一受讓人,前面已把該申請列為參考資料。在該第一備擇的實施例中,布萊葉盲文I/O部件輸出多字節(jié)字符并且一個揚聲器輸出用于輔助音頻通道的音頻輸出,前面說明過的輔助音頻通道采用三種多義性消除模式中的任一模式。因為用戶不必同時傾聽主音頻通道和輔助音頻通道,該系統(tǒng)對于視力受損的用戶是有優(yōu)點的。替代地,用戶能夠利用二種感覺理解數(shù)據(jù),即觸覺和聽覺。用戶在布萊葉盲文I/O部件上觸覺多字節(jié)字符,并且用戶監(jiān)聽音頻輸出,從而消除多字節(jié)字符的多義性。通過以這種方式利用二種感覺,用戶能夠更好地理解多字節(jié)字符。
      第二備擇的實施例在視頻顯示器510上向有視力的用戶顯示文件516。閱讀程序514逐次突出顯示文件516中的每個語法元素,從而用戶視覺上可看到該語法元素。在突出顯示每個多字節(jié)字符的同時,閱讀程序514在揚聲器上向用戶輸出聲音,以便對用戶傳遞該多字節(jié)字符的附加含義。在揚聲器上的聲音輸出將是上面說明的根據(jù)三種多義性消除模式中的任一模式的輔助音頻通道的輸出。當有學習障礙的人在理解書面語言遇到困難時,這種系統(tǒng)特別有用。通過揚聲器向用戶傳遞聲音,用戶能夠利用二種感覺,即視覺和聽覺,獲得對多字節(jié)字符的理解。利用二種感覺會幫助用戶更好地理解語法元素。此外,當根據(jù)上述第二、第三多義性消除模式揚聲器上輸出的聲音是語法元素的有含義的聲音時,用戶接收附加的信息,利用該附加信息用戶可以更好地理解語法元素。
      盡管參照一種優(yōu)選實施例說明了本發(fā)明,熟練的技術人員理解在不違背附屬權利要求書所定義的本要求權利的發(fā)明的精神和范圍下,可對其形式和細節(jié)作出各種修改。
      權利要求
      1.一種在計算機系統(tǒng)中輸出多字節(jié)字符的方法,該計算機系統(tǒng)具有一個揚聲器、一個包含各多字節(jié)字符的文件和每個多字節(jié)字符對主聲音及輔助聲音的一種變換,該方法包括以下步驟訪問該文件以檢索某個多字節(jié)字符;訪問該變換以得到該多字節(jié)字符的主聲音,其中多字節(jié)字符的主聲音是該多字節(jié)字符的語音,該語音是說出該多字節(jié)字符時產(chǎn)生的聲音,其中其它多字節(jié)字符具有相同語音,從而不能單靠主聲音唯一地辨別出該多字節(jié)字符;訪問該變換以得到該多字節(jié)字符的輔助聲音,其中輔助聲音傳遞該多字節(jié)字符的含義,從而當用戶聽主聲音和輔助聲音時,用戶可以把該多字節(jié)字符和其它的多字節(jié)字符區(qū)分開來;以及幾乎同時在揚聲器上輸出主聲音和輔助聲音,以使用戶能夠確定該多字節(jié)字符。
      2.根據(jù)權利要求1的方法,其中多字節(jié)字符包括一種偏旁,其中輔助聲音是說出該偏旁時所產(chǎn)生的聲音。
      3.根據(jù)權利要求2的方法,其中其它多字節(jié)字符包括一種偏旁,并且其中訪問該變換以得到輔助聲音的步驟包括確定至少一個的其它多字節(jié)字符的偏旁是否和該多字節(jié)字符的偏旁相同,并且當判定至少一個的其它多字節(jié)字符的偏旁和該多字節(jié)字符的偏旁相同時,定義輔助聲音,從而該輔助聲音區(qū)別該多字節(jié)字符和至少一個的其它多字節(jié)字符。
      4.根據(jù)權利要求3的方法,其中定義步驟包括把輔助聲音定義成某個其中包含著該多字節(jié)字符的多個多字節(jié)字符短語的語音,以使用戶能根據(jù)該短語的語境區(qū)別該多字節(jié)字符和至少一個的其它多字節(jié)字符。
      5.根據(jù)權利要求4的方法,其中各多字節(jié)字符是某種語言的一部分,并且其中定義步驟包括判定在該語言中使用的該多字節(jié)字符是否要比至少一個的其它多字節(jié)字符更為常用,并且當判定該多字節(jié)字符要比至少一個的其它多字節(jié)字符更為常用時,把輔助聲音定義成該多字節(jié)字符的部首的語音。
      6.根據(jù)權利要求3的方法,其中該多字節(jié)字符具有含義,并且其中定義步驟包括把輔助聲音定義成該多字節(jié)字符的有含義的聲音,從而該有含義的聲音描述該多字節(jié)字符的含義。
      7.根據(jù)權利要求6的方法,其中該多字節(jié)字符的含義是產(chǎn)生某種聲音的一個物體,并且其中定義步驟包括把輔助聲音定義成該物體產(chǎn)生的聲音。
      8.根據(jù)權利要求1的方法,其中輔助聲音表示一個其中帶有該多字節(jié)字符的短語,從而使用戶根據(jù)該短語的語境確定該多字節(jié)字符。
      9.一種通過多個聲頻通道對某種設備的用戶無多義性地輸出聲音的方法,該方法包括以下步驟在第一音頻通道上輸出試圖向用戶傳遞單個含義的主聲音,該主聲音和多種含義相關;以及幾乎在輸出主聲音的同時在第二音頻通道上輸出輔助聲音,以消除主聲音的多義性,從而用戶能夠確定單個含義。
      10.根據(jù)權利要求9的方法,其中主聲音表示某語言的某語法元素的語音,并且其中輔助聲音是該語法元素的用法,從而使用戶根據(jù)該用法的語境確定該語法元素。
      11.根據(jù)權利要求10的方法,其中該用法是一個包含該語法元素以及至少一個其它語法元素的短語。
      12.根據(jù)權利要求9的方法,其中語法元素是一個帶有含義的字根,并且其中輔助聲音是描述該字根的含義的聲音。
      13.根據(jù)權利要求9的方法,其中主聲音表示某語言的某語法元素的語音,并且其中輔助聲音是該語法元素的字根的語音。
      14.根據(jù)權利要求13的方法,其中語法元素是包含偏旁的漢字,并且其中輔助聲音代表偏旁的語音。
      15.根據(jù)權利要求14的方法,其中漢字包含多個偏旁,其中一個偏旁是部首,并且其中輔助聲音表示部首的語音。
      16.根據(jù)權利要求15的方法,其中該語言是中文。
      17.根據(jù)權利要求9的方法,其中主聲音反映語音,該語音表示某種語言的帶有含義的語法元素,并且其中輔助聲音是描述語法元素的含義的聲音。
      18.根據(jù)權利要求17的方法,其中語法元素是產(chǎn)生某種聲音的物體,并且其中輔助聲音是物體產(chǎn)生的聲音。
      19.一種在計算機系統(tǒng)中音頻輸出一個文件中所含有的某種語言的語法元素的方法,該方法包括以下步驟讀該文件以得到各語法元素,每個語法元素具有一個含義;以及音頻播出描述語法元素的含義的聲音,其中該聲音既不傳遞語法元素的視覺特征也不傳遞語法元素的聽覺特征。
      20.一種輸出多字節(jié)字符的計算機,包括一個聲音子系統(tǒng),用于在主通道上和輔助通道上播出聲音;一個輔助存儲部件,其包含多個多字節(jié)字符對多組語音的變換,和一個多字節(jié)字符對應的一組語音表示說出該多字節(jié)字符時產(chǎn)生的聲音,多個多字節(jié)字符是多義性的字在于這些多義性字的語音組都相同;以及一個含有一個閱讀程序的存儲器,該閱讀程序讀該文件以檢索各多義性字中選定的一個字;訪問該變換以得到該選定的多義性字的語音組;在聲音子系統(tǒng)的主通道上音頻播出該選定多義性字的語音組;并且在輔助通道上音頻播出多義性消除的聲音,以確定這些多義性字之中的哪一個是該選定的多性性字。
      21.根據(jù)權利要求20的計算機,其中多義性消除聲音是該選定的多義性字的用法。
      22.根據(jù)權利要求20的計算機,其中多字節(jié)字符包含至少一種具有語音的偏旁,并且其中多義性消除聲音是偏旁的語音。
      23.根據(jù)權利要求20的計算機,其中多義性多字節(jié)字符各具有不同的含義,并且其中多義性消除聲音是對選定的多義性字的含義的描述。
      24.根據(jù)權利要求20的計算機,其中多字節(jié)字符包含至少一種帶含義的偏旁,并且其中多義性消除聲音傳遞偏旁的含義。
      25.根據(jù)權利要求20的計算機,其中多字節(jié)字符是漢字。
      26.根據(jù)權利要求20的計算機,其中多字節(jié)字符是中文字。
      27.一種包含著用于控制計算機系統(tǒng)以輸出多字節(jié)字符的指令的計算機可讀媒體,該計算機系統(tǒng)具有一個揚聲器、一個包含各多字節(jié)字符的文件和每個多字節(jié)字符對主聲音及輔助聲音的一種變換,其通過執(zhí)行下述步驟進行控制訪問該文件以檢索某個多字節(jié)字符;訪問該變換以得到該多字節(jié)字符的主聲音,其中多字節(jié)字符的主聲音是該多字節(jié)字符的語音,該語音是說出該多字節(jié)字符時產(chǎn)生的聲音,其中其它多字節(jié)字符具有相同語音,從而不能單靠主聲音唯一地辨別出該多字節(jié)字符;訪問該變換以得到該多字節(jié)字符的輔助聲音,其中輔助聲音傳遞該多字節(jié)字符的含義,從而當用戶聽主聲音和輔助聲音時,用戶可以把該多字節(jié)字符和其它的多字節(jié)字符區(qū)分開來;以及幾乎同時在揚聲器上輸出主聲音和輔助聲音,以使用戶能夠確定該多字節(jié)字符。
      28.根據(jù)權利要求27的計算機可讀媒體,其中多字節(jié)字符包括一種偏旁,并且其中輔助聲音是說出該偏旁時所產(chǎn)生的聲音。
      29.根據(jù)權利要求28的計算機可讀媒體,其中其它多字節(jié)字符包括一種偏旁,并其其中訪問該變換以得到輔助聲音的步驟包括確定至少一個的其它多字節(jié)字符的偏旁是否和該多字節(jié)字符的偏旁相同,并且當判定至少一個的其它多字節(jié)字符的偏旁和該多字節(jié)字符的偏旁相同時,定義輔助聲音,從而該輔助聲音區(qū)別該多字節(jié)字符和至少一個的其它多字節(jié)字符。
      30.一種包含著用于控制某設備以通過多個音頻通道向用戶無多義性地輸出聲音的指令的計算機可讀媒體,其通過執(zhí)行下述步驟進行控制在第一音頻通道上輸出試圖向用戶傳遞單個含義的主聲音,該主聲音和多種含義相關;以及幾乎在輸出主聲音的同時在第二音頻通道上輸出輔助聲音,以消除主聲音的多義性,從而用戶能夠確定單個含義。
      31.根據(jù)權利要求30的計算機可讀媒體,其中主聲音表示某語言的語法元素的語音,并且其中輔助聲音是該語法元素的用法,從而使用戶根據(jù)該用法的語境確定該語法元素。
      32.根據(jù)權利要求30的計算機可讀媒體,其中該用法是一個包含該語法元素以及至少一個其它語法元素的短語。
      33.根據(jù)權利要求30的計算機可讀媒體,其中語法元素是一個帶有含義的字根,并且其中輔助聲音是描述該字根的含義的聲音。
      34.根據(jù)權利要求30的計算機可讀媒體,其中主聲音表示某語言的某語法元素的語音,并且其中輔助聲音是該語法元素的字根的語音。
      35.一種包含著用于控制計算機系統(tǒng)以音頻播出某文件中所包含的某語言的語法元素的指令的計算機可讀媒體,其通過執(zhí)行下述步驟進行控制讀該文件以得到各語法元素,每個語法元素具有一個含義;以及音頻播出描述語法元素的含義的聲音,其中該聲音既不傳遞語法元素的視覺特征也不傳遞語法元素的聽覺特征。
      36.一種用于在具有語法元素的計算機系統(tǒng)中輸出語法元素的方法,其包括以下步驟;對每個語法元素,向用戶輸出該語法元素;以及音頻向用戶輸出傳遞該語法元素的附加含義的聲音,以使用戶更好地理解該語法元素。
      37.根據(jù)權利要求36的方法,其中該計算機系統(tǒng)具有布萊葉盲文I/O部件,并且其中輸出語法元素的步驟包括在布萊葉盲文I/0部件上輸出語法元素。
      38.根據(jù)權利要求36的方法,其中該計算機系統(tǒng)具有視頻顯示器,并且其中輸出語法元素的步驟包括在該視頻顯示器上輸出語法元素。
      39.根據(jù)權利要求36的方法,其中該計算機系統(tǒng)具有揚聲器,并且其中輸出語法元素的步驟包括在該揚聲器上輸出語法元素。
      40.根據(jù)權利要求36的方法,其中輸出語法元素的步驟多義性地向用戶標記語法元素,并且其中音頻輸出聲音的步驟包括音頻輸出聲音,以使用戶能夠多義性消除地確定語法元素。
      41.一種包含著用于控制計算機系統(tǒng)以輸出語法元素的指令的計算機可讀媒體,其通過執(zhí)行下述步驟進行控制對每個語法元素,向用戶輸出該語法元素;以及音頻向用戶輸出傳遞該語法元素的附加含義的聲音,以使用戶更好地理解該語法元素。
      全文摘要
      一種音頻輸出系統(tǒng),其消除多字節(jié)字符的語音聲音中的多義性,從而視力受損的用戶可以唯一地確定與輸出關聯(lián)的字。通過采用輔助音頻通道該改進型的音頻輸出系統(tǒng)提供這種多義性消除,該輔助音頻通道同時輸出一個或多個聲音以區(qū)分正在主音頻通道上輸出的字。即,在主通道上音頻輸出字的語音,并且同時在輔助通道上輸出區(qū)分聲音。二個通道上二種聲音的組合無岐義地辨別對聽者輸出的字。
      文檔編號G10L13/00GK1268238SQ97182297
      公開日2000年9月27日 申請日期1997年11月21日 優(yōu)先權日1996年12月2日
      發(fā)明者彼得·K-H·翁, 杰弗里·M·韋特 申請人:微軟公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1