專利名稱:數(shù)至文本和語音的轉換的制作方法
技術領域:
本發(fā)明涉及將數(shù)(number)轉換成為文本形式、并且進一步轉 換至語音形式。
背景技術:
可以通過文本至語音系統(tǒng)將書面文本轉換成為語音,所述文本 至語音系統(tǒng)可應用于多媒體、講話網(wǎng)站、消息閱讀(電子郵件、SMS )、 用于免提/免看(eyesfree)設備(導航、移動電話)的用戶界面、自 動上下文感知的告知系統(tǒng)(包括變換數(shù)據(jù)、電話服務的任何事物)、 以及視覺受損者輔助。TTS系統(tǒng)的文本標準化器或者文本預處理器控制輸入TTS系統(tǒng) 的所有信息可通過常規(guī)字符來適當?shù)爻尸F(xiàn)。進一步處理字符以創(chuàng)建 相應的發(fā)音。然而,信息的數(shù)字式(numerical)部分(諸如,"1"、"45" 、 "363")并不包含任何關于發(fā)音的線索,并且由此必須單 獨生成該發(fā)音。對此的一種方式是,將數(shù)轉換成文本化表示。然后, 如同在任何其他非數(shù)字式信息的情況下那樣,使用文本串"1"—"一"、"45"—"四十五,,等,可以使用規(guī)則或者查找表來發(fā)音 作為文本的數(shù)。當然,在每種語言中數(shù)具有不同的文本表示。此外,文本串的 構建根據(jù)不同語言而彼此不同。例如,在英語中,"四十三,,包括 針對數(shù)"40"和"3"的詞語,在芬蘭語"neljakymmentakolme"包 含針對"4"的詞語,"kymmenm,,指示十和"3"。在法語中,數(shù) "74"是"soixamte-dix-quatre,,,該數(shù)等于"60" 、 "10"和"4"。 基數(shù)(cardinal number )表示輸入至TTS系統(tǒng)的一種特殊情況。 如果所需數(shù)的范圍較大,則不能將每個數(shù)的發(fā)音分別出處在查找表中。例如,支持從1至99999數(shù)的表的大小是非常巨大的。對于將數(shù)轉換至文本,已經(jīng)提出了某些基于規(guī)則的方法。然而, 所提出的方案具有許多問題。通常,這些方法是語言特定的,并且 由此只能將數(shù)轉換成為一種語言。通常,這些方法是基于復雜的數(shù) 學需求(例如,取模計算)。總之,已知的基于規(guī)則的方法在方法 以及結構兩方面都是復雜的。由此,需要一種用于構造基數(shù)的文本化表示的簡單方案。該方 案還應該適用于多種語言。發(fā)明內(nèi)容本發(fā)明的 一個方面提供了 一種用于將數(shù)轉換成為文本的改進的 方案。根據(jù)本發(fā)明的一個方面,提供了一種將十進制數(shù)系統(tǒng)的基數(shù) 轉換成為期望語言的文本化表示的方法,所述基數(shù)包括由十的冪排 序的數(shù)位序列中的至少一個數(shù)字(digit),所述方法包括將所述 基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;根據(jù)由十的 冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文 本化表示添加數(shù)位值的文本化表示;以及基于定義正確表述的語言 依賴的規(guī)則,來附加地執(zhí)行以下操作校正關于至少一個數(shù)字的任 何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文 本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一 方面,提供了 一種將十進制數(shù)系統(tǒng)的基數(shù)轉 換成為期望語言的語音的方法,所述基數(shù)包括由十的冪排序的數(shù)位 序列中的至少一個數(shù)字,所述方法包括將所述基數(shù)的每個數(shù)字逐 個轉換成為期望語言的文本化表示;根據(jù)由十的冪排序的所述數(shù)位 序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表示添加數(shù)位 值的文本化表示;以及基于定義正確表述的語言依賴的規(guī)則,來附 加地執(zhí)行以下操作校正關于至少 一個數(shù)字的任何形成的文本化表 示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中; 如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所述數(shù)的完整文本化表示,以及否則使用所述單 一數(shù)字的所述文本化表 示,來形成所述數(shù)的所述完整文本化表示;以及將所述數(shù)的所述完 整文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一方面,提供了 一種將十進制數(shù)系統(tǒng)的基數(shù)轉 換成為期望語言的文本化表示的設備,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換器,配置以將 所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;組合器, 配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字 的文本化表示添加數(shù)位值的文本化表示;以及校正器,配置以基于 定義正確表述的語言依賴的規(guī)則,來校正關于至少一個數(shù)字的任何 形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本 化表示的數(shù)位中。根據(jù)本發(fā)明的另 一方面,提供了 一種將十進制數(shù)系統(tǒng)的基數(shù)轉 換成為期望語言的文本化表示的設備,所述基數(shù)包括由十的冪排序 的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換裝置,用于將 所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;添加裝 置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù) 字的文本化表示添加數(shù)位值的文本化表示;以及校正裝置,用于基 于定義正確表述的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任 何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文 本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一 方面,提供了 一種將十進制數(shù)系統(tǒng)的基數(shù)轉 換成為期望語言的語音的設備,所述基數(shù)包括由十的冪排序的數(shù)位 序列中的至少一個數(shù)字,所述設備包括轉換器,配置以將所述基 數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;組合器,配置 以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文 本化表示添加數(shù)位值的文本化表示;校正器,配置以基于定義正確 表述的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文 本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中;以及如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表 示以形成所述數(shù)的完整文本化表示,以及否則使用所述單 一 數(shù)字的 所述文本化表示,來形成所述數(shù)的所述完整文本化表示;以及合成 器,配置以將所述數(shù)的所述完整文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一方面,提供了 一種將十進制數(shù)系統(tǒng)的基數(shù)轉 換成為期望語言的語音的設備,所述基數(shù)包括由十的冪排序的數(shù)位 序列中的至少一個數(shù)字,所述設備包括轉換裝置,用于將所述基 數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;添加裝置,用 于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文 本化表示添加數(shù)位值的文本化表示;裝置,用于基于定義正確表述 的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文本化 表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位 中;以及如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以 形成所述數(shù)的完整文本化表示,以及否則使用所述單 一 數(shù)字的所述 文本化表示,來形成所述數(shù)的所述完整文本化表示;以及轉換裝置, 用于將所述數(shù)的所述完整文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一方面,提供了 一種包括將十進制數(shù)系統(tǒng)的基 數(shù)轉換成為期望語言的文本化表示的設備的用戶終端,所述基數(shù)包 括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉 換器,配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本 化表示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字 的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校 正器,配置以基于定義正確表述的語言依賴的規(guī)則,來校正關于至 少 一 個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同 于正確表述的文本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一方面,提供了 一種包括將十進制數(shù)系統(tǒng)的基 數(shù)轉換成為期望語言的文本化表示的設備的用戶終端,所述基數(shù)包 括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換裝置,用于所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;組合裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的 數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校正 裝置,用于基于定義正確表述的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于 正確表述的文本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一方面,提供了 一種包括將十進制數(shù)系統(tǒng)的基 數(shù)轉換成為期望語言的語音的設備的用戶終端,所述基數(shù)包括由十 的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換器, 配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表 示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;校正器,配 置以基于定義正確表述的語言依賴的規(guī)則,來校正關于至少一個數(shù) 字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表 述的文本化表示的數(shù)位中;以及如果所述數(shù)具有多于一個數(shù)字,則 組合所述文本化表示以形成所述數(shù)的完整文本化表示,以及否則使 用所述單一數(shù)字的所述文本化表示,來形成所述數(shù)的所述完整文本 化表示;以及合成器,配置以將所述數(shù)的所述完整文本化表示轉換 成為語音。根據(jù)本發(fā)明的另 一 方面,提供了 一種包括將十進制數(shù)系統(tǒng)的基 數(shù)轉換成為期望語言的語音的設備的用戶終端,所述基數(shù)包括由十 的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換裝置, 用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;添加裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;裝置,用于基于 定義正確表述的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何 形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本 化表示的數(shù)位中;以及如果所述數(shù)具有多于一個數(shù)字,則組合所述 文本化表示以形成所述數(shù)的完整文本化表示,以及否則使用所述單 一數(shù)字的所述文本化表示,來形成所述數(shù)的所述完整文本化表示;以及轉換裝置,用于將所述數(shù)的所述完整文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一 方面,提供了 一種計算機程序產(chǎn)品編碼用于 執(zhí)行計算機處理的指令的計算機程序,所述計算機處理用于將十進 制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示,所述基數(shù)包括由 十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;根據(jù)由十的 冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文 本化表示添加數(shù)位值的文本化表示;以及基于定義正確表述的語言 依賴的規(guī)則,來附加地執(zhí)行以下操作校正關于至少一個數(shù)字的任 何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文 本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一 方面,提供了 一種計算機程序產(chǎn)品編碼用于 執(zhí)行計算機處理的指令的計算機程序,所述計算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音,所述基數(shù)包括由十的冪 排序的數(shù)位序列中的至少一個數(shù)字,所述處理包括將所述基數(shù)的 每個數(shù)字逐個轉換成為期望語言的文本化表示;根據(jù)由十的冪排序 的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表 示添加數(shù)位值的文本化表示;基于定義正確表述的語言依賴的規(guī)則, 來附加地執(zhí)行以下操作校正關于至少 一個數(shù)字的任何形成的文本 化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù) 位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述文 本化表示,來形成所述數(shù)的所述完整文本化表示;以及將所述數(shù)的 所述完整文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一方面,提供了 一種計算機可讀的計算機程序 分布介質(zhì),并且編碼用于執(zhí)行計算機處理的指令的計算機程序,所 述計算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本 化表示,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一 個數(shù)字, 所述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行 以下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及基 于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作校正 關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導 致不同于正確表述的文本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一方面,提供了 一種計算機可讀的計算機程序 分布介質(zhì),并且編碼用于執(zhí)行計算機處理的指令的計算機程序的, 所述計算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語 音,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所 述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本 化表示;根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以 下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;基于定義 正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下才乘作校正關于至 少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同 于正確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字, 則組合所述文本化表示以形成所述數(shù)的完整文本化表示,以及否則 使用所述單一數(shù)字的所述文本化表示,來形成所述數(shù)的所述完整文 本化表示;以及將所述數(shù)的所述完整文本化表示轉換成為語音。根據(jù)本發(fā)明的另一方面,提供了一種數(shù)據(jù)結構,用于將十進制 數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示,所述基數(shù)包括由十 的冪排序的數(shù)位序列中的至少一個數(shù)字,所述數(shù)據(jù)結構包括第一 數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個數(shù)字逐 個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操 作的信息,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位, 來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及第三數(shù)據(jù)域, 包括用于以下操作的信息,用于基于定義正確表述的語言依賴的規(guī) 則,來校正關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字 處于已知導致不同于正確表述的文本化表示的數(shù)位中。根據(jù)本發(fā)明的另 一方面,提供了 一種由計算機可讀的計算機程序分布介質(zhì),所述計算機程序分布介質(zhì)具有這樣的數(shù)據(jù)結構,所述 數(shù)據(jù)結構用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表 示,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所 述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序的所述數(shù) 位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義 正確表述的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成 的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表 示的數(shù)位中。根據(jù)本發(fā)明的另一方面,提供了一種數(shù)據(jù)結構,用于將十進制 數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示的語音,所述基數(shù)包 括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述數(shù)據(jù)結構包括: 第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個數(shù) 字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以 下操作的信息,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;第三數(shù)據(jù)域, 包括用于以下操作的信息,用于基于定義正確表述的語言依賴的規(guī)j 則,來校正關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字 處于已知導致不同于正確表述的文本化表示的數(shù)位中;用于如果所 述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所述數(shù)的完 整文本化表示,以及否則使用所述單一數(shù)字的所述文本化表示,來 形成所述數(shù)的所述完整文本化表示,以及用于將所述數(shù)的所述完整 文本化表示轉換成為語音。根據(jù)本發(fā)明的另 一方面,提供了 一種由計算機可讀的計算機程 序分布介質(zhì),所述計算機程序分布介質(zhì)具有這樣的數(shù)據(jù)結構,用于 將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示的語音,所 述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示; 第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義正確表述的 語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文本化表 示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中; 用于如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成 所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述文本 化表示,來形成所述數(shù)的所述完整文本化表示,以及用于將所述數(shù) 的所述完整文本化表示轉換成為語音。本發(fā)明提供了多個優(yōu)點。本方案提供了 一種簡單并且有效的方 式,以便將數(shù)轉換成為文本和語音。本方案是非常存儲器有效的, 并且允許具有較低內(nèi)存占用(memory footprint)的數(shù)值的良好覆蓋。 規(guī)則集可呈現(xiàn)為可在語言特定包中包括的數(shù)據(jù)。這以及并不復雜的 語法簡化了隨各種語言變化的制造產(chǎn)品中的邏輯。
在下文中,將參考實施方式以及附圖來更詳細地描述本發(fā)明, 其中圖1示出了文本至語音系統(tǒng)的框圖;圖2示出了無線系統(tǒng)的終端設備;圖3示出了標準化操作塊;圖4示出了數(shù)到書面英語的轉換;圖5示出了用于將小于十的數(shù)轉換成為書面英語的表;圖6示出了書面英語中數(shù)位值的表;圖7A示出了英語的文本化表示的校正表的第一部分;圖7B示出了英語的文本化表示的校正表的第二部分;圖8A示出了數(shù)字至書面芬蘭語的轉換;圖8B示出了書面芬蘭語中的數(shù)位值的表;
圖8C示出了芬蘭語的文本化表示的校正表;
圖9A示出了數(shù)字至書面瑞典語的轉換;
圖9B示出了書面瑞典語中的數(shù)位值表;
圖9C示出了瑞典語中的文本化表示的校正表的第一部分;
圖9D示出了瑞典語中的文本化表示的校正表的第二部分;
圖IOA示出了數(shù)字至書面法語的轉換;
圖10B示出了書面法語中的數(shù)位值表;
圖10C示出了法語中的文本化表示的校正表的第一部分;
圖10D示出了法語中的文本化表示的校正表的第二部分;
圖10E示出了法語中的文本化表示的校正表的第三部分;
圖11A示出了數(shù)字至書面德語的轉換;
圖11B示出了書面德語中的數(shù)位值表;
圖11C示出了德語中的文本化表示的校正表的第一部分;
圖11D示出了德語中的文本化表示的校正表的第二部分;
圖12A示出了數(shù)字至書面丹麥語的轉換;
圖12B示出了書面丹麥語中的數(shù)位值表;
圖12C示出了丹麥語中的文本化表示的校正表的第一部分;
圖12D示出了丹麥語中的文本化表示的校正表的第二部分;
圖13A示出了數(shù)字至書面匈牙利語的轉換;
圖13B示出了書面匈牙利語中的數(shù)位值表;
圖13C示出了匈牙利語中的文本化表示的校正表的第一部分;
圖13D示出了匈牙利語中的文本化表示的校正表的第二部分;
圖14A示出了數(shù)字至書面意大利語的轉換;
圖14B示出了書面意大利語中的數(shù)位值表;
圖14C示出了意大利語中的文本化表示的校正表的第一部分;
圖14D示出了意大利語中的文本化表示的校正表的第二部分;
圖15A示出了數(shù)字至書面國語中文的轉換;
圖15B示出了書面國語中文的數(shù)位值的表;圖15C示出了國語中文的文本化表示的校正表;
圖16A示出了數(shù)字至書面烏克蘭語的轉換;
圖16B示出了書面烏克蘭語中的數(shù)位值表;
圖16C示出了烏克蘭語中的文本化表示的校正表的第一部分;
圖16D示出了烏克蘭語中的文本化表示的校正表的第二部分;
圖16E示出了烏克蘭語中的文本化表示的校正表的第三部分;
圖17示出了轉換至文本的流程圖18示出了轉換至語音的流程圖19示出了用于轉換時間的寄存器設置;
圖20A示出了在轉換的第一步驟之后的寄存器元;
圖20B示出了在轉換的第二步驟之后的寄存器元;
圖21示出了針對轉換縮寫的寄存器設置;以及
圖22示出了轉換之后的寄存器元。
具體實施例方式
本方案適用于電子設備,所述電子設備可以是用戶設備、計算 機等。應用領域可以包括消息閱讀、用于免提或者免看設備的用戶 界面、自動上下文感知的告知系統(tǒng)、以及視覺受損者輔助。
參考圖1,檢查文本至語音(TTS)系統(tǒng)的框圖。文本包括書面 符號、數(shù)、特殊標記和/或注釋,可將該文本饋送進入預處理操作塊 100。預處理可包括解析,解析可依次包括解譯文本中的特殊標記和 注釋以便控制合成處理,例如定義段落、特別強調(diào)特定詞語等。預 處理還可以包括某些應用特定的處理,諸如從文本中去除不必要的 信息。不必要的信息可以是例如(電子郵件的)標題或者不發(fā)音的 字符(諸如, )。
在預處理之后,可在標準化操作塊102中將文本標準化。此塊 102可以包括例如將數(shù)轉換成為文本化表示、擴展縮寫等。可使用基 于規(guī)則的方法,用于創(chuàng)建用于發(fā)音的數(shù)的文本串。在現(xiàn)有技術中, 通常將用于創(chuàng)建數(shù)的文本串的規(guī)則在語言特定的程序代碼中編碼,例如在DLL (動態(tài)裝載庫)中。在某些系統(tǒng)中,提供了還用于處理
其他語言特定處理的復雜腳本語言。
語言學處理塊104還包括語言學和句法分析以及韻律分析。語 言學和句法分析可以包括形態(tài)分析、上下文分析,以及基于某些標 準來將詞語分類成為分句。韻律分析可以利用語言學和句法分析來 指定例如語調(diào)升降曲線、停頓、重音以及語音片斷長度。
合成塊106可以基于從語言學處理塊104接收的數(shù)據(jù),來纟丸行 字母至聲音或者文本至音素的轉換,以便生成實際語音波形。
現(xiàn)在,使用圖2來研究無線系統(tǒng)的終端設備,其中所述終端設 備是作為可以利用本發(fā)明的電子設備的示例。終端設備可以包括作 為操作單元的移動設備(塊200、 202、 206至216)、以及作為用戶 特定模塊204的USIM (全球移動電話系統(tǒng)用戶標識模塊)模塊或者 如SIM。用戶特定模塊是包括微處理器和存儲器的智能卡。用戶的 個人數(shù)據(jù)、可操作單元數(shù)據(jù)、以及用戶界面的標識數(shù)據(jù)可在USIM 模塊的存儲器中存儲。
終端設備包括其中可以執(zhí)行終端設備的計算機程序操作的處理 器200。例如,處理器200可以進行數(shù)字信號處理以及控制其他塊的 操作。用戶控制電子設備并且以終端設備的用戶界面202(顯示器和 小鍵盤)來輸入數(shù)據(jù),并以用戶界面來向用戶顯示由處理器200處 理的可視信息(諸如,文本、數(shù)和圖像)??稍诖鎯ζ?06中存儲 由處理器200所需的數(shù)據(jù)。聲音處理單元208對來自處理器200的 信號進行轉換以適應揚聲器210。聲音處理單元208可以是合成器, 用于合成語音形式的文本。另外,語音處理單元208可以包括編解 碼塊。聲音處理單元208還可以對來自麥克風212的信號進行轉換 以適應處理器200。接著,RP塊214依次將待傳送的并來自處理器 200的數(shù)字信號轉換成為模擬射頻信號,以便將信號作為電磁輻射來 經(jīng)由天線216傳送。相應地,將由天線216接收的射頻信號轉換至 較低頻率,并且在去往處理器200的應用之前,將其在RF塊214中 數(shù)字化。本方案聚焦于標準化操作塊102,在所述標準化操作塊102中可執(zhí)行將數(shù)轉換成為文本化表示?;鶖?shù)0、 1、 2、 3…可以表示有限基 數(shù),還可以稱作計數(shù)數(shù)、自然數(shù)、非負整數(shù)或者全部數(shù)?;鶖?shù)不包 括小數(shù)部分或者分數(shù)部分。十進制數(shù)系統(tǒng)的基數(shù)包括以十的冪排序 的數(shù)位序列中的至少一個數(shù)字。例如,數(shù)15243是l、 5、 2、 4和3 的序列,并且其可解譯為,諸如數(shù)"1"表示在所述數(shù)中包括10000 =104的多少倍。數(shù)"5"表示在所述數(shù)中包括1000 = 103的多少倍。 數(shù)"2"表示在所述數(shù)中包括100 = 102的多少倍。數(shù)"4"表示在所 述數(shù)中包括10= 10i的多少倍。最后,數(shù)"3"表示在所述數(shù)中包括 1 = 10。的多少倍。10000 = 104、 1000 = 103、 100 = 102、 10-l(^以及 1 = 10Q,這些數(shù)都是十的冪,并且這些十的冪在序列中定義了這些數(shù) 字的數(shù)位(在此示例中,是l、 2、 3、 4和5的數(shù)位)。圖3示出了標準化操作塊102,其中可以執(zhí)行將數(shù)字式數(shù)據(jù)形式 的數(shù)轉換成為文本化表示,還可以是以下方式的數(shù)字式數(shù)據(jù)的形式。 如果可用多種語言,則首先通過選擇器300來選擇期望的語言。先 前的處理100可以通過A^輸入詞語的信號識別語言來自動選才李語言, 或者用戶可以定義語言。標準化操作塊102還包括轉換器302、組合 器304以及校正器306。轉換器302將基數(shù)的每個數(shù)字的數(shù)據(jù)逐個地 轉換成為期望語言的文本化表示的數(shù)據(jù)。組合器3 04可以向數(shù)字的文本化表示添加數(shù)位值的文本化表示 的數(shù)據(jù)。組合器是否添加數(shù)位值的文本化表示可以依賴于由十的冪 排序的數(shù)位序列中的數(shù)字數(shù)位。在十進制數(shù)系統(tǒng)中,數(shù)字的值依賴 于其在數(shù)中(即,在數(shù)字序列中)的數(shù)位或者位置。每個數(shù)位具有 的值十倍于其右邊前面的數(shù)位。該數(shù)位的值是十的冪的值,并且可 以寫作個位(l = 10。)、十位(10= 101)、百位(100 = 102)、千 位(1000 = 103 )、萬位(10 000 = 104)、十萬位(100 000 = 105 )、 百萬位(1 000 000= 106)等。當數(shù)位具有零時,意味著該數(shù)位沒有 值。例如,在1 000 000的情況下,第六數(shù)位意味著零乘以十萬。但是第七數(shù)位意味著一乘以百萬。由此,結果是"一百萬"。例如,如果數(shù)是2,則當將該數(shù)轉換成為英語時,組合器304不需要添加任 何事物,這是因為轉換器302提供了正確的結果"二"。校正器306可以校正由轉換器302和組合器304形成的文本化 表示的任何數(shù)據(jù)。在許多情況下,校正器306不需要校正任何事物, 這是由于由轉換器302和/或組合器304形成的文本化表示已經(jīng)是正 確的。但是,由于在自然語言中通常存在意外和不規(guī)則情況,則校 正器306是重要的。自然語言是當人們在一起彼此討論或者書面交 流時使用的人類語言。自然語言在人類社會中自然地進化。例如, 芬蘭語、英語、法語和日語都是自然語言。已經(jīng)由人類人工構建了 諸如世界語的語言,這也是可接受的。事先可以已知由轉換器302 和組合器304形成的所有文本化表示,其中所述文本化表示不同于 自然語言的文本化表示。因為它們的數(shù)有限,因而可以容易地將關 于這樣的數(shù)位中的數(shù)字或者數(shù)字組合的差異進行列表,其中已知所 述數(shù)位導致不同于正確表述的文本化表示。校正可以基于定義正確 表述的語言依賴的規(guī)則??赏ㄟ^期望語言的語法規(guī)則來支持語言依 賴的規(guī)則。圖4示出了使用寄存器將數(shù)轉換成為書面英語的示例。由十的 冪所排序的數(shù)位序列在寄存器中可實現(xiàn)為寄存器元的序列。以類似 方式,可通過具有寄存器元的行的寄存器來處理數(shù)位值。第一寄存 器400包括將要轉換成為文本化表示的數(shù)。第二寄存器402包括以 期望語言的數(shù)的數(shù)字的文本化表示。第三寄存器404包括以期望語 言的數(shù)位值的文本化表示。在此示例中,數(shù)是12 368。數(shù)字"1"是 最高有效數(shù)字,數(shù)字'T,位于寄存器元4000(用于ten thousands (萬 位))中,數(shù)字"2"位于寄存器元4002 (用于thousands (千位)) 中,數(shù)字"3"位于寄存器元4004 (用于hundreds (百位))中,數(shù) 字"6"位于寄存器元4006 (用于tens (十位))中,而作為最低有 效數(shù)字,數(shù)字"8"位于寄存器元4008 (用于ones (個位))中。根據(jù)將基數(shù)的每個位逐個轉換成為期望語言的文本化表示,來 應用第一規(guī)則,寄存器402的寄存器元R5包括文本化表示"one( 1 )"。以類似方式,寄存器元R4包括文本化表示"two (2)",寄存器元 R3包括文本化表示"three ( 3 ),,,寄存器元R2包括文本化表示"six(6),,,以及寄存器元R1包括文本化表示"eight (8)"。例如, 如果最低有效數(shù)字是"0",則在寄存器元R1中的文本化表示可以 是"",但是其還可以是"zero (0)"。當應用第二規(guī)則時,向數(shù)字的文本化表示添加數(shù)位值的文本化 表示。根據(jù)由十的冪排序的數(shù)位序列中的數(shù)字的數(shù)位,來添加文本 化表示。根據(jù)此示例,在寄存器元T65中的數(shù)位值的文本化表示不 是必要的,這是因為其表示十萬??梢运阉髯罡哂行?shù)字(在此情 況中是'T,),以確定針對可能數(shù)位值的需要。在英語中,實際上"ten thousand (萬)"的數(shù)位值不是必要的。由此,寄存器元T54 的內(nèi)容為空,即寄存器元丁54=",,。接著,對寄存器元T43中的"thousand(千),,的數(shù)位值添加"2"。對寄存器元T32中的"hundred(百)"的數(shù)位值添加"3"。在英語中,寄存器元T21和T10的數(shù) 位值"ten (十)"和"one ( — )"不是必要的。由此,寄存器元 T21和T10的內(nèi)容是空,即寄存器元丁21="",并且寄存器元T10 =",,。R5、 T54、 R4、 T43、 R3、 T32、 R2、 T21、 Rl 、 T10中的 文本4b表示結果是"one two thousand three hundred six eight"的文本 化形式,將所述文本化表示結果進行組合。通過第三規(guī)則,數(shù)的文 本化表示得以校正,根據(jù)所述第三規(guī)則,校正關于至少一個數(shù)字的 任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的 文本化表示的數(shù)位中。在此示例中,與正確表述存在兩個差異"one two"以及"six"。然而,在檢查第三規(guī)則來校正差異之前,首先研 究用于將數(shù)字轉換成為文本化表示以及將數(shù)位值與數(shù)字相組合的列 表規(guī)則。接著,使用圖5至圖16E來示出用于轉換基數(shù)的數(shù)據(jù)結構。該 數(shù)據(jù)結構可包括在由計算機可讀的計算機程序分布介質(zhì)中??梢耘c 執(zhí)行轉換的實際計算機程序分開地存儲語言特定的數(shù)據(jù)域即,規(guī)則。 這支持針對多種語言來使用相同的計算機程序,在轉換期間,每種語言使用其自身的數(shù)據(jù)域。圖5示出了用于將小于十的數(shù)轉換至英語文本化表示的第一數(shù) 據(jù)域??梢酝ㄟ^列表形式表示該第一數(shù)據(jù)域。該表是直接的,并且將數(shù)'T,轉換至文本化表示"one",將數(shù)"2"轉換至"two", 等等。作為一種特殊情況,數(shù)"0"可轉換至"",這意味著,零具 有空的文本化表示。圖6示出了針對英語數(shù)位值的文本化表示的第二數(shù)據(jù)域。該第 二數(shù)據(jù)域也以列表形式表示。在圖6中的表代表小于一百萬的數(shù)。 針對寄存器元了32的必要數(shù)位值="hundred",針對寄存器元T43 的必要數(shù)位值- "thousand",并且針對寄存器元T65的必要數(shù)位值="hundred"。其他所有寄存器可以是空。根據(jù)定義正確表述的語 言依賴的規(guī)則,可將數(shù)位值的文本化表示添加至數(shù)字的文本化表示。 可將數(shù)位值的文本化表示添加到數(shù)字的文本化表示之后?,F(xiàn)在,研究用于校正文本化表示的第三數(shù)據(jù)域。也可以以列表 形式表示第三數(shù)據(jù)域。在圖7A中示出了該表的第一部分,并且在圖 7B中示出了第二部分。還可認為這三個數(shù)據(jù)域是規(guī)則。第三規(guī)則超 越先前的規(guī)則,并且在兩個規(guī)則沒有得出期望語言的正確表述的情 況下是預先已知的。非正確表述的原因例如可以是詞尾變化、數(shù)的 次序、正負性等。然而,無論原因如何,都可以4交正文本化表示。 問號的數(shù)目表示在數(shù)中數(shù)字的數(shù)目,而星號表示通配符字符。 根據(jù)在數(shù)中數(shù)字的數(shù)目,將數(shù)位值的寄存器被清空。如果在數(shù)中數(shù) 字的最大數(shù)目是五(即,該數(shù)小于100 000),則將具有索引XX大 于54的寄存器元TXX清空。如果在數(shù)中數(shù)字的最大數(shù)目是四(即, 該數(shù)小于10 000),則將具有索引XX大于43的寄存器元TXX (諸 如,T65和T54)清空。如果在數(shù)中數(shù)字的最大數(shù)目是三(即,該數(shù) 小于IOOO),則將具有索引XX大于32的寄存器元TXX清空。如 果在數(shù)中數(shù)字的最大數(shù)目是二 (即,該數(shù)小于100),則將具有索引 XX大于21的寄存器元TXX清空。如果在數(shù)中數(shù)字的最大數(shù)目是一(即,該數(shù)小于IO),則以類似方式將寄存器元T21清空。英語中的校正可以涉及"ten thousands (萬位)"。如果第五數(shù) 字是"2",則將寄存器元R5的內(nèi)容設置為"twenty"。如果第五 數(shù)字是"3",則將寄存器元R5的內(nèi)容設置為"thirty"。如果第五 數(shù)字是"4",則將寄存器元R5的內(nèi)容設置為"forty"。如果第五 數(shù)字是"5",則將寄存器元R5的內(nèi)容設置為"fifty"。如果第五 數(shù)字是"6",則將寄存器元R5的內(nèi)容設置為"sixty"。如果第五 數(shù)字是"7",則將寄存器元R5的內(nèi)容設置為"seventy"。如果第 五數(shù)字是"8",則將寄存器元R5的內(nèi)容設置為"eighty"。如果第 五數(shù)字是"9",則將寄存器元R5的內(nèi)容設置為"ninety"。英語中的校正還可以涉及從一萬至十萬九千的數(shù)。在所有這些 情況下,第五數(shù)字是"1"并且將寄存器元R4的內(nèi)容設置為空。如 果第四數(shù)字是"0",則寄存器元R5的內(nèi)容是"ten"。如果第四數(shù) 字是'T,,則將寄存器元R5的內(nèi)容設置為"eleven"。如果第四數(shù) 字是"2",則將寄存器元R5的內(nèi)容設置為"twelve"。如果第四數(shù) 字是"3",則將寄存器元R5的內(nèi)容設置為"thirteen"。如果第四 數(shù)字是"4",則將寄存器元R5的內(nèi)容設置為"fourteen"。如果第 四數(shù)字是"5",則將寄存器元R5的內(nèi)容設置為"fifteen"。如果第 四數(shù)字是"6",則將寄存器元R5的內(nèi)容設置為"sixteen"。如果 第四數(shù)字是"7",則將寄存器元R5的內(nèi)容設置為"seventeen"。 如果第四數(shù)字是"8",則將寄存器元R5的內(nèi)容設置為"eighteen"。 如果第四數(shù)字是"9",則將寄存器元R5的內(nèi)容設置為"nineteen"。在涉及萬位以及涉及從一萬至一萬九千的數(shù)的情況下,對在已 知導致非正確表述的數(shù)位中具有多于一個數(shù)字的數(shù)的連續(xù)數(shù)字的組 合的文本化表示進行校正??赏ㄟ^由正確文本化表示來替換已知非正確的文本^;表示來^^亍纟交正。英語中的校正可以涉及十位。如果第二數(shù)字是"2",則將寄存 器元R2設置為"twenty"。如果第二數(shù)字是"3",則將寄存器元 R2設置為"thirty"。如果第二數(shù)字是"4",則將寄存器元R2設置 為"forty"。如果第二數(shù)字是"5",則將寄存器元R2設置為"fifty"。如果第二數(shù)字是"6",則將寄存器元R2設置為"sixty"。如果第 二數(shù)字是"7",則將寄存器元R2設置為"seventy"。如果第二數(shù) 字是"8",則將寄存器元R2設置為"eighty"。如果第二數(shù)字是"9", 則將寄存器元R2設置為"ninety"。英語中的校正可以涉及在十和二十之間的數(shù)。在所有這些情況 中,第二數(shù)字都是"1"。如果第一數(shù)字是"1",則將寄存器元R2 的內(nèi)容設置為"eleven"。如果第一數(shù)字是"2",則將寄存器元R2 的內(nèi)容設置為"twelve"。如果第一數(shù)字是"3",則將寄存器元R2 的內(nèi)容設置為"thirteen"。如果第一數(shù)字是"4",則將寄存器元 R2的內(nèi)容設置為"fourteen"。如果第一數(shù)字是"5",則將寄存器 元R2的內(nèi)容設置為"fifteen"。如果第一數(shù)字是"6",則將寄存器 元R2的內(nèi)容設置為"sixteen"。如果第一數(shù)字是"7",則將寄存 器元R2的內(nèi)容設置為"seventeen"。如果第一數(shù)字是"8",則將 寄存器元R2的內(nèi)容設置為"eighteen"。如果第一數(shù)字是"9",則 將寄存器元R2的內(nèi)容設置為"nineteen"。在涉及十位以及涉及在十和二十之間的數(shù)的情況下,對在已知 導致非正確表述的數(shù)位中包括多于一個數(shù)字的數(shù)的連續(xù)數(shù)字的組合 的文本化表示進行校正??赏ㄟ^由正確文本化表示來替換已知非正 確的文本化表示來執(zhí)行4交正。如果第三數(shù)字是"0",則將寄存器元T32的內(nèi)容設置為空。最 后,如果數(shù)是"0",則將寄存器元R1的內(nèi)容設置為"zero",而 將其他寄存器清空。在必要的校正之后,其中在此情況下意味著針 對在一萬和一萬九千(*12—R5= "twelve")以及在二十和九十 之間的值(*6 —R2= "sixty")來應用4交正,12 368的示例變?yōu)?"twelve thousand three hundred sixty eight"。在才交正之前, "*6 ,, 的文本化表示可以是"sixten,,或者只是"six"。兩種形式都可以校 正為文本化表示"sixty"。此類型的方法可應用至多種語言,同時數(shù)位值和校正的應用規(guī) 則根據(jù)語言不同而有所不同。根據(jù)定義正確表述的語言依賴的規(guī)則,通過改變寄存器元的內(nèi)容,可以容易地實現(xiàn)數(shù)位值和校正的不同應 用。語法非常簡單,并且僅包括條件和指定。再一次簡言之,每個 數(shù)字可指定為<數(shù)寄存器元>="<字符串>"。數(shù)位值可以構成為<數(shù)位值寄存器元〉="<字符串〉"。校正可以構成為<匹配標準>;< 寄存器元>="<字符串>"|<寄存器元>; <寄存器元>="<字符串>" |<寄存器元>;…匹配標準可以在標準的開始處或者結尾處使用通配 符符號,以及可以在標準的任何位置使用"任意字符"標記"?"。 另外, <>表示所需字符串,[]表示可選字符串,I是在可選方式、 多個相互排斥的參數(shù)之間的分隔符,?是指示任何單個數(shù)字的符號, 以及*是指示任意數(shù)目的數(shù)字的符號。參見英語、芬蘭語、瑞典語、法語、德語、丹麥語、匈牙利語、 意大利語、國語中文(日語)以及烏克蘭語的數(shù)"534 676"的示例。 在應用第 一規(guī)則之后,在英語中數(shù)變?yōu)?five three four six seven six"。 在應用第二規(guī)則之后,數(shù)變?yōu)?five hundred three" "four thousand six hundred seven" "six"。在第三規(guī)則之后,通過將"five hundred three" "four thousand six hundred seven" "six"的文本化表示進行組合來 正確地書寫。圖8A示出了數(shù)字到芬蘭語的文本化表示的轉換。在此轉換之 后,凄史變?yōu)?"viisi kolme nelj注kuusi seitsemSn kuusi"。圖8B示出了芬蘭語中數(shù)位值的添加。在添加之后,數(shù)變?yōu)?viisi sataa kolme kymmenta nelja tuhatta kuusi sataa seitseman kymmenta kuusi,,。應該注意到在芬蘭語中,實際上在第一和第二規(guī)則之后對 數(shù)的文本化表示進行校正。圖8C示出了在芬蘭語中文本化表示的校正。數(shù)的校正形式是文 本化表示 "viisi sataa kolmekymmenta nelja tuhatta kuusi sataa seitsemankymmenta kuusi"的組合。在芬蘭語中,通過使用第二規(guī)則 來添加針對十位的數(shù)位值。在英語中,必須使用第三規(guī)則來校正十 位。圖9A示出了數(shù)字至瑞典語的文本化表示的轉換。在此轉換之后,婆丈變成 "fem tre fyra sex sju sex"。圖9B示出了瑞典語中數(shù)位值的添加。在添加之后,數(shù)變?yōu)?fem hundra tre,, 、"fyra tusen sex himdra sju ,, 、"sex',。圖9C至圖9D示出了瑞典語的文本化表示的校正。數(shù)的校正形 式是"fem hundra trettio" 、 "fyra tusen sex hundra sjuttio" 、 "sex,,。圖IOA示出了數(shù)字至法語文本化表示的轉換。在此轉換之后, 數(shù)變?yōu)?"cinq trios quatre six sept six"。圖10B示出了法語中數(shù)位值的添加。在添加之后,數(shù)變?yōu)?cinq cents trios" 、"quatre mille six cents sept" 、"six"。在圖10C、圖IOD和圖10E中示出了法語文本化表示的校正。 凄t白勺才交正開j式是"cinq cents trente" 、 "quatre mille six cents soixante sdzG,,。圖11A示出了數(shù)字至德語文本化表示的轉換。在此轉換之后, 數(shù)變?yōu)?"fiinf drei vier sechs sieben sechs,,。圖11B示出了德語數(shù)位值的添加。在添加之后,數(shù)變?yōu)?fiinf hundert drei" 、"vier tausend sechs hundert sieben,, 、"sechs,,。圖IIC和圖11D示出了德語文本化表示的校正。數(shù)的校正形式 是"fiinf hundert viemnddreizig tausend sechs hundert sechsundsiebzig"。在德語中,特殊性在于十位的結構與個位組合。圖12A示出了數(shù)字至丹麥語文本化表示的轉換。在此轉換之后, 數(shù)變?yōu)?"fem tre fire seks syv seks"圖12B示出了丹麥語數(shù)位值的添加。在添加之后,數(shù)變?yōu)?fem hundrede og tre" 、"fire tusind seks hundrede og syv" 、"seks"。圖12C和圖12D示出了丹麥語文本化表示的校正。數(shù)的校正形 式是"fem hundrede og fieogtredive tusind seks hundrede og seksoghalv巧ers"。圖13A示出了數(shù)字至匈牙利語文本化表示的轉換。在此轉換之 后,數(shù)變?yōu)?"6t harom n6gy hat h6t hat,,。圖13B示出了匈牙利語數(shù)位值的添加。在添加之后,數(shù)變?yōu)?6tszdz harom" 、"n6gy ezer hat szaz h6t" 、"hat"。圖13C和圖13D示出了匈牙利語文本化表示的校正。數(shù)的校正 形式是"6t szAz harminc,, 、"n谷gy ezer hat sz&z hetvem,, 、"hat,,。圖14A示出了數(shù)字至意大利語文本化表示的轉換。在此轉換之 后,凄丈變?yōu)?"cinque tre quattro sei sette sei"。圖14B示出了意大利語數(shù)位值的添加。在添加之后,數(shù)變?yōu)?"cinque cento tre" 、"quattro mila sei cento sette" 、"sei"。圖14C和圖14D示出了意大利語文本化表示的校正。數(shù)的校正 形式是"cinque cento trenta,, 、 "quattro mila sei cento settanta,, 、 "sei"。圖15A示出了數(shù)字至國語中文文本化表示的轉換。在此轉換之 后,數(shù)變?yōu)?五三四六七六"。圖15B示出了國語中文數(shù)位值的添加。在添加之后,數(shù)變?yōu)?五 十三萬四千六百七十六"。圖15C示出了國語中文文本化表示的校正。數(shù)的校正形式是"五 十三萬四千六百七十六,,。數(shù)至日本漢字字符的轉換也與日文中相 同。在此轉換中的特殊性在于數(shù)位值"萬","萬"表示IOOOO。 下一特殊數(shù)位值位于100 000處,等等。數(shù)"五十三萬四千六百七十 六,,的日語發(fā)音可通過字母表來書寫為 "go juu sanmanyon sen roppyaku nana juu roku,,。圖16A示出了數(shù)字至烏克蘭語文本化表示的轉換。在此轉換之 后,凄史變?yōu)?"n》111 Tpw 40Tnpw iuteTb c!m山terb "。圖16B示出了烏克蘭語數(shù)位值的添加。在添加之后,數(shù)變?yōu)?'40t, Wt,山iCTfa COT CIm" 、 "UjiCTb"。圖16C、圖16D和圖16E示出了烏克蘭語文本化表示的校正。數(shù)的4交正形式是"n'附bCOT TPM職只T" " 、 "40TMPWTMCR4i山iCTb00TdM^CflT,,、"lUlCTts"。在所有這些語言中,可以類似于英語的方式應用列表的規(guī)則。 顯然,相同的方法可應用至在此應用中沒有提及的許多其他語言。圖17示出了將數(shù)轉換成為文本化表示的方法的流程圖。在步驟1700中,基數(shù)的每個數(shù)字被逐個轉換成為期望語言的文本化表示。在步驟1702中,根據(jù)十的冪排序的數(shù)位序列中數(shù)字的數(shù)位,來執(zhí)行 將數(shù)位值的文本化表示添加至數(shù)字的文本化表示。在步驟1704中, 根據(jù)定義正確表述的語言依賴的規(guī)則,來校正所形成的文本化表示, 并且其中所述文本化表示涉及在已知導致不同于正確表述的文本化 表示的數(shù)位中的至少 一個數(shù)字。圖18示出了將數(shù)轉換成為語音的方法的流程圖。在步驟1800 中,將基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示。在步 驟1802中,根據(jù)十的冪排序的數(shù)位序列中數(shù)字的數(shù)位,來執(zhí)行將數(shù) 位值的文本化表示添加至數(shù)字的文本化表示。在步驟1804中,根據(jù) 定義正確表述的語言依賴的規(guī)則,來校正所形成的文本化表示,并 且其中所述文本化表示涉及在已知導致不同于正確表述的文本化表 示的數(shù)位中的至少一個數(shù)字。在步驟1806中,如果數(shù)具有多于一個 數(shù)字,則組合文本化表示以形成數(shù)的完整文本化表示;否則使用單 一數(shù)字的文本化表示,來形成數(shù)的完整文本化表示。在步驟1808中, 將數(shù)的完整文本化表示轉換成為語音。本發(fā)明的實施方式可以在電子設備中實現(xiàn),包括例如顯示器、 鍵盤以及可操作地連接至鍵盤和顯示器的控制器??刂破骺梢耘渲?以執(zhí)行結合在圖17和圖18中所示方法的任一項所描述的步驟中的 至少某些。實施方式可以實現(xiàn)為包括用于執(zhí)行計算機處理的指令的 計算機程序,用于將基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本 化表示;根據(jù)由十的冪排序的數(shù)位序列中的數(shù)字的數(shù)位來執(zhí)行以下 操作將數(shù)位值的文本化表示添加至數(shù)字的文本化表示;以及根據(jù) 定義正確表述的語言依賴的規(guī)則來附加地執(zhí)行以下才喿作校正任何 形成的文本化表示,并且其中所述文本化表示涉及在已知導致不同 于正確表述的文本化表示的數(shù)位中的至少 一個數(shù)字。實施方式還可以實現(xiàn)為包括用于執(zhí)行計算機處理的指令的計算 機程序,用于將基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表 示;根據(jù)由十的冪排序的數(shù)位序列中的數(shù)字的數(shù)位來執(zhí)行以下操作將數(shù)位值的文本化表示添加至數(shù)字的文本化表示;根據(jù)定義正確表述的語言依賴的規(guī)則來附加地執(zhí)行以下操作校正任何形成的文本化表示,并且其中所述文本化表示涉及在已知導致不同于正確表述的文本化表示的數(shù)位中的至少一個數(shù)字;如果數(shù)具有多于一個數(shù)字, 則組合文本化表示以形成數(shù)的完整文本化表示,否則使用單一數(shù)字 的文本化表示,來形成數(shù)的完整文本化表示;以及將數(shù)的完整文本 化表示轉換成為語音。計算機程序的任 一 項可在由計算機或者處理器可讀的計算機程序分布介質(zhì)上存儲。計算機程序介質(zhì)例如但不局限于電、磁、光、 紅外或者半導體系統(tǒng)、設備或者傳輸介質(zhì)。所述介質(zhì)可以是計算機可讀介質(zhì)、程序存儲介質(zhì)、記錄介質(zhì)、計算機可讀存儲器、隨機訪 問存儲器、可擦除可編程只讀存儲器、計算機可讀軟件分布包、計 算機可讀信號、計算機可讀電信信號以及計算機可讀壓縮的軟件包。寄存器的應用可用于將以小時和分鐘表示的時間轉換成為文本 化表示。實現(xiàn)使用包括多個數(shù)字的寄存器。在每個數(shù)字之間設置轉 化寄存器(類似于數(shù)位值寄存器)。在圖19中示出了寄存器設置。數(shù)寄存器1900包括諸如12: 35的時間。然后,寄存器元R4包括數(shù)"1",寄存器元R3包括數(shù)"2",寄存器元R2包括數(shù)"3",以及寄存器元R1包括數(shù)"5"。轉化寄存器1902包括寄存器元D54至D10。寄存器1900和1902的內(nèi)容可進行組合,以便其形成D54R4D43 R3 D32R2D21 Rl DIO。轉化寄存器元1902可用作存儲器,用于存儲在特定語言中每個數(shù)字之間可能需要的詞語。在英語中,例如可以根據(jù)以下規(guī)則來處理時間 :0 RT2 - 'o";RT2 - "o'clock"; RT1 -"";其中?是指示任意單一數(shù)字的符號。在芬蘭語中,例如可以才艮據(jù)以下規(guī)則來處理時間 :0 RT2 - "nolla"; :00RT2 - aTO aa; D21 -雨;RT1 - "noJla";在德語中,例如可以根據(jù)以下規(guī)則來處理時間 : D32 = "Uhr-; :01 RT2 =""; RT1 = "d冊"; :00 D54 = Bgenau"; RT2 =附';RT1 ="";語法考慮如下<匹配標準>; <寄存器> ="<字符串>"|<寄存器>;[<寄存器>="<字符串>"|<寄存器>;…],<匹配標準〉=[*〗<數(shù)>[<數(shù)〉]…[<凌史〉],<數(shù)>= |0|1|2|3|4|5|6|7|8|9,以及<寄存器〉=111| R2| R3|R4|T54|T43|T32|T21|T10圖20A和圖20B示出了應用規(guī)則的示例。寄存器1900包括時間 12: 01。在圖20A中,在應用規(guī)則影響寄存器元D32之后,寄存器 1902在寄存器元D32中包括詞語"Uhr,,。將其他寄存器元設置為 空。接著,應用關于"??:0r,的規(guī)則,并且由此在圖20B中寄存器 元RT1包括"eins"。將寄存器元RT2設置為空。在使用在應用中 先前呈現(xiàn)的數(shù)井見則之后,時間變?yōu)?zw6lfUhr eins"。以類似方式 來處理秒。另外,可以類似地處理關于數(shù)的縮寫,諸如,km、 km/h、 m、 kg等。實現(xiàn)使用兩個主寄存器 一個用于單位,而另一個用于與該 單元相關聯(lián)的數(shù)。在數(shù)和單位之間以及在單位之后,在數(shù)之前還可 以存在附加的轉化寄存器元。在圖21中呈現(xiàn)了寄存器設置。在寄存 器2100中的寄存器元RR2包括數(shù),而寄存器元RR1包括縮寫。在 寄存器2102中的寄存器元DD10至DD32包括對于適當表述所必須 的詞語。可以組合寄存器的內(nèi)容,以便其形成序列DD32RR2DD21 RR1 DDIO??梢詫⒓拇嫫髟狣D21設置為"\m,, 、 "\n,,或者"\f,, 其中可以使用標記來表示陽性("\m,,)、中性("\n")或者陰性 ("\f,)。需要定義規(guī)則集合,以便獲得針對縮寫單位的適當格式。 規(guī)則可實現(xiàn)為具有某些附加模式匹配能力的查找表。 語法可以考慮如下<匹配標準〉; <寄存器> = "<字符串>"|<寄存器>;[<寄存器〉="<字符串>"|<寄存器〉;…],<匹酉己才示〉焦〉=[*]<數(shù)>[<數(shù)>^,.[<數(shù)>]"<單位〉<數(shù)〉= |0卩|2|3|4|5|6|7|8|9,<單位> =m|km|ydimi|kCal|kJ|km/h|min/h|mph|min/mi,.., 以及〈寄存器〉-RRllRR2IDD32IDD21IDD10。 標"i己w表示空白處。例如,可使用以下規(guī)則將表達式453 km/h可轉換至英語文本化 表示* kn#tRR1 = "kilometers per tou產(chǎn); 1 km/h RR1 - "kilometer per Hour*1;圖22示出了匹酉己頭見則Tk喻 = ^kilometers p@r houf;〗的才全測之后的寄存器內(nèi)容。然后,輸出串是"453 kilometers per hour"。如果 單位"km/h"的正負對于數(shù)453的口語/書面形式具有影響,則針對 數(shù)處理塊,在寄存器2102的寄存器元DD21之中設置正負標記,例 如,"453" "\f, "kilometers per hour"。另夕卜,應該注意,如果在"kilometers per hour"的開始中不存在 空白處,則輸出序列將是"453kilometers per hour"。如上所述,可 在字符串之中包括空白處,或者可將空白處放入轉化寄存器元 DD21。盡管已經(jīng)根據(jù)附圖參考示例來描述了本發(fā)明,顯然,本發(fā)明并 不局限于其中,而是可以在所附權利要求書的范圍以內(nèi)以各種方式 進行修改。
權利要求
1.一種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示的方法,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述方法包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作校正關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中。
2. 根據(jù)權利要求1所述的方法,所述方法進一步包括,如果所 述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所述數(shù)的完 整文本化表示,以及否則使用單一數(shù)字的所述文本化表示,來形成所述數(shù)的完整文本化表示。
3. 根據(jù)權利要求1所述的方法,所述方法進一步包括,根據(jù)定 義正確表述的所述語言依賴的規(guī)則,來向數(shù)字的文本化表示添加數(shù) 位值的文本化表示。
4. 根據(jù)權利要求1所述的方法,所述方法進一步包括,校正數(shù) 的連續(xù)數(shù)字的組合的文本化表示,所述數(shù)在已知導致非正確表述的 數(shù)位中包括多于一個的數(shù)字。
5. 根據(jù)權利要求1所述的方法,所述方法進一步包括,通過由 正確文本化表示替換已知非正確的文本化表示,來校正文本化表示。
6. 根據(jù)權利要求1所述的方法,所述方法進一步包括,在數(shù)字 的文本化表示之后添加數(shù)位值的文本化表示。
7. 根據(jù)權利要求1所述的方法,所述方法進一步包括,為了將 所述基數(shù)轉換成為文本化表示而從多種語言中選擇期望的語言。
8. 根據(jù)權利要求1所述的方法,所述方法進一步包括,如果數(shù) 是0,則將所述數(shù)的所述文本化表示校正成與所述期望語言的零相對 應的文本化表示。
9. 根據(jù)權利要求1所述的方法,所述方法進一步包括,搜索所 述最高有效數(shù)字,以確定針對數(shù)位值的需要。
10. 根據(jù)權利要求1所述的方法,所述方法進一步包括,將以小 時和分鐘表述的時間轉換成為文本化表示。
11. 根據(jù)權利要求1所述的方法,所述方法進一步包括,將縮寫 轉換成為文本化表示。
12. —種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音的方 法,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所 述方法包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示; 根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及 基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作 才交正關于至少 一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所述數(shù)的完整文本化表示,以及否則使用所述單 一 數(shù)字的所述文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 將所述數(shù)的所述完整文本化表示轉換成為語音。
13. —種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示 的設備,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字, 所述設備包括轉換器,配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本^ft表示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校正器,配置以基于定義正確表述的語言依賴的規(guī)則,來校正關 于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致 不同于正確表述的文本化表示的數(shù)位中。
14. 根據(jù)權利要求13所述的設備,其中所述校正器進一步配置 以便如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所 述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述文本化表示,來形成所述數(shù)的完整文本 化表示。
15. 根據(jù)權利要求13所述的設備,其中所述組合器配置以根據(jù) 定義正確表述的所述語言依賴的規(guī)則,來向數(shù)字的所述文本化表示 添加所述數(shù)位值的文本化表示。
16. 根據(jù)權利要求13所述的設備,其中所述校正器配置以校正 數(shù)的連續(xù)數(shù)字的組合的文本化表示,所述數(shù)在已知導致非正確表述 的數(shù)位中包括多于一個的數(shù)字。
17. 根據(jù)權利要求13所述的設備,其中所述校正器配置以通過 由正確文本化表示替換已知非正確的文本化表示,來校正文本化表 示。
18. 根據(jù)權利要求13所述的設備,其中所述組合器配置以在數(shù) 字的文本化表示之后添加數(shù)位值的文本化表示。
19. 根據(jù)權利要求13所述的設備,其中所述設備包括選擇器, 配置以針對將所述基數(shù)轉換成為文本化表示來從多種語言中選擇期 望的語言。
20. 根據(jù)權利要求13所述的設備,其中所述校正器配置成如果 所述數(shù)是O,則將所述數(shù)的所述文本化表示校正成與所述期望語言的 零相對應的文本化表示。
21. 根據(jù)權利要求13所述的設備,其中所述設備配置以搜索所 述最高有效數(shù)字,以確定針對數(shù)位值的需要。
22. 根據(jù)權利要求13所述的設備,其中所述設備配置以將以小 時和分鐘表述的時間轉換成為文本化表示。
23. 根據(jù)權利要求13所述的設備,其中所述設備配置以將縮寫 轉換成為文本化表示。
24. —種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表示 的設備,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字, 所述設備包括轉換裝置,用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本化表示;添加裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校正裝置,用于基于定義正確表述的語言依賴的規(guī)則,來校正關 于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致 不同于正確表述的文本化表示的數(shù)位中。
25. —種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音的設 備,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所 述設備包括轉換器,配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本化表示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示; 校正器,配置以基于定義正確表述的語言依賴的規(guī)則,來校正關于至少 一個 數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正 確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述 文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 合成器,配置以將所述數(shù)的所述完整文本化表示轉換成為語音。
26. —種將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音的設備,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述設備包括轉換裝置,用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本化表示;添加裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示; 裝置,用于基于定義正確表述的語言依賴的規(guī)則,來校正關于至少一個 數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正 確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述 文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 裝置,用于將所述數(shù)的所述完整文本化表示轉換成為語音。
27. —種包括將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化 表示的設備的用戶終端,所述基數(shù)包括由十的冪排序的數(shù)位序列中 的至少一個數(shù)字,所述設備包括轉換器,配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本化表示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校正器,配置以基于定義正確表述的語言依賴的規(guī)則,來校正關 于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中。
28. —種包括將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化 表示的設備的用戶終端,所述基數(shù)包括由十的冪排序的數(shù)位序列中 的至少一個數(shù)字,所述設備包括轉換裝置,用于所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示;組合裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及校正裝置,用于基于定義正確表述的語言依賴的規(guī)則,來校正關 于至少 一 個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致 不同于正確表述的文本化表示的數(shù)位中。
29. —種包括將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音的 設備的用戶終端,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述設備包括轉換器,配置以將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本4t表示;組合器,配置以根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向^:字的文本化表示添加數(shù)位值的文本化表示; 校正器,配置以基于定義正確表述的語言依賴的規(guī)則,來校正關于至少 一個 數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正 確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述 文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 合成器,配置以將所述數(shù)的所述完整文本化表示轉換成為語音。
30. —種包括將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音的 設備的用戶終端,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述設備包括轉換裝置,用于將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的 文本化表示;添加裝置,用于根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù) 位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示; 裝置,用于基于定義正確表述的語言依賴的規(guī)則,來校正關于至少一個 數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單 一 數(shù)字的所述 文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 裝置,用于將所述數(shù)的所述完整文本化表示轉換成為語音。
31. —種計算機程序產(chǎn)品,編碼用于執(zhí)行計算機處理的指令的計 算機程序,所述計算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期 望語言的文本化表示,所述基數(shù)包括由十的冪排序的數(shù)位序列中的 至少一個數(shù)字,所述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示; 根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及 基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作 校正關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于 已知導致不同于正確表述的文本化表示的數(shù)位中。
32. 根據(jù)權利要求31所述的計算機程序產(chǎn)品,所述計算機程序 產(chǎn)品包括以下的至少一個計算機可讀介質(zhì)、計算機存儲介質(zhì)、記 錄介質(zhì)、計算機可讀存儲器、計算機可讀軟件分布包、計算機可讀 信號、計算機可讀電信信號、以及計算機可讀壓縮的軟件包。
33. —種計算機程序產(chǎn)品,編碼用于執(zhí)行計算機處理的指令的計 算機程序,所述計算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期 望語言的語音,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一 個數(shù)字,所述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示; 根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及 基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作 校正關于至少 一 個數(shù)字的任何形成的文本化表示,所述數(shù)字處于 已知導致不同于正確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所 述數(shù)的完整文本化表示,以及否則使用所述單 一數(shù)字的所述文本化 表示,來形成所述數(shù)的所述完整文本化表示;以及 將所述數(shù)的所述完整文本化表示轉換成為語音。
34. 根據(jù)權利要求33所述的計算機程序產(chǎn)品,所述計算機程序 產(chǎn)品包括以下的至少一個計算機可讀介質(zhì)、計算機存儲介質(zhì)、記 錄介質(zhì)、計算機可讀存儲器、計算機可讀軟件分布包、計算機可讀 信號、計算機可讀電信信號、以及計算機可讀壓縮的軟件包。
35. —種計算機可讀的計算機程序分布介質(zhì),并且所述計算機程序分布介質(zhì)編碼用于執(zhí)行計算機處理的指令的計算機程序,所述計 算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的文本化表 示,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所 述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示; 根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向數(shù)字的文本化表示添加數(shù)位值的文本化表示;以及 基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作 校正關于至少 一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于 已知導致不同于正確表述的文本化表示的數(shù)位中。
36. 根據(jù)權利要求35所述的計算機程序分布介質(zhì),所述分布介 質(zhì)包括以下介質(zhì)的至少一個計算機可讀介質(zhì)、計算機存儲介質(zhì)、 記錄介質(zhì)、計算機可讀存儲器、計算機可讀軟件分布包、計算機可 讀信號、計算機可讀電信信號、以及計算機可讀壓縮的軟件包。
37. —種計算機可讀的計算機程序分布介質(zhì),并且所述計算機程序分布介質(zhì)編碼用于執(zhí)行計算機處理的指令的計算機程序,所述計 算機處理用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語言的語音,所 述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述處理包括將所述基數(shù)的每個數(shù)字逐個轉換成為期望語言的文本化表示; 根據(jù)由十的冪排序的所述數(shù)位序列中數(shù)字的數(shù)位來執(zhí)行以下操作向tt字的文本化表示添加數(shù)位值的文本化表示;以及基于定義正確表述的語言依賴的規(guī)則,來附加地執(zhí)行以下操作校正關于至少 一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中;如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形成所述數(shù)的完整文本化表示,以及否則使用所述單一^:字的所述文本化表示,來形成所述數(shù)的所述完整文本化表示;以及 將所述數(shù)的所述完整文本化表示轉換成為語音。
38. 根據(jù)權利要求37所述的計算機程序分布介質(zhì),所述分布介 質(zhì)包括以下介質(zhì)的至少一個計算機可讀介質(zhì)、計算機存儲介質(zhì)、 記錄介質(zhì)、計算機可讀存儲器、計算機可讀軟件分布包、計算機可 讀信號、計算機可讀電信信號、以及計算機可讀壓縮的軟件包。
39. —種數(shù)據(jù)結構,用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語 言的文本化表示,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少 一個數(shù)字,所述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個 數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序 的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值 的文本化表示;以及第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義正確表述 的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文本化表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位 中。
40, —種由計算機可讀的計算機程序分布介質(zhì),所述計算機程序 分布介質(zhì)具有這樣的數(shù)據(jù)結構,所述數(shù)據(jù)結構用于將十進制數(shù)系統(tǒng) 的基數(shù)轉換成為期望語言的文本化表示,所述基數(shù)包括由十的冪排 序的數(shù)位序列中的至少 一 個數(shù)字,所述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個 數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序 的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值 的文本化表示;以及第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義正確表述 的語言依賴的規(guī)則,來校正關于至少 一 個數(shù)字的任何形成的文本化 表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位 中。
41. 一種數(shù)據(jù)結構,用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為期望語 言的文本化表示的語音,所述基數(shù)包括由十的冪排序的數(shù)位序列中 的至少一個數(shù)字,所述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個 數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序 的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值 的文本化表示;第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義正確表述 的語言依賴的規(guī)則,來校正關于至少 一個數(shù)字的任何形成的文本化 表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位 中;用于如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述文本化表示,來形成所述數(shù)的所述完整文本化表示,以及用于將所述 數(shù)的所述完整文本化表示轉換成為語音。
42. —種計算機可讀的計算機程序分布介質(zhì),所述計算機程序分布介質(zhì)具有這樣的數(shù)據(jù)結構,用于將十進制數(shù)系統(tǒng)的基數(shù)轉換成為 期望語言的文本化表示的語音,所述基數(shù)包括由十的冪排序的數(shù)位序列中的至少一個數(shù)字,所述數(shù)據(jù)結構包括第一數(shù)據(jù)域,包括用于以下操作的信息,用于將所述基數(shù)的每個 數(shù)字逐個轉換成為期望語言的文本化表示;第二數(shù)據(jù)域,包括用于以下操作的信息,用于根據(jù)由十的冪排序 的所述數(shù)位序列中數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值 的文本化表示;第三數(shù)據(jù)域,包括用于以下操作的信息,用于基于定義正確表述 的語言依賴的規(guī)則,來校正關于至少 一 個數(shù)字的任何形成的文本化 表示,所述數(shù)字處于已知導致不同于正確表述的文本化表示的數(shù)位中;用于如果所述數(shù)具有多于一個數(shù)字,則組合所述文本化表示以形 成所述數(shù)的完整文本化表示,以及否則使用所述單一數(shù)字的所述文 本化表示,來形成所述數(shù)的所述完整文本化表示,以及用于將所述 數(shù)的所述完整文本化表示轉換成為語音。
全文摘要
公開了一種將基數(shù)轉換成為期望文本化表示、或者轉換成為語音的解決方案。轉換器(302)將基數(shù)的每個數(shù)字逐個轉換成為文本化表示。組合器(304)根據(jù)數(shù)字的數(shù)位,來向數(shù)字的文本化表示添加數(shù)位值的文本化表示。校正器(306)基于定義正確表述的語言依賴的規(guī)則,來校正關于至少一個數(shù)字的任何形成的文本化表示,所述數(shù)字具有不同于正確表述的文本化表示,以及組合文本化表示用于形成數(shù)的完整文本化表示。合成器將數(shù)的完整文本化表示轉換成為語音。
文檔編號G10L13/00GK101263491SQ200680033143
公開日2008年9月10日 申請日期2006年7月18日 優(yōu)先權日2005年7月29日
發(fā)明者M·莫貝格 申請人:諾基亞公司