專利名稱:自動語音識別(asr)語境的制作方法
自動語音識別(ASR)語境(相關(guān)申請) 本正式申請要求在2007年7月11日提交的發(fā)明名稱為"AUTOMATED SPEECH RECOGNITION (ASR) CONTENT"的美國臨時申請No. 60/949140和在2007年7月11日提交的 發(fā)明名稱為"AUTOMATED SPEECH RECOGNITION (ASR) LISTS"的美國臨時申請No. 60/949151 的權(quán)益,在此通過引用并入以上每一個申請的全部內(nèi)容。
背景技術(shù):
自動語音識別(ASR) —般被用于翻譯語音以找到"意思",該"意思"然后可被用于 執(zhí)行期望的功能。但是,常規(guī)的用于提供ASR的技術(shù)消耗大量的資源(例如,處理和存儲資 源),因此實(shí)現(xiàn)起來會是昂貴的。并且,當(dāng)遇到會在執(zhí)行ASR時導(dǎo)致等待時間(latency)增 加以及精度下降的大量的數(shù)據(jù)時,這種實(shí)現(xiàn)會進(jìn)一步復(fù)雜化。會遇到大量的數(shù)據(jù)的一種實(shí) 現(xiàn)是在具有位置確定功能的裝置中。 例如,定位系統(tǒng)(例如,全球定位系統(tǒng)(GPS))可采用大量的數(shù)據(jù)以提供位置確定 功能,以諸如向名勝提供逐圈(turn-by-turn)驅(qū)動指令。這些名勝(和有關(guān)的數(shù)據(jù))會消 耗巨量的資源,因此在執(zhí)行ASR以諸如定位特定的名勝時導(dǎo)致延遲。并且,當(dāng)諸如由于類似 的發(fā)音的名勝導(dǎo)致對于音頻輸入的翻譯可用的選項(xiàng)的數(shù)量增多時,ASR的精度會降低。
發(fā)明內(nèi)容
描述創(chuàng)建用于自動語音識別中的動態(tài)語境(context)的技術(shù)。在實(shí)現(xiàn)中,確定由 位置確定裝置接收的哪個數(shù)據(jù)可被選擇以啟動位置確定裝置的一種或多種功能,其中,所 述功能中的至少一種涉及位置確定功能?;谒龃_定產(chǎn)生包含取自數(shù)據(jù)的一個或多個短 語(phrase)的動態(tài)語境。通過使用來自動態(tài)語境的一個或多個所述短語由位置確定裝置 翻譯音頻輸入。 本發(fā)明內(nèi)容僅被提供用于介紹在具體實(shí)施方式
和附圖中完整描述的主題。因此, 發(fā)明內(nèi)容不應(yīng)被認(rèn)為是描述基本特征,也不應(yīng)被用于確定權(quán)利要求的范圍。
參照附圖進(jìn)行詳細(xì)的描述。在圖中,附圖標(biāo)記的最左側(cè)數(shù)字表示首先出現(xiàn)該附圖 標(biāo)記的圖。相同的附圖標(biāo)記在說明書和附圖中的不同實(shí)例中的使用可表示類似或相同的項(xiàng) 目。 圖1是可操作以執(zhí)行自動語音識別(ASR)語境技術(shù)的示例性定位系統(tǒng)環(huán)境的示 圖。 圖2是在將圖1的位置確定裝置更詳細(xì)地顯示為采用使用語境的ASR技術(shù)的示例 性實(shí)現(xiàn)中的系統(tǒng)的示圖。 圖3是示出示例性實(shí)現(xiàn)中的過程的流程圖,其中,基于當(dāng)前在用戶界面中顯示的 短語產(chǎn)生語境并且動態(tài)地維護(hù)語境以反映用戶界面的變化。
圖4是示出示例性實(shí)現(xiàn)中的過程的流程圖,其中,由裝置從另一裝置輸入短語以 向要在裝置之間的交互作用中使用的ASR提供語境。
具體實(shí)施例方式
常規(guī)的用于提供自動語音識別(ASR)的技術(shù)一般消耗大量的資源(例如,處理和 存儲資源)。并且,當(dāng)遇到諸如會在具有音樂播放功能(例如,具有帶有關(guān)聯(lián)元數(shù)據(jù)的幾千 首歌曲的便攜式音樂播放器,所述元數(shù)據(jù)包含標(biāo)題、藝術(shù)家等)、地址功能(例如,具有大規(guī) 模電話簿的無線電話)、定位功能(例如,包含名勝、地址和電話號碼的定位數(shù)據(jù)庫)等的裝 置中遇到的數(shù)據(jù)量的大量數(shù)據(jù)時,ASR的實(shí)現(xiàn)會進(jìn)一步復(fù)雜化。 例如,當(dāng)與諸如服務(wù)器或桌上型計算機(jī)的不被配置為用于便攜式用途的裝置相比 時,個人全球定位系統(tǒng)(GPS)裝置可被配置為用于便攜式用途,因此具有相對有限的資源 (例如,處理資源)。但是,個人GPS裝置可包含大量的用于確定地理位置并基于確定的地理 位置提供附加的功能的數(shù)據(jù)。例如,用戶可說出期望的餐館的名稱。在響應(yīng)中,個人GPS裝 置可轉(zhuǎn)換所說出的名稱以找到"意思",這會消耗大量的資源。個人GPS裝置也可確定當(dāng)前 的地理位置,然后使用該位置來搜索數(shù)據(jù),以定位具有該名稱或類似的名稱的最近的餐館, 這也會消耗大量的資源。 因此,描述了提供用于自動語音識別(ASR)中的動態(tài)語境的技術(shù),這些技術(shù)可被 用于改善ASR的效率和精度。在實(shí)現(xiàn)中,以可被選擇以啟動裝置的功能的短語創(chuàng)建動態(tài)語 境。例如,語境可被配置為包含可由用戶選擇以啟動裝置的功能的短語。因此,該語境可以 與ASR —起使用以更加迅速地定位這些短語,由此在執(zhí)行ASR時減少等待時間(例如,通過 分析較少量的數(shù)據(jù))并改善精度(例如,通過減少可用的選項(xiàng)的數(shù)量并因此減少具有類似 發(fā)音的短語的可能性)。也想到了各種其它的例子,可關(guān)于以下的附圖找到其進(jìn)一步的討 論。 在另一實(shí)現(xiàn)中,至少部分地通過在局域網(wǎng)絡(luò)連接上從另一裝置獲得的數(shù)據(jù)定義語 境。繼續(xù)前面的例子,用戶可采用個人GPS裝置以利用導(dǎo)航功能。GPS裝置還可包含啟動另 一裝置的功能的功能,以諸如在局域無線連接上通過使用ASR經(jīng)由用戶的無線電話撥號和 通信。為了通過GPS裝置提供用于無線電話中的ASR的語境,GPS裝置可從無線電話獲得數(shù) 據(jù)。例如,GPS裝置可輸入地址簿并從包含于地址簿中的短語產(chǎn)生語境。然后,當(dāng)與無線電話 交互作用時,可由GPS裝置將該語境用于ASR。以此方式,可通過GPS裝置利用(leverage) 無線電話的數(shù)據(jù)以改善效率(例如,減少等待時間和對處理和存儲資源的使用),并且還改 善精度??申P(guān)于圖2和圖4找到從另一裝置輸入數(shù)據(jù)以產(chǎn)生語境的進(jìn)一步的討論。
在以下的討論中,首先描述可操作以產(chǎn)生和利用自動語音識別(ASR)技術(shù)的語境 的示例性環(huán)境。然后,描述可在示例性環(huán)境中使用以及在其它環(huán)境中使用而不背離其精神 和范圍的示例性過程。雖然關(guān)于位置確定環(huán)境描述了 ASR語境技術(shù),但應(yīng)容易清楚,可以諸 如通過便攜式音樂播放器、無線電話等在各種環(huán)境中采用這些技術(shù),以提供便攜式音樂播 放功能、交通狀況(traffic)獲知功能(例如,涉及意外事故的信息和用于產(chǎn)生路線的交通 流量)、因特網(wǎng)搜索功能等。 圖1示出可操作以執(zhí)行自動語音識別(ASR)語境技術(shù)的示例性定位系統(tǒng)環(huán)境100。 可以采用各種定位系統(tǒng)來提供位置確定技術(shù),其例子在圖1中被示為全球定位系統(tǒng)(GPS)。環(huán)境100可包含任意數(shù)量的位置發(fā)射平臺102(1) 102(N),諸如GPS平臺、衛(wèi)星、轉(zhuǎn)播站、 飛機(jī)和/或任何其它類型的啟用定位系統(tǒng)的發(fā)射裝置或系統(tǒng)。環(huán)境100還包含位置確定裝 置104,諸如任意類型的移動基于地面的、基于海洋的和/或基于空運(yùn)的接收器,可以在后 面的描述中找到其進(jìn)一步的討論。雖然關(guān)于圖1描述和示出了GPS系統(tǒng),但應(yīng)清楚,也可 采用各種各樣的其它定位系統(tǒng),諸如基于陸地的系統(tǒng)(例如,從蜂窩式塔廣播位置數(shù)據(jù)的 基于無線電話的系統(tǒng))、發(fā)射定位信號的無線網(wǎng)絡(luò)等。例如,可通過使用基于服務(wù)器的結(jié)構(gòu) 中的服務(wù)器、從基于地面的基礎(chǔ)結(jié)構(gòu)、通過一個或多個傳感器(例如,陀螺儀、里程表、磁力 計)、使用"船位推算法(dead reckoning)"技術(shù)等實(shí)現(xiàn)位置確定功能。
在圖1的環(huán)境100中,位置發(fā)射平臺102(1) 102(N)被描述為被示為包含一個 或多個相應(yīng)的天線106(1) 106 (N)的GPS衛(wèi)星。 一個或多個天線106(1) 106 (N)分別 向位置確定裝置104發(fā)射可包含定位信息和導(dǎo)航信號的相應(yīng)的信號108(1) 108 (N)。雖 然示出了三個位置發(fā)射平臺102(1) 102(N),但應(yīng)容易清楚,環(huán)境可包含另外的位置發(fā)射 平臺102(1) 102 (N)以提供諸如冗余等的另外的位置確定功能。例如,可以使用三個示 出的位置發(fā)射平臺102(1) 102 (N)以提供二維導(dǎo)航,同時,可以使用四個位置發(fā)射平臺以 提供三維導(dǎo)航。也想到了各種其它的例子,包括使用前述的基于陸地的發(fā)射器。
位置確定功能出于以下的討論的目的可涉及各種不同的導(dǎo)航技術(shù)和可通過"知 道"一個或多個位置支撐的其它技術(shù)。例如,可以采用位置確定功能以提供位置信息、定時 信息、速度信息和各種其它的與導(dǎo)航有關(guān)的數(shù)據(jù)。因此,可以以各種方式配置位置確定裝置 104以執(zhí)行各種各樣的功能。例如,位置確定裝置104可被配置用于示出的車輛導(dǎo)航、航空 導(dǎo)航(例如,用于飛機(jī)、直升機(jī))、海洋導(dǎo)航、個人用途(例如,作為與健康有關(guān)的設(shè)備的一部 分)等。因此,位置確定裝置104可包含通過使用前述技術(shù)中的一種或多種來確定位置的
各種裝置。 圖1的示出的位置確定裝置104包含與位置接收器112通信耦合的位置天線110。 位置接收器112、輸入設(shè)備114(例如,觸摸屏、按鈕、麥克風(fēng)、無線輸入設(shè)備、數(shù)據(jù)輸入等)、 輸出設(shè)備116(例如,屏幕、揚(yáng)聲器和/或數(shù)據(jù)連接)和存儲器118也被示為與處理器120 通信耦合。 處理器120不受形成它們的材料或其中采用的處理機(jī)制的限制,因而,可通過半 導(dǎo)體和/或晶體管(例如,電子集成電路(IC))等被實(shí)現(xiàn)。另外,雖然示出單一的存儲器 118,但是,可以采用諸如隨機(jī)存取存儲器(RAM)、硬盤存儲器、可移動介質(zhì)存儲器(例如,可 通過接收可移動存儲器卡的插槽實(shí)現(xiàn)的存儲器118)和其它類型的計算機(jī)可讀介質(zhì)的各種 各樣類型的存儲器和它們的組合。 雖然位置確定裝置104的部件被單獨(dú)地示出,但應(yīng)清楚,這些部件也可被進(jìn)一步 分割(例如,輸出設(shè)備116可實(shí)現(xiàn)為揚(yáng)聲器和顯示裝置)和/或組合(例如,輸入和輸出設(shè) 備114、116可通過觸摸屏被組合)而不背離其精神和范圍。 示出的位置天線IIO和位置接收器112被配置為接收通過各位置發(fā)射平臺 102(1) 102 (N)的各天線106(1) 106 (N)發(fā)射的信號108(1) 108 (N)。這些信號被提 供給處理器120以被導(dǎo)航模塊122處理,該導(dǎo)航模塊122被示為在處理器120上被執(zhí)行并 且可被存儲在存儲器118中。導(dǎo)航模塊122代表諸如通過處理從位置發(fā)射平臺102(1) 102 (N)獲得的信號108(1) 108 (N)來確定地理位置以提供前述的位置確定功能、以諸如
6確定位置、速度、時間等的功能。 導(dǎo)航模塊122例如可被執(zhí)行為使用存儲在存儲器118中的位置數(shù)據(jù)124以產(chǎn)生導(dǎo) 航指令(例如,對于輸入目的地的逐圈指令)、在地圖上表示當(dāng)前的位置等。導(dǎo)航模塊122 還可被執(zhí)行以提供其它的位置確定功能,以諸如確定當(dāng)前的速度、計算到達(dá)時間等。還想到 了各種各樣的其它例子。 導(dǎo)航模塊122還被示為包含語音識別模塊126,該語音識別模塊126代表可被位置 確定裝置104采用的自動語音識別(ASR)功能。語音識別模塊126例如可包含轉(zhuǎn)換通過輸 入設(shè)備114(例如,麥克風(fēng)、藍(lán)牙頭戴式送受話器等)從用戶128接收的音頻輸入以找到諸 如文本、數(shù)字表現(xiàn)等的"意思"的功能。也可采用各種技術(shù)來翻譯音頻輸入。
語音識別模塊126還可采用ASR語境技術(shù)以創(chuàng)建用于ASR中的語境130以提高精 度和效率。例如,可采用這些技術(shù)以減少執(zhí)行ASR的數(shù)據(jù)搜索量。通過減少數(shù)據(jù)搜索量,可 以在增加ASR精度的同時減少實(shí)現(xiàn)ASR所采用的資源量,可關(guān)于以下的圖找到其進(jìn)一步的 討論。 圖2是將圖1的位置確定裝置104更詳細(xì)地表示為輸出用戶界面202并采用使用 語境的ASR技術(shù)的示例性實(shí)現(xiàn)中的系統(tǒng)200的示圖。在該示例性的實(shí)現(xiàn)中,語音識別模塊 126被示為包含語音引擎204和語境模塊206。語音引擎204代表翻譯音頻輸入以找到意 思的功能。語境模塊206代表創(chuàng)建具有一個或多個短語210 (w)(這里,"w"可以是從1到 "W"的任意整數(shù))的語境208的功能。從而,語境208、特別是語境208中的短語210 (w)可 被語音引擎204用來翻譯音頻輸入。可以以各種方式由語境模塊206產(chǎn)生語境208。
例如,語境模塊206可通過被配置為供給諸如通過使用射頻實(shí)現(xiàn)的局域無線連接 的局域網(wǎng)絡(luò)連接的網(wǎng)絡(luò)216從無線電話214輸入地址簿212。因此,當(dāng)位置確定裝置104與 無線電話214交互作用時,可利用地址簿212,以通過在與無線電話214交互作用時包含可 能被用戶128使用的短語210(w)而向該交互作用提供語境208。雖然已描述了無線電話 214,但各種的裝置組合可采用輸入技術(shù)來創(chuàng)建用于ASR中的語境,可關(guān)于圖4找到其進(jìn)一 步的討論。 在另一例子中,語境模塊206可基于當(dāng)前由位置確定裝置顯示的內(nèi)容產(chǎn)生包含短 語210(w)的語境208。例如,位置確定裝置104可通過衛(wèi)星無線電220接收無線電內(nèi)容 218、當(dāng)網(wǎng)絡(luò)216被配置為因特網(wǎng)時通過網(wǎng)絡(luò)216從網(wǎng)絡(luò)服務(wù)器224接收網(wǎng)絡(luò)內(nèi)容222,等 等。因此,本例子中的位置確定裝置104可使用語境模塊206以基于當(dāng)前由位置確定裝置 104顯示的內(nèi)容創(chuàng)建還定義什么交互作用可用的語境208。語境208還可反映當(dāng)前沒有被 顯示的可用于選擇的諸如對于要被滾動的列表中的歌曲的其它功能、可從多個菜單訪問的 導(dǎo)航功能,等等。 如圖2所示,位置確定裝置104示出多個部分226(1) 226 (4),所述多個部分 226(1) 226(4)可在用戶界面中被選擇以啟動被描述為可被選擇以導(dǎo)致輸出相應(yīng)的歌曲 的藝術(shù)家/歌曲標(biāo)題組合的功能。語境模塊206可檢查用戶界面以定位包含于用戶界面中 的短語210 (w)并在語境208中包含它們。因此,該語境208可被語音引擎204使用以使得 用戶128能夠說出短語210(w)中的一個或多個以導(dǎo)致啟動相應(yīng)的功能。例如,用戶128可 說出多個詞"Beethoven' s Fifth"、"Beethoven"和/或"Symphony"以導(dǎo)致選擇相應(yīng)部分 226 (1),如同用戶手動與用戶界面交互作用,例如,通過使用手指"按壓"部分226 (1)。
在實(shí)現(xiàn)中,語境模塊206被配置為動態(tài)維護(hù)語境208以反映在用戶界面中進(jìn)行的 改變。例如,可通過衛(wèi)星無線電220使得另一首歌曲可用,這在用戶界面中導(dǎo)致相應(yīng)的改 變。來自該新歌曲的短語可被添加到語境208上以保持語境208 "最新"。類似地,該另一 首歌曲可替代用戶界面中的先前顯示的歌曲。因此,語境模塊206可從語境208去除與被 替代的歌曲對應(yīng)的短語??申P(guān)于以下的過程找到語境208的創(chuàng)建、使用和維護(hù)的進(jìn)一步的 討論。 可通過使用軟件、固件、硬件(例如,固定邏輯電路)、手動處理或這些實(shí)現(xiàn)的組合 實(shí)現(xiàn)這里描述的功能中的任何功能。這里使用的術(shù)語"模塊"和"功能"一般代表軟件、固 件、硬件和它們的組合。在軟件實(shí)現(xiàn)的情況下,例如,模塊代表當(dāng)在諸如圖1的位置確定裝 置104的處理器120的處理器上被執(zhí)行時執(zhí)行特定任務(wù)的可執(zhí)行指令。程序代碼可被存儲 在一個或多個計算機(jī)可讀介質(zhì)中,該計算機(jī)可讀介質(zhì)的例子是圖1的位置確定裝置104的 存儲器118。以下描述的ASR語境技術(shù)的特征是與平臺無關(guān),這意味著可以在具有各種處理
器的各種商業(yè)計算平臺上實(shí)現(xiàn)所述技術(shù)。 以下的討論描述可通過利用前面描述的系統(tǒng)和裝置實(shí)現(xiàn)的ASR語境技術(shù)。可以以
硬件、固件、軟件或它們的組合實(shí)現(xiàn)這些過程中的每一個的各方面。這些過程被示為規(guī)定通
過一個或多個裝置執(zhí)行的操作的一組框,并且,未必限于由各框表示的用于執(zhí)行操作的次
序。在以下的討論的各部分中,將參照圖1的環(huán)境100和/或圖2的系統(tǒng)200。 圖3示出基于當(dāng)前在用戶界面中顯示的短語產(chǎn)生語境并且動態(tài)維護(hù)語境以反映
用戶界面的改變的示例性實(shí)現(xiàn)中的過程300。接收包含短語的數(shù)據(jù)(框302)。如前所述,
可以諸如通過輸入局域網(wǎng)絡(luò)連接上的數(shù)據(jù)、包含于通過衛(wèi)星無線電流動的無線電語境中的
元數(shù)據(jù)、通過因特網(wǎng)獲得的網(wǎng)絡(luò)內(nèi)容等以各種方式接收該數(shù)據(jù)。 確定可通過用戶界面選擇短語中的哪一個以啟動裝置的功能(框304)。例如,語 境模塊206可分析用于形成用戶界面的下層代碼以確定哪些功能是通過用戶界面可用的。 語境模塊206然后可從該代碼確定要被顯示于用戶界面中以代表該功能并且/或者以其他 方式可被選擇以啟動該功能的短語。出于以下討論的目的,應(yīng)當(dāng)注意,"短語"不限于常規(guī)的 說出的語言(例如,常規(guī)的英語詞),而是可包含可用于代表功能的字母數(shù)字和符號字符的 任意組合。換句話說。"短語(phrase)"可包含詞的一部分,例如, 一個"發(fā)音(utterance)"。 并且,應(yīng)當(dāng)容易清楚,也想到了短語的多種組合,諸如多個詞、多個發(fā)音和句子。
然后產(chǎn)生包含當(dāng)前可被選擇以啟動裝置的功能的短語的語境(框306)。語境例如 可引用當(dāng)前顯示的可選擇的短語。在實(shí)現(xiàn)中,可以過濾包含于語境中的短語以去除不是對 于特定的功能可唯一識別的短語而保留諸如"交響樂"的短語,諸如"to"、"the"、"or"等。 以此方式,語境可基于當(dāng)前顯示的內(nèi)容定義供用戶選擇的選項(xiàng),并且還可包含當(dāng)前沒有被 顯示但可被選擇的選項(xiàng),諸如前述的當(dāng)前沒有被顯示的列表的成員。 也可在裝置上動態(tài)維護(hù)語境(框308)。例如, 一個或多個短語可在被添加到用戶 界面時被動態(tài)添加到語境(框310)。類似地,來自語境的短語中的一個或多個在被從用戶 界面被去除時被去除(框312)。 裝置例如可被配置為通過衛(wèi)星無線電220接收無線電內(nèi)容218。可以在圖2所示 的用戶界面中顯示歌曲名稱。當(dāng)歌曲名稱在用戶界面中改變時,語境208中的短語210(w) 也可改變。因此,語境模塊206可保證包含于語境208中的短語210 (w)精確地反映在用戶界面中顯示的短語。也想到了各種其它的例子。 然后通過使用語境翻譯由該裝置接收的音頻輸入(框314)并且基于翻譯的音頻 輸入執(zhí)行裝置的一種或多種功能(框316)。繼續(xù)前面的實(shí)例,音頻輸入可導(dǎo)致輸出特定的 歌曲。也想到了各種其它的實(shí)例。 圖4示出由裝置從另一裝置輸入短語以向在裝置之間的交互作用中使用的ASR提 供語境的示例性實(shí)現(xiàn)中的過程400。在裝置和另一裝置之間啟動局域網(wǎng)絡(luò)連接(框402)。 例如,位置確定裝置104可啟動與圖2的無線電話214的局域無線連接(例如,藍(lán)牙)。
由裝置在另一裝置上定位要用于創(chuàng)建用于自動語音識別(ASR)中的語境的短語 (框404)。位置確定裝置104例如可確定無線電話214包含地址簿212。然后,從另一裝置 向一裝置輸入短語(框406),由此與位置確定裝置104"共享"無線電話214的地址簿212。
語境產(chǎn)生為包含輸入的短語中的一個或多個(框408)。語境208例如可產(chǎn)生為包 含取自地址簿212的名稱和地址(例如,街道、城市和州名稱)。例如,語境模塊206可輸入 縮寫"KS"并在語境208中提供詞"堪薩斯(Kansas)"和/或縮寫"KS"。
該裝置通過使用來自語境的短語中的一個或多個來翻譯音頻輸入(框410)。位置 確定裝置104例如可確定用戶已經(jīng)選擇了位置確定裝置104上的選項(xiàng)來與無線電話214交 互作用。因此,取得(例如,在存儲器118中定位并且從存儲器118加載)被創(chuàng)建用于幫助 定義電話交互作用的語境208。語音引擎204然后可使用語境208特別是語境208中的短 語210(w)來翻譯來自用戶128的音頻輸入以確定音頻輸入的諸如文本、數(shù)字表現(xiàn)等的"意 思"。 然后可為各種目的使用翻譯的音頻輸入,諸如基于翻譯的音頻輸入啟動另一裝置 的一種或多種功能(框412)。繼續(xù)前面的例子,位置確定裝置104可接收請求撥打特定的 電話號碼的音頻輸入。然后可通過使用該語境翻譯該音頻輸入,以諸如定位電話號碼薄中 的被叫人(addressee)的特定名稱。然后可由便攜式導(dǎo)航裝置104使用該名稱以導(dǎo)致無線 電話214撥打該號碼。然后可在用戶128和位置確定裝置104之間執(zhí)行通信以利用無線電 話214的功能。也想到了各種其它的例子。 雖然以結(jié)構(gòu)特征和/或方法動作特定的語言描述了本發(fā)明,但應(yīng)理解,在所附的 權(quán)利要求中限定的本發(fā)明不必限于描述的具體的特征或動作。而是,具體的特征和動作作 為實(shí)現(xiàn)要求保護(hù)的本發(fā)明的示例性形式被公開。
9
權(quán)利要求
一種方法,包括確定由位置確定裝置接收的哪個數(shù)據(jù)可被選擇以啟動所述位置確定裝置的一種或多種功能,其中,至少一種所述功能涉及位置確定功能;基于所述確定步驟產(chǎn)生包含取自所述數(shù)據(jù)的一個或多個短語的動態(tài)語境;和通過使用來自所述動態(tài)語境的一個或多個所述短語由所述位置確定裝置翻譯音頻輸入。
2. 如權(quán)利要求1所述的方法,其中,動態(tài)執(zhí)行所述產(chǎn)生步驟,以在向所述位置確定裝置的用戶界面添加一個或多個短語時在所述語境中添加所述一個或多個短語。
3. 如權(quán)利要求1所述的方法,其中,動態(tài)執(zhí)行所述產(chǎn)生步驟,以在從所述位置確定裝置的用戶界面去除所述短語中的一個或多個時從所述語境去除所述短語中的所述一個或多個。
4. 如權(quán)利要求1所述的方法,還包括接收包含所述短語的數(shù)據(jù);禾口確定所述短語可被選擇以啟動所述位置確定裝置的一種或多種功能,使得包含于所述數(shù)據(jù)中但不可選擇的至少一個短語不被包含于所產(chǎn)生的動態(tài)語境中。
5. 如權(quán)利要求4所述的方法,其中,所述位置確定裝置通過由衛(wèi)星發(fā)射的信號來接收所述數(shù)據(jù)。
6. 如權(quán)利要求4所述的方法,其中,所述位置確定裝置通過因特網(wǎng)來接收所述數(shù)據(jù)。
7. 如權(quán)利要求4所述的方法,其中,所述位置確定裝置通過局域無線網(wǎng)絡(luò)連接導(dǎo)入數(shù)據(jù)。
8. 如權(quán)利要求7所述的方法,其中,從無線電話導(dǎo)入所述數(shù)據(jù)。
9. 如權(quán)利要求1所述的方法,還包括接收規(guī)定地理位置的輸入;禾口獲得與地理位置有關(guān)的自動語音識別ASR數(shù)據(jù);禾口在語境中包含所獲得的ASR數(shù)據(jù),使得至少部分地通過使用所述語境中的所獲得的ASR數(shù)據(jù)來執(zhí)行音頻輸入的翻譯。
10. —種方法,包括產(chǎn)生包含由位置確定裝置通過局域網(wǎng)絡(luò)連接從另一裝置導(dǎo)入的一個或多個短語的語境;通過使用來自所述語境的一個或多個所述短語由所述位置確定裝置翻譯音頻輸入;和通過使用所翻譯的音頻輸入執(zhí)行與所述位置確定裝置的位置確定功能有關(guān)的一種或多種功能。
11. 如權(quán)利要求io所述的方法,其中,所述另一裝置被配置為無線電話。
12. 如權(quán)利要求IO所述的方法,其中,由所述位置確定裝置啟動并由所述另一裝置執(zhí)行所述功能中的至少一種。
13. 如權(quán)利要求IO所述的方法,其中,所述短語中的至少一個供給地址的一部分;禾口所述一種或多種功能包含找到從另一地址到前一地址的方向。
14. 如權(quán)利要求13所述的方法,其中,所述另一地址是通過使用所述裝置的位置確定功能所確定的所述位置確定裝置的當(dāng)前位置。
15. —種位置確定裝置,包含通過使用具有取自自動語音識別ASR數(shù)據(jù)的一個或多個短語的語境來翻譯音頻輸入的一個或多個模塊,其中,所述語境是動態(tài)的,從而短語被添加到所述語境或從所述語境被去除,以與可被選擇以啟動與位置確定功能有關(guān)的位置確定裝置的功能的短語一致。
16. 如權(quán)利要求15所述的裝置,所述一個或多個模塊進(jìn)一步被配置為接收包含要在用戶界面中顯示的短語的數(shù)據(jù);禾口確定短語是可在用戶界面中被選擇以啟動所述裝置的功能的,使得包含于用戶界面中但不可選擇的至少一個詞不被包含于所產(chǎn)生的語境中。
17. 如權(quán)利要求15所述的裝置,所述一個或多個模塊進(jìn)一步被配置為接收規(guī)定地理位置的輸入;禾口獲得與所述地址位置有關(guān)的自動語音識別ASR數(shù)據(jù),其中,通過使用所述語境中的ASR數(shù)據(jù)來執(zhí)行所述音頻輸入的翻譯。
18. 如權(quán)利要求15所述的裝置,其中,所述一個或多個模塊進(jìn)一步被配置為采用位置確定功能。
19. 如權(quán)利要求15所述的裝置,其中,所述一個或多個模塊進(jìn)一步被配置為采用音樂播放功能。
全文摘要
本發(fā)明涉及一種位置確定裝置及相應(yīng)的方法。描述了創(chuàng)建用于自動語音識別中的語境的技術(shù)。在實(shí)現(xiàn)中,確定由位置確定裝置接收的哪個數(shù)據(jù)可被選擇以啟動位置確定裝置的一種或多種功能,其中,所述功能中的至少一種涉及位置確定功能?;谒龃_定產(chǎn)生包含取自數(shù)據(jù)的一個或多個短語的動態(tài)語境。通過使用來自動態(tài)語境的一個或多個所述短語由位置確定裝置翻譯音頻輸入。
文檔編號G10L15/02GK101796577SQ200880105388
公開日2010年8月4日 申請日期2008年6月5日 優(yōu)先權(quán)日2007年7月11日
發(fā)明者J·W·凱爾, K·A·博爾頓, P·M·盧茨 申請人:佳明有限公司