使用選擇性重新講話來校正話音識別的制作方法

文檔序號：10724895閱讀：206來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

使用選擇性重新講話來校正話音識別的制作方法
【專利摘要】公開了使用選擇性重新講話來校正話音識別。本公開的實施方式包括以下的動作：提供用于在用戶的計算設(shè)備上的顯示的第一文本，第一文本基于從所述計算設(shè)備的第一語音而從第一語音識別引擎來提供，并且作為搜索查詢顯示，從所述計算設(shè)備接收語音校正指示，所述語音校正指示指示第一文本要校正的部分，從所述計算設(shè)備接收第二語音，基于所述第二語音從第二語音識別引擎接收第二文本，所述第二語音識別引擎不同于所述第一語音識別引擎，使用所述第二文本代替所述第一文本的所述部分以提供組合文本，以及提供組合文本以用于作為修正搜索查詢在所述計算設(shè)備上顯示。
【專利說明】
使用選擇性重新講話來校正話音識別
【背景技術(shù)】
[0001 ]互聯(lián)網(wǎng)提供對諸如圖像文件、音頻文件、視頻文件、和網(wǎng)頁的多種資源的訪問。搜索系統(tǒng)可以響應(yīng)于由用戶提交的查詢來識別資源并且以對于用戶有用的方式提供關(guān)于該資源的信息。用戶可以通過例如點擊來導(dǎo)航搜索結(jié)果以獲取感興趣的信息。

【發(fā)明內(nèi)容】

[0002]本說明書涉及在搜索系統(tǒng)中的語音識別，例如話音至文本。
[0003]本公開的實施方式一般地指向使用選擇性的重新講出而校正語音識別。更具體地，本公開的實施方式指向基于(由用戶)重新講出文本搜索查詢的部分，來校正該文本搜索查詢的該部分。在一些示例中，文本搜索查詢的該部分被校正以提供校正的文本搜索查詢。
[0004]一般地，在本說明書中描述的主題內(nèi)容的創(chuàng)造方面可以在包括以下動作的方法中實現(xiàn)，所述動作包括:提供第一文本以用于在用戶的計算設(shè)備上顯示，所述第一文本基于從所述計算設(shè)備的第一語音而從第一語音識別引擎來提供，并且作為搜索查詢顯示，從所述計算設(shè)備接收語音校正指示，所述語音校正指示用于指示所述第一文本的要校正的部分，從所述計算設(shè)備接收第二語音，基于所述第二語音從第二語音識別引擎接收第二文本，所述第二語音識別引擎不同于所述第一語音識別引擎，使用所述第二文本代替所述第一文本的所述部分以提供組合文本，以及提供所述組合文本以用于作為修正搜索查詢在所述計算設(shè)備上顯示。本方面的其他的實施方式包括被配置成執(zhí)行在計算機(jī)存儲設(shè)備上編碼的方法的動作的對應(yīng)系統(tǒng)、裝置、和計算機(jī)程序。
[0005]這些和其他的實施方式每個都可以實施方式地包括以下的特征中的一個或多個:所述部分包括所述第一文本的整體;所述部分包括小于所述第一文本的整體;所述第二語音識別引擎包括所述第一語音識別引擎和至少一個附加的功能;所述至少一個附加的功能包括基于與所述第一文本相關(guān)聯(lián)的一個或多個實體選擇潛在的文本作為所述第二文本;所述動作還包括:接收基于所述第一文本的第一搜索結(jié)果，以及提供所述第一搜索結(jié)果以用于在所述計算設(shè)備上顯示;所述動作還包括:接收基于所述第二文本的第二搜索結(jié)果，以及提供所述第二搜索結(jié)果以用于在所述計算設(shè)備上代替所述第一搜索結(jié)果顯示;并且所述語音校正指示包括對所述第一文本的多個單詞中的至少一個單詞的用戶選擇。
[0006]在本說明書中描述的本主題的特定實施方式可以被實施從而實現(xiàn)以下優(yōu)點中的一個或多個優(yōu)點。在一些示例中，對初始查詢的部分的校正是更快的并且資源效率更高的。例如，從用戶觀點，重新講出該部分而不是重新講出初始查詢的整體是更快/更容易的。從資源觀點，與對初始查詢的整體執(zhí)行語音識別相對，對該部分執(zhí)行語音識別需要更少的帶寬以及更少的計算機(jī)處理能力和/或存儲器。在一些示例中，與計算設(shè)備的用戶交互被簡化，例如，用戶拼寫出單個單詞而不是整個查詢。在一些示例中，可以在不消耗增加的資源的情況下，將更復(fù)雜的語音識別可以用于將第二語音更精確地轉(zhuǎn)換為文本，例如，因為第二語音比初始查詢的整體短。
[0007]在本說明書中描述的本主題的一個或多個實施方式的細(xì)節(jié)在下文的附圖和描述中提出。本主題的其他特征、方面、和優(yōu)點將從描述、附圖、和權(quán)利要求變得明顯。
【附圖說明】
[0008]圖1描繪了示例在其中搜索系統(tǒng)提供搜索結(jié)果的示例環(huán)境。
[0009]圖2A-2D描繪了根據(jù)本公開的實施方式的示例使用案例。
[0010]圖3描繪了根據(jù)本公開的實施方式的示例語音識別系統(tǒng)。
[0011]圖4描繪了可以根據(jù)本公開的實施方式執(zhí)行的示例過程。
[0012 ]在各個附圖中的相似的附圖標(biāo)記和指代指示相似的元件。
【具體實施方式】
[0013]本公開的實施方式一般地指向使用選擇性的再說話校正語音識別。更具體地，本公開的實施方式指向基于用戶重新講出搜索查詢的部分來校正該部分。在一些實施方式中，提供第一文本以用于向用戶顯示，該第一文本基于從計算設(shè)備的用戶的第一語音而從第一語音識別引擎來提供。在一些示例中，該第一文本是提交至搜索系統(tǒng)的搜索查詢。在一些實施方式中，用戶可以指示第一文本的要校正的部分，并且可以提供第二語音，使用第二語音識別引擎對其進(jìn)行處理以提供第二文本。在一些實施方式中，該第一文本的該部分被該第二文本代替以提供組合文本。在一些示例中，組合文本是提交至搜索系統(tǒng)的修正搜索查詢。
[0014]圖1描繪了在其中搜索系統(tǒng)基于用戶查詢提供搜索結(jié)果的示例環(huán)境100。在一些示例中，示例環(huán)境100使得用戶能夠與一個或多個計算機(jī)實現(xiàn)的服務(wù)交互。示例的計算機(jī)實現(xiàn)的服務(wù)可以包括搜索服務(wù)、電子郵件服務(wù)、聊天服務(wù)、文檔共享服務(wù)、日程表共享服務(wù)、照片共享服務(wù)、視頻共享服務(wù)、博客服務(wù)、微博服務(wù)、社交網(wǎng)絡(luò)服務(wù)、定位(地點認(rèn)知)服務(wù)、登記服務(wù)、以及評級和檢查服務(wù)。在圖1的示例中，描繪了搜索系統(tǒng)120，其提供搜索服務(wù)，如在本文中更詳細(xì)地描述的。
[0015]繼續(xù)參照圖1，示例環(huán)境100包括連接網(wǎng)站104、用戶設(shè)備106、和搜索系統(tǒng)120的網(wǎng)絡(luò)102，網(wǎng)絡(luò)102例如局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、互聯(lián)網(wǎng)、或其組合。在一些示例中，可以經(jīng)過有線和/或無線通信鏈路訪問網(wǎng)絡(luò)102。例如，諸如智能電話的移動計算設(shè)備可以利用蜂窩網(wǎng)絡(luò)來訪問網(wǎng)絡(luò)102。環(huán)境100可以包括上百萬的網(wǎng)站104和用戶設(shè)備106。
[0016]在一些示例中，提供網(wǎng)站104作為與域名相關(guān)聯(lián)并且由一個或多個服務(wù)器托管的一個或多個資源105。示例的網(wǎng)站是以合適的機(jī)器可讀語言(例如超文本標(biāo)記語言(HTML))格式化的網(wǎng)頁的集合，其可以包含文本、圖像、多媒體內(nèi)容、和例如腳本的編程元素。每個網(wǎng)站104被發(fā)布者維護(hù)，例如管理和/或擁有該網(wǎng)站的實體。
[0017]在一些示例中，資源105是通過網(wǎng)絡(luò)102提供的并且與資源地址(例如統(tǒng)一資源定位符(URL))相關(guān)聯(lián)的數(shù)據(jù)。在一些示例中，可以由網(wǎng)站104提供的資源105包括網(wǎng)頁、單詞處理文檔、和便攜文檔格式(PDF)文檔、圖像、視頻、和饋送源，以及其他的合適的數(shù)字內(nèi)容。資源105可以包括例如單詞、短語、圖像、和聲音的內(nèi)容，并且可以包括嵌入信息，例如，元信息和超鏈接、和/或嵌入的指令(例如，腳本)。
[0018]在一些示例中，用戶設(shè)備106是能夠通過網(wǎng)絡(luò)102請求和接收資源105的電子設(shè)備。示例的用戶設(shè)備106包括可以通過網(wǎng)絡(luò)102發(fā)送和接收數(shù)據(jù)的個人計算機(jī)、膝上型計算機(jī)、和移動計算設(shè)備，例如，智能電話和/或平板計算設(shè)備。如在整個文檔中使用的，術(shù)語移動計算設(shè)備(“移動設(shè)備”)是指被配置成通過移動通信網(wǎng)絡(luò)通信的用戶設(shè)備。智能電話(例如實現(xiàn)通過互聯(lián)網(wǎng)通信的電話)是移動設(shè)備的一個示例。用戶設(shè)備106可以執(zhí)行用戶應(yīng)用(例如web瀏覽器)以有助于通過網(wǎng)絡(luò)102發(fā)送和接收數(shù)據(jù)。
[0019]在一些示例中，為了有助于資源105的搜索，搜索系統(tǒng)120通過爬行和索引在網(wǎng)站104上提供的資源105來識別資源105。關(guān)于資源105的數(shù)據(jù)可以基于該數(shù)據(jù)所對應(yīng)的資源來索引。資源105的經(jīng)索引并且可選地緩存的副本存儲在搜索索引122中。
[0020]用戶設(shè)備106將搜索查詢109提交至搜索系統(tǒng)120。在一些示例中，用戶設(shè)備106可以包括一個或多個輸入模式。示例的模式可以包括鍵盤、觸摸屏、和/或麥克風(fēng)。例如，用戶可以使用鍵盤和/或觸摸屏在搜索查詢中打字。作為另一個示例，用戶可以說出搜索查詢，用戶語音通過麥克風(fēng)來捕獲，并且通過語音識別來處理以提供搜索查詢。
[0021]響應(yīng)于接收到搜索查詢109，搜索系統(tǒng)120訪問搜索索引122以識別與搜索查詢109相關(guān)(例如具有對于搜索查詢109的至少一個最小的指定相關(guān)性評分)的資源105。搜索系統(tǒng)120識別資源105，產(chǎn)生包括識別資源105的搜索結(jié)果112的搜索結(jié)果顯示111，并且將搜索結(jié)果顯示111返回至用戶設(shè)備106。在一個示例場境中，搜索結(jié)果顯示可以包括一個或多個網(wǎng)頁，例如，一個或多個搜索結(jié)果頁面。在一些示例中，可以基于可以以任何合適的機(jī)器可讀語言編寫的web文檔來提供網(wǎng)頁。然而，設(shè)想，本公開的實施方式可以包括其他合適的顯示類型。例如，可以在由在計算設(shè)備上執(zhí)行的應(yīng)用所生成的顯示中和/或由操作系統(tǒng)(例如移動操作系統(tǒng))生成的顯示中提供搜索結(jié)果。在一些示例中，可以基于任何合適的形式(例如，Javascript-html、純文本)來提供搜索結(jié)果。
[0022]搜索結(jié)果112是由搜索系統(tǒng)120生成的數(shù)據(jù)，其識別對特定搜索查詢作出響應(yīng)的資源105，并且包括指向該資源105的鏈接。示例的搜索結(jié)果112可以包括網(wǎng)頁標(biāo)題、從網(wǎng)頁提取的文本片段或圖像部分、和網(wǎng)頁的URL。在一些示例中，可以從資源數(shù)據(jù)存儲庫中檢索到在搜索結(jié)果112中提供的數(shù)據(jù)。例如，搜索系統(tǒng)120可以提供搜索結(jié)果顯示111，其顯示搜索結(jié)果112。在一些示例中，可以用從資源數(shù)據(jù)存儲庫提供的信息填入搜索結(jié)果顯示111，例如網(wǎng)頁標(biāo)題、從網(wǎng)頁提取的文本片段或圖像部分。
[0023]在一些示例中，用于在用戶會話期間提交的搜索查詢109的數(shù)據(jù)存儲在數(shù)據(jù)存儲庫中，諸如歷史數(shù)據(jù)存儲庫124。例如，搜索系統(tǒng)120可以將的搜索查詢存儲在歷史數(shù)據(jù)存儲庫124中。
[0024]在一些示例中，指定響應(yīng)于對每個搜索查詢109作出響應(yīng)而提供的搜索結(jié)果112而采取的動作的選擇數(shù)據(jù)也(例如，由搜索系統(tǒng)120)存儲在歷史數(shù)據(jù)存儲庫124中。這些動作可以包括搜索結(jié)果112是否被選擇，例如，用指針點擊或懸停。對于搜索結(jié)果112的每個選擇，選擇數(shù)據(jù)可以還包括識別針對其提供搜索結(jié)果112的搜索查詢109的數(shù)據(jù)。
[0025]在一些實施方式中，用戶可以基于語音提交搜索查詢109。例如，用戶可以對著用戶設(shè)備106的麥克風(fēng)講話，并且用戶的語音可以作為語音數(shù)據(jù)(也稱為第一語音)被捕獲在數(shù)據(jù)文件中。在一些示例中，提供語音數(shù)據(jù)作為通過網(wǎng)絡(luò)102提交至搜索系統(tǒng)120的搜索查詢109。在一些實施方式中，搜索系統(tǒng)120可以將語音數(shù)據(jù)提供至語音識別系統(tǒng)130。在一些示例中，語音識別系統(tǒng)130可以處理語音數(shù)據(jù)以提供文本。例如，語音識別系統(tǒng)130可以使用話音至文本引擎(也稱為第一語音識別引擎)來處理語音數(shù)據(jù)以提供文本。在一些示例中，語音識別系統(tǒng)130將文本提供至搜索系統(tǒng)120，搜索系統(tǒng)120將該文本作為搜索查詢處理以提供搜索結(jié)果112。在一些示例中，可以提供搜索查詢以用于向用戶顯示，例如，與搜索結(jié)果一起。以這種方式，用戶可以看到如何識別語音，以及搜索結(jié)果所基于的搜索查詢。
[0026]雖然搜索系統(tǒng)120和語音識別系統(tǒng)130在圖1的示例中描繪為分立的系統(tǒng)，應(yīng)意識至IJ，搜索系統(tǒng)120和語音識別系統(tǒng)130可以被包括在同一個系統(tǒng)中，例如，搜索系統(tǒng)120可以包括其中的語音識別系統(tǒng)130。
[0027]根據(jù)本公開的實施方式，用戶可以校正搜索查詢的一部分，例如一個或多個單詞。在一些示例中，用戶可以確定搜索查詢的一部分是不正確的，例如，對于該部分的語音識別不精確地識別用戶的語音，并且可以指示該部分是要校正的。例如，用戶可以選擇被使用用戶設(shè)備106向用戶顯示的該搜索查詢的該部分。在一些實施方式中，用戶再次對著用戶設(shè)備106的麥克風(fēng)講話，并且用戶的語音可以作為部分語音數(shù)據(jù)(也稱為第二語音)被捕獲在數(shù)據(jù)文件中。在一些示例中，提供該部分語音數(shù)據(jù)作為搜索查詢的該部分的重新講話，并且通過網(wǎng)絡(luò)102提交至搜索系統(tǒng)120。在一些實施方式中，搜索系統(tǒng)120可以將該部分語音數(shù)據(jù)提供至語音識別系統(tǒng)130，并且可以包括與語音輸入的重新講話相對應(yīng)的該部分語音數(shù)據(jù)的指示。在一些示例中，語音識別系統(tǒng)130可以處理該部分語音數(shù)據(jù)以提供修正文本。例如，語音識別系統(tǒng)130可以使用話音至文本引擎(也稱為第二語音識別引擎)處理該部分語音數(shù)據(jù)。
[0028]在一些實施方式中，用于處理語音數(shù)據(jù)的第一語音識別引擎不同于用于處理部分語音數(shù)據(jù)的第二語音識別引擎。在一些示例中，相對于第二語音識別引擎，第一語音識別引擎可以被用于利用不那么嚴(yán)格的精確度閾值提供語音數(shù)據(jù)的相對迅速的處理。例如，第一語音識別引擎可以使用更少的資源，例如，處理器、存儲器，并且可以比第二語音識別引擎更迅速地提供結(jié)果。在一些示例中，相對于第一語音識別引擎，第二語音識別引擎可以被用于提供對部分語音數(shù)據(jù)的更精確的處理，例如，更嚴(yán)格的精確度閾值。例如，第二語音識別引擎可以使用更多的資源，例如，處理器、存儲器，并且可以提供比第一語音識別引擎更精確的結(jié)果。在一些示例中，雖然第二語音識別引擎比第一語音識別引擎更復(fù)雜，并且可能消耗更多的資源，但是提供結(jié)果的速度可以是相似的。例如，并且如在本文中更詳細(xì)地描述的，第一語音識別引擎可以正在處理比第二語音識別引擎多的語音，例如，第二語音識別引擎正在僅處理原始提交的語音的部分。
[0029]在一些實施方式中，語音識別系統(tǒng)130將修正文本提供至搜索系統(tǒng)120，搜索系統(tǒng)120基于搜索查詢和該修正文本提供修正的搜索查詢。例如，搜索系統(tǒng)120用修正的文本代替搜索查詢的該部分以提供修正的搜索查詢。搜索系統(tǒng)120處理修正的搜索查詢以提供已修正的搜索結(jié)果112。在一些示例中，可以提供修正的搜索查詢以用于向用戶顯示，例如，與搜索結(jié)果一起。以這種方式，用戶可以看到語音如何被修正，以及搜索結(jié)果所基于的搜索查詢。
[0030]圖2A-2D描繪了根據(jù)本公開的實施方式的示例使用案例。具體地參照圖2A，用戶200使用計算設(shè)備202進(jìn)行搜索。更具體地，用戶200使用計算設(shè)備202將搜索查詢提交至搜索系統(tǒng)，例如，圖1的搜索系統(tǒng)120，搜索系統(tǒng)提供搜索結(jié)果以用于在計算設(shè)備202上向用戶顯示。在所描繪的示例中，提供計算設(shè)備202作為移動計算設(shè)備，例如，智能電話、平板。然而，應(yīng)意識到，可以使用任何合適類型的計算設(shè)備來實現(xiàn)本公開的實施方式，例如，桌面型計算機(jī)、膝上型計算機(jī)、諸如智能手表的可穿戴計算設(shè)備。
[0031]在所描繪的示例中，計算設(shè)備202顯示用戶200可以使用其提交搜索查詢和接收搜索結(jié)果的搜索界面204。示例的搜索界面204包括搜索框206、搜索按鈕208、搜索結(jié)果區(qū)域210和麥克風(fēng)按鈕212。在一些示例中，被提交至搜索系統(tǒng)的搜索查詢在搜索框206中顯示，并且所得到的搜索結(jié)果在搜索結(jié)果區(qū)域210中顯示。在一些示例中，用戶200可以選擇搜索按鈕208以啟動提交搜索查詢至搜索系統(tǒng)。在一些示例中，搜索查詢被自動地提交至搜索系統(tǒng)，而不要求用戶選擇搜索按鈕208。
[0032]根據(jù)本公開的實施方式，用戶200提供第一語音220作為至搜索界面204的輸入。在所描繪的示例中，第一語音220包括查詢[給我看Maradona的圖片]。在一些示例中，計算設(shè)備202使用麥克風(fēng)記錄第一語音220，并且生成將第一語音220作為音頻數(shù)據(jù)存儲的一個或多個數(shù)據(jù)文件(例如.wav文件、.mp3文件)。在一些實施方式中，計算設(shè)備202將第一語音220提供至搜索系統(tǒng)。在一些示例中，將第一語音220自動地提供至搜索系統(tǒng)，例如，不要求用戶選擇搜索按鈕208。在一些示例中，在用戶已經(jīng)說出第一語音220的整體之后，第一語音220被傳送至搜索系統(tǒng)。例如，搜索系統(tǒng)120在一個請求中接收第一語音220的整體。在一些示例中，第一語音220的部分在它們被說出時傳送至搜索系統(tǒng)。例如，在第一語音220的每個部分被說出時，搜索系統(tǒng)這些部分(例如單詞)。
[0033]在一些實施方式中，并且如在本文中更詳細(xì)地描述的，第一語音220被語音識別系統(tǒng)(例如圖1的語音識別系統(tǒng)130)處理以提供第一文本(例如文本搜索查詢)ο例如，搜索系統(tǒng)可以將音頻數(shù)據(jù)提供至語音識別系統(tǒng)以用于處理。在一些示例中，語音識別系統(tǒng)使用第一語音識別引擎處理第一語音220以提供第一文本。
[0034]在一些實施方式中，提供第一文本以用于在計算設(shè)備202上顯示。在一些示例中，搜索系統(tǒng)從語音識別系統(tǒng)接收第一文本并且將第一文本傳送至計算設(shè)備202。在一些示例中，第一文本作為搜索查詢222顯示在搜索框206中。在一些示例中，搜索系統(tǒng)將第一文本作為搜索查詢處理以提供搜索結(jié)果，其中的至少一些被發(fā)送至計算設(shè)備202并且作為搜索結(jié)果224被顯示在搜索結(jié)果區(qū)域210中。在一些示例中，在計算設(shè)備202搜索結(jié)果224和顯示其之前，將搜索查詢222顯示給用戶。例如，第一文本可以并且作為搜索查詢222在搜索框206中顯示，并且可以隨后并顯示搜索結(jié)果224，例如，在搜索查詢222的顯示和搜索結(jié)果224的顯示之間存在時間滯后。
[0035]在所描繪的示例中，搜索查詢222被提供為[給我看Madonna的圖片]。據(jù)此，單詞[Maradona]被語音識別系統(tǒng)不正確地識別為[Madonna]。因此，搜索結(jié)果224包括歌手-作曲家、女演員、和制片人Madonna的圖像。即，搜索結(jié)果224所基于的搜索查詢222是不正確的，因為其應(yīng)當(dāng)被提供為[給我看Maradona的圖片]。
[0036]根據(jù)本公開的實施方式，用戶200可以校正搜索查詢222的部分以提供修正的搜索查詢，可以將所述修正的搜索查詢提交至搜索系統(tǒng)。在一些實施方式中，用戶200可以提供語音校正指示，其指示搜索查詢222(例如第一文本)要校正的部分。例如，用戶可以選擇搜索查詢222的要校正的一個或多個單詞。在一些示例中，用戶200可以在該部分上敲擊，例如，包括觸摸屏設(shè)備的計算設(shè)備202。
[0037]圖2B描繪了搜索查詢222的要校正的部分230。在所描繪的示例中，用戶200選擇要校正的單詞[Madonna]。
[0038]圖2C描繪了用戶200重新講出部分230。在所描繪的示例中，用戶200提供第二語音232作為至搜索界面204的輸入。在所描繪的示例中，第二語音232包括[Maradona]。在一些示例中，用戶200可以拼寫出要校正的部分230。在圖2A-2C的示例中，用戶200可以拼寫出第二文本232，例如，“M-A-R-A-D-0-N-A”。在一些示例中，計算設(shè)備202使用麥克風(fēng)記錄第二語音232，并且生成將第二語音232作為音頻數(shù)據(jù)存儲的一個或多個數(shù)據(jù)文件，例如.wav文件、.mp3文件。在一些實施方式中，計算設(shè)備202將第二語音232提供至搜索系統(tǒng)。在一些示例中，第二語音232被自動地提供至搜索系統(tǒng)，例如，不要求用戶選擇搜索按鈕208。
[0039]在一些實施方式中，并且如在本文中更詳細(xì)地描述的，將第二語音232和第二語音232與要校正的部分相對應(yīng)的指示(也稱為校正指示)提供至語音識別系統(tǒng)。在一些示例中，第二語音232被語音識別系統(tǒng)處理以提供第二文本。在一些示例中，并且也響應(yīng)于校正指示，語音識別系統(tǒng)使用第二語音識別引擎處理第二語音232以提供第二文本。在一些示例中，并且如在本文中更詳細(xì)地描述的，第二語音識別引擎不同于第一語音識別引擎。
[0040]根據(jù)本公開的實施方式，基于第一文本和第二文本提供組合文本。在一些實施方式中，第一文本的該部分，例如在所描繪的示例中，將[Madonna]從第一文本刪除并且被例如[Maradona]的第二文本代替以提供組合文本。在一些實施方式中，搜索系統(tǒng)從語音識別系統(tǒng)接收第二文本并且基于第一文本和第二文本提供組合文本。
[0041]現(xiàn)在參照圖2D，并且在一些實施方式中，提供組合文本以用于在計算設(shè)備202上的顯示。在一些示例中，搜索系統(tǒng)將組合文本傳送至計算設(shè)備202。在一些示例中，組合文本在搜索框206中作為修正的搜索查詢222’顯示。在一些示例中，搜索系統(tǒng)將組合文本作為搜索查詢處理以提供搜索結(jié)果，其至少一些被發(fā)送至計算設(shè)備202并且作為搜索結(jié)果240在搜索結(jié)果區(qū)域210中顯示。在一些示例中，在計算設(shè)備202并顯示搜索結(jié)果240之前，將修正的搜索查詢222’顯示給用戶。例如，可以組合文本并且作為修正的搜索查詢222’在搜索框206中顯示，并且可以隨后并顯示搜索結(jié)果240，例如，在修正的搜索查詢222’的顯示和搜索結(jié)果240的顯示之間可以存在時間滯后。
[0042]在一些實施方式中，并且如在圖2A-2D的示例中描繪的，用戶選擇文本的要校正的部分，并且說出該校正，例如，選擇[Madonna]并說出[Maradona]例如作為第二語音。在一些示例中，響應(yīng)于對文本要校正的部分的用戶選擇，自動地激活計算設(shè)備的麥克風(fēng)。在一些示例中，用戶選擇文本的要校正的部分，并且用戶激活麥克風(fēng)，例如，選擇麥克風(fēng)按鈕212。
[0043]在一些實施方式中，代替重新講出該要校正的部分，用戶講出向該要校正的部分提供上下文的短語。例如，并且繼續(xù)圖2A-2D的示例，代替說出[Maradona]或[M-A-R-A-D-0-N-A]，如上文描述的，用戶可以說出[我的意思是那個足球運動員]，例如，作為第二語音，其向要校正的部分提供上下文。在一些示例中，該上下文可以被用于在該部分的潛在校正之間做出辨別，如在本文中更詳細(xì)地描述的。
[0044]在一些實施方式中，要校正的部分未被用戶明確地選擇。在圖2A-2D的示例中，用戶選擇單詞[Madonna]，例如通過在計算設(shè)備的觸摸屏上敲擊[Madonna]。在一些示例中，并且代替選擇部分，用戶可以提供第二語音以提供該校正的上下文，處理該第二語音以確定要校正的部分，并且提供用于校正該部分的第二文本。例如，并且繼續(xù)圖2A-2D的示例，第二語音可以包括[不，我的意思是那個足球運動員]、[我的意思是Maradona]、[將Madonna改為Maradona]、或[刪除Madonna]。據(jù)此，第二語音提供上下文來選擇要校正的部分，并且可以用于在對該部分的潛在校正之間做出辨別，如在本文中更詳細(xì)地描述的。在一些示例中，用戶在提供第二語音之前激活麥克風(fēng)，例如選擇麥克風(fēng)按鈕212。
[0045]在一些實施方式中，在一部分要被校正的情況下自動地激活麥克風(fēng)。例如，并且如上文討論的，響應(yīng)于對要校正的部分的用戶選擇，可以自動地激活麥克風(fēng)。在一些示例中，在搜索查詢被顯示至用戶之后可以自動地激活麥克風(fēng)。以這種方式，用戶可以提供第二語音，而不要求用戶首先激活麥克風(fēng)。
[0046]圖3描繪了根據(jù)本公開的實施方式的示例語音識別系統(tǒng)300。示例語音識別系統(tǒng)300包括第一語音識別引擎302和第二語音識別引擎304。在一些示例中，語音識別系統(tǒng)300接收輸入數(shù)據(jù)306，使用第一語音識別引擎302或第二語音識別引擎304處理輸入數(shù)據(jù)306，并且提供輸出數(shù)據(jù)308。在一些示例中，輸入數(shù)據(jù)306被從搜索系統(tǒng)提供至語音識別系統(tǒng)300，并且語音識別系統(tǒng)300將輸出數(shù)據(jù)提供至搜索系統(tǒng)。
[0047]在一些實施方式中，輸入數(shù)據(jù)306包括由用戶提供至搜索系統(tǒng)的第一語音的音頻數(shù)據(jù)(語音數(shù)據(jù))。參照圖2A-2D的示例，輸入數(shù)據(jù)306可以包括第一語音[給我看Maradona的圖片]的音頻文件。在一些示例中，第一語音識別引擎302處理輸入數(shù)據(jù)306以提供輸出數(shù)據(jù)308。在一些實施方式中，輸出數(shù)據(jù)308是基于音頻數(shù)據(jù)的第一文本。參照圖2A-2D的示例，輸出數(shù)據(jù)308可以包括包含例如[給我看Madonna的圖片]的第一文本的文本文件。
[0048]在一些示例中，第一文本可以由第一語音識別引擎基于潛在文本的集合來選擇。在一些示例中，基于與潛在文本相關(guān)聯(lián)的相應(yīng)置信度評分而從潛在文本的集合中選擇第一文本。例如，并且使用圖2A-2D的示例，可以處理第一語音以提供[給我看Madonna的圖片]和[給我看Maradona的圖片]。在本示例中，[給我看Madonna的圖片]與第一置信度評分(例如95%)相關(guān)聯(lián)，并且[給我看Maradona的圖片]與第二置信度評分(例如92%)相關(guān)聯(lián)?？梢源_定，第一置信度評分超過第二置信度評分。因此，選擇[給我看Madonna的圖片]作為第一文本。換句話說，可以選擇在潛在文本的集合中具有最高的置信度評分的潛在文本作為第一文本。
[0049]在一些實施方式中，輸入數(shù)據(jù)306包括由用戶提供至搜索系統(tǒng)的第二語音的音頻數(shù)據(jù)(部分語音數(shù)據(jù))，以及校正指示。參照圖2A-2D的示例，輸入數(shù)據(jù)306可以包括第二語音[Maradona]的音頻文件，以及校正指示。在一些示例中，第二語音識別引擎304處理輸入數(shù)據(jù)306以提供輸出數(shù)據(jù)308。例如，響應(yīng)于輸入數(shù)據(jù)306包括校正指示，將第二語音識別引擎304用于處理該音頻數(shù)據(jù)。在一些實施方式中，輸出數(shù)據(jù)308是基于該音頻數(shù)據(jù)的第二文本。參照圖2A-2D的示例，輸出數(shù)據(jù)308可以包括包含例如[Maradona]的第二文本的文本文件。
[0050]在一些實施方式中，第一語音識別引擎302不同于第二語音識別引擎304。在一些示例中，相對于第二語音識別引擎304，第一語音識別引擎302可以被用于使用的不那么嚴(yán)格的精確度閾值來提供語音數(shù)據(jù)的相對更迅速的處理。例如，相對于第二語音識別引擎304，第一語音識別引擎302可以實現(xiàn)更不復(fù)雜、更不精確的語音識別算法。以這種方式，相比于第二語音識別引擎304，第一語音識別引擎302可以相對更迅速地提供結(jié)果并且可以使用更少的例如處理器、存儲器的資源。在一些示例中，相對于第一語音識別引擎302，第二語音識別引擎304可以被用于提供對部分語音數(shù)據(jù)的更精確的處理，例如更嚴(yán)格的精確度閾值。例如，相對于第一語音識別引擎302，第二語音識別引擎304可以實現(xiàn)更復(fù)雜的、更精確的語音識別算法。以這種方式，如果處理相同的音頻數(shù)據(jù)的話，相比于第一語音識別引擎304，第二語音識別引擎304將相對更慢地提供結(jié)果并且可以使用更多的例如處理器、存儲器的資源，。
[0051]在一些實施方式中，雖然第二語音識別引擎302是比第一語音識別引擎304更復(fù)雜的，但是提供結(jié)果的速度和用于提供結(jié)果的資源的量可以是相似的。例如，并且如在本文中更詳細(xì)地描述的，第一語音識別引擎302可以正在處理比第二語音識別引擎304更多的音頻數(shù)據(jù)，例如，第二語音識別引擎304正在僅處理原始提交的語音的部分。參照圖2A-2D的示例，第一語音識別引擎302處理文本[給我看Maradona的圖片]，而第二語音識別引擎304僅處理文本[Maradona]。
[0052]如上文描述的，第一語音識別引擎不同于第二語音識別引擎。在一些示例中，第二語音識別是不同的，因為第二語音識別包括第一語音識別引擎，以及用于處理第二語音的附加的功能和/或不同的參數(shù)。也就是說，并且在一些示例中，第二語音識別引擎是第一語音識別以及用于處理第二語音的附加的功能和/或不同的參數(shù)。
[0053]在一些實施方式中，處理第二語音以提供潛在文本的集合，可以根據(jù)其確定第二文本。在一些示例中，從對基于第二語音所提供的潛在文本的集合的選擇中排除包括在第一文本中的文本。例如，從對潛在文本的集合的選擇中排除文本的要校正的部分。繼續(xù)圖2A-2D的示例，第二語音可以包括[Maradona]，可以對其進(jìn)行處理以提供包括[Madonna]和[Maradona]的潛在文本的集合，例如。因為[Madonna]已經(jīng)包括在例如第一文本中并且經(jīng)選擇以用于校正，所以從對于第二文本的選擇中排除[Madonna]。因此，選擇潛在文本[Maradona]作為潛在文本。
[0054]在一些實施方式中，并且響應(yīng)于第二語音，可以處理用于確定第一文本的潛在文本以使相應(yīng)實體彼此相關(guān)聯(lián)。在一些示例中，可以處理第二語音并且一個或多個實體可以與其相關(guān)聯(lián)。在一些實施方式中，與第二語音相關(guān)聯(lián)的實體可以與和潛在文本的集合中的潛在文本中的每一個相關(guān)聯(lián)的實體進(jìn)行比較。在一些示例中，選擇具有至少一個實體的潛在文本，所述實體與和第二語音相關(guān)聯(lián)的實體相匹配。
[0055]以示例的方式，并且使用圖2A-2D的示例，可以處理第一語音以提供[給我看Madonna的圖片]和[給我看Maradona的圖片]作為潛在文本的集合中的潛在的文本。在一些示例中，[給我看Madonna的圖片]可以與實體[歌手]、[女演員]、[制片人]、和[音樂家]等相關(guān)聯(lián)，并且[給我看Maradona的圖片]可以與實體[運動員]、[足球運動員]、和[踢足球的]等相關(guān)聯(lián)。在一些示例中，第二語音被提供為[我的意思是那個足球運動員]，并且可以與實體[體育]、[足球]、和[足球運動員]相關(guān)聯(lián)。可以確定，潛在文本和第二語音共同地具有實體[足球運動員]。因此，可以選擇潛在文本[給我看Maradona的圖片]作為校正的文本，例如組合文本。
[0056]在一些實施方式中，多個實體和與其相關(guān)聯(lián)的信息可以作為結(jié)構(gòu)數(shù)據(jù)存儲在知識圖中。在一些示例中，知識圖包括多個節(jié)點和在節(jié)點之間的邊。在一些示例中，節(jié)點代表實體，并且邊代表實體之間的關(guān)系。在一些示例中，可以基于以域、類型、和性質(zhì)為基礎(chǔ)的結(jié)構(gòu)數(shù)據(jù)的方案而提供知識圖。在一些示例中，域包括共享命名空間的一個或多個類型。在一些示例中，提供命名空間作為唯一命名的對象的目錄，其中命名空間中的每個對象具有唯一名稱，例如，標(biāo)識符。在一些示例中，類型表示關(guān)于話題的“是”關(guān)系，并且用于保存性質(zhì)的集合。在一些示例中，話題代表諸如人、地點或事物的實體。在一些示例中，每個話題可以具有與其相關(guān)聯(lián)的一個或多個類型。在一些示例中，性質(zhì)與話題相關(guān)聯(lián)并且定義該話題和該性質(zhì)的值之間的“具有”關(guān)系。在一些示例中，該性質(zhì)的值可以包括另一個話題。
[0057]圖4描繪了根據(jù)本公開的實施方式的可以執(zhí)行的示例過程400。示例過程400可以例如被圖1的示例環(huán)境100實現(xiàn)，例如，搜索系統(tǒng)120和/或語音識別系統(tǒng)130。在一些示例中，示例過程400可以由使用一個或多個計算設(shè)備所執(zhí)行的一個或多個計算機(jī)可執(zhí)行程序來提供。
[0058]接收第一語音數(shù)據(jù)(402)。例如，搜索系統(tǒng)(例如圖1的搜索系統(tǒng)120)從用戶設(shè)備接收第一語音數(shù)據(jù)。接收基于第一語音數(shù)據(jù)的第一文本(404)。例如，搜索系統(tǒng)從語音識別系統(tǒng)(例如圖1的語音識別系統(tǒng)130)接收第一文本。在一些示例中，搜索系統(tǒng)將第一語音數(shù)據(jù)提供至語音識別系統(tǒng)。提供第一文本以用于顯示(406)。例如，搜索系統(tǒng)將用于顯示的第一文本傳送至用戶設(shè)備，例如，將第一文本作為搜索查詢在搜索界面的搜索框中顯示。確定是否已經(jīng)指示對第一文本的校正(408)。例如，搜索系統(tǒng)可以從用戶設(shè)備接收校正指示。在一些示例中，可以響應(yīng)于用戶設(shè)備的用戶選擇第一文本的部分而提供校正指示。在一些示例中，可以響應(yīng)于用戶提供后續(xù)的語音輸入而提供校正指示。如果未接收到校正指示，則提供搜索結(jié)果以用于顯示(410)。例如，搜索系統(tǒng)可以確定對作為搜索查詢的第一文本作出響應(yīng)的搜索結(jié)果，并且可以提供該搜索結(jié)果以用于顯示。
[0059]如果接收到校正指示，則第二語音數(shù)據(jù)(412)。例如，搜索系統(tǒng)從用戶設(shè)備接收第二語音數(shù)據(jù)?；诘诙Z音數(shù)據(jù)的第二文本(414)。例如，搜索系統(tǒng)從語音識別系統(tǒng)第二文本。在一些示例中，搜索系統(tǒng)將第二語音數(shù)據(jù)提供至語音識別系統(tǒng)。提供組合文本以用于顯示(416)。例如，搜索系統(tǒng)將用于顯示的組合文本傳送至用戶設(shè)備，例如將組合文本作為修正的搜索查詢顯示在搜索界面的搜索框中。在一些示例中，搜索系統(tǒng)基于第一文本和第二文本提供組合文本。例如，該第一文本的要校正的部分可以被第二文本代替。在一些示例中，該第一文本的該部分是第一文本的整體。在一些示例中，該第一文本的該部分小于第一文本的整體。提供搜索結(jié)果以用于顯示(410)。例如，搜索系統(tǒng)可以確定對作為修正的搜索查詢的組合文本作出響應(yīng)的搜索結(jié)果，并且可以提供該搜索結(jié)果以用于顯示。
[0060]圖4的示例過程400包括在已經(jīng)提供了第一文本(例如，作為搜索查詢)以用于顯示之后，或在已經(jīng)提供了組合文本(例如，作為已修正的搜索查詢)以用于顯示之后，提供搜索結(jié)果以用于顯示。然而，設(shè)想搜索結(jié)果可以與第一文本或組合文本的顯示相對同時地顯示。例如，在一些實施方式中，第一文本和基于第一文本的搜索結(jié)果可以在確定是否對第一文本進(jìn)行校正之前顯示。
[0061 ]在本說明書中描述的主題內(nèi)容的實施方式和操作可以在包括在本說明書中公開的結(jié)構(gòu)和它們的結(jié)構(gòu)等同物的數(shù)字電子電路中或在計算機(jī)軟件、固件或硬件中，或在它們中的一個或多個的組合中實現(xiàn)。在本說明書中描述的主題的實施方式可以使用一個或多個計算機(jī)程序，即計算機(jī)程序指令的一個或多個模塊來實現(xiàn)，所述一個或多個計算機(jī)程序在計算機(jī)存儲介質(zhì)上編碼以用于由數(shù)據(jù)處理裝置執(zhí)行或用于控制數(shù)據(jù)處理裝置的操作。替選地或另外地，程序指令可以被編碼在人工生成的傳播信號上，例如機(jī)器生成的電、光、或電磁信號，所述信號被生成以對用于向合適的接收器裝置傳輸以用于由數(shù)據(jù)處理裝置執(zhí)行的信息進(jìn)行編碼。計算機(jī)存儲介質(zhì)可以是或被包括在計算機(jī)可讀存儲設(shè)備、計算機(jī)可讀存儲基板、隨機(jī)或串行存取存儲器陣列或設(shè)備、或它們中的一個或多個的組合中。此外，當(dāng)計算機(jī)存儲介質(zhì)不是傳播信號時，計算機(jī)存儲介質(zhì)可以是在人工生成的傳播信號中編碼的計算機(jī)程序指令的源或目的地。計算機(jī)存儲介質(zhì)也可以是或被包括在一個或多個分立的物理組件或介質(zhì)(例如，多個CD、盤、或其他的存儲設(shè)備)中。
[0062]在本說明書中描述的操作可以被實現(xiàn)為由數(shù)據(jù)處理裝置對存儲在一個或多個計算機(jī)可讀的存儲部設(shè)備上的數(shù)據(jù)或從其他源的數(shù)據(jù)所執(zhí)行的操作。
[0063]術(shù)語“數(shù)據(jù)處理裝置”涵蓋用于處理數(shù)據(jù)的所有類型的裝置、設(shè)備和機(jī)器，包括以示例方式的可編程處理器、計算機(jī)、芯片上系統(tǒng)、或前述的多個或組合。該裝置可以包括專用邏輯電路，例如，F(xiàn)PGA(現(xiàn)場可編程門陣列)或ASICX專用集成電路)。除了硬件之外，該裝置還可以包括創(chuàng)建用于所討論的計算機(jī)程序的執(zhí)行環(huán)境的代碼，例如，構(gòu)成處理器固件、協(xié)議桟、數(shù)據(jù)庫管理系統(tǒng)、操作系統(tǒng)、跨平臺運行時環(huán)境、虛擬機(jī)、或它們中的一個或多個的組合的代碼。該裝置和執(zhí)行環(huán)境可以實現(xiàn)各種不同的計算模型基礎(chǔ)架構(gòu)，諸如web服務(wù)、分布式計算和網(wǎng)格計算基礎(chǔ)架構(gòu)。
[0064]計算機(jī)程序(也被稱為程序、軟件、軟件應(yīng)用、腳本、或代碼)可以被以任何形式的編程語言編寫，包括匯編或解釋語言、說明性或過程語言，并且其可以被以任何形式部署，包括作為獨立程序或作為模塊、組件、子例程、對象、或適合于在計算環(huán)境中使用的其他單元。計算機(jī)程序可以但不需要，與文件系統(tǒng)中的文件相對應(yīng)。程序可以被存儲在保持其他程序或數(shù)據(jù)的文件的部分(例如，在標(biāo)記語言文檔中存儲的一個或多個腳本)中，在專用于所討論的程序的單個的文件中，或在多個協(xié)同文件(例如，存儲一個或多個模塊、子程序、或代碼部分的文件)中。計算機(jī)程序可以被部署，以在一個計算機(jī)上、或在位于一個站點處或被跨多個站點分布并且被通信網(wǎng)絡(luò)互連的多個計算機(jī)上執(zhí)行。
[0065]在本說明書中描述的過程和邏輯流可以由執(zhí)行一個或多個計算機(jī)程序的一個或多個可編程處理器執(zhí)行，以通過對于輸入數(shù)據(jù)進(jìn)行操作并且生成輸出來執(zhí)行動作。所述過程和邏輯流也可以由例如FPGA(現(xiàn)場可編程門陣列)或ASIC(專用集成電路)的專用邏輯電路來執(zhí)行，并且裝置也可以被實現(xiàn)為例如FPGA(現(xiàn)場可編程門陣列)或ASIC(專用集成電路)的專用邏輯電路。
[0066]以示例方式，適合于執(zhí)行計算機(jī)程序的處理器包括，通用微處理器和專用微處理器二者，以及任何類型的數(shù)字計算機(jī)的任何一個或多個處理器。通常，處理器將從只讀存儲器或隨機(jī)存取存儲器或二者接收指令和數(shù)據(jù)。計算機(jī)的元件可以包括用于執(zhí)行根據(jù)指令的動作的處理器，和用于存儲指令和數(shù)據(jù)的一個或多個存儲器設(shè)備。通常，計算機(jī)將還包括或操作地耦合用于存儲數(shù)據(jù)的一個或多個大量存儲部設(shè)備，以從其接收數(shù)據(jù)或向其轉(zhuǎn)移數(shù)據(jù)，或二者，例如，磁盤、磁光盤、或光盤。然而，計算機(jī)不需要具有這樣的設(shè)備。此外，計算機(jī)可以被嵌入在另一個設(shè)備中，例如，移動電話、個人數(shù)字助理(PDA)、移動音頻或視頻播放器、游戲控制臺、全球定位系統(tǒng)(GPS)接收器、或便攜式存儲設(shè)備(例如，通用串行總線(USB)閃速驅(qū)動)，僅舉幾個例子。適合于存儲計算機(jī)程序指令和數(shù)據(jù)的設(shè)備包括所有的形式的非易失性存儲器、介質(zhì)、和存儲器設(shè)備，以示例的方式包括半導(dǎo)體存儲器設(shè)備(例如，EPR0M、EEPR0M、和閃速存儲器設(shè)備)；磁盤(例如，內(nèi)部硬盤或可移動盤)；磁光盤;和⑶ROi^PDVD-ROM盤。處理器和存儲器可以被專用邏輯電路補(bǔ)充或被合并在專用邏輯電路中。
[0067]為了提供與用戶的交互，在本說明書中描述的主題的實施方式可以被實現(xiàn)在具有用于向用戶顯示信息的顯示設(shè)備(例如CRT(陰極射線管)或LCD(液晶顯示器)監(jiān)視器)，和用戶可以通過其向計算機(jī)提供輸入的鍵盤和指示設(shè)備(例如鼠標(biāo)或軌跡球)的計算機(jī)上。也可以提供其他類型的設(shè)備來提供與用戶的交互;例如，提供給用戶的反饋可以是任何形式的感覺反饋，例如，視覺反饋、聽覺反饋、或觸覺反饋;并且來自用戶的輸入可以被以任何形式接收，包括聲學(xué)的、語音的、或觸覺的輸入。此外，計算機(jī)可以通過向用戶使用的設(shè)備發(fā)送文檔和從其接收文檔來與用戶交互;例如，通過響應(yīng)于從web瀏覽器的請求而將網(wǎng)頁發(fā)送至在用戶的客戶端設(shè)備上的該web瀏覽器。
[0068]在本說明書中描述的本主題的實施方式可以被實現(xiàn)在包括后端組件(例如作為數(shù)據(jù)服務(wù)器)、或包括中間件組件(例如應(yīng)用服務(wù)器)、或包括前端組件(例如通過其用戶可以與在本說明書中描述的主題的實施方式交互的具有圖形用戶界面或Web瀏覽器的客戶端計算機(jī))、或一個或多個這樣的后端、中間件或前端組件的任何組合的計算系統(tǒng)中。系統(tǒng)的組件可以被例如通信網(wǎng)絡(luò)數(shù)字?jǐn)?shù)據(jù)通信的任何形式或介質(zhì)互連，例如通信網(wǎng)絡(luò)。通信網(wǎng)絡(luò)的示例包括局域網(wǎng)(“LAN”)和廣域網(wǎng)(“WAN”)、互聯(lián)網(wǎng)絡(luò)(例如，互聯(lián)網(wǎng))、和對等網(wǎng)絡(luò)(例如，自組織對等網(wǎng)絡(luò))。
[0069]計算系統(tǒng)可以包括客戶端和服務(wù)器?？蛻舳撕头?wù)器通常是彼此遠(yuǎn)離并且通常通過通信網(wǎng)絡(luò)交互的?？蛻舳撕头?wù)器的關(guān)系借助于在相應(yīng)的計算機(jī)上運行并且彼此具有客戶端-服務(wù)器關(guān)系的計算機(jī)程序而產(chǎn)生。在一些實施方式中，服務(wù)器將數(shù)據(jù)(例如HTML頁面)傳送至客戶端設(shè)備(例如，出于向與客戶端設(shè)備交互的用戶顯示數(shù)據(jù)以及從其接收用戶輸入的目的)。在客戶端設(shè)備處生成的數(shù)據(jù)(例如，用戶交互的結(jié)果)可以在服務(wù)器處從客戶端設(shè)備來接收。
[0070]雖然本說明書包含許多特定的實施方式細(xì)節(jié)，但是這些不應(yīng)當(dāng)被視為對本公開的任何實施方式或可以被要求保護(hù)的范圍的限制，而是視為對特定于示例實施方式的特征的描述。在本說明書中以分立實施方式的場境所描述的特征，也可以在單個實施方式的組合中來實現(xiàn)。相反地，在單個實施方式的場境中所描述的各種特征也可以分立地實現(xiàn)在多個實施方式中，或在任何合適的子組合中。此外，雖然上文可能將特征描述為以某些組合來起作用，并且甚至初始也是這樣要求保護(hù)的，但是來自要求保護(hù)的組合的一個或多個特征可以在某些情況下從該組合去除，并且該要求保護(hù)的組合可以指向子組合或子組合的變化。
[0071]相似地，雖然操作在附圖中以特定的順序描繪，但是這不應(yīng)當(dāng)被理解為要求這樣的操作應(yīng)當(dāng)以所示出的特定的順序或以相繼的順序執(zhí)行，或所有所圖示的操作應(yīng)當(dāng)被執(zhí)行以實現(xiàn)期望的結(jié)果。在一些情況下，多任務(wù)和并行處理可以是有利的。此外，在上文描述的實施方式中的各種系統(tǒng)組件的分離不應(yīng)當(dāng)被理解為要求在所有的實施方式中的這樣的分離，并且應(yīng)當(dāng)理解，所描述的程序組件和系統(tǒng)可以通常在單一的軟件產(chǎn)品中被集成在一起或被封裝到多個軟件產(chǎn)品中。
[0072]因此，已經(jīng)描述了本主題的特定實施方式。其他實施方式在以下權(quán)利要求的范圍內(nèi)。在一些情況下，在權(quán)利要求中記載的動作可以以不同的順序來執(zhí)行并且仍然實現(xiàn)期望的結(jié)果。此外，在附圖中描繪的過程不一定要求所示出的特定的順序或相繼的順序來實現(xiàn)期望的結(jié)果。在某些實施方式中，多任務(wù)和并行處理可以是有利的。
【主權(quán)項】
1.一種計算機(jī)實現(xiàn)的方法，所述方法包括: 提供第一文本以用于在用戶的計算設(shè)備上顯示，基于從所述計算設(shè)備接收的第一語音，所述第一文本從第一語音識別引擎被提供，并且作為搜索查詢被顯示；從所述計算設(shè)備接收語音校正指示，所述語音校正指示用于指示所述第一文本中要被校正的部分；從所述計算設(shè)備接收第二語音；基于所述第二語音而從第二語音識別引擎接收第二文本，所述第二語音識別引擎不同于所述第一語音識別引擎；使用所述第二文本代替所述第一文本的所述部分，以提供組合文本；以及提供所述組合文本，以用于作為修正搜索查詢在所述計算設(shè)備上顯示。2.根據(jù)權(quán)利要求1所述的方法，其中，所述部分包括所述第一文本的整體。3.根據(jù)權(quán)利要求1所述的方法，其中，所述部分包括小于所述第一文本的整體。4.根據(jù)權(quán)利要求1-3中任一項所述的方法，其中，所述第二語音識別引擎包括所述第一語音識別引擎和至少一個附加的功能。5.根據(jù)權(quán)利要求4所述的方法，其中，所述至少一個附加的功能包括:基于與所述第一文本相關(guān)聯(lián)的一個或多個實體，選擇潛在的文本作為所述第二文本。6.根據(jù)權(quán)利要求1-3中任一項所述的方法，還包括: 接收基于所述第一文本的第一搜索結(jié)果；以及提供所述第一搜索結(jié)果，以用于在所述計算設(shè)備上顯示。7.根據(jù)權(quán)利要求6所述的方法，還包括: 接收基于所述第二文本的第二搜索結(jié)果；以及提供所述第二搜索結(jié)果，以用于在所述計算設(shè)備上代替所述第一搜索結(jié)果來顯示。8.根據(jù)權(quán)利要求1-3中任一項所述的方法，其中，所述語音校正指示包括所述對第一文本的多個單詞中至少一個單詞的用戶選擇。9.一種計算機(jī)實現(xiàn)的方法，所述方法包括: 提供第一文本以用于在用戶的計算設(shè)備上顯示，基于從所述計算設(shè)備接收的第一語音，所述第一文本從第一語音識別引擎被提供，并且作為搜索查詢被顯示；從所述計算設(shè)備接收語音校正指示，所述語音校正指示用于指示所述第一文本中要被校正的部分；從所述計算設(shè)備接收第二語音；基于所述第二語音而從第二語音識別引擎接收第二文本，所述第二語音識別引擎不同于所述第一語音識別引擎；使用所述第二文本代替所述第一文本的所述部分，以提供組合文本；以及提供所述組合文本，以用于作為修正搜索查詢在所述計算設(shè)備上顯示。10.根據(jù)權(quán)利要求9所述的方法，其中，所述部分包括所述第一文本的整體。11.根據(jù)權(quán)利要求9所述的方法，其中，所述部分包括小于所述第一文本的整體。12.根據(jù)權(quán)利要求9至11中任一項所述的方法，其中，所述第二語音識別引擎包括所述第一語音識別引擎和至少一個附加的功能。13.根據(jù)權(quán)利要求12所述的方法，其中，所述至少一個附加的功能包括:基于與所述第一文本相關(guān)聯(lián)的一個或多個實體，選擇潛在的文本作為所述第二文本。14.根據(jù)權(quán)利要求9至11中任一項所述的方法，還包括: 接收基于所述第一文本的第一搜索結(jié)果；以及提供所述第一搜索結(jié)果，以用于在所述計算設(shè)備上顯示。15.根據(jù)權(quán)利要求14所述的方法，其中所述操作還包括: 接收基于所述第二文本的第二搜索結(jié)果；以及提供所述第二搜索結(jié)果，以用于在所述計算設(shè)備上代替所述第一搜索結(jié)果來顯示。16.根據(jù)權(quán)利要求9至11中任一項所述的方法，其中，所述語音校正指示包括對所述第一文本的多個單詞中的至少一個單詞的用戶選擇。17.一種計算機(jī)實現(xiàn)的系統(tǒng)，包括用于提供第一文本以用于在用戶的計算設(shè)備上顯示的裝置，基于從所述計算設(shè)備接收的第一語音，所述第一文本從第一語音識別引擎被提供，并且作為搜索查詢被顯示；用于從所述計算設(shè)備接收語音校正指示的裝置，所述語音校正指示用于指示所述第一文本中要被校正的部分；用于從所述計算設(shè)備接收第二語音的裝置；用于基于所述第二語音而從第二語音識別引擎接收第二文本的裝置，所述第二語音識別引擎不同于所述第一語音識別引擎；用于使用所述第二文本代替所述第一文本的所述部分以提供組合文本的裝置；以及用于提供所述組合文本以用于作為修正搜索查詢在所述計算設(shè)備上顯示的裝置。18.根據(jù)權(quán)利要求17所述的系統(tǒng)，其中，所述部分包括所述第一文本的整體。19.根據(jù)權(quán)利要求17所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述部分包括小于所述第一文本的整體。20.根據(jù)權(quán)利要求17至19中任一項所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述第二語音識別引擎包括所述第一語音識別引擎和至少一個附加的功能。21.根據(jù)權(quán)利要求20所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述至少一個附加的功能包括:基于與所述第一文本相關(guān)聯(lián)的一個或多個實體，選擇潛在的文本作為所述第二文本。22.根據(jù)權(quán)利要求17至19中任一項所述的系統(tǒng)，包括: 用于接收基于所述第一文本的第一搜索結(jié)果的裝置；以及用于提供所述第一搜索結(jié)果以用于在所述計算設(shè)備上顯示的裝置。23.根據(jù)權(quán)利要求22所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述操作還包括: 用于接收基于所述第二文本的第二搜索結(jié)果的裝置；以及用于提供所述第二搜索結(jié)果以用于在所述計算設(shè)備上代替所述第一搜索結(jié)果來顯示的裝置。24.根據(jù)權(quán)利要求17至19中任一項所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述語音校正指示包括對所述第一文本的多個單詞中至少一個單詞的用戶選擇。25.一種計算機(jī)實現(xiàn)的系統(tǒng)，包括用于提供第一文本以用于在用戶的計算設(shè)備上顯示的裝置，基于從所述計算設(shè)備接收的第一語音，所述第一文本從第一語音識別引擎被提供，并且作為搜索查詢被顯示；用于從所述計算設(shè)備接收語音校正指示的裝置，所述語音校正指示用于指示所述第一文本中要被校正的部分；用于從所述計算設(shè)備接收第二語音的裝置；用于基于所述第二語音而從第二語音識別引擎接收第二文本的裝置，所述第二語音識別引擎不同于所述第一語音識別引擎；用于使用所述第二文本代替所述第一文本的所述部分以提供組合文本的裝置；以及用于提供所述組合文本以用于作為修正搜索查詢在所述計算設(shè)備上顯示的裝置。26.根據(jù)權(quán)利要求25所述的系統(tǒng)，其中，所述部分包括所述第一文本的整體。27.根據(jù)權(quán)利要求25所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述部分包括小于所述第一文本的整體。28.根據(jù)權(quán)利要求25至27中任一項所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述第二語音識別引擎包括所述第一語音識別引擎和至少一個附加的功能。29.根據(jù)權(quán)利要求28所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述至少一個附加的功能包括:基于與所述第一文本相關(guān)聯(lián)的一個或多個實體，選擇潛在的文本作為所述第二文本。30.根據(jù)權(quán)利要求25至27中任一項所述的系統(tǒng)，還包括: 用于接收基于所述第一文本的第一搜索結(jié)果的裝置；以及用于提供所述第一搜索結(jié)果以用于在所述計算設(shè)備上顯示的裝置。31.根據(jù)權(quán)利要求30所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述操作還包括: 用于接收基于所述第二文本的第二搜索結(jié)果的裝置；以及用于提供所述第二搜索結(jié)果以用于在所述計算設(shè)備上代替所述第一搜索結(jié)果來顯示的裝置。32.根據(jù)權(quán)利要求25至27中任一項所述的計算機(jī)實現(xiàn)的系統(tǒng)，其中，所述語音校正指示包括對所述第一文本的多個單詞中至少一個單詞的用戶選擇。
【文檔編號】G10L15/26GK106095766SQ201610273179
【公開日】2016年11月9日
【申請日】2016年4月28日公開號201610273179.7, CN 106095766 A, CN 106095766A, CN 201610273179, CN-A-106095766, CN106095766 A, CN106095766A, CN201610273179, CN201610273179.7
【發(fā)明人】德魯夫·巴克希, 扎希德·撒布爾, 蒂爾克·瑪麗·尤德, 尼古拉斯·G·非
【申請人】谷歌公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：德魯夫·巴克希;扎希德·撒布爾;蒂爾克·瑪麗·尤德;尼古拉斯·G·非;
技術(shù)所有人：谷歌公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

使用選擇性重新講話來校正話音識別的制作方法