国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      針對(duì)由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)生成的文本的分布式用戶(hù)輸入的制作方法

      文檔序號(hào):6379904閱讀:294來(lái)源:國(guó)知局
      專(zhuān)利名稱(chēng):針對(duì)由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)生成的文本的分布式用戶(hù)輸入的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及語(yǔ)音到文本的轉(zhuǎn)錄,尤其涉及用于增加語(yǔ)音到文本轉(zhuǎn)錄的質(zhì)量的技術(shù)。
      背景技術(shù)
      計(jì)算系統(tǒng)(諸如,個(gè)人計(jì)算機(jī)、膝上型設(shè)備、平板設(shè)備、游戲設(shè)備和電話(huà))所使用的軟件的接口正在增加對(duì)語(yǔ)音識(shí)別的使用,并且對(duì)高質(zhì)量的自動(dòng)化的音頻到文本內(nèi)容的需求也正在增加。機(jī)器算法已被用于語(yǔ)音到文本轉(zhuǎn)錄,但這樣的算法通常生成具有錯(cuò)誤的文本。發(fā)明內(nèi)容
      公開(kāi)了利用眾包(crowd sourcing)來(lái)增加語(yǔ)音到文本轉(zhuǎn)錄的質(zhì)量的機(jī)制。在一特定實(shí)施例中,一種方法包括在代表性狀態(tài)傳輸(REST)端點(diǎn)設(shè)備處接收與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第一語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第一用戶(hù)輸入;在REST端點(diǎn)設(shè)備接收與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第二語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第二用戶(hù)輸入;以及在所述REST端點(diǎn)設(shè)備處處理所述第一用戶(hù)輸入和第二用戶(hù)輸入以生成語(yǔ)音到文本調(diào)整信息。在所述REST 端點(diǎn)設(shè)備處進(jìn)行處理允許使用眾包(例如,使用來(lái)自第一用戶(hù)、第二用戶(hù)和可能一個(gè)或多個(gè)附加用戶(hù)的輸入)來(lái)改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄服務(wù)。
      在另一方面,一種計(jì)算機(jī)可讀存儲(chǔ)設(shè)備包括計(jì)算機(jī)可執(zhí)行的用于以下的指令接收來(lái)自多個(gè)客戶(hù)機(jī)設(shè)備的捕捉到的語(yǔ)音數(shù)據(jù);對(duì)于所述多個(gè)客戶(hù)機(jī)設(shè)備中的每一個(gè)客戶(hù)機(jī)設(shè)備,將捕捉到的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成文本;以及,將包括所述文本的有效載荷數(shù)據(jù)發(fā)送至所述多個(gè)客戶(hù)機(jī)設(shè)備中的每一個(gè)客戶(hù)機(jī)設(shè)備。有效載荷數(shù)據(jù)包括至少一個(gè)指示以下設(shè)備的位置的屬性該設(shè)備被配置成處理與捕捉到的語(yǔ)音數(shù)據(jù)到文本的轉(zhuǎn)換的感知準(zhǔn)確性有關(guān)的用戶(hù)輸入。
      在另一方面,一種計(jì)算機(jī)實(shí)現(xiàn)的方法包括將捕捉到的語(yǔ)音數(shù)據(jù)發(fā)送到語(yǔ)音到文本轉(zhuǎn)錄服務(wù);接收包括來(lái)自所述語(yǔ)音到文本轉(zhuǎn)錄服務(wù)的文本的有效載荷;將所述文本顯示在電子設(shè)備的顯示設(shè)備處;將用戶(hù)界面顯示在所述顯示設(shè)備處,其中所述用戶(hù)界面使得用戶(hù)能夠提供關(guān)于所述文本的準(zhǔn)確性的用戶(hù)輸入;接收所述用戶(hù)輸入以及所述文本的至少一個(gè)音素替換;以及,將所述用戶(hù)輸入傳送至遠(yuǎn)程設(shè)備。該遠(yuǎn)程設(shè)備可以是REST端點(diǎn)設(shè)備。 因此,眾包的方法和系統(tǒng)可以改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄的結(jié)果。


      圖I是分布式計(jì)算系統(tǒng)的特定實(shí)施例的框圖2是圖I的系統(tǒng)的一部分的特定實(shí)施例的框圖3是語(yǔ)音到文本轉(zhuǎn)錄處理的方法的特定實(shí)施例的流程圖4是在客戶(hù)機(jī)設(shè)備處處理用戶(hù)輸入的方法的特定實(shí)施例的流程圖5是示出客戶(hù)機(jī)設(shè)備可顯示的用戶(hù)界面的一部分的圖示;并且
      圖6是計(jì)算設(shè)備的特定實(shí)施例的框圖。
      具體實(shí)施方式
      對(duì)跨各種設(shè)備、設(shè)備制造商和運(yùn)營(yíng)商的語(yǔ)音到文本轉(zhuǎn)錄的質(zhì)量的眾包提供了一種改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄的機(jī)器算法的方法。例如,在特定實(shí)現(xiàn)中,當(dāng)語(yǔ)音到文本轉(zhuǎn)錄是由算法過(guò)程來(lái)執(zhí)行的時(shí),可將若干屬性與轉(zhuǎn)錄文本一起附加到有效載荷中。這些屬性可包括指示所提供的轉(zhuǎn)錄文本是機(jī)器轉(zhuǎn)換的屬性、指定用于對(duì)轉(zhuǎn)錄文本的質(zhì)量進(jìn)行投票的可接受的用戶(hù)反饋刻度范圍的屬性、以及標(biāo)識(shí)用來(lái)對(duì)要提供的文本的質(zhì)量進(jìn)行投票的代表性狀態(tài)傳輸 (REST)端點(diǎn)設(shè)備的屬性。任選地,有效載荷可基于發(fā)起設(shè)備(例如,從其接收轉(zhuǎn)錄語(yǔ)音的客戶(hù)機(jī)設(shè)備)的用戶(hù)所選設(shè)置而包括附加屬性。這些屬性可包括說(shuō)話(huà)者的語(yǔ)言,該語(yǔ)言可由發(fā)起設(shè)備的發(fā)起應(yīng)用來(lái)顯式地收集,或者可以從發(fā)起設(shè)備的操作系統(tǒng)的基礎(chǔ)語(yǔ)言、說(shuō)話(huà)者的當(dāng)前位置和發(fā)起應(yīng)用的統(tǒng)一資源定位符(URL)中導(dǎo)出。
      當(dāng)有效載荷被傳遞至客戶(hù)機(jī)設(shè)備(例如,移動(dòng)電話(huà)、電視機(jī)、計(jì)算機(jī)、平板設(shè)備、游戲設(shè)備等)時(shí),客戶(hù)機(jī)設(shè)備可任選地展示用戶(hù)界面以使接收者能夠?qū)D(zhuǎn)換的質(zhì)量進(jìn)行投票。 該界面對(duì)于應(yīng)用體驗(yàn)而言可能是合適的(例如,該界面可能是基于正在客戶(hù)機(jī)設(shè)備處執(zhí)行的特定應(yīng)用而生成的),并且該界面在有效載中的范圍所標(biāo)識(shí)的約束之內(nèi)。
      例如,用戶(hù)界面可以被實(shí)現(xiàn)為三個(gè)按鈕“非常好”、“接近”或“很糟”。另外地或另選地,用戶(hù)界面可以被實(shí)現(xiàn)為拇指向上按鈕和拇指向下按鈕的集合、表示范圍的滑塊控件或星級(jí)評(píng)級(jí)系統(tǒng)??蓪⒂脩?hù)提供的評(píng)級(jí)發(fā)送至REST端點(diǎn)設(shè)備的URL處,該URL被標(biāo)識(shí)為有效載荷中的一個(gè)屬性。REST端點(diǎn)設(shè)備可以是集中式服務(wù),并且不需要與發(fā)起應(yīng)用的始發(fā)者或客戶(hù)機(jī)設(shè)備綁定。例如,不同的聽(tīng)筒制造商可以創(chuàng)建利用用于移動(dòng)設(shè)備的語(yǔ)音到文本轉(zhuǎn)換的應(yīng)用和將用戶(hù)數(shù)據(jù)提供給REST端點(diǎn)設(shè)備的應(yīng)用。REST端點(diǎn)設(shè)備可以以特定方(例如, 第三方服務(wù))為中心,或可以是某一聽(tīng)筒制造商或移動(dòng)運(yùn)營(yíng)商所專(zhuān)用的。每一用戶(hù)所提供的評(píng)級(jí),任選地與源語(yǔ)言和/或用戶(hù)位置信息結(jié)合,用作通過(guò)上下文和地理數(shù)據(jù)來(lái)提升語(yǔ)音到文本轉(zhuǎn)換引擎的投票,該上下文和地理數(shù)據(jù)可以幫助尤其對(duì)區(qū)域方言和口音、新興語(yǔ)言和俚語(yǔ)等的更準(zhǔn)確轉(zhuǎn)換。因此,REST端點(diǎn)設(shè)備與客戶(hù)機(jī)設(shè)備和語(yǔ)音到文本轉(zhuǎn)錄服務(wù)結(jié)合在一起操作允許進(jìn)行眾包以改進(jìn)針對(duì)不同的、可能無(wú)關(guān)的設(shè)備和用戶(hù)的語(yǔ)音到文本轉(zhuǎn)錄。
      參考圖1,示出了分布式計(jì)算機(jī)系統(tǒng)100的特定說(shuō)明性實(shí)施例。分布式計(jì)算機(jī)系統(tǒng)100包括提供語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的服務(wù)器106。服務(wù)器106可以是執(zhí)行用于提供自動(dòng)的語(yǔ)音到文本轉(zhuǎn)錄的指令的計(jì)算設(shè)備。分布式計(jì)算機(jī)系統(tǒng)100還包括耦合到多個(gè)客戶(hù)機(jī)設(shè)備(諸如,代表性的第一客戶(hù)機(jī)設(shè)備102和代表性的第二客戶(hù)機(jī)設(shè)備104)的計(jì)算機(jī)網(wǎng)絡(luò)108。分布式計(jì)算機(jī)系統(tǒng)100還包括代表性狀態(tài)傳輸(REST)端點(diǎn)設(shè)備處的服務(wù)器110。 REST端點(diǎn)設(shè)備處的服務(wù)器110包括評(píng)級(jí)和音素替換分析邏輯160。第一客戶(hù)機(jī)設(shè)備102和第二客戶(hù)機(jī)設(shè)備104可各自位于REST端點(diǎn)設(shè)備110的遠(yuǎn)程。
      分布式計(jì)算機(jī)系統(tǒng)100的各個(gè)組件交互以提供語(yǔ)音到文本轉(zhuǎn)錄并持續(xù)地、規(guī)律地或偶爾地使用眾包來(lái)改進(jìn)或調(diào)節(jié)語(yǔ)音到文本轉(zhuǎn)錄過(guò)程,以提供更準(zhǔn)確的語(yǔ)音轉(zhuǎn)錄。為了說(shuō)明,作為一般概覽,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以由用于接收來(lái)自多個(gè)客戶(hù)機(jī)設(shè)備的捕捉到的語(yǔ)音數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行的指令來(lái)實(shí)現(xiàn)。這些指令可以針對(duì)多個(gè)客戶(hù)機(jī)設(shè)備中的每一個(gè)客戶(hù)機(jī)設(shè)備將捕捉到的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成文本。語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以將包括文本5的有效載荷數(shù)據(jù)發(fā)送至多個(gè)客戶(hù)機(jī)設(shè)備中的每一個(gè)客戶(hù)機(jī)設(shè)備。有效載荷數(shù)據(jù)可包括可用于調(diào)節(jié)或訓(xùn)練由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170用來(lái)轉(zhuǎn)錄語(yǔ)音的算法的信息。例如,有效載荷數(shù)據(jù)可包括指示諸如REST端點(diǎn)設(shè)備110處的服務(wù)器之類(lèi)的計(jì)算機(jī)設(shè)備的位置的一個(gè)或多個(gè)屬性,該計(jì)算機(jī)設(shè)備被配置成處理與轉(zhuǎn)錄的準(zhǔn)確性有關(guān)的用戶(hù)輸入。有效載荷數(shù)據(jù)還可包括便于收集諸如評(píng)級(jí)刻度范圍之類(lèi)的用戶(hù)輸入的一個(gè)或多個(gè)屬性??蓪⒃撚脩?hù)輸入發(fā)送至 REST端點(diǎn)設(shè)備110。來(lái)自客戶(hù)機(jī)設(shè)備的用戶(hù)輸入可以包括指示語(yǔ)音到文本轉(zhuǎn)錄的質(zhì)量或準(zhǔn)確性的信息、替代轉(zhuǎn)錄信息(例如,音素替換)、關(guān)于用戶(hù)的信息(例如,用戶(hù)位置、客戶(hù)機(jī)設(shè)備類(lèi)型等)和/或其他信息。
      REST端點(diǎn)設(shè)備110可使用該用戶(hù)輸入來(lái)確定用于調(diào)整或訓(xùn)練語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的調(diào)整(例如,語(yǔ)音到文本調(diào)整信息162)。REST端點(diǎn)設(shè)備110還可向語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170提供便于語(yǔ)音到文本轉(zhuǎn)錄的其他信息。例如,REST端點(diǎn)設(shè)備110可以為分布式計(jì)算系統(tǒng)100的用戶(hù)生成說(shuō)話(huà)者簡(jiǎn)檔。說(shuō)話(huà)者簡(jiǎn)檔可用于通過(guò)使得語(yǔ)音到文本轉(zhuǎn)錄服務(wù)能夠考慮諸如特定用戶(hù)的地理位置或其他特性等因素,來(lái)進(jìn)一步調(diào)整或改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄。分布式計(jì)算系統(tǒng)100還可將信息發(fā)送給用于音素評(píng)估第三方眾包系統(tǒng)164,以收集可用于調(diào)整或改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄的附加信息。因此,即使在分布式計(jì)算系統(tǒng)100的各組件不相關(guān)(例如,由不相關(guān)或不同的業(yè)務(wù)實(shí)體提供)時(shí),分布式計(jì)算系統(tǒng)100仍可允許對(duì)語(yǔ)音到文本轉(zhuǎn)錄的持續(xù)或偶爾的調(diào)整和調(diào)節(jié)。
      客戶(hù)機(jī)設(shè)備102、104中的每一個(gè)可包括處理器可執(zhí)行的、用于執(zhí)行計(jì)算機(jī)實(shí)現(xiàn)的方法的計(jì)算機(jī)指令。例如,計(jì)算機(jī)實(shí)現(xiàn)的方法可包括捕捉用戶(hù)提供的語(yǔ)音并將捕捉到的相應(yīng)語(yǔ)音數(shù)據(jù)112、114發(fā)送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。例如,可以由第一客戶(hù)機(jī)設(shè)備102來(lái)捕捉第一語(yǔ)音134,并且可以經(jīng)由網(wǎng)絡(luò)108將捕捉到的相應(yīng)語(yǔ)音數(shù)據(jù)112傳送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。在一特定實(shí)施例中,第一客戶(hù)機(jī)設(shè)備102包括可顯示文本或可接收來(lái)自第一用戶(hù)130的語(yǔ)音輸入的應(yīng)用136,諸如搜索引擎或移動(dòng)應(yīng)用。
      該計(jì)算機(jī)實(shí)現(xiàn)的方法還可包括接收包括來(lái)自語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的文本的有效載荷,諸如第一有效載荷120。該方法還包括將文本顯示在電子設(shè)備的顯示設(shè)備處。例如,可將第一有效載荷120中的文本顯不在第一客戶(hù)機(jī)設(shè)備102的顯不設(shè)備處。第一客戶(hù)機(jī)設(shè)備102還可顯示提示第一用戶(hù)130提供與所顯示的文本有關(guān)的輸入的用戶(hù)界面。例如, 用戶(hù)界面124可提示第一用戶(hù)130提供第一用戶(hù)輸入132。第一用戶(hù)輸入132可包括關(guān)于與捕捉到的對(duì)應(yīng)于第一語(yǔ)音134的語(yǔ)音數(shù)據(jù)112有關(guān)的顯示文本的準(zhǔn)確性的信息。該計(jì)算機(jī)實(shí)現(xiàn)的方法還可包括接收可包括文本的至少一個(gè)音素替換的用戶(hù)輸入??梢詫⒂脩?hù)輸入數(shù)據(jù)(諸如第一用戶(hù)輸入150)傳送至遠(yuǎn)程設(shè)備,諸如至REST端點(diǎn)設(shè)備110。
      第一客戶(hù)機(jī)設(shè)備102和第二客戶(hù)機(jī)設(shè)備104可以是相同類(lèi)型的設(shè)備,或者可以是不同類(lèi)型的設(shè)備。例如,第一客戶(hù)機(jī)設(shè)備102和第二客戶(hù)機(jī)設(shè)備104可以是包括用于顯示圖像和文本的顯示器的移動(dòng)電話(huà)、電視機(jī)、計(jì)算機(jī)、游戲設(shè)備、平板設(shè)備或其他電子設(shè)備。在一特定實(shí)施例中,第一客戶(hù)機(jī)設(shè)備102選擇性地顯示用戶(hù)界面124。例如,第一客戶(hù)機(jī)設(shè)備 102可以在接收第一有效載荷120后選擇性地啟動(dòng)用戶(hù)界面124?;蛘?,應(yīng)用136可以接收多個(gè)數(shù)據(jù)有效載荷,并在經(jīng)由多個(gè)有效載荷120生成并接收了一定量的文本時(shí)或在應(yīng)用 136所確定的不同時(shí)間處選擇性地啟動(dòng)用戶(hù)界面124。為了說(shuō)明,應(yīng)用136可以在啟動(dòng)用戶(hù)界面124之前收集與完整句子相對(duì)應(yīng)的多個(gè)轉(zhuǎn)錄文本,以呈現(xiàn)對(duì)該完整句子的顯示。
      用戶(hù)界面124可以收集與從語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170處接收到的文本有關(guān)的用戶(hù)評(píng)級(jí)或反饋。例如,用戶(hù)界面124可以顯示用于收集用戶(hù)評(píng)級(jí)的視覺(jué)表達(dá)。這種視覺(jué)表達(dá)的示例包括拇指向上/拇指向下圖標(biāo)、滑塊、1-10的刻度或可以可視地呈現(xiàn)給第一用戶(hù)130 以接收用戶(hù)輸入的另一評(píng)級(jí)顯示??梢越?jīng)由用戶(hù)界面124將用戶(hù)評(píng)級(jí)提供為二進(jìn)制評(píng)級(jí)、 評(píng)級(jí)的范圍或可選評(píng)級(jí)(例如,兩個(gè)以上可選評(píng)級(jí))的集合。二進(jìn)制評(píng)級(jí)的示例是拇指向上或拇指向下指示符。評(píng)級(jí)的范圍可以是1-10的范圍或其他類(lèi)似的范圍??蛇x評(píng)級(jí)的集合可以是定義的集合,使得用戶(hù)可以選擇諸如1、2、3、4或5等特定值或選擇星數(shù)或選擇其他指示符。用戶(hù)界面124還可任選地包括替換轉(zhuǎn)錄選擇或供用戶(hù)輸入文本的輸入?yún)^(qū)。第一客戶(hù)機(jī)設(shè)備102對(duì)來(lái)自第一用戶(hù)130的語(yǔ)音134作出響應(yīng),并且也對(duì)到可能由第一用戶(hù)130 提供給用戶(hù)界面124的第一用戶(hù)輸入132作出響應(yīng)。
      類(lèi)似地,第二客戶(hù)機(jī)設(shè)備104可包括第二應(yīng)用126和第二用戶(hù)界面128。第二客戶(hù)機(jī)設(shè)備104可以與提供第二語(yǔ)音142和第二輸入144的第二用戶(hù)140進(jìn)行交互。第二輸入 144可指示第二用戶(hù)對(duì)通過(guò)來(lái)自語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的第二有效載荷122接收到的文本的評(píng)級(jí)。
      在操作期間,第一客戶(hù)機(jī)設(shè)備102接收來(lái)自第一用戶(hù)130的第一語(yǔ)音134并捕捉該第一語(yǔ)音134。經(jīng)由網(wǎng)絡(luò)108將對(duì)應(yīng)于第一語(yǔ)音134的數(shù)據(jù)作為捕捉到的第一語(yǔ)音數(shù)據(jù) 112傳送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。類(lèi)似地,第二客戶(hù)機(jī)設(shè)備104可以捕捉第二語(yǔ)音142, 并經(jīng)由網(wǎng)絡(luò)108將對(duì)應(yīng)于該第二語(yǔ)音142的數(shù)據(jù)作為捕捉到的第二語(yǔ)音數(shù)據(jù)114傳送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。響應(yīng)于接收到捕捉到的語(yǔ)音數(shù)據(jù)112、114,服務(wù)器106處的語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170轉(zhuǎn)錄所捕捉到的第一用戶(hù)130和第二用戶(hù)140的語(yǔ)音,并生成文本。服務(wù)器106可以經(jīng)由網(wǎng)絡(luò)108將包括轉(zhuǎn)錄文本和其他屬性的第一有效載荷120傳送給第一客戶(hù)機(jī)設(shè)備102。類(lèi)似地,服務(wù)器106可以經(jīng)由網(wǎng)絡(luò)108將包括轉(zhuǎn)錄文本和屬性的第二有效載荷122傳送給第二客戶(hù)機(jī)設(shè)備104。每一有效載荷120、122的屬性可包括用戶(hù)輸入的刻度范圍、REST端點(diǎn)標(biāo)識(shí)、其他屬性(例如,在客戶(hù)機(jī)設(shè)備處執(zhí)行的應(yīng)用的語(yǔ)言、位置、或統(tǒng)一資源定位符(URL))或其結(jié)合。
      響應(yīng)于接收到第一有效載荷120,第一客戶(hù)機(jī)設(shè)備102可以顯示第一有效載荷120 所承載的轉(zhuǎn)錄文本。第一用戶(hù)130可以響應(yīng)于第一客戶(hù)機(jī)設(shè)備102處顯示的文本而將第一用戶(hù)輸入132提供給用戶(hù)界面124。第一用戶(hù)輸入132可以指示與對(duì)應(yīng)于捕捉到的第一語(yǔ)音數(shù)據(jù)112的轉(zhuǎn)錄文本的質(zhì)量或準(zhǔn)確性有關(guān)的用戶(hù)反饋。
      第一用戶(hù)130可以與第一客戶(hù)機(jī)設(shè)備102進(jìn)行交互以響應(yīng)于所顯示的文本來(lái)提供第一用戶(hù)輸入132。例如,第一用戶(hù)130可以響應(yīng)于來(lái)自第一有效載荷120的轉(zhuǎn)錄文本的顯示而經(jīng)由用戶(hù)界面124輸入第一用戶(hù)輸入132。更特殊地,第一用戶(hù)130可以通過(guò)提供轉(zhuǎn)錄文本的評(píng)級(jí),諸如通過(guò)使用拇指向上或拇指向下指示符、滑塊指示符、1-10的刻度(例如,其中I是低劣的轉(zhuǎn)錄而10是極好的轉(zhuǎn)錄)或指示轉(zhuǎn)錄的準(zhǔn)確性或質(zhì)量的其他替換指示符來(lái)指示反饋。用戶(hù)界面124還可使第一用戶(hù)130能夠指示對(duì)應(yīng)于捕捉到的第一語(yǔ)音數(shù)據(jù)112或捕捉到的第一語(yǔ)音數(shù)據(jù)112的一部分的替換轉(zhuǎn)錄。為了說(shuō)明,用戶(hù)輸入132可以包括輸入在用戶(hù)界面124的文本區(qū)中的選擇或文本。例如,第一用戶(hù)130可以鍵入一正確的單詞或鍵入準(zhǔn)確地對(duì)應(yīng)于捕捉到的第一語(yǔ)音數(shù)據(jù)112的短語(yǔ)的多個(gè)單詞。
      第一客戶(hù)機(jī)設(shè)備102可以將第一輸入132作為第一用戶(hù)輸入數(shù)據(jù)150傳送給REST端點(diǎn)設(shè)備110處的服務(wù)器。例如,第一用戶(hù)輸入數(shù)據(jù)150可以包括評(píng)級(jí)和音素替換轉(zhuǎn)錄信息??梢酝ㄟ^(guò)第一有效載荷120中的屬性之一來(lái)標(biāo)識(shí)REST端點(diǎn)設(shè)備110處的服務(wù)器。因此,對(duì)于語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所執(zhí)行的每一語(yǔ)音到文本轉(zhuǎn)錄,客戶(hù)機(jī)設(shè)備的用戶(hù)可以提供諸如評(píng)級(jí)信息和/或音素替換等輸入,并且該輸入可以被捕捉并被傳送至REST端點(diǎn)設(shè)備110處的服務(wù)器。通過(guò)類(lèi)似的方式,第二用戶(hù)140可以經(jīng)由第二用戶(hù)界面128來(lái)提供第二輸入144,并且該第二輸入144可以被捕捉并作為第二用戶(hù)輸入數(shù)據(jù)152被傳送至REST 端點(diǎn)設(shè)備110處的服務(wù)器。
      盡管僅第一客戶(hù)機(jī)設(shè)備102和第二客戶(hù)機(jī)設(shè)備104已被示出,但應(yīng)理解可以使用各種不同類(lèi)型的客戶(hù)機(jī)設(shè)備和多個(gè)設(shè)備(例如,兩個(gè)以上的設(shè)備)。這樣的設(shè)備可以被耦合到網(wǎng)絡(luò)108、可以具有到語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的入口、并可將所捕捉的和所分發(fā)的用戶(hù)輸入提供給REST斷電設(shè)備110處的服務(wù)器。因此,分布式計(jì)算機(jī)系統(tǒng)100可以允許進(jìn)行眾包來(lái)改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄。
      REST端點(diǎn)設(shè)備110可以基于從多個(gè)客戶(hù)機(jī)設(shè)備處接收到的用戶(hù)輸入數(shù)據(jù)來(lái)對(duì)多個(gè)用戶(hù)評(píng)級(jí)執(zhí)行評(píng)級(jí)分析。該評(píng)級(jí)分析可以接收輸入信息,該輸入信息包括多個(gè)REST符合 (compliant)的用戶(hù)投票(例如,與轉(zhuǎn)錄文本相關(guān)聯(lián)的評(píng)級(jí))、源語(yǔ)言信息和用戶(hù)位置信息。 例如,REST端點(diǎn)設(shè)備110可以接收與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所執(zhí)行的第一語(yǔ)音到文本轉(zhuǎn)錄有關(guān)的第一用戶(hù)輸入數(shù)據(jù)150以及與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所執(zhí)行的第二語(yǔ)音到文本轉(zhuǎn)錄有關(guān)的第二用戶(hù)輸入數(shù)據(jù)152,并可基于用戶(hù)輸入數(shù)據(jù)150、152來(lái)執(zhí)行評(píng)級(jí)分析。
      在特定實(shí)施例中,評(píng)級(jí)分析由REST端點(diǎn)設(shè)備110處的服務(wù)器的評(píng)級(jí)和音素替換分析邏輯160來(lái)執(zhí)行,該評(píng)級(jí)和音素替換分析邏輯處理第一用戶(hù)輸入數(shù)據(jù)150和第二用戶(hù)輸入數(shù)據(jù)152以便生成語(yǔ)音到文本調(diào)節(jié)信息162。例如,評(píng)級(jí)分析可包括基于經(jīng)由用戶(hù)輸入數(shù)據(jù)150、152接收到的信息(諸如與特定語(yǔ)音到文本轉(zhuǎn)錄相關(guān)聯(lián)的評(píng)級(jí)、用戶(hù)位置信息、用戶(hù)標(biāo)識(shí)信息和其他信息)的加權(quán)計(jì)算。在特定實(shí)施例中,REST端點(diǎn)設(shè)備110收集特定用戶(hù)(諸如,第一用戶(hù)130)的用戶(hù)標(biāo)識(shí)信息并生成說(shuō)話(huà)者簡(jiǎn)檔。說(shuō)話(huà)者簡(jiǎn)檔還可包括與用戶(hù)或客戶(hù)機(jī)設(shè)備的上下文和/或地理位置有關(guān)的信息(例如,第一客戶(hù)機(jī)設(shè)備102的地理位置)。說(shuō)話(huà)者簡(jiǎn)檔可被評(píng)級(jí)和音素替換分析邏輯160用來(lái)生成語(yǔ)音到文本調(diào)整信息162。另外地或另選地,可以將說(shuō)話(huà)者簡(jiǎn)檔作為語(yǔ)音到文本調(diào)整信息162的一部分傳送到語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170,以進(jìn)一步改善或調(diào)節(jié)語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170針對(duì)特定用戶(hù)執(zhí)行的語(yǔ)音到文本轉(zhuǎn)錄。語(yǔ)音到文本調(diào)整信息162可以依賴(lài)于特定說(shuō)話(huà)者簡(jiǎn)檔。
      可以將語(yǔ)音到文本調(diào)整信息162傳送到服務(wù)器106的語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。 語(yǔ)音到文本調(diào)整信息162可包括被語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170用來(lái)調(diào)整或調(diào)節(jié)語(yǔ)音到文本轉(zhuǎn)錄算法的信息。
      REST端點(diǎn)設(shè)備110可以由耦合到網(wǎng)絡(luò)108的計(jì)算設(shè)備來(lái)實(shí)現(xiàn)。REST端點(diǎn)設(shè)備110 可位于服務(wù)器106的遠(yuǎn)程,或者REST端點(diǎn)設(shè)備110和服務(wù)器106可以位于一處。因此,可以經(jīng)由網(wǎng)絡(luò)108或經(jīng)由REST端點(diǎn)設(shè)備110和服務(wù)器106之間的替換連接將語(yǔ)音到文本調(diào)整信息162從REST端點(diǎn)設(shè)備110傳送到服務(wù)器106。
      網(wǎng)絡(luò)108可任選地提供到第三方眾包音素評(píng)估系統(tǒng)164的接口??梢詫?lái)自第三方眾包音素評(píng)估系統(tǒng)164的信息傳送至語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170,以便改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄的質(zhì)量。另外地或另選地,來(lái)自第三方眾包音素評(píng)估系統(tǒng)164的信息可以被傳送至REST端點(diǎn)設(shè)備110,并可被用來(lái)確定語(yǔ)音到文本調(diào)整信息162。
      在一特定說(shuō)明性實(shí)施例中,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170是代表多個(gè)實(shí)體提供不同的語(yǔ)音到文本轉(zhuǎn)錄應(yīng)用的多租戶(hù)服務(wù)。另外地,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以是來(lái)自單個(gè)實(shí)體的單個(gè)機(jī)器轉(zhuǎn)錄軟件程序。由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170發(fā)送給客戶(hù)機(jī)設(shè)備(例如,第一客戶(hù)機(jī)設(shè)備102和第二客戶(hù)機(jī)設(shè)備104)的有效載荷(例如,第一有效載荷120和第二有效載荷122)的屬性可包括REST端點(diǎn)設(shè)備110的標(biāo)識(shí)符??蛻?hù)機(jī)設(shè)備102、104可以使用該標(biāo)識(shí)符來(lái)確定REST端點(diǎn)設(shè)備110的位置或地址,使得用戶(hù)輸入數(shù)據(jù)(例如,第一和第二用戶(hù)輸入數(shù)據(jù)150、152)可被發(fā)送至REST端點(diǎn)設(shè)備110。因此,可以將可被語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170 用來(lái)調(diào)節(jié)語(yǔ)音到文本轉(zhuǎn)錄算法的用戶(hù)輸入數(shù)據(jù)甚至通過(guò)與REST端點(diǎn)設(shè)備110相關(guān)聯(lián)的客戶(hù)機(jī)設(shè)備而提供給REST端點(diǎn)設(shè)備110。
      在一特定實(shí)施例中,第一語(yǔ)音134和第二語(yǔ)音142可以指所說(shuō)的相同的一個(gè)或多個(gè)單詞,并且語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以將這樣的語(yǔ)音轉(zhuǎn)換成共同的文本。在另一實(shí)施例中,由于語(yǔ)音134和142間的差異,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以將該所說(shuō)的相同的一個(gè)或多個(gè)單詞轉(zhuǎn)換成不同的文本。語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以接收各種語(yǔ)音輸入,并可響應(yīng)于語(yǔ)音到文本調(diào)整信息162而被調(diào)整,以便根據(jù)這樣的語(yǔ)音輸入來(lái)改進(jìn)機(jī)器文本轉(zhuǎn)錄。
      在特定實(shí)施例中,第一有效載荷120包括與對(duì)第一語(yǔ)音134的語(yǔ)音到文本轉(zhuǎn)錄相關(guān)的第一標(biāo)識(shí)符,且第二有效載荷 122包括與對(duì)第二語(yǔ)音142的語(yǔ)音到文本轉(zhuǎn)錄相關(guān)的第二標(biāo)識(shí)符。第一有效載荷120的第一標(biāo)識(shí)符可以與第二有效載荷122的第二標(biāo)識(shí)符相同。例如,標(biāo)識(shí)符可以指示從語(yǔ)音數(shù)據(jù)112、114中轉(zhuǎn)錄的特定單詞或短語(yǔ)。因此,當(dāng)?shù)谝徽Z(yǔ)音134 和第二語(yǔ)音142包括相同的單詞或短語(yǔ)時(shí),第一標(biāo)識(shí)符和第二標(biāo)識(shí)符可以是相同的。或者, 第一標(biāo)識(shí)符可以不同于第二標(biāo)識(shí)符。第一應(yīng)用136可以將第一標(biāo)識(shí)符與第一用戶(hù)數(shù)據(jù)150 一起發(fā)送給REST端點(diǎn)設(shè)備110。REST端點(diǎn)設(shè)備110可以基于第一用戶(hù)輸入150確定語(yǔ)音到文本調(diào)整信息162,并可將與第一用戶(hù)輸入150相關(guān)聯(lián)的語(yǔ)音到文本轉(zhuǎn)錄信息162與第一標(biāo)識(shí)符一起發(fā)送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。因此,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以使用第一標(biāo)識(shí)符來(lái)使得用戶(hù)反饋及與捕捉到的第一語(yǔ)音數(shù)據(jù)112相關(guān)聯(lián)的語(yǔ)音到文本調(diào)整信息162 和文本轉(zhuǎn)錄相關(guān)。同樣,第二應(yīng)用126可以將第二標(biāo)識(shí)符與第二用戶(hù)輸入數(shù)據(jù)152 —起發(fā)送給REST端點(diǎn)設(shè)備110。REST端點(diǎn)設(shè)備110可以基于第二用戶(hù)輸入152確定語(yǔ)音到文本調(diào)整信息162,并可將與第二用戶(hù)輸入152相關(guān)聯(lián)的語(yǔ)音到文本轉(zhuǎn)錄信息162與第二標(biāo)識(shí)符一起發(fā)送給語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。因此,語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以使用第二標(biāo)識(shí)符來(lái)使用戶(hù)反饋及與捕捉到的第一語(yǔ)音數(shù)據(jù)114相關(guān)聯(lián)的語(yǔ)音到文本調(diào)整信息162和文本轉(zhuǎn)錄相關(guān)。通過(guò)使用這些標(biāo)識(shí)符,即使在客戶(hù)機(jī)設(shè)備或系統(tǒng)100的其他方面(諸如,評(píng)級(jí)和音素替換分析邏輯160)不與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170相關(guān)聯(lián)或并非由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170提供(即,與第三方、無(wú)關(guān)的實(shí)體或其他服務(wù)提供商相關(guān)聯(lián))時(shí),語(yǔ)音到文本轉(zhuǎn)錄服務(wù) 170仍可從客戶(hù)機(jī)設(shè)備102、104接收到關(guān)于語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170執(zhí)行的特定語(yǔ)音到文本轉(zhuǎn)錄的反饋。
      服務(wù)提供方、設(shè)備制造商、軟件提供商和其他業(yè)務(wù)實(shí)體可以參加分布式計(jì)算機(jī)系統(tǒng)100以接收直接受顧客影響的較高質(zhì)量的產(chǎn)品。應(yīng)用制造商(接收者)可以參加分布式計(jì)算機(jī)系統(tǒng)100以例如提供改進(jìn)的語(yǔ)音到文本轉(zhuǎn)錄能力以改進(jìn)用戶(hù)體驗(yàn)。可鼓勵(lì)終端用戶(hù)參加以從更準(zhǔn)確的語(yǔ)音到文本轉(zhuǎn)錄中接收好處。
      參考圖2,示出了計(jì)算機(jī)系統(tǒng)200的特定說(shuō)明性實(shí)施例。計(jì)算機(jī)系統(tǒng)200包括REST 端點(diǎn)設(shè)備110的評(píng)級(jí)和音素替換分析邏輯160。評(píng)級(jí)和音素替換分析邏輯160包括用于對(duì)語(yǔ)音到文本轉(zhuǎn)錄執(zhí)行加權(quán)分析210的處理邏輯。加權(quán)分析210可以接收轉(zhuǎn)錄服務(wù)輸入202、 用戶(hù)輸入204、源語(yǔ)言輸入206、用戶(hù)位置信息輸入208或其結(jié)合。在特定實(shí)施例中,加權(quán)分析210接收這些輸入202-208中的每一個(gè)輸入;然而,在其他實(shí)施例中,加權(quán)分析210接收比這些輸入202-208的全部少的輸入。例如,加權(quán)分析210可以?xún)H接收用戶(hù)輸入204而不接收其他信息。轉(zhuǎn)錄服務(wù)輸入202可以包括由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)(諸如,圖I的與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170)生成的一個(gè)或多個(gè)單詞。用戶(hù)輸入204可以包括圖I中的用戶(hù)輸入數(shù)據(jù)150、152和/或其他設(shè)備(未示出)的其他用戶(hù)輸入中的一個(gè)或多個(gè)。在特定實(shí)施例中, 用戶(hù)輸入204包括與特定語(yǔ)音到文本轉(zhuǎn)錄有關(guān)的用戶(hù)評(píng)級(jí)信息。用戶(hù)輸入204任選地包括替換轉(zhuǎn)錄建議,諸如替換音素或某用戶(hù)的特定文本輸入。源語(yǔ)言輸入206可以指示語(yǔ)音的語(yǔ)言。用戶(hù)位置信息輸入208可以包括與每一用戶(hù)輸入204的源相關(guān)聯(lián)的地理信息(例如, 特定用戶(hù)的位置)。加權(quán)分析210可以對(duì)應(yīng)于與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170執(zhí)行的特定轉(zhuǎn)錄相關(guān)聯(lián)的特定相關(guān)標(biāo)識(shí)符。相關(guān)標(biāo)識(shí)符可以由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170在將特定轉(zhuǎn)錄文本提供給客戶(hù)機(jī)設(shè)備時(shí)提供,以使得客戶(hù)機(jī)設(shè)備能夠提供與特定轉(zhuǎn)錄文本相關(guān)聯(lián)的語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170反饋。
      在特定實(shí)施例中,評(píng)級(jí)和音素替換分析邏輯160包括說(shuō)話(huà)者簡(jiǎn)檔生成模塊220。說(shuō)話(huà)者簡(jiǎn)檔生成模塊220可以包括計(jì)算設(shè)備可執(zhí)行的用于生成一個(gè)或多個(gè)用戶(hù)的說(shuō)話(huà)者簡(jiǎn)檔的指令。例如,當(dāng)特定用戶(hù)輸入被接收時(shí),特定用戶(hù)輸入可以包括說(shuō)話(huà)者簡(jiǎn)檔標(biāo)識(shí)符或者與說(shuō)話(huà)者簡(jiǎn)檔標(biāo)識(shí)符相關(guān)聯(lián)。說(shuō)話(huà)者簡(jiǎn)檔標(biāo)識(shí)符可用于指示從特定用戶(hù)接收到的用戶(hù)輸入。可以收集并分析在某時(shí)間段期間從特定用戶(hù)接收到的用戶(hù)輸入,以便生成特定用戶(hù)的說(shuō)話(huà)者簡(jiǎn)檔。
      由評(píng)級(jí)和音素替換分析邏輯160執(zhí)行的加權(quán)分析210可用于調(diào)整或調(diào)節(jié)語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。例如,評(píng)級(jí)和音素替換分析邏輯160可以生成語(yǔ)音到文本調(diào)整信息162。 語(yǔ)音到文本調(diào)整信息162可以包括與由說(shuō)話(huà)者簡(jiǎn)檔生成模塊220生成的說(shuō)話(huà)者簡(jiǎn)檔有關(guān)的信息。語(yǔ)音到文本調(diào)整信息162的示例可包括,基于提供關(guān)于語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的轉(zhuǎn)錄的準(zhǔn)確性的反饋的多個(gè)用戶(hù)的用戶(hù)輸入的對(duì)語(yǔ)音的建議替換轉(zhuǎn)錄。評(píng)級(jí)和音素替換分析邏輯160還可經(jīng)由數(shù)據(jù)庫(kù)230來(lái)檢索包括替換和置信度評(píng)分的轉(zhuǎn)錄服務(wù)數(shù)據(jù)。數(shù)據(jù)庫(kù)230 可提供與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所執(zhí)行的語(yǔ)音到文本轉(zhuǎn)錄相關(guān)聯(lián)的信息。例如,可以將轉(zhuǎn)錄的每一個(gè)單詞或多個(gè)單詞及替換與相應(yīng)的置信度評(píng)分一起存儲(chǔ)在數(shù)據(jù)庫(kù)230中。響應(yīng)于用戶(hù)輸入204以及響應(yīng)于其他輸入,加權(quán)分析210可以考慮數(shù)據(jù)庫(kù)230中的替換和置信度評(píng)分以便提供可用于提升或改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170的準(zhǔn)確性的語(yǔ)音到文本調(diào)整信息162。
      加權(quán)分析210使用多個(gè)輸入來(lái)確定任何給定短語(yǔ)的建議匹配的次序(置信度)。這些輸入包括但不限于由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170輸出的置信度、來(lái)自個(gè)別用戶(hù)的響應(yīng)/ 調(diào)整、從說(shuō)話(huà)者簡(jiǎn)檔傳遞的或與說(shuō)話(huà)者簡(jiǎn)檔相關(guān)聯(lián)的調(diào)節(jié)參數(shù)或來(lái)自“超級(jí)用戶(hù)”的手動(dòng)覆至 JHL ο
      默認(rèn)地,置信度基于由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170輸出的置信度。對(duì)于各個(gè)單詞和短語(yǔ)(如果可能的話(huà)),加權(quán)分析210還使用以置信度次序來(lái)評(píng)級(jí)的替換轉(zhuǎn)錄的評(píng)級(jí)列表。當(dāng)從系統(tǒng)100的用戶(hù)處供應(yīng)了校正數(shù)據(jù)時(shí),可基于該校正(拇指向上/向下、1-5顆星、替換單詞/短語(yǔ)等)的性質(zhì)以及用戶(hù)的歷史可信度來(lái)加權(quán)數(shù)據(jù)對(duì)于用戶(hù)提供的每一調(diào)整/響應(yīng),可以改變特定單詞或短語(yǔ)的系統(tǒng)置信度,這可能導(dǎo)致下一個(gè)替換變成最高的置信度/偏好的選擇。可使用歷史輸入來(lái)確定系統(tǒng)給予各個(gè)用戶(hù)的響應(yīng)多少權(quán)重,歷史輸入包括他們的響應(yīng)與其他用戶(hù)的響應(yīng)一致的頻率、用戶(hù)使用了該系統(tǒng)的多長(zhǎng)時(shí)間等。
      權(quán)重可被表示成分配給特定用戶(hù)的投票的倍數(shù)。系統(tǒng)操作者還可向已知的和/或批準(zhǔn)的用戶(hù)(例如,被賦予審閱和校正結(jié)果的專(zhuān)業(yè)職員)分配較高的權(quán)重,使得他們對(duì)另一用戶(hù)的建議校正的響應(yīng)或批準(zhǔn)被較高的加權(quán),并在用于與其他用戶(hù)比較響應(yīng)以便向這些用戶(hù)分配置信度時(shí)具有較高的影響。系統(tǒng)100還可支持防止特定用戶(hù)的調(diào)整(S卩,說(shuō)話(huà)者他/ 她本人)被自動(dòng)覆蓋和/或在根據(jù)其選擇來(lái)提升替換之前要求手動(dòng)批準(zhǔn)的能力。因此,加權(quán)分析210可以考慮各種因素,以便選擇或調(diào)整特定單詞或短語(yǔ)。
      參考圖3,示出了計(jì)算機(jī)實(shí)現(xiàn)的方法300的特定說(shuō)明性實(shí)施例。計(jì)算機(jī)實(shí)現(xiàn)的方法300可以由計(jì)算設(shè)備(諸如,圖I的服務(wù)器106)來(lái)執(zhí)行。計(jì)算機(jī)實(shí)現(xiàn)的方法300包括 在302,接收來(lái)自多個(gè)客戶(hù)機(jī)設(shè)備的捕捉到的語(yǔ)音數(shù)據(jù)。例如,圖I的語(yǔ)音到文本轉(zhuǎn)錄服務(wù) 170可以接收分別來(lái)自客戶(hù)機(jī)設(shè)備102、104的捕捉到的語(yǔ)音數(shù)據(jù)112、114。計(jì)算機(jī)實(shí)現(xiàn)的方法300還可包括在304,為每一個(gè)客戶(hù)機(jī)設(shè)備,將捕捉到的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成文本。例如, 圖I的語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以使用一個(gè)或多個(gè)語(yǔ)音到文本機(jī)器轉(zhuǎn)錄方法或算法來(lái)將捕捉到的語(yǔ)音數(shù)據(jù)112、114轉(zhuǎn)換成文本。計(jì)算機(jī)實(shí)現(xiàn)的方法300還包括在306,將包括該文本的有效載荷數(shù)據(jù)發(fā)送到每一個(gè)客戶(hù)機(jī)設(shè)備。有效載荷數(shù)據(jù)還可包括與關(guān)于捕捉到的語(yǔ)音數(shù)據(jù)到文本的轉(zhuǎn)換的準(zhǔn)確性的用戶(hù)輸入的分析有關(guān)的至少一個(gè)屬性。有效載荷數(shù)據(jù)還可包括計(jì)算設(shè)備(諸如,圖I的REST端點(diǎn)設(shè)備110)的位置(例如,通信地址或網(wǎng)絡(luò)地址)。例如,圖I的語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可以生成第一有效載荷120和第二有效載荷122,并且每一有效載荷120、122可包括文本和屬性。屬性可包括例如指定REST端點(diǎn)設(shè)備110的位置的地址或其他數(shù)據(jù)。語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170可接收來(lái)自多個(gè)不同客戶(hù)機(jī)設(shè)備的捕捉到的語(yǔ)音,并可生成相應(yīng)的文本??蓪⑽谋竞蛯傩苑职l(fā)給這些客戶(hù)機(jī)設(shè)備。屬性可包括要對(duì)與語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所生成的文本的準(zhǔn)確性有關(guān)的用戶(hù)反饋執(zhí)行后續(xù)處理的特定遠(yuǎn)程設(shè)備的標(biāo)識(shí)符。因此,計(jì)算機(jī)實(shí)現(xiàn)的方法300允許進(jìn)行眾包來(lái)改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄。
      參考圖4,示出了計(jì)算機(jī)實(shí)現(xiàn)的方法400的特定說(shuō)明性實(shí)施例。計(jì)算機(jī)實(shí)現(xiàn)的方法 400可以由客戶(hù)機(jī)設(shè)備(諸如,圖I的客戶(hù)機(jī)設(shè)備102、104中的任一個(gè))來(lái)執(zhí)行。計(jì)算機(jī)實(shí)現(xiàn)的方法400包括在402,將捕捉到的語(yǔ)音數(shù)據(jù)發(fā)送至語(yǔ)音到文本轉(zhuǎn)錄服務(wù),以及在404, 接收包括來(lái)自語(yǔ)音到文本轉(zhuǎn)錄服務(wù)的文本的有效載荷。有效載荷還可包括遠(yuǎn)程設(shè)備的定位符(例如,收集關(guān)于語(yǔ)音到文本轉(zhuǎn)錄的用戶(hù)反饋的設(shè)備的地址)。計(jì)算機(jī)實(shí)現(xiàn)的方法400還包括在406,將文本顯示在電子設(shè)備的顯示設(shè)備(例如,客戶(hù)機(jī)設(shè)備的顯示設(shè)備)上,以及在 408,將用戶(hù)界面顯示在顯示設(shè)備上。該用戶(hù)界面可使得用戶(hù)能夠提供關(guān)于對(duì)捕捉到的語(yǔ)音的文本轉(zhuǎn)錄的準(zhǔn)確性的用戶(hù)輸入。例如,用戶(hù)加密可以提示用戶(hù)對(duì)文本的準(zhǔn)確性進(jìn)行評(píng)級(jí)。 用戶(hù)界面還可使得用戶(hù)能夠提供文本或文本的一部分的替換轉(zhuǎn)錄(例如,以建議一個(gè)或多個(gè)音素替換轉(zhuǎn)錄)。計(jì)算機(jī)實(shí)現(xiàn)的方法400還包括在410,經(jīng)由用戶(hù)界面來(lái)接收用戶(hù)輸入, 以及在412,將該用戶(hù)輸入傳送至遠(yuǎn)程設(shè)備。例如,圖I的第一客戶(hù)機(jī)設(shè)備102可將捕捉到的語(yǔ)音數(shù)據(jù)112發(fā)送至語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170。第一客戶(hù)機(jī)設(shè)備102可以接收來(lái)自語(yǔ)音11到文本轉(zhuǎn)錄服務(wù)170的第一有效載荷120。第一有效載荷120可包括轉(zhuǎn)錄文本和REST端點(diǎn)設(shè)備110的定位符(例如,地址)。第一客戶(hù)機(jī)設(shè)備102可以顯不來(lái)自第一有效載荷120的文本,并可顯示用戶(hù)界面124。第一客戶(hù)機(jī)設(shè)備102可以經(jīng)由用戶(hù)界面124來(lái)接收第一用戶(hù)輸入132,并可將從第一用戶(hù)輸入132中導(dǎo)出的第一用戶(hù)輸入數(shù)據(jù)150傳送至REST端點(diǎn)設(shè)備110處的服務(wù)器。
      因此,計(jì)算機(jī)實(shí)現(xiàn)的方法400可以使得客戶(hù)機(jī)設(shè)備能夠接收來(lái)自語(yǔ)音到文本轉(zhuǎn)錄服務(wù)的文本,并響應(yīng)于該文本而經(jīng)由交互式用戶(hù)界面來(lái)提供用戶(hù)輸入。交互式用戶(hù)界面可用于提示并接收來(lái)自用戶(hù)的關(guān)于語(yǔ)音到文本轉(zhuǎn)錄服務(wù)170所生成的文本的準(zhǔn)確性的反饋。 因此,計(jì)算機(jī)實(shí)現(xiàn)的方法400允許使用眾包來(lái)改進(jìn)語(yǔ)音到文本轉(zhuǎn)錄。
      參考圖5,示出了客戶(hù)機(jī)設(shè)備處可顯示的用戶(hù)界面的一部分500的特定說(shuō)明性實(shí)施例。例如,用戶(hù)界面的部分500可以是可被呈現(xiàn)在第一客戶(hù)機(jī)設(shè)備102的顯示設(shè)備處的圖I的用戶(hù)界面124的一部分。用戶(hù)界面的部分500可包括第一視圖502,該第一視圖502 包括從語(yǔ)音到文本轉(zhuǎn)錄服務(wù)接收到的響應(yīng)于語(yǔ)音數(shù)據(jù)的轉(zhuǎn)錄文本。在圖5所示的示例中, 轉(zhuǎn)錄文本是“As I was saying, this cumquat is terrible”。第一視圖 502 還可包括用戶(hù)可選部分,該用戶(hù)可選部分用于提供關(guān)于涉及語(yǔ)音數(shù)據(jù)的轉(zhuǎn)錄文本的質(zhì)量或準(zhǔn)確性的反饋。例如,用戶(hù)可選部分可包括拇指向上和拇指向下指示符。在圖5所示的示例中,語(yǔ)音數(shù)據(jù)包括句子“As I was saying, this caption is terrible”。因此,界面的用戶(hù)可以通過(guò)選擇如第二視圖504所示的拇指向下指示符來(lái)指示與輸入語(yǔ)音相對(duì)應(yīng)的文本的較低評(píng)級(jí)。 當(dāng)用戶(hù)提供否定的反饋(例如,通過(guò)選擇拇指向下指示符)時(shí),用戶(hù)界面使得用戶(hù)能夠指示轉(zhuǎn)錄文本的單個(gè)單詞或多個(gè)單詞是否被認(rèn)為是不正確的。
      對(duì)于單個(gè)不正確單詞的情況,可呈現(xiàn)修訂視圖506。修訂視圖506可用于突出顯示已被不正確地轉(zhuǎn)錄的特定單詞。在選擇了如修訂視圖506所示的特定單詞后,可顯示更新視圖508。更新視圖508可包括提供用于替換突出顯示的單詞的替換單詞的用戶(hù)選項(xiàng)。 例如,更新視圖508可包括列出突出顯示的單詞的替換轉(zhuǎn)錄的下拉式菜單。在另一示例中, 更新視圖508可包括用于接收校正突出顯示的單詞的輸入的另一用戶(hù)界面區(qū),諸如文本輸入?yún)^(qū)。為了說(shuō)明,對(duì)于所選的單詞“cumquat”,可示出多個(gè)選擇,諸如選擇“caption”和 “captain”,和/或其中用戶(hù)可輸入他或她自己的替換單詞的空白文本文區(qū)。在選擇了所呈現(xiàn)的替換之一后或在用戶(hù)輸入了文本后,可顯示第二修訂視圖514。第二修訂視圖514顯示經(jīng)修訂的轉(zhuǎn)錄文本,諸如“As I was saying, this caption is terrible”。用戶(hù)可以通過(guò)選擇拇指向上指示符來(lái)指示接受經(jīng)修訂的轉(zhuǎn)錄文本??梢韵蛴脩?hù)提供反饋以指示已接收了經(jīng)修訂的轉(zhuǎn)錄文本。例如,響應(yīng)于用戶(hù)選擇了拇指向上指示符,可示出肯定的圖標(biāo),諸如,如第二修訂視圖514中示出的“笑臉”?;蛘?,當(dāng)用戶(hù)提供的輸入指示經(jīng)修訂的轉(zhuǎn)錄文本不正確(例如,通過(guò)選擇拇指向下圖標(biāo))時(shí),用戶(hù)界面可以例如通過(guò)返回到顯示了經(jīng)修訂的轉(zhuǎn)錄文本的修訂視圖506來(lái)再次提示用戶(hù)突出顯示要改變的單詞。
      在多個(gè)單詞被指示或選擇來(lái)進(jìn)行修訂或顯示的情況下,可呈現(xiàn)視圖510。視圖510 可顯示多個(gè)替換單詞,諸如替換短語(yǔ)或句子。如視圖512處所示出的,用戶(hù)可以選擇(或輸入文本)以指示要用替換短語(yǔ)或句子來(lái)替換整個(gè)短語(yǔ)或句子。響應(yīng)于指示替換短語(yǔ)或句子的用戶(hù)輸入,呈現(xiàn)第二修訂視圖514。因此,用戶(hù)可以與用戶(hù)界面進(jìn)行交互,以便查看與之前的語(yǔ)音輸入相對(duì)應(yīng)的轉(zhuǎn)錄文本,并提供關(guān)于轉(zhuǎn)錄文本與語(yǔ)音輸入相比的質(zhì)量或準(zhǔn)確性的反饋或其他用戶(hù)輸入。
      圖6描繪了包括計(jì)算機(jī)設(shè)備610的計(jì)算環(huán)境600的框圖,該計(jì)算設(shè)備610可用于支持根據(jù)本發(fā)明的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的各實(shí)施例。
      計(jì)算設(shè)備610包括至少一個(gè)處理器620和系統(tǒng)存儲(chǔ)器630。取決于計(jì)算設(shè)備610 的配置和類(lèi)型,系統(tǒng)存儲(chǔ)器630可以是易失性的(諸如隨機(jī)存取存儲(chǔ)器,即“RAM”)、非易失性的(諸如只讀存儲(chǔ)器(即“ROM”)、閃存以及即使在未提供電源時(shí)也保持已存儲(chǔ)數(shù)據(jù)的類(lèi)似存儲(chǔ)器設(shè)備)或兩者的某種組合?!毕到y(tǒng)存儲(chǔ)器630通常包括操作系統(tǒng)632、一個(gè)或多個(gè)應(yīng)用程序平臺(tái)634、一個(gè)或多個(gè)應(yīng)用程序636和程序數(shù)據(jù)638。系統(tǒng)存儲(chǔ)器630還可包括語(yǔ)音到文本轉(zhuǎn)錄應(yīng)用612和有效載荷生成應(yīng)用614。在一說(shuō)明性實(shí)施例中,語(yǔ)音到文本轉(zhuǎn)錄應(yīng)用 612、有效載荷生成應(yīng)用614或其任何組合可包括處理器620可執(zhí)行的用于執(zhí)行在此公開(kāi)的功能和方法的指令。例如,圖I的服務(wù)器106的功能可以由應(yīng)用612和614來(lái)執(zhí)行或者由操作系統(tǒng)632來(lái)執(zhí)行。另外地或另選地,計(jì)算設(shè)備610可用于實(shí)現(xiàn)REST端點(diǎn)設(shè)備110的功能以及圖I和2的評(píng)級(jí)和音素替換分析邏輯160的功能。計(jì)算設(shè)備610還可用于實(shí)現(xiàn)在此公開(kāi)的諸如圖3和4中示出的方法之類(lèi)的計(jì)算機(jī)實(shí)現(xiàn)的方法或計(jì)算設(shè)備中的任何一個(gè)。在這種情況下,可以用客戶(hù)機(jī)設(shè)備應(yīng)用來(lái)替換應(yīng)用612、614。計(jì)算設(shè)備610還可用于實(shí)現(xiàn)或顯示在此公開(kāi)的用戶(hù)界面中的一個(gè)或多個(gè),諸如圖I和5中示出的用戶(hù)界面。
      計(jì)算設(shè)備610還可具有附加特征或功能。例如,計(jì)算設(shè)備610可包括可移動(dòng)和/ 或不可移動(dòng)附加數(shù)據(jù)存儲(chǔ)設(shè)備,諸如磁盤(pán)、光盤(pán)、磁帶和標(biāo)準(zhǔn)大小的存儲(chǔ)卡或閃存卡。在圖 6中通過(guò)可移動(dòng)存儲(chǔ)640和不可移動(dòng)存儲(chǔ)650示出這樣的附加存儲(chǔ)。計(jì)算機(jī)存儲(chǔ)介質(zhì)可包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序組件或其它數(shù)據(jù)等信息的任何技術(shù)實(shí)現(xiàn)的易失性和/或非易失性存儲(chǔ)以及可移動(dòng)和/或不可移動(dòng)介質(zhì)。系統(tǒng)存儲(chǔ)器630、可移動(dòng)存儲(chǔ)640和不可移動(dòng)存儲(chǔ)650都是計(jì)算機(jī)存儲(chǔ)介質(zhì)的示例。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括,但不限于,RAM、ROM、電可擦除可編程只讀存儲(chǔ)器(EEPR0M)、閃存或其它存儲(chǔ)器技術(shù)、緊致盤(pán)(CD)、 數(shù)字多功能盤(pán)(DVD)或其它光存儲(chǔ)、磁帶盒、磁帶、磁盤(pán)存儲(chǔ)或其它磁性存儲(chǔ)設(shè)備、或可用于存儲(chǔ)信息且可以由計(jì)算設(shè)備610訪(fǎng)問(wèn)的信息的任何其它介質(zhì)。任何這樣的計(jì)算機(jī)存儲(chǔ)介質(zhì)都可以是計(jì)算設(shè)備610的一部分。
      計(jì)算設(shè)備610還可具有經(jīng)由一個(gè)或多個(gè)有線(xiàn)或無(wú)線(xiàn)輸入接口連接的輸入設(shè)備 660,諸如鍵盤(pán)、鼠標(biāo)、語(yǔ)音輸入設(shè)備、觸摸輸入設(shè)備、運(yùn)動(dòng)或姿勢(shì)輸入設(shè)備等。在說(shuō)明性實(shí)施例中,輸入設(shè)備660可接收用戶(hù)輸入,諸如圖I的用戶(hù)輸入132、144。諸如顯不器、揚(yáng)聲器、 打印機(jī)等輸出設(shè)備670也可經(jīng)由一個(gè)或多個(gè)有線(xiàn)或無(wú)線(xiàn)輸出接口連接。輸出設(shè)備670可包括一個(gè)或多個(gè)顯示設(shè)備。例如,顯示設(shè)備可以與圖I的客戶(hù)機(jī)設(shè)備102、104中的任何一個(gè)相關(guān)聯(lián)。
      計(jì)算設(shè)備610還包含允許該計(jì)算設(shè)備610通過(guò)有線(xiàn)或無(wú)線(xiàn)網(wǎng)絡(luò)(諸如,圖I的網(wǎng)絡(luò) 108)與其它計(jì)算設(shè)備690進(jìn)行通信的一個(gè)或多個(gè)通信連接680。
      這里所描述的實(shí)施例的說(shuō)明旨在提供對(duì)各實(shí)施例的結(jié)構(gòu)的一般理解。說(shuō)明不旨在作為利用這里所描述的結(jié)構(gòu)或方法的裝置和系統(tǒng)的所有元素和特征的完整描述。許多其他實(shí)施例對(duì)本領(lǐng)域的技術(shù)人員在審閱本發(fā)明后是顯而易見(jiàn)的。也可以利用其他實(shí)施例,并從本發(fā)明派生出其他實(shí)施例,以便可以在不偏離本發(fā)明的范圍的情況下作出結(jié)構(gòu)和邏輯上的替換和改變。相應(yīng)地,本發(fā)明和附圖應(yīng)被視為說(shuō)明性的,而不是限制性的。
      本領(lǐng)域技術(shù)人員還可理解,結(jié)合本文所公開(kāi)的各種說(shuō)明性邏輯框、配置、模塊、和過(guò)程步驟或指令可被實(shí)現(xiàn)為電子硬件或計(jì)算機(jī)軟件。各種說(shuō)明性組件、框、配置、模塊或步驟已經(jīng)大致按照其功能來(lái)描述。此類(lèi)功能性是被實(shí)現(xiàn)為硬件還是軟件取決于具體應(yīng)用和加諸于整體系統(tǒng)的設(shè)計(jì)約束。技術(shù)人員可針對(duì)每種特定應(yīng)用以不同方式來(lái)實(shí)現(xiàn)所描述的功能集,但此類(lèi)實(shí)現(xiàn)決策不應(yīng)被解釋為致使脫離本公開(kāi)的范圍。
      結(jié)合此處所公開(kāi)的各實(shí)施例所描述的方法的各個(gè)步驟可直接用硬件、由處理器執(zhí)行的軟件模塊、或兩者的組合來(lái)實(shí)現(xiàn)。軟件模塊可駐留在諸如隨機(jī)存取存儲(chǔ)器(RAM)、閃存、 只讀存儲(chǔ)器(ROM)、寄存器、硬盤(pán)、可移動(dòng)盤(pán)、⑶-ROM、或本領(lǐng)域內(nèi)已知的任何其他形式的存儲(chǔ)介質(zhì)等計(jì)算機(jī)可讀介質(zhì)中。示例性存儲(chǔ)介質(zhì)耦合到處理器以使得該處理器能從該存儲(chǔ)介質(zhì)讀取信息并向該存儲(chǔ)介質(zhì)寫(xiě)入信息。在替換方案中,存儲(chǔ)介質(zhì)可集成到處理器或處理器并且存儲(chǔ)介質(zhì)可作為分立組件駐留在計(jì)算設(shè)備或計(jì)算機(jī)系統(tǒng)中。
      雖然這里顯示和描述了具體的實(shí)施例,但是,應(yīng)該了解,被設(shè)計(jì)為實(shí)現(xiàn)相同或類(lèi)似的目的的任何隨后的安排都可以代替所示出的具體實(shí)施例。本說(shuō)明書(shū)計(jì)劃涵蓋各種實(shí)施例的任何隨后的修改或變化。
      提交本發(fā)明的摘要的同時(shí)要明白,將不用它來(lái)解釋或限制權(quán)利要求的范圍或含義。此外,在前面的具體實(shí)施例中,出于將本公開(kāi)連成一個(gè)整體的目的,各種特征可以組合到一起,或在一個(gè)實(shí)施例中進(jìn)行描述。本發(fā)明不應(yīng)被解釋為反映帶權(quán)利要求的實(shí)施例需要比每一個(gè)權(quán)利要求中明確地記載的特征更多的特點(diǎn)的意圖。相反,如下面的權(quán)利要求所反映的,本發(fā)明的主題可以涉及少于所公開(kāi)的實(shí)施例中的任一個(gè)的所有特征。
      盡管用結(jié)構(gòu)特征和/或方法動(dòng)作專(zhuān)用的語(yǔ)言描述了本主題,但可以理解,所附權(quán)利要求書(shū)中定義的主題不必限于上述具體特征或動(dòng)作。更確切而言,上述具體特征和動(dòng)作是作為實(shí)現(xiàn)權(quán)利要求的示例形式公開(kāi)的。
      權(quán)利要求
      1.一種方法,包括 在代表性狀態(tài)傳輸端點(diǎn)設(shè)備處,接收與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第一語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第一用戶(hù)輸入; 在所述代表性狀態(tài)傳輸端點(diǎn)設(shè)備處,接收與由所述語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第二語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第二用戶(hù)輸入;以及 在所述代表性狀態(tài)傳輸端點(diǎn)設(shè)備處,處理所述第一用戶(hù)輸入和所述第二用戶(hù)輸入以生成語(yǔ)音到文本調(diào)整信息。
      2.如權(quán)利要求I所述的方法,其特征在于,所述第一用戶(hù)輸入接收自第一客戶(hù)機(jī)設(shè)備,且所述第二用戶(hù)輸入接收自所述第二客戶(hù)機(jī)設(shè)備,其中所述第一用戶(hù)輸入包括由所述第一客戶(hù)機(jī)設(shè)備供應(yīng)的第一用戶(hù)評(píng)級(jí)和音素替換,并且其中所述第一客戶(hù)機(jī)設(shè)備和所述第二客戶(hù)機(jī)設(shè)備位于所述代表性傳輸端點(diǎn)設(shè)備的遠(yuǎn)程,并且其中所述代表性狀態(tài)傳輸端點(diǎn)設(shè)備包括耦合到網(wǎng)絡(luò)的計(jì)算機(jī)服務(wù)器。
      3.如權(quán)利要求2所述的方法,其特征在于,所述第一客戶(hù)機(jī)設(shè)備是與所述第二客戶(hù)機(jī)設(shè)備不同類(lèi)型的設(shè)備。
      4.如權(quán)利要求I所述的方法,其特征在于,所述語(yǔ)音到文本調(diào)整信息至少部分地基于說(shuō)話(huà)者簡(jiǎn)檔。
      5.如權(quán)利要求2所述的方法,其特征在于,所述語(yǔ)音到文本轉(zhuǎn)錄服務(wù)接收來(lái)自所述第一客戶(hù)機(jī)設(shè)備的第一語(yǔ)音數(shù)據(jù)、對(duì)所述第一語(yǔ)音數(shù)據(jù)執(zhí)行語(yǔ)音到文本轉(zhuǎn)錄以生成第一文本、以及生成包括所述第一文本和第一屬性的第一有效載荷。
      6.如權(quán)利要求5所述的方法,其特征在于,所述第一屬性包括用戶(hù)反饋刻度范圍和所述代表性狀態(tài)傳輸端點(diǎn)設(shè)備的標(biāo)識(shí)符,其中所述第一屬性還包括語(yǔ)言信息、位置信息和用于執(zhí)行界面以在所述第一客戶(hù)機(jī)設(shè)備處收集第一用戶(hù)評(píng)級(jí)的應(yīng)用的統(tǒng)一資源定位符,并且其中第一客戶(hù)機(jī)設(shè)備執(zhí)行第一應(yīng)用并在接收所述第一有效載荷后選擇性地啟動(dòng)第一用戶(hù)界面。
      7.如權(quán)利要求5所述的方法,其特征在于,所述語(yǔ)音到文本轉(zhuǎn)錄服務(wù)接收來(lái)自所述第二客戶(hù)機(jī)設(shè)備的第二語(yǔ)音數(shù)據(jù)、對(duì)所述第二語(yǔ)音數(shù)據(jù)執(zhí)行語(yǔ)音到文本轉(zhuǎn)錄以生成第二文本、以及生成包括所述第二文本并包括第二屬性的第二有效載荷,其中所述第一有效載荷還包括與所述第一文本相關(guān)的第一標(biāo)識(shí)符,并且其中所述第二有效載荷包括與所述第二文本相關(guān)的第二標(biāo)識(shí)符。
      8.如權(quán)利要求I所述的方法,其特征在于,所述代表性狀態(tài)傳輸端點(diǎn)設(shè)備對(duì)來(lái)自接收到的用戶(hù)輸入的多個(gè)用戶(hù)評(píng)級(jí)執(zhí)行評(píng)級(jí)分析,其中所述接收到的用戶(hù)輸入包括多個(gè)REST符合的投票、源語(yǔ)言信息和用戶(hù)位置信息,并且其中所述評(píng)級(jí)分析包括使用基于所述接收到的用戶(hù)輸入的加權(quán)計(jì)算來(lái)生成所述語(yǔ)音到文本調(diào)整信息。
      9.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,包括 將捕捉到的語(yǔ)音數(shù)據(jù)發(fā)送到語(yǔ)音到文本轉(zhuǎn)錄服務(wù); 接收包括來(lái)自所述語(yǔ)音到文本轉(zhuǎn)錄服務(wù)的文本的有效載荷; 將所述文本顯示在電子設(shè)備的顯示器處; 將用戶(hù)界面顯示在所述顯示器處,其中所述用戶(hù)界面使得用戶(hù)能夠提供有關(guān)所述文本的準(zhǔn)確性的用戶(hù)輸入;接收所述用戶(hù)輸入以及所述文本的至少一個(gè)音素替換;以及 將所述用戶(hù)輸入以及所述至少一個(gè)音素替換傳送至遠(yuǎn)程設(shè)備。
      10.如權(quán)利要求9所述的方法,其特征在于,所述遠(yuǎn)程設(shè)備是REST端點(diǎn)設(shè)備處的服務(wù)器。
      全文摘要
      本發(fā)明涉及針對(duì)由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)生成的文本的分布式用戶(hù)輸入。特定方法包括在代表性狀態(tài)傳輸端點(diǎn)設(shè)備處接收與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第一語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第一用戶(hù)輸入。該方法還包括在代表性狀態(tài)傳輸端點(diǎn)設(shè)備處接收與由語(yǔ)音到文本轉(zhuǎn)錄服務(wù)執(zhí)行的第二語(yǔ)音到文本轉(zhuǎn)換有關(guān)的第二用戶(hù)輸入。該方法包括在代表性狀態(tài)傳輸端點(diǎn)設(shè)備處處理第一用戶(hù)輸入和第二用戶(hù)輸入以生成語(yǔ)音到文本調(diào)整信息。
      文檔編號(hào)G06F17/28GK102929866SQ20121041925
      公開(kāi)日2013年2月13日 申請(qǐng)日期2012年10月26日 優(yōu)先權(quán)日2011年10月28日
      發(fā)明者J·E·卡思, T·E·哈里斯, M·墨丘里, J·O·蒂斯代爾三世 申請(qǐng)人:微軟公司
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1