專利名稱:聽寫系統(tǒng)語音到文本轉(zhuǎn)換用戶性能的測量方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請的技術(shù)一般涉及聽寫系統(tǒng)的語音到文本轉(zhuǎn)換,尤其涉及提供用于測量用戶 性能(performance)的基線(base line)和量度(metric)的方法和系統(tǒng)。
背景技術(shù):
許多公司為客戶提供了使用呼叫中心聯(lián)系本公司的能力,以便當(dāng)場回復(fù)客戶的呼 叫、糾正客戶的問題,或?yàn)榭蛻糁概珊侠淼馁Y源來解決引起呼叫的問題。常規(guī)地,呼叫中心 通過將呼叫從客戶指引到可用的代理或代表進(jìn)行操作。除電話呼叫裝置以外,代理或代表 通常還具有公司已授權(quán)或?qū)iT設(shè)計(jì)的便于幫助客戶的客戶關(guān)系管理屏?,F(xiàn)在參考圖1,示出了在呼叫中心100內(nèi)的系統(tǒng)的概念性表示。呼叫中心100包括 語音技術(shù)設(shè)備和基于IP的技術(shù)設(shè)備,其中語音技術(shù)設(shè)備位于信令和音頻路徑中,并終止于 代理的電話(或頭戴式耳麥),基于IP的技術(shù)設(shè)備支持CRM(也稱為客戶關(guān)系管理)應(yīng)用程 序,CRM應(yīng)用程序的圖形用戶界面(GUI)在代理的諸如個(gè)人計(jì)算機(jī)或類似裝置這樣的處理 器上運(yùn)行。為支持這點(diǎn),呼叫中心100包括自動(dòng)呼叫分配(A⑶)102,其具有與代理的電話 106的音頻連接104。A⑶102還具有與交互語音應(yīng)答(IVR) 110的音頻連接108。音頻連接 104和108可重疊、完全分離或合并到一起。IVRllO具有與計(jì)算機(jī)電話界面(CTI)的數(shù)據(jù) 連接112。CTI114典型地為A⑶102提供呼叫控制116,和向代理的計(jì)算機(jī)120提供數(shù)據(jù)和 應(yīng)用程序控制118。因此,當(dāng)客戶使用電話122或者類似的裝置通過諸如所示的公共交換電 話網(wǎng)(PSTN)之類的常規(guī)網(wǎng)絡(luò)IM呼叫該呼叫中心時(shí),向代理提供用來幫助呼叫者所必要的 音頻、數(shù)據(jù)和應(yīng)用程序。盡管圖1標(biāo)識出如圖所示的通過常規(guī)的PSTN進(jìn)行的客戶呼叫,但來自客戶的呼叫 可從計(jì)算機(jī)或基于電纜的VoIP網(wǎng)絡(luò)發(fā)起。例如當(dāng)客戶使用常規(guī)的陸上通信線或蜂窩電話 時(shí),該網(wǎng)絡(luò)IM可以是如圖所示的常規(guī)PSTN網(wǎng)絡(luò)?;蛘撸W(wǎng)絡(luò)IM可以是計(jì)算網(wǎng)絡(luò),例如 LAN、WAN、WLAN、ffffAN、WiFi、因特網(wǎng)、以太網(wǎng)或其它私有區(qū)域網(wǎng)絡(luò)。當(dāng)網(wǎng)絡(luò)1 是計(jì)算網(wǎng)絡(luò) 時(shí),來自客戶的呼叫可從例如計(jì)算機(jī)電話的能夠?qū)崿F(xiàn)IP語音技術(shù)(VoIP)的設(shè)備發(fā)起。注 意,可使用常規(guī)技術(shù)將VoIP電話轉(zhuǎn)接到常規(guī)PSTN網(wǎng)絡(luò),此外例如,常規(guī)陸上通信線可被連 接到使用軟電話(soft phone)或媒體網(wǎng)關(guān)的計(jì)算機(jī)網(wǎng)絡(luò)。
一旦與客戶服務(wù)代表間的呼叫建立起來,并且CRM應(yīng)用程序在代表的用戶界面上 運(yùn)行,客戶服務(wù)代表將請求客戶的輸入。這種輸入可包括諸如客戶名、地址、問題性質(zhì)以及 類似內(nèi)容的信息。傳統(tǒng)地,代表通過將信息鍵入各自的輸入信息區(qū)來輸入這種信息。在通 話結(jié)束時(shí),經(jīng)常是客戶服務(wù)代表填寫CRM應(yīng)用程序中的通常熟知為注釋或通話結(jié)束的注釋 的信息區(qū)。這種信息區(qū)通常由代表來鍵入確認(rèn)信息,例如對客戶投訴或類似事件的處理。雖然CRM應(yīng)用程序和信息生成是有用的工具,但許多客戶服務(wù)代表并非是高效率 的打字員。而且,即使對于高效率打字員,已經(jīng)被公認(rèn)的是大多數(shù)人說話速度也大大快于他 們的打字速度。因此,近來使用例如Nuance通信公司的Dragon Naturally Speaking聽寫 系統(tǒng)進(jìn)行聽寫,來代替將信息鍵入各種信息區(qū)已經(jīng)成為一種趨勢。然而,使用聽寫系統(tǒng)作為工具來向CRM應(yīng)用程序中的信息區(qū)添加信息,到目前為 止是麻煩而不方便的。此外,很難提供量度,來衡量與基于打字的系統(tǒng)相對比基于聽寫的系 統(tǒng)的性能。因此依據(jù)這種背景,需要提供一種聽寫系統(tǒng)的語音到文本轉(zhuǎn)換的用戶性能的測 量方法和系統(tǒng)。
發(fā)明內(nèi)容
一種測量使用轉(zhuǎn)錄機(jī)的用戶性能的計(jì)算機(jī)實(shí)現(xiàn)的方法被提供。該方法包括接收轉(zhuǎn) 錄文件,該轉(zhuǎn)錄文件包含由被評估的用戶生成的音頻文件的轉(zhuǎn)錄文本。該系統(tǒng)基于轉(zhuǎn)錄文 件確定例如每分鐘字?jǐn)?shù)、每分鐘錯(cuò)誤數(shù)、每字錯(cuò)誤、每分鐘有效字?jǐn)?shù),或類似量度的至少一個(gè) 性能量度。該性能量度可指示用戶性能。該性能量度被發(fā)送給能夠評估用戶性能的管理員。依照在此描述的一般原理,任意上述實(shí)施例的特征可彼此相結(jié)合地來使用。在結(jié) 合附圖和權(quán)利要求書閱讀了下面的詳細(xì)描述后,能更完整地理解這些以及其它的實(shí)施例、 特征和優(yōu)點(diǎn)。在某些配置中,該方法和系統(tǒng)可被提供以相當(dāng)?shù)?comparative)性能量度。例如, 可提供或生成相當(dāng)?shù)拇蜃中阅芰慷?,以便與更多常規(guī)領(lǐng)域的打字系統(tǒng)相對比地來評估使用 聽寫和轉(zhuǎn)錄系統(tǒng)的用戶的性能。還提供了被配置成獲得關(guān)于聽寫系統(tǒng)的使用的性能信息的計(jì)算機(jī)系統(tǒng)。該系統(tǒng)包 括處理器和與該處理器電子通信的存儲器。該處理器被配置為接收由用戶的音頻文件生成 的轉(zhuǎn)錄文件,并基于該轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度,該至少一個(gè)聽寫性能量度指 示了用戶性能。該處理器被配置成將該至少一個(gè)聽寫性能量度發(fā)送給管理員,由此該管理 員可評估用戶的性能。還提供了用于評估使用聽寫系統(tǒng)的用戶的性能的計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序 產(chǎn)品包括其上具有指令的計(jì)算機(jī)可讀媒介。該計(jì)算機(jī)編程產(chǎn)品由介質(zhì)攜帶,并可加載到處 理器。介質(zhì)上的代碼被編程為接收用戶的由轉(zhuǎn)錄機(jī)從該用戶的音頻文件產(chǎn)生的轉(zhuǎn)錄文件。 而且,介質(zhì)上的代碼被編程為從轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度,該至少一個(gè)聽寫性 能量度指示用戶性能。介質(zhì)上的代碼被編程為將被確定的至少一個(gè)聽寫性能量度發(fā)送給管 理員。由此該管理員可評估用戶的性能。
圖1是呼叫中心系統(tǒng)的功能框5
圖2是與本申請的技術(shù)的示范性實(shí)施例一致的評估系統(tǒng)的功能性框圖;圖3是與本申請的技術(shù)實(shí)施例相關(guān)聯(lián)的示范性方法的示范性操作流程圖;圖4是與本申請的技術(shù)的示范性實(shí)施例相關(guān)聯(lián)的評估屏幕的示范性顯示;圖5是與本申請的技術(shù)的示范性實(shí)施例相關(guān)聯(lián)的評估屏幕的示范性顯示;圖6是與本申請的技術(shù)的評估相關(guān)聯(lián)的表格;圖7是與本申請的技術(shù)的實(shí)施例相關(guān)聯(lián)的選項(xiàng)的示范性表格;圖8是與本申請的技術(shù)相關(guān)聯(lián)的示范性數(shù)據(jù)表格。
具體實(shí)施例方式將參考客戶呼叫中心應(yīng)用程序來解釋本申請的技術(shù)。該技術(shù)大體上被描述為將音 頻從用戶引導(dǎo)向?qū)⒁纛l轉(zhuǎn)換為文本并返回轉(zhuǎn)錄(transcription)文本的遠(yuǎn)程服務(wù)器。本 領(lǐng)域的普通技術(shù)人員在閱讀了本公開內(nèi)容后將能夠認(rèn)識到本申請的技術(shù)在其它環(huán)境中也 是有用的。例如,代替由遠(yuǎn)程服務(wù)器提供轉(zhuǎn)錄,轉(zhuǎn)錄可被直接加載到用戶處理器。此外,本 申請的技術(shù)可用在不同于呼叫中心的環(huán)境中,以提供與聽寫系統(tǒng)有關(guān)的基線和公制計(jì)量 (metric measurement) 0而且,本申請的技術(shù)將參考示范性實(shí)施例來描述。在此使用措辭 “示范性”來表示“用作示例、舉例或說明”。此處描述為“示范性”的任意實(shí)施例不必被理解 為優(yōu)選或優(yōu)于其它實(shí)施例。此外,除非明確指出,否則此處描述的所有實(shí)施例都應(yīng)被認(rèn)為是 示范性的。如上面所解釋的,基于聽寫的語音到文本轉(zhuǎn)換軟件已經(jīng)存在了一段時(shí)間。該聽寫 可在本地處理器執(zhí)行,以便為用戶提供實(shí)時(shí)的或接近實(shí)時(shí)的口述轉(zhuǎn)錄(transcription)?;?者,可將口述批量加載到中央處理器或服務(wù)器,而在稍后返回轉(zhuǎn)錄文本。聽寫系統(tǒng)可采用自 由形式、語法語音識別機(jī)或模式匹配語音識別。在其它實(shí)施例中,語音到文本的轉(zhuǎn)換可在實(shí) 時(shí)或接近實(shí)時(shí)地工作的分布式聽寫系統(tǒng)中提供。一種這樣的分布式聽寫系統(tǒng)在提交于2008 年 12 月 19 日,標(biāo)題為“distributed dictation/transcription system”的第 12/339,336 號美國待審專利申請中描述,在此結(jié)合該專利全部內(nèi)容作為參考。首先參考圖2,提供了采用本申請的技術(shù)的評估系統(tǒng)200的功能框圖。評估系統(tǒng) 200包括例如微處理器、中央處理單元、臺式機(jī)、服務(wù)器、筆記本電腦、掌上電腦或類似裝置 的處理器202。處理器202控制評估系統(tǒng)200的主要功能,該評估系統(tǒng)200包括在下文中描 述的功能性操作。處理器202還處理操作評估系統(tǒng)200所需的各種輸入和/或數(shù)據(jù)。存儲 器204與處理器202互連。存儲器204可置于遠(yuǎn)處,或與處理器202協(xié)同定位。如同本文 將要描述的,該存儲器204還可存儲對于評估系統(tǒng)200必需的或適宜的數(shù)據(jù)。如將要說明 的,存儲器204可包括生成基線和評估量度信息、關(guān)于任意特定文本或評估的結(jié)果、時(shí)間信 息或?qū)⒈唤忉尩念愃祈?xiàng)目。評估系統(tǒng)200還包括可從例如客戶服務(wù)代表的用戶接收音頻信 息的音頻接收接口 206或端口。評估系統(tǒng)200還包括從用戶接收數(shù)據(jù)或向用戶發(fā)送數(shù)據(jù)的 數(shù)據(jù)接口 208或端口。與處理器202互連的是語音到文本機(jī)210,其將從用戶接收的音頻信號轉(zhuǎn)換成文 本文件,該文本文件可被返回給用戶,或作為評估部分進(jìn)一步處理。語音到文本機(jī)210通常 在本領(lǐng)域中是可理解的,在此不作進(jìn)一步解釋。語音到文本機(jī)210可從遠(yuǎn)程提供,可與處理 器202集成或協(xié)同定位。
評估系統(tǒng)200還包括輸出裝置212,例如顯示器、打印機(jī)、電子郵件生成器或類似 的本領(lǐng)域中常規(guī)設(shè)備,用來輸出評估系統(tǒng)200的結(jié)果?,F(xiàn)今許多企業(yè)和公司,在認(rèn)識到聽寫提供的快捷和簡單的同時(shí),需要某些測量由 聽寫的使用所帶來的生產(chǎn)率的提高的實(shí)際器件(real means)。此外,一旦被安裝,聽寫系 統(tǒng)的有效性必須被測量出來,以除提供其他信息以外,還提供系統(tǒng)未充分執(zhí)行時(shí)的指示?,F(xiàn) 在參考圖3,提供了示范性流程圖300,其示出了生成與基于聽寫的系統(tǒng)的使用有關(guān)的量度 的示范性操作步驟。一種類型的性能量度與可生成信息的速度有關(guān)。如上所述,使用聽寫 的一個(gè)優(yōu)點(diǎn)是可增加每次登記的速度。然而,理解效率的提高將是有用的。因此,如圖300 所示,用戶將發(fā)起一個(gè)測試,步驟302。接下來為該用戶提供樣本文本,步驟304。視情況可 提供單個(gè)樣本或多個(gè)可選樣本。而且,在設(shè)計(jì)者的選擇方面,可以允許最終用戶提供自生成 的或定制的樣本。提供樣本文本可包括從多個(gè)樣本文本中選擇一個(gè)的步驟。一旦被選中, 該樣本文本被顯示給用戶,步驟306。該顯示可在用戶界面、顯示器或紙印本上提供。例如, 參考圖4,提供了樣本顯示窗口 400。顯示窗口 400在樣本區(qū)域404內(nèi)示出了樣本文本402。 另一個(gè)區(qū)域406為空白。如將聯(lián)系圖3的剩余部分所描述的,當(dāng)“開始”按鈕408被激活或 以類似的方式被激活時(shí),區(qū)域406被啟用來允許用戶將文本鍵入該區(qū)域。本技術(shù)可視情況包括打字部分。但是,另一方面,關(guān)于每分鐘鍵入的字?jǐn)?shù)、每分鐘 出現(xiàn)的錯(cuò)誤或類似方面的信息可通過其他應(yīng)用程序得到。因此,盡管描述了獲得打字相關(guān) 信息的處理時(shí),在此,可從其它程序或應(yīng)用程序輸入打字信息,例如來自Mavis Beacon的應(yīng) 用程序可提供對比打字統(tǒng)計(jì)數(shù)據(jù)。但是,為了完備性,在此提供樣本打字評估。當(dāng)準(zhǔn)備開始 測試打字部分時(shí),用戶點(diǎn)擊開始按鈕來啟用文本區(qū)域406,步驟308,并且開始鍵入樣本文 本,步驟310。點(diǎn)擊開始基本同時(shí)初始化跟蹤時(shí)間的計(jì)數(shù)器或時(shí)鐘,步驟312。一旦完成鍵入 樣本文本,用戶將點(diǎn)擊結(jié)束按鈕410,步驟314,或者類似按鈕(可替換地,再次點(diǎn)擊開始按 鈕)。這使得向區(qū)域406鍵入的能力被禁止并且停止了計(jì)數(shù)器或時(shí)鐘,步驟316。確定從開 始打字到結(jié)束打字的時(shí)間,步驟318,并且保存該時(shí)間,步驟320。注意,視情況,區(qū)域406的 激活可簡單地通過在該區(qū)域打字來完成,并且區(qū)域406的禁用可通過用戶敲擊例如返回、 回車或類似鍵來完成。可選擇地,處理器202可對照著樣本文本檢查在區(qū)域406中鍵入的 文本以判定差錯(cuò),步驟322??商鎿Q地,步驟308到322可通過分離的應(yīng)用程序獲得,將結(jié)果 輸出應(yīng)用程序或從應(yīng)用程序輸入結(jié)果。用戶開始語音測試。在這種情況下,如圖5所示,事先選出的同樣的樣本文本可在 區(qū)域402中被顯示。但是,聽寫文本和打字文本不需要是相同的,但當(dāng)打字和聽寫樣本相同 時(shí)可以進(jìn)行更好的比較。準(zhǔn)備好開始時(shí),用戶選擇按下對話按鈕508,步驟324,并且讀出樣 本文本,步驟326。選擇按下對話按鈕508基本上同時(shí)啟動(dòng)了計(jì)數(shù)器或時(shí)鐘,步驟330。一 旦該段被讀完,用戶可按下斷連按鈕510,步驟332,聽寫完成。該聽寫系統(tǒng)可被設(shè)計(jì)成接 受宏(macro)來增加每分鐘的有效字?jǐn)?shù)。例如,聽寫短句“we are unable to make the necessary over the air programming corrections until your phone is back on the AT&T network,可能是一個(gè)常用短句。系統(tǒng)可允許將宏編程為使得“phone out of network" 的聽寫導(dǎo)致在聽寫中返回以上子句。因此,代替21個(gè)單詞的聽寫,用戶可以聽寫4個(gè)單詞, 這樣將平均占用較少的時(shí)間來聽寫,有效地增加了聽寫的每分鐘字?jǐn)?shù)。具有宏或者不具有 宏的音頻文件,將被發(fā)送給處理器并轉(zhuǎn)化成文本文件,步驟334,該文本文件被返回填入?yún)^(qū)
7域506,步驟336。用文本占用區(qū)域506將停止計(jì)數(shù)器或時(shí)鐘,并且處理器202將判定從該 段被讀出到返回話語內(nèi)容(speech)的時(shí)間,步驟338。而且,可選地,處理器202可通過將 話語內(nèi)容與樣本文本進(jìn)行比較來判斷轉(zhuǎn)錄文本中的錯(cuò)誤,步驟340。類似于打字信息,該處 理器將聽寫統(tǒng)計(jì)數(shù)字與打字統(tǒng)計(jì)數(shù)字相比較可以從其它應(yīng)用程序輸入聽寫統(tǒng)計(jì)數(shù)字。一旦打字和讀出部分都被完成,和/或從分離的應(yīng)用程序輸入(即使所示的是鍵 入和讀出,該步驟順序可顛倒),處理器202將評估和提供許多的性能量度。一種樣本的性 能量度在圖6中通過表格500示出。表格500標(biāo)識測試運(yùn)行的數(shù)量、測試平均長度、每分鐘 聽寫字?jǐn)?shù)和每分鐘打字字?jǐn)?shù)。如所提到的,如果錯(cuò)誤率是期望的,可針對錯(cuò)誤調(diào)整每分鐘的 字?jǐn)?shù),或者錯(cuò)誤可被提供為示出每字平均錯(cuò)誤、每分鐘錯(cuò)誤或類似的獨(dú)立量度。聽寫的每分 鐘字?jǐn)?shù)或錯(cuò)誤數(shù)以及打字的每分鐘字?jǐn)?shù)或錯(cuò)誤可以是判定出的每分鐘實(shí)際的或有效的字 數(shù)或錯(cuò)誤。此外,也可以期望或求出其它量度。同時(shí)測試初始化(initiative)是有用的,如本領(lǐng)域公知的那樣,許多聽寫系統(tǒng)可 能需要對用戶進(jìn)行培訓(xùn)以便適當(dāng)?shù)嘏c系統(tǒng)相交互。因此,允許管理員觀看關(guān)于性能和培訓(xùn) 的信息是有幫助的。例如,管理員可訪問如圖7所示的指示管理回顧處理,例如培訓(xùn)報(bào)告 602、時(shí)間測試604、性能606和統(tǒng)計(jì)數(shù)字608的頁面。管理員可具有附加功能,例如,更新樣 本或測試文本及類似文件的能力。如果管理員選擇了培訓(xùn)報(bào)告602,如同所示出的,將為該 管理員呈現(xiàn)備選的用戶列表。這允許該管理員選出將調(diào)查的用戶?;蛘撸稍趩蝹€(gè)顯示器 上提供所有信息。該管理員將能夠識別該用戶是否已經(jīng)執(zhí)行了所要求的培訓(xùn)的全部、部分、 未執(zhí)行培訓(xùn)或執(zhí)行了培訓(xùn)的某種組合。此外,培訓(xùn)文本和音頻可存儲下來,使得管理員能夠 對用戶讀出的在培訓(xùn)練習(xí)中呈現(xiàn)的文本進(jìn)行快速的判定。接下來,例如管理員可選擇時(shí)間測試功能,用戶列表或全部信息將再次呈現(xiàn)。管理 員將能夠識別,例如,完成了哪個(gè)時(shí)間測試,(協(xié)同對培訓(xùn)特征的檢查)時(shí)間測試是在具有 還是不具有適當(dāng)?shù)呐嘤?xùn)和性能的情況下執(zhí)行的。各個(gè)結(jié)果(類似于以上那些結(jié)果)可由管 理員相對于每個(gè)用戶來監(jiān)控。被監(jiān)控的結(jié)果可包括如所期望地那樣保存樣本文本、打字文 本、轉(zhuǎn)錄文本和音頻,以便管理員能夠通過音頻、視頻或通過音頻、視頻的某種組合來回顧 各用戶的性能。為了迅速做出如顯示器700的表702所示的總結(jié),可提供給管理員例如用 戶名、所執(zhí)行樣本測試、每分鐘字?jǐn)?shù)和每分鐘聽寫的一般信息。表702的一般信息可配備到 如顯示器700的表704所示文本的特定結(jié)果的鏈接。表704的細(xì)節(jié)包括樣本文本706、打字 文本708、聽寫文本710以及到管理員在回顧時(shí)可聽到的音頻文件712的鏈接。代替?zhèn)€體的用戶,管理員可為所有用戶提供以上的和其它的性能指示,或者為用 戶組選擇性能組。如同能夠理解的,以上方法和系統(tǒng)提供了通過將針對個(gè)體或一組個(gè)體將基于打字 的輸入和口述輸入進(jìn)行對比來基于時(shí)間和每分鐘字?jǐn)?shù)測量性能的系統(tǒng)。該系統(tǒng)進(jìn)一步通過 跟蹤個(gè)體用戶輸入和將該個(gè)體用戶輸入保存在系統(tǒng)中,建立了基線測量和性能評估量度。 在所提供的例子中,用戶最初使用鍵盤、鼠標(biāo)、觸摸屏、光筆或類似設(shè)備的傳統(tǒng)輸入法將信 息輸入系統(tǒng)。此外,用戶使用語音到文本轉(zhuǎn)錄將信息輸入。對技術(shù)設(shè)想的當(dāng)前實(shí)現(xiàn)使用了 基于web的用戶界面,允許各個(gè)用戶采用兩種方法執(zhí)行樣本文本的定時(shí)輸入。此外,該系統(tǒng)可跟蹤關(guān)于性能的其它量度。例如,該系統(tǒng)可跟蹤例如音頻轉(zhuǎn)錄平均 持續(xù)時(shí)間、轉(zhuǎn)錄服務(wù)器平均等待時(shí)間、轉(zhuǎn)錄音頻的平均時(shí)間、聽寫數(shù)量、取消數(shù)量、錯(cuò)誤數(shù)量或類似的統(tǒng)計(jì)數(shù)據(jù)。頻繁地影響聽寫性能的一個(gè)特征是音頻輸出212的質(zhì)量。在許多不良的執(zhí)行情況 下,可能是音頻質(zhì)量太響而導(dǎo)致了系統(tǒng)飽和或削波(clipping),和/或音頻質(zhì)量太輕而導(dǎo) 致話音被當(dāng)作例如噪音而被拋棄。因此,本申請可提供一種添加到音頻文件或鏈接到系統(tǒng) 的音頻質(zhì)量指示器,使得管理員或用戶可識別音頻質(zhì)量問題。該音頻質(zhì)量可以是在用戶講 話時(shí)提供給用戶的視頻指示器,或是在用戶可能說話太響或太輕時(shí)做出補(bǔ)償?shù)哪承┢渌?型指示器。本領(lǐng)域技術(shù)人員將能夠理解,信息和信號可使用任意多種不同的技術(shù)和方法來表 示。例如,在以上描述中所涉及的數(shù)據(jù)、指令、命令、信息、信號、比特、符號和碼片均可通過 電壓、電流、電磁波、磁場或粒子、光學(xué)場或粒子或者其任意組合來表示。本領(lǐng)域的普通技術(shù)人員還應(yīng)當(dāng)理解與在此公開的實(shí)施方式有關(guān)的各種說明性的 邏輯功能塊、模塊、電路和算法程序可以作為電子硬件、計(jì)算機(jī)軟件或者其組合來實(shí)現(xiàn)。為 了清楚地舉例說明硬件和軟件的這種互換性,通常根據(jù)其功能來描述各種說明性的組件、 功能塊、模塊、電路和步驟。這種功能是以硬件還是軟件來實(shí)現(xiàn)取決于對整個(gè)系統(tǒng)的特殊應(yīng) 用和設(shè)計(jì)約束。熟練技術(shù)人員可為每個(gè)特殊應(yīng)用以變化的方式來實(shí)現(xiàn)所描述的功能,但是 這種實(shí)現(xiàn)不應(yīng)被解釋成造成對本發(fā)明的范圍的偏離。與在此公開的實(shí)施方式有關(guān)的各種說明性的邏輯功能塊、模塊和電路可以利用通 用處理器、數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其他 可編程邏輯器件、離散門或晶體管邏輯、離散的硬件組件、或者被設(shè)計(jì)成執(zhí)行在此描述的各 功能的任何組合來實(shí)現(xiàn)或者執(zhí)行。通用處理器可以是微處理器,但是作為替換,處理器可以 是任何傳統(tǒng)的處理器、控制器、微型控制器或者狀態(tài)機(jī)。處理器還可以作為計(jì)算裝置的組合 來實(shí)現(xiàn),例如DSP和微處理器、多個(gè)微處理器、一個(gè)或多個(gè)微處理器同DSP核心、或者任何其 他這種結(jié)構(gòu)的組合。與在此公開的實(shí)施方式有關(guān)的方法、程序或算法的步驟可以直接在硬件中、在由 處理器執(zhí)行的軟件模塊中,或者在這二者的組合中實(shí)現(xiàn)。軟件模塊可以存在于隨機(jī)存取存 儲器(RAM)、閃速存儲器、只讀存儲器(ROM)、電氣可編程ROM(EPROM)、電氣可擦除的可編程 ROM(EEPROM)、寄存器、硬盤、移動(dòng)磁盤、CD-ROM或者任何其他形式本領(lǐng)域所公知的存儲介質(zhì) 中。示例性存儲介質(zhì)用這樣的方式同處理器相耦合,使得處理器可以從存儲介質(zhì)中讀取信 息,也可以將信息寫入到存儲介質(zhì)中。在替換方式中,存儲介質(zhì)可以被集成到處理器中。處 理器和存儲介質(zhì)可以存在于ASIC中。在替換方式中,處理器和存儲介質(zhì)可以作為用戶終端 中的獨(dú)立元件。以上對所公開的實(shí)施方式的描述被提供來使本領(lǐng)域任何技術(shù)人員能夠制造或使 用本發(fā)明。對本領(lǐng)域的技術(shù)人員來說,對這些實(shí)施方式的各種修改是顯而易見的,并且在不 脫離本發(fā)明的精神或者范圍的情況下可以將在此定義的原理應(yīng)用于其他實(shí)施方式。因此, 本發(fā)明并不受到在此顯示的實(shí)施方式的限制,而是應(yīng)當(dāng)與符合在此公開的原理和新穎性特 征的最寬范圍相一致。
權(quán)利要求
1.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,用于測量使用轉(zhuǎn)錄機(jī)的用戶性能,其包括 接收由轉(zhuǎn)錄機(jī)從用戶的音頻文件生成的所述用戶的轉(zhuǎn)錄文件;從所述轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度,所述至少一個(gè)聽寫性能量度指示所述用 戶的性能;并且將確定出的至少一個(gè)聽寫性能量度發(fā)送給管理員,由此該管理員能夠評估所述用戶的 性能。
2.如權(quán)利要求1所述的方法,其中所述聽寫性能量度包括確定每分鐘被轉(zhuǎn)錄的字?jǐn)?shù)。
3.如權(quán)利要求1所述的方法,其中所述每分鐘被轉(zhuǎn)錄的字?jǐn)?shù)包括每分鐘的有效字?jǐn)?shù)。
4.如權(quán)利要求2所述的方法,其中所述聽寫性能量度包括判定聽寫錯(cuò)誤。
5.如權(quán)利要求1所述的方法,進(jìn)一步包括獲得用戶的至少一個(gè)打字性能量度,并且將 所述打字性能量度與所述聽寫性能量度作比較。
6.如權(quán)利要求2所述的方法,進(jìn)一步包括獲得所述用戶的每分鐘打字字?jǐn)?shù)的性能量 度,并將所述每分鐘打字字?jǐn)?shù)的性能量度與所述每分鐘被轉(zhuǎn)錄字?jǐn)?shù)的性能量度作比較。
7.如權(quán)利要求6所述的方法,其中所述打字性能量度還包括打字錯(cuò)誤,并且所述聽寫 性能量度還包括聽寫錯(cuò)誤。
8.如權(quán)利要求1所述的方法,其中所述用戶包括一組個(gè)人。
9.一種計(jì)算機(jī)實(shí)現(xiàn)的方法,用于測量使用轉(zhuǎn)錄機(jī)的用戶性能,其包括 接收用戶生成的音頻文件;將所述音頻文件轉(zhuǎn)錄成包含與所述音頻相對應(yīng)的文本的轉(zhuǎn)錄文件; 將所述轉(zhuǎn)錄文件發(fā)送給用戶;基于所述用戶生成所述音頻文件和將所述轉(zhuǎn)錄文件發(fā)送給所述用戶所需的時(shí)間以及 所述轉(zhuǎn)錄文件中的字?jǐn)?shù),來確定每分鐘聽寫字?jǐn)?shù)的性能量度; 獲得相應(yīng)的每分鐘打字字?jǐn)?shù)的性能量度;和將所述每分鐘聽寫字?jǐn)?shù)的性能量度和所述每分鐘打字字?jǐn)?shù)的性能量度發(fā)送給管理員, 其中所述管理員可評估聽寫和打字之間的用戶性能。
10.如權(quán)利要求9所述的方法,其中所述每分鐘聽寫字?jǐn)?shù)的性能量度或所述每分鐘打 字字?jǐn)?shù)的性能量度中的至少一個(gè)包括每分鐘有效字?jǐn)?shù)。
11.如權(quán)利要求9所述的方法,進(jìn)一步包括確定聽寫錯(cuò)誤和打字錯(cuò)誤的性能量度。
12.如權(quán)利要求9所述的方法,其中所述每分鐘打字字?jǐn)?shù)從遠(yuǎn)程應(yīng)用程序輸入。
13.一種計(jì)算機(jī)系統(tǒng),被配置成得出關(guān)于聽寫系統(tǒng)的使用的性能信息,其包括 處理器;存儲器,與所述處理器進(jìn)行電子通信;所述處理器被配置成接收由用戶的音頻文件生成的轉(zhuǎn)錄文件;基于所述轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度;所述至少一個(gè)聽寫性能量度指示所述 用戶的性能;并且將所述至少一個(gè)聽寫性能量度發(fā)送給管理員,由此所述管理員可評估所述用戶的性能。
14.如權(quán)利要求13所述的計(jì)算機(jī)系統(tǒng),其中所述處理器被進(jìn)一步配置成獲得所述用戶的與所述至少一個(gè)聽寫性能量度相對應(yīng)的至少一個(gè)打字性能量度,并且將所述至少一個(gè)打 字性能量度發(fā)送給所述管理員。
15.如權(quán)利要求13所述的計(jì)算機(jī)系統(tǒng),其中所述至少一個(gè)聽寫性能量度選自于一組聽 寫性能量度,該組聽寫性能量度是每分鐘有效字?jǐn)?shù)、每分鐘實(shí)際字?jǐn)?shù)或錯(cuò)誤數(shù)。
16.如權(quán)利要求15所述的計(jì)算機(jī)系統(tǒng),其中所述處理器被進(jìn)一步配置成獲得所述用戶 的與所述至少一個(gè)聽寫性能量度相對應(yīng)的至少一個(gè)打字性能量度,并且將所述至少一個(gè)打 字性能量度發(fā)送給所述管理員。
17.如權(quán)利要求14所述的計(jì)算機(jī)系統(tǒng),其中所述處理器通過生成與所述至少一個(gè)聽寫 性能量度相對應(yīng)的至少一個(gè)打字性能量度來獲得所述至少一個(gè)打字性能量度。
18.一種計(jì)算機(jī)系統(tǒng),被配置成得出關(guān)于聽寫系統(tǒng)的使用的性能信息,包括處理器;存儲器,與所述處理器進(jìn)行電子通信;所述處理器包括用于接收從用戶的音頻文件生成的轉(zhuǎn)錄文件的裝置;用于基于所述轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度的裝置;所述至少一個(gè)聽寫性能量 度指示所述用戶的性能;以及用于將所述至少一個(gè)聽寫性能量度發(fā)送給管理員,由此所述管理員可以評估所述用戶 的性能。
19.如權(quán)利要求18所述的計(jì)算機(jī)系統(tǒng),其中所述處理器還包括用于獲得所述用戶的與 所述至少一個(gè)聽寫性能量度相對應(yīng)的至少一個(gè)打字性能量度和將所述至少一個(gè)打字性能 量度發(fā)送給所述管理員的裝置。
20.一種計(jì)算機(jī)程序產(chǎn)品,用于評估使用聽寫系統(tǒng)的用戶的性能,所述計(jì)算機(jī)程序產(chǎn)品 包括其上具有指令的計(jì)算機(jī)可讀介質(zhì),該指令包括被編程為接收由轉(zhuǎn)錄機(jī)從所述用戶的音頻文件生成的用戶的轉(zhuǎn)錄文件的代碼;被編程為從所述轉(zhuǎn)錄文件確定至少一個(gè)聽寫性能量度的代碼,所述至少一個(gè)聽寫性能 量度指示用戶性能;以及被編程為將所確定的至少一個(gè)聽寫性能量度發(fā)送給管理員的代碼,由此所述管理員能 夠評估所述用戶的性能。
全文摘要
一種計(jì)算機(jī)實(shí)現(xiàn)的系統(tǒng)和方法,用于評估使用聽寫系統(tǒng)的用戶的性能。該系統(tǒng)和方法包括接收由用戶音頻生成的文本或轉(zhuǎn)錄文件?;谠撧D(zhuǎn)錄文件生成例如每分鐘字?jǐn)?shù)或錯(cuò)誤數(shù)的性能量度。該性能量度被提供給管理員,使得該管理員能夠評估使用該聽寫系統(tǒng)的用戶的性能。
文檔編號G10L15/26GK102067208SQ200980123891
公開日2011年5月18日 申請日期2009年4月23日 優(yōu)先權(quán)日2008年4月23日
發(fā)明者布賴恩·馬奎特, 托德·埃斯皮, 查爾斯·科菲爾德 申請人:Nvoq股份有限公司