用于調(diào)整用于激活話音輔助功能的檢測閾值的方法及設(shè)備的制造方法
【專利說明】用于調(diào)整用于激活話音輔助功能的檢測閾值的方法及設(shè)備
[0001 ] 相關(guān)申請案的交叉參考
[0002]本申請案主張2013年9月17日申請的共同擁有的美國非臨時專利申請案第14/029,131號的優(yōu)先權(quán),所述申請案的內(nèi)容以全文引用的方式并入本文中。
技術(shù)領(lǐng)域
[0003]本發(fā)明大體上涉及用于激活移動裝置中的話音輔助功能的方法。更具體來說,本發(fā)明涉及調(diào)整用于檢測移動裝置中的目標(biāo)關(guān)鍵字的閾值。
【背景技術(shù)】
[0004]近年來,例如智能電話及平板計算機等移動裝置的使用已變得普遍。此類移動裝置一般允許無線網(wǎng)絡(luò)上的話音及數(shù)據(jù)通信。通常,這些裝置包含額外的特征或應(yīng)用,其提供經(jīng)設(shè)計以增強用戶便利性的多種功能。
[0005]在此類應(yīng)用或特征之間,話音輔助應(yīng)用使得移動裝置能夠從用戶接收語音命令以用于響應(yīng)于所述語音命令操作各種功能或其它應(yīng)用。例如,話音輔助應(yīng)用可允許用戶說出語音命令以調(diào)用所要的電話號碼、播放音頻文件、拍攝圖片、搜索因特網(wǎng)或獲得天氣信息,而不需要用手物理地操作移動裝置。因此,用戶可選擇使用語音命令在其中用戶可能不希望或不可物理地操作移動裝置的多種情形中控制移動裝置的各種操作。
[0006]常規(guī)的話音輔助應(yīng)用經(jīng)常響應(yīng)于用戶的物理輸入(例如,用手)而被激活。然而,由于使用話音輔助應(yīng)用的目的中的一者可為在沒有物理輸入的情況下操作移動裝置,所以用戶可發(fā)現(xiàn)不方便或難以物理地激活話音輔助應(yīng)用。因此,一些移動裝置允許用戶通過說出語音命令而激活所述話音輔助應(yīng)用。
[0007]然而,此類移動裝置經(jīng)常錯誤地響應(yīng)于由裝置所俘獲的各種輸入聲音而被激活或無法響應(yīng)于恰當(dāng)?shù)恼Z音命令而被激活。例如,移動裝置可錯誤地將另一人的話語辨識為恰當(dāng)?shù)恼Z音命令且激活話音輔助應(yīng)用。另一方面,在移動裝置處于響亮的環(huán)境中時,移動裝置可歸因于背景噪聲而辨識不出恰當(dāng)?shù)恼Z音命令且因此無法激活話音輔助應(yīng)用。
【發(fā)明內(nèi)容】
[0008]本發(fā)明提供用于通過基于閾值檢測輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的方法及裝置,所述閾值可根據(jù)裝置的情境進行調(diào)整。
[0009]根據(jù)本發(fā)明的一個方面,揭示一種用于激活移動裝置中的話音輔助功能的方法。所述方法包含通過聲音及接收輸入聲音流且確定所述移動裝置的情境。在此方法中,基于所述情境而調(diào)整用于激活所述話音輔助功能的閾值。所述方法基于所述經(jīng)調(diào)整的閾值從所述輸入聲音流檢測目標(biāo)關(guān)鍵字。如果檢測到所述目標(biāo)關(guān)鍵字,那么所述方法激活所述話音輔助功能。本發(fā)明還描述與此方法相關(guān)的設(shè)備、裝置、裝置組合及計算機可讀媒體。
[0010]根據(jù)本發(fā)明的另一方面,一種用于激活話音輔助功能的移動裝置包含聲音傳感器、閾值調(diào)整單元及話音激活單元。所述聲音傳感器經(jīng)配置以接收輸入聲音流。所述閾值調(diào)整單元經(jīng)配置以通過確定移動裝置的情境而調(diào)整用于激活話音輔助功能的閾值。所述話音激活單元經(jīng)配置以在基于經(jīng)調(diào)整的閾值從輸入聲音流檢測到目標(biāo)關(guān)鍵字的情況下激活所述話音輔助功能。
【附圖說明】
[0011]當(dāng)結(jié)合附圖閱讀時,通過參考以下詳細描述將理解本發(fā)明的發(fā)明性方面的實施例。
[0012]圖1說明根據(jù)本發(fā)明的一個實施例的在確定移動裝置的情境是在車輛中時經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置。
[0013]圖2說明根據(jù)本發(fā)明的一個實施例的在用戶可能將清醒時在確定移動裝置的情境是在早晨的情況下經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置。
[0014]圖3說明根據(jù)本發(fā)明的一個實施例的在用戶可能睡著時在確定移動裝置的情境是在夜晚的情況下經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置。
[0015]圖4說明根據(jù)本發(fā)明的一個實施例的在確定移動裝置的情境是在包袋中時經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置。
[0016]圖5說明根據(jù)本發(fā)明的一個實施例的在接收文本消息的情境中經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置。
[0017]圖6說明根據(jù)本發(fā)明的一個實施例的經(jīng)配置以通過基于移動裝置的情境調(diào)整用于檢測目標(biāo)關(guān)鍵字的閾值而從輸入聲音流檢測目標(biāo)關(guān)鍵字的移動裝置的框圖。
[0018]圖7說明根據(jù)本發(fā)明的一個實施例的移動裝置中的經(jīng)配置以輸出用于確定移動裝置的情境的聲音流及傳感器數(shù)據(jù)的傳感器單元的框圖。
[0019]圖8說明根據(jù)本發(fā)明的一個實施例的移動裝置中的經(jīng)配置以通過推斷移動裝置的情境而確定用于激活話音輔助功能的檢測閾值的閾值調(diào)整單元的框圖。
[0020]圖9是根據(jù)本發(fā)明的一個實施例的在移動裝置中執(zhí)行的用于通過推斷移動裝置的情境而確定用于激活話音輔助功能的檢測閾值的方法的流程圖。
[0021]圖10是根據(jù)本發(fā)明的一個實施例的在移動裝置中執(zhí)行的用于產(chǎn)生經(jīng)調(diào)整的檢測閾值且在指定時間周期之后將檢測閾值復(fù)位到預(yù)定檢測閾值的方法的流程圖。
[0022]圖11說明根據(jù)本發(fā)明的一個實施例的移動裝置中的經(jīng)配置以通過基于經(jīng)調(diào)整的檢測閾值檢測輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的話音激活單元的框圖。
[0023]圖12是根據(jù)本發(fā)明的一個實施例的在移動裝置中執(zhí)行的用于基于經(jīng)調(diào)整的檢測閾值檢測輸入聲音流中的目標(biāo)關(guān)鍵字而激活話音輔助功能的方法的流程圖。
[0024]圖13說明根據(jù)本發(fā)明的一個實施例的無線通信系統(tǒng)中的移動裝置的框圖,其中根據(jù)移動裝置的情境而調(diào)整用于基于檢測閾值檢測輸入聲音流中的目標(biāo)關(guān)鍵字的方法及設(shè)備。
【具體實施方式】
[0025]現(xiàn)在將詳細參考各種實施例,在附圖中說明所述實施例的實例。在以下詳細描述中,陳述眾多具體細節(jié)以便提供對本發(fā)明的透徹理解。然而,對于所屬領(lǐng)域的一般技術(shù)人員將是顯而易見的是可在沒有這些具體細節(jié)的情況下實踐本發(fā)明。在其它情況下,未詳細描述眾所周知的方法、程序、系統(tǒng)和組件,以便不會不必要地混淆各種實施例的各方面。
[0026]圖1說明根據(jù)本發(fā)明的一個實施例的在確定移動裝置110的情境是在車輛130中時經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置110。在此所說明的實施例中,移動裝置110的用戶120在駕駛車輛130,同時移動裝置110放置在車輛130的乘客座椅上。圖1的移動裝置110可為配備有用于在輸入聲音中辨識用戶的語音的語音辨識功能的智能電話。
[0027]在激活移動裝置110中的話音輔助功能時,移動裝置110可使用語音辨識功能響應(yīng)于各種口頭請求、指令、命令及來自用戶120單獨的類似者。例如,用戶120可在已經(jīng)激活話音輔助功能時說出例如“呼叫SUSAN”的指令。作為響應(yīng),移動裝置110辨識所述指令且使用與所辨識的姓名相關(guān)聯(lián)的電話號碼呼叫Susan。移動裝置110中的話音輔助功能可響應(yīng)于經(jīng)由移動裝置110的按鈕或觸摸屏的輸入而被激活。
[0028]在一些實施方案中,在來自用戶120的輸入聲音中檢測到目標(biāo)關(guān)鍵字時,移動裝置110存儲用于激活話音輔助功能的預(yù)定目標(biāo)關(guān)鍵字。如本文所用,術(shù)語“目標(biāo)關(guān)鍵字”是指可用于激活移動裝置110中的功能或應(yīng)用的一或多個字或聲音的任何數(shù)字或模擬表示。舉例來說,例如“HEY話音輔助”或“開始話音輔助”等預(yù)定關(guān)鍵字可存儲在移動裝置110中以作為用于激活話音輔助功能的目標(biāo)關(guān)鍵字。在從用戶120接收輸入聲音時,移動裝置110可通過對所接收的輸入聲音執(zhí)行語音辨識功能而檢測輸入聲音中的目標(biāo)關(guān)鍵字。
[0029]移動裝置110可經(jīng)配置以基于檢測閾值而檢測目標(biāo)關(guān)鍵字以確保所要的置信水平。在一個實施例中,移動裝置110計算輸入聲音與目標(biāo)關(guān)鍵字之間的類似性程度(或關(guān)鍵字匹配得分)且將類似性程度與檢測閾值進行比較。在計算類似性程度中,可使用目標(biāo)關(guān)鍵字的預(yù)設(shè)聲音模型。如果輸入聲音與目標(biāo)關(guān)鍵字(或聲音模型)之間的類似性程度超過檢測閾值,那么移動裝置110檢測輸入聲音中的目標(biāo)關(guān)鍵字且激活話音輔助功能。另一方面,如果類似性程度未超過檢測閾值,那么移動裝置110確定未在輸入聲音中檢測到目標(biāo)關(guān)鍵字。
[0030]所述檢測閾值影響在檢測輸入聲音中的目標(biāo)關(guān)鍵字中的準(zhǔn)確度。例如,如果檢測閾值過高,那么移動裝置110可從包含目標(biāo)關(guān)鍵字的輸入聲音檢測不到目標(biāo)關(guān)鍵字。在此情況下,移動裝置110可“未命中”輸入聲音中的目標(biāo)關(guān)鍵字,且導(dǎo)致目標(biāo)關(guān)鍵字的增加的未命中率。另一方面,如果檢測閾值過低,那么移動裝置110可在不包含目標(biāo)關(guān)鍵字的輸入聲音中錯誤地檢測到目標(biāo)關(guān)鍵字。在此情況下,移動裝置可錯誤地激活話音輔助功能(即,“假激活”),且導(dǎo)致話音輔助功能的增加的假激活率。
[0031]在一些實施方案中,起初將檢測閾值設(shè)定為預(yù)定值(例如,默認值)且隨后基于移動裝置110的情境中的改變進行調(diào)整。參看圖1,移動裝置110經(jīng)配置以基于來自例如聲音傳感器、全球定位系統(tǒng)(GPS)及加速度計等各種傳感器的情境數(shù)據(jù)而確定情境。例如,移動裝置110的聲音傳感器可俘獲包含引擎聲音及道路噪聲等環(huán)境交通噪聲以作為輸入聲音。另外,GPS及加速度計可監(jiān)視移動裝置110的位置、速度及/或加速度。基于來自傳感器的情境數(shù)據(jù),移動裝置110可將移動裝置110的情境識別為在車輛中。
[0032]在確定移動裝置110的情境是在車輛中時,可假設(shè)圖1中的移動裝置110的用戶120與用手物理地操作移動裝置110相比更可能使用話音輔助功能。因此,移動裝置110可將檢測閾值調(diào)整到低于針對正?;蛭醋R別的情境預(yù)定的默認檢測閾值的值。減小的檢測閾值增加檢測到目標(biāo)關(guān)鍵字的可能性(例如,減小的未命中率),從而減小用戶必須用手操作移動裝置110的可能性。
[0033]還可假設(shè)在一些其它情境中使用話音輔助功能的可能性較高。圖2說明根據(jù)本發(fā)明的一個實施例的在確定移動裝置110的情境是在早晨的情況下在用戶210可能將清醒時經(jīng)配置以調(diào)整用于激活話音輔助功能的檢測閾值的移動裝置110。移動裝置110放置在用戶210附近,例如放在床220附近的桌子230上,如圖2中所說明。
[0034]在此實例中,用戶210在早晨醒來但仍坐在床220上。在這種情況下,移動裝置110中的照度傳感器可產(chǎn)生指示移動裝置110的明亮環(huán)境的情境數(shù)據(jù)。此外,移動裝置110中的時鐘單元還可提供當(dāng)前時間(例如,7:00AM)作為情境數(shù)據(jù)。在一些實施例中,可將當(dāng)前時間與由用戶210在移動裝置110中設(shè)定的指示他或她通常何時醒來的時間進行比較。另外,移動裝置110中的聲音傳感器還俘獲具有小強度的安靜環(huán)境聲