例如,基于嘴跟蹤軟件和/或基于使用將嘴的位置與嘴的位置的指示進(jìn)行關(guān) 聯(lián)的查找表格)表示用戶正在提供或?qū)⒁峁┛陕?tīng)輸入。作為另一示例,可以通過(guò)裝置針 對(duì)用戶的眼睛甚至更具體地針對(duì)用戶的瞳孔是否是對(duì)準(zhǔn)裝置、對(duì)準(zhǔn)裝置附近或者朝向裝置 (這可以使用眼睛跟蹤軟件確定),來(lái)對(duì)來(lái)自用于采集用戶的圖像并且將圖像提供給裝置 的處理器的攝像頭的一個(gè)或更多個(gè)信號(hào)進(jìn)行分析、檢查等,用戶的眼睛對(duì)準(zhǔn)裝置、對(duì)準(zhǔn)裝置 附近或者朝向裝置可以表示用戶正基于用戶的眼睛對(duì)準(zhǔn)裝置來(lái)提供或?qū)⒁峁┑目陕?tīng)輸 入。相反地,如果確定用戶的眼睛例如不是看著裝置、看著裝置附近或朝向裝置(例如,盯 著遠(yuǎn)方和/或用戶的面部從裝置轉(zhuǎn)開(kāi)(例如,在轉(zhuǎn)開(kāi)時(shí)相對(duì)于例如由用戶的視線建立的矢 量與裝置成預(yù)先確定的和/或閾值度數(shù))),則可能即使從用戶接收到了音頻也使邏輯確定 用戶沒(méi)有向裝置提供可聽(tīng)輸入,并且因而不應(yīng)該進(jìn)行處理。
[0039] 無(wú)論如何,如果在菱形框204處邏輯確定用戶的嘴和/或眼睛不是表示提供可聽(tīng) 輸入或?qū)⒁峁┛陕?tīng)輸入,則邏輯可以返回菱形框202并從此前進(jìn)。然而,如果在菱形框 204處邏輯確定用戶的嘴和/或眼睛表示提供可聽(tīng)輸入或?qū)⒁峁┛陕?tīng)輸入,則邏輯替代 地進(jìn)行到塊206。在塊206處,邏輯開(kāi)始處理可聽(tīng)輸入序列(和/或等待提供可聽(tīng)輸入序 列)和/或響應(yīng)于接收到可聽(tīng)輸入序列而執(zhí)行功能。此后,邏輯進(jìn)行到判定菱形框208,在 判定菱形框208處,邏輯確定是否接收到了"語(yǔ)音分隔符","語(yǔ)音分隔符"盡管是由用戶輸 入的,但例如不構(gòu)成可聽(tīng)輸入序列的一部分(例如,有意的部分),其對(duì)于裝置而言是錯(cuò)誤 的輸入,對(duì)于裝置而言是無(wú)意義的和/或無(wú)法理解的,和/或不構(gòu)成對(duì)于裝置的命令的一部 分。
[0040] 可以通過(guò)裝置像這樣來(lái)辨識(shí)這樣的"語(yǔ)音分隔符":例如,響應(yīng)于確定該"語(yǔ)音分隔 符"相對(duì)于可聽(tīng)輸入的其它部分(例如,與大部分輸入和/或用戶說(shuō)出的作為輸入的第一個(gè) 詞或多個(gè)詞不同的部分)為不同語(yǔ)言的詞;響應(yīng)于確定所輸入的"語(yǔ)音分隔符"不是在提供 輸入的其它部分時(shí)所說(shuō)的語(yǔ)言中的真實(shí)的詞,和/或響應(yīng)于確定用戶所輸入的"語(yǔ)音分隔 符"與語(yǔ)音分隔符數(shù)據(jù)表中的如下語(yǔ)音分隔符匹配,例如在處理可聽(tīng)命令序列時(shí),該語(yǔ)音分 隔符被裝置忽略。除了前述方式以外或替代前述方式,可以通過(guò)裝置像這樣響應(yīng)于如下確 定來(lái)辨識(shí)"語(yǔ)音分隔符":至少部分地基于對(duì)由裝置的攝像頭采集的用戶的面部的至少一個(gè) 圖像應(yīng)用讀唇軟件而確定盡管裝置正在接收音頻,然而該音頻是來(lái)自例如緊閉的嘴和/或 不動(dòng)的/靜止的嘴的、不構(gòu)成真實(shí)詞部分的聲音,從而確定該"語(yǔ)音分隔符"是不能理解的。 在任何情況下,應(yīng)該理解的是,例如響應(yīng)于像這樣被辨識(shí)的"語(yǔ)音分隔符"輸入,裝置忽略該 "語(yǔ)音分隔符"輸入,排除該"語(yǔ)音分隔符"作為將要處理的可聽(tīng)輸入序列的部分,和/或以 相反不將它作為其中提供該"語(yǔ)音分隔符"的可聽(tīng)輸入序列和/或命令的部分進(jìn)行處理。
[0041] 例如,在對(duì)于裝置的輸入為"Pleasefindthenearestuhhrestaurant"的情況 下,可以將輸入中的每個(gè)單詞與英語(yǔ)單詞表進(jìn)行比對(duì),其中,例如基于將輸入的單詞與英語(yǔ) 單詞表中的各個(gè)相應(yīng)的條目進(jìn)行匹配而確定"nearest"和"restaurant"是英語(yǔ)單詞(例 如,和/或基于作為與初始單詞"please"相同語(yǔ)言的單詞而被確定為構(gòu)成命令的一部分), 而確定"uhh"不是英語(yǔ)單詞因此不應(yīng)作為命令的一部分進(jìn)行處理(例如,和/或在由裝置 處理時(shí)從可聽(tīng)輸入序列中去除"uhh")。除上述方式之外或替代前述方式,可以基于"uhh" 在"語(yǔ)音分隔符"表中和/或"uhh"是不能理解的輸入而將"uhh"辨識(shí)為裝置要忽略的輸 入。
[0042] 仍然參照?qǐng)D2,如果在菱形框208處做出了肯定的判斷,則邏輯可以返回塊206并 繼續(xù)處理可聽(tīng)輸入序列,并且/或者忽略和/或拒絕將"語(yǔ)音分隔符"包括為序列的一部分 同時(shí)仍將來(lái)自用戶的音頻的其它部分處理為序列的一部分。在這方面,如以下將會(huì)進(jìn)一步 描述的那樣,"語(yǔ)音分隔符"可以延長(zhǎng)可聽(tīng)輸入序列應(yīng)用的音頻處理而沒(méi)有中止(例如,連續(xù) 的和/或基本連續(xù)的)。然而,如果在菱形框208處做出了否定的判斷,則邏輯替代地前進(jìn) 到判定菱形框210。
[0043] 在判定菱形框210處,邏輯確定用戶是否正在進(jìn)行裝置上的其它操作(例如,其它 應(yīng)用)。例如,如果邏輯確定用戶正在操作裝置的觸控顯示器以使用瀏覽器應(yīng)用瀏覽互聯(lián) 網(wǎng),則邏輯可以前進(jìn)到塊212,在塊212處,邏輯例如在用戶正在操作其它應(yīng)用(例如,瀏覽 器應(yīng)用)期間中止對(duì)可聽(tīng)輸入序列的處理,以例如不對(duì)不構(gòu)成和/或不意欲構(gòu)成對(duì)于裝置 的命令的一部分的音頻進(jìn)行處理。
[0044] 雖然沒(méi)有根據(jù)圖2的表面證實(shí),但是應(yīng)該理解,在一些實(shí)施方式中,根據(jù)本原理確 定正執(zhí)行另一操作可以與確定用戶已停止提供可聽(tīng)輸入序列(例如,和/或完全地停止提 供音頻)相結(jié)合,以依然不中止或不停止處理可聽(tīng)輸入,因?yàn)檠b置可能還是繼續(xù)"接聽(tīng)"來(lái) 自下述序列的輸入,在用戶例如針對(duì)對(duì)可聽(tīng)輸入序列有用的信息瀏覽因特網(wǎng)時(shí)已經(jīng)至少部 分地提供了該序列。
[0045] 然而,如在圖2的示例性邏輯中所示,邏輯可以響應(yīng)于確定用戶正在執(zhí)行裝置的 另一操作和/或應(yīng)用而前進(jìn)到塊212以例如不論用戶是否仍在說(shuō)話和/或提供可聽(tīng)輸入都 中止處理,或者基于在菱形框210處的肯定的判斷結(jié)合用戶已停止提供任何音頻(例如,基 于對(duì)用戶的圖像執(zhí)行讀唇軟件確定了用戶的嘴唇不再動(dòng)來(lái)判定用戶已經(jīng)停止說(shuō)話,因而確 定用戶不再對(duì)該裝置提供輸入)的確定而前進(jìn)到塊212。
[0046] 無(wú)論哪種情況,注意,在菱形框210處的否定判斷使邏輯前進(jìn)到判定菱形框214。 在菱形框214處,邏輯確定來(lái)自裝置的加速度計(jì)和/或來(lái)自裝置的表面接近傳感器的一個(gè) 或更多個(gè)信號(hào)是否表示裝置在距離閾值以外和/或正移至距離閾值以外,其中針對(duì)閾值的 距離是相對(duì)于裝置與用戶的面部之間的距離。因此,例如,基于用戶由于例如不打算向裝置 提供任何進(jìn)一步輸入而將其面部區(qū)域從裝置移開(kāi)(例如,移開(kāi)至少預(yù)定義的距離),在菱形 框214處可以做出肯定的判斷。然而,不管前述如何,在一些實(shí)施方式中,如果盡管用戶相 對(duì)于裝置在距離閾值之外,但在菱形框214處還確定用戶繼續(xù)說(shuō)話(例如,即便所說(shuō)的音 頻是"語(yǔ)音分隔符"),則在菱形框214處邏輯仍然可以前進(jìn)到判定菱形框216 (將在以下描 述)。
[0047] 在任何情況下,應(yīng)該理解,響應(yīng)于肯定的判斷,邏輯返回到塊212。然而,在菱形框 214處的否定的判斷使邏輯行進(jìn)到判定菱形框216,在判定菱形框216處邏輯確定在可聽(tīng)輸 入序列中是否發(fā)生了可聽(tīng)中止。例如,可聽(tīng)中止可以是用戶中止說(shuō)話(例如,完全地中止和 /或不提供任何聲音)和/或停止向裝置提供可聽(tīng)輸入。基于根據(jù)用戶的嘴至少幾乎全部 閉合(和/或不動(dòng)/靜止),用戶的嘴閉合(和/或不動(dòng)/靜止),和/或用戶的嘴至少部 分地張開(kāi)(例如,但是不動(dòng)/靜止)而確定用戶的當(dāng)前面部表情(基于由裝置的攝像頭采 集的用戶的圖像)表示不是要提供可聽(tīng)輸入,可以進(jìn)行菱形框216處的判斷。
[0048] 如果在菱形框216處做出否定的判斷,則邏輯可以返回塊206。然而,如果在菱形 框216處做出肯定的判斷,則邏輯替代地返回到塊212并且如本文所描述的那樣中止處理 可聽(tīng)輸入。然后,(例如,不管從哪個(gè)判定菱形框到達(dá)塊212)圖2的邏輯從塊212繼續(xù)到 判定菱形框218。在菱形框218處,邏輯確定觸控顯示器沒(méi)有接收到觸摸輸入的閾值時(shí)間是 否期滿,觸控顯示器沒(méi)有接收到觸摸輸入的閾值時(shí)間期滿可以表示用戶(例如,在如本文 闡述的使用觸控顯示器進(jìn)行裝置的另一操作之后)例如恢復(fù)或?qū)⒁謴?fù)向裝置提供可聽(tīng) 輸入(例如,在用戶使用因特網(wǎng)瀏覽器找出用于提供可聽(tīng)輸入的有用信息之后)。因此,在 用戶執(zhí)行裝置的另一操作的實(shí)例中,可以到達(dá)判定菱形框218,而在其它實(shí)施方式中邏輯可 以從塊212直接進(jìn)行到將要描述的判定菱形框220。在任何情況下,在菱形框218處的否定 的判斷可以使邏輯繼續(xù)進(jìn)行菱形框218處的判斷直到做出肯定的判斷的時(shí)間為止。然后, 當(dāng)在菱形框218處做出肯定的判斷時(shí),邏輯前進(jìn)到判定菱形框220。
[0049] 在判定菱形框220處,邏輯基于例如在裝置在距用戶的面部閾值距離以內(nèi)時(shí)對(duì)音 頻的檢測(cè),基于如本文所闡述在用戶看著裝置、看著裝置附近或朝向裝置看時(shí)對(duì)音頻的檢 測(cè),和/或基于如本文所闡述的在用戶的嘴正在活動(dòng)時(shí)對(duì)音頻的檢測(cè)等,來(lái)確定是否正再 次向裝置提供可聽(tīng)輸入。菱形框220處的否定的判斷可以使邏輯繼續(xù)進(jìn)行菱形框220的判 斷直到做出肯定的判斷為止。菱形框220處的肯定的判斷使邏輯前進(jìn)到塊222,在塊222 處,邏輯恢復(fù)對(duì)可聽(tīng)輸入序列的處理和/或執(zhí)行在所提供的可聽(tīng)輸入序列中提供的命令和 /或從所提供的可聽(tīng)輸入序列獲得的命令。
當(dāng)前第3頁(yè)
1 
2 
3 
4 
5