以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法
【專利摘要】本發(fā)明涉及一種以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法,本發(fā)明的控制客體選擇裝置是以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置,其特征在于,包括一個(gè)以上的處理裝置,所述一個(gè)以上的處理裝置,其構(gòu)成為,基于用戶的語(yǔ)音獲取輸入信息,基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與輸入信息匹配,在識(shí)別信息中獲取與輸入信息匹配的匹配識(shí)別信息,在匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體;在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí),也可以通過(guò)語(yǔ)音識(shí)別來(lái)控制電子裝置,具有可提高該電子裝置的用戶接近性的效果。
【專利說(shuō)明】以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置和方法,尤其是利用基于控制 客體的符號(hào)的識(shí)別信息來(lái)選擇控制客體的裝置和方法。
【背景技術(shù)】
[0002] 隨著使用電腦、筆記本電腦、智能手機(jī)、平板電腦、汽車導(dǎo)航儀等電子裝置的用戶 越來(lái)越多,這些電子裝置與用戶間易于人機(jī)交互的用戶界面的重要性也越來(lái)越高。
[0003] -般的用戶界面多是通過(guò)鍵盤(pán)、鼠標(biāo)、觸控屏幕等輸入裝置進(jìn)行物理性輸入,但是 對(duì)于無(wú)法看到顯示畫(huà)面的視覺(jué)殘疾人,或是不便于使用操作鍵盤(pán)、鼠標(biāo)、觸控屏幕等輸入裝 置的用戶來(lái)說(shuō),通過(guò)上述的用戶界面來(lái)操作電子裝置是不容易的。
[0004] 另外,對(duì)于沒(méi)有殘疾的人來(lái)說(shuō),在駕駛中或是雙手拿著行李不便于或是很難對(duì)電 子裝置進(jìn)行操作時(shí),通過(guò)上述用戶界面不易于操作電子裝置。
[0005] 由此可見(jiàn),開(kāi)發(fā)出可提高電子裝置接近性的用戶界面勢(shì)在必行??商岣唠娮友b置 接近性的用戶界面中,如分析用戶語(yǔ)音控制電子裝置的語(yǔ)音識(shí)別技術(shù)就屬其一。
[0006] 為了實(shí)現(xiàn)電子裝置利用語(yǔ)音識(shí)別技術(shù),通過(guò)用戶的語(yǔ)音來(lái)進(jìn)行控制,需要事先將 可與用戶語(yǔ)音匹配的控制指令內(nèi)置在電子裝置中。
[0007] 在將可與用戶語(yǔ)音匹配的控制指令內(nèi)置在平臺(tái)端時(shí),通過(guò)語(yǔ)音識(shí)別,可對(duì)相關(guān)電 子裝置的基本設(shè)定,如電子裝置的音量或亮度等進(jìn)行控制。
[0008] 此外,為了通過(guò)語(yǔ)音識(shí)別對(duì)個(gè)性的應(yīng)用程序進(jìn)行控制,在各個(gè)應(yīng)用程序上,必須內(nèi) 置可與用戶語(yǔ)音匹配的控制指令。
[0009] 因此,為了在不支持語(yǔ)音識(shí)別的應(yīng)用程序中進(jìn)行語(yǔ)音識(shí)別,或是為了添加語(yǔ)音識(shí) 別功能,需要對(duì)應(yīng)用程序進(jìn)行新的開(kāi)發(fā)或是升級(jí),以便在相關(guān)的應(yīng)用程序上內(nèi)置與用戶語(yǔ) 音匹配的控制指令。
[0010] 但是,電子裝置和各個(gè)電子裝置所搭載的應(yīng)用程序日新月異、多種多樣,在所有的 應(yīng)用程序上內(nèi)置與用戶語(yǔ)音匹配的控制指令并不容易,在多種多樣的應(yīng)用程序中實(shí)現(xiàn)可聯(lián) 動(dòng)通用的語(yǔ)音識(shí)別系統(tǒng)就更為不易。
[0011] 綜上所述,支持語(yǔ)音識(shí)別的應(yīng)用程序很少,即使支持語(yǔ)音識(shí)別,通過(guò)語(yǔ)音識(shí)別而執(zhí) 行的動(dòng)作也很有限,實(shí)質(zhì)上提高電子裝置的接近性也是非常有限的。
[0012] 由此可見(jiàn),開(kāi)發(fā)通過(guò)語(yǔ)音識(shí)別來(lái)提高電子裝置接近性的技術(shù),是勢(shì)在必行的。
【發(fā)明內(nèi)容】
[0013] 為了解決上述技術(shù)問(wèn)題,本發(fā)明的目的在于,提供一種在使用用戶事前未內(nèi)置控 制指令的應(yīng)用程序時(shí),也可以通過(guò)語(yǔ)音識(shí)別控制電子裝置的裝置及方法。
[0014] 為了解決上述技術(shù)問(wèn)題,本發(fā)明的另一目的在于,提供一種通過(guò)語(yǔ)音識(shí)別可選擇 由圖像構(gòu)成的控制客體的裝置和方法。
[0015] 本發(fā)明的目的不局限于上述目的,未提及的其他目的通過(guò)下述記載對(duì)本【技術(shù)領(lǐng)域】 的技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的。
[0016] 本發(fā)明實(shí)現(xiàn)上述目的的技術(shù)方案是:一種控制客體選擇裝置,是以語(yǔ)音識(shí)別來(lái)選 擇控制客體的裝置,其特征在于,包括一個(gè)以上的處理裝置;所述一個(gè)以上的處理裝置的構(gòu) 成為,基于用戶的語(yǔ)音獲取輸入信息,基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別 信息與所述輸入信息匹配,在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息, 在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
[0017] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)是基于所述控制客體的顯示信息而獲取的。
[0018] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
[0019] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)是通過(guò)光學(xué)字符識(shí)別(0CR:〇ptical character recognition)而獲取的。
[0020] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)通過(guò)圖像模式匹配(image pattern matching)而獲取。
[0021] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的 識(shí)別息對(duì)應(yīng)。
[0022] 本發(fā)明的另一技術(shù)特征是:所述輸入信息包括分析所述用戶的語(yǔ)音特征而獲取的 語(yǔ)音模式信息;所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述語(yǔ)音模式信 息的匹配。
[0023] 本發(fā)明的另一技術(shù)特征是:所述輸入信息包括通過(guò)語(yǔ)音識(shí)別,由所述用戶的語(yǔ)音 而識(shí)別的文本(Text);所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述文本 的匹配。
[0024] 本發(fā)明的另一技術(shù)特征是:所述一個(gè)以上的處理裝置,不存在與所述識(shí)別信息匹 配的匹配識(shí)別信息時(shí),設(shè)定用戶指定識(shí)別信息與一控制客體對(duì)應(yīng)。
[0025] 本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種控制客體選擇方法,是在電腦裝置 中通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的方法,其特征在于,包括:基于用戶的語(yǔ)音獲取輸入信息 的步驟;基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配的步 驟;在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息的步驟;在所述匹配識(shí)別 信息中選擇對(duì)應(yīng)的控制客體的步驟。
[0026] 本發(fā)明的另一技術(shù)特征是:所述識(shí)別信息是基于所述控制客體的顯示信息而獲取 的。
[0027] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
[0028] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)是通過(guò)光學(xué)字符識(shí)別(0CR:〇ptical character recognition)而獲取的。
[0029] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)通過(guò)圖像模式匹配(image pattern matching)而獲取。
[0030] 本發(fā)明的另一技術(shù)特征是:所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的 識(shí)別息對(duì)應(yīng)。
[0031] 本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是:一種可電腦判讀的媒體,是儲(chǔ)存指令集 的可電腦判讀的媒體,其特征在于,所述指令集因電腦裝置而被執(zhí)行時(shí),可讓所述電腦裝置 獲取基于用戶語(yǔ)音的輸入信息,基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與 所述輸入信息匹配,在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息,在所述 匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
[0032] 其他實(shí)施方式的具體事項(xiàng)包含在本發(fā)明的詳細(xì)說(shuō)明及說(shuō)明書(shū)附圖內(nèi)。
[0033] 本發(fā)明的有益效果是:依據(jù)本發(fā)明,在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序 時(shí),也可以通過(guò)語(yǔ)音識(shí)別控制電子裝置,具有提高相關(guān)電子裝置接近性的效果。
[0034] 依據(jù)本發(fā)明,通過(guò)語(yǔ)音識(shí)別可選擇由圖像構(gòu)成的控制客體,具有不受構(gòu)成控制客 體的構(gòu)成要素的類別影響,可通過(guò)語(yǔ)音識(shí)別選擇控制客體的效果。
[0035] 本發(fā)明的效果并不局限于上述內(nèi)容,本發(fā)明還具有其他多種效果。
【專利附圖】
【附圖說(shuō)明】
[0036] 圖1是本發(fā)明一實(shí)施方式的控制客體選擇裝置的方塊圖;
[0037] 圖2是本發(fā)明一實(shí)施方式的控制客體選擇方法的流程圖;
[0038] 圖3圖示了基于控制客體的顯示信息而獲取符號(hào)和與符號(hào)對(duì)應(yīng)識(shí)別信息;
[0039] 圖4圖不了符號(hào)和符號(hào)對(duì)應(yīng)的識(shí)別信息的不例圖;
[0040] 圖5是本發(fā)明一實(shí)施方式的控制客體選擇裝置的示意圖;
[0041] 圖6是本發(fā)明一實(shí)施方式的控制客體選擇裝置的流程圖;
[0042] 圖7是本發(fā)明一實(shí)施方式的控制客體選擇方法的另一示意圖。
[0043] 附圖符號(hào)說(shuō)明
[0044] 100、控制客體選擇裝置;110、界面;120、處理器;122、內(nèi)存控制器;124、內(nèi)存; 130、顯示部;140、話筒;142、揚(yáng)聲器;150、160、應(yīng)用程序;152、154、156、171、172、173、174、 175、176、177、178、179、控制客體 ;200、控制客體的信息;252、2524、2528、254、254八、2548、 256、256A、256B、控制客體的顯示信息;300、352、354、356、358、368、符號(hào);400、452、454、 456、458、468、識(shí)別信息
【具體實(shí)施方式】
[0045] 本發(fā)明的優(yōu)點(diǎn)及特征,以及實(shí)現(xiàn)其優(yōu)點(diǎn)及特征的方法,將結(jié)合本發(fā)明的附圖,通過(guò) 以下的實(shí)施方式進(jìn)行明確的說(shuō)明。但是,本發(fā)明并不局限于以下的實(shí)施方式,可為多種形 態(tài),本發(fā)明的實(shí)施方式用于說(shuō)明本發(fā)明的特征,用于在本發(fā)明的【技術(shù)領(lǐng)域】,向相關(guān)技術(shù)人員 說(shuō)明本發(fā)明的范圍,本發(fā)明的范圍取決于本發(fā)明的權(quán)利要求項(xiàng)的范圍。
[0046] "第一"、"第二"等表現(xiàn)用于說(shuō)明多種構(gòu)成要素,但是本發(fā)明的構(gòu)成要素并不局限 于此。這中表現(xiàn)只用來(lái)區(qū)分不同的構(gòu)成要素,也就是說(shuō),本發(fā)明中的第一構(gòu)成要素也可以被 稱為第二構(gòu)成要素。
[0047] 在說(shuō)明書(shū)中所標(biāo)記的相同的符號(hào)是指相同的構(gòu)成要素。
[0048] 本發(fā)明的多個(gè)實(shí)施方式的各自特征可部分或全部的結(jié)合或組合,本發(fā)明【技術(shù)領(lǐng)域】 的技術(shù)人員可通過(guò)充分理解其內(nèi)容,進(jìn)行多種多樣的技術(shù)性聯(lián)動(dòng)或驅(qū)動(dòng),各實(shí)施方式可相 對(duì)獨(dú)立,也可結(jié)合實(shí)施。
[0049] 在本說(shuō)明書(shū)中,在任何一個(gè)構(gòu)成要素向其他構(gòu)成要素"傳送"數(shù)據(jù)或信號(hào)時(shí),可以 是直接傳送所述數(shù)據(jù)或信號(hào),也可以是通過(guò)至少一個(gè)以上的其他構(gòu)成要素來(lái)傳送數(shù)據(jù)和信 號(hào)。
[0050] "語(yǔ)音識(shí)別"一般是指用戶所發(fā)出的聲音被電子裝置分析,并以文本來(lái)識(shí)別的作 業(yè)。具體來(lái)說(shuō),用戶所發(fā)出聲音的波形被輸入電子裝置時(shí),參照音響型號(hào)等,語(yǔ)音波形被分 析,從而獲取語(yǔ)音模式信息。另外,所獲取的語(yǔ)音模式信息與識(shí)別信息進(jìn)行對(duì)比,從而識(shí)別 出識(shí)別信息中一致概率最高的文本。
[0051] 在本說(shuō)明書(shū)中,"輸入信息"是指基于用戶的語(yǔ)音,經(jīng)過(guò)前述的部分或是全部的語(yǔ) 音識(shí)別過(guò)程而獲取的信息。比如說(shuō),輸入信息可以是分析用戶的語(yǔ)音波形而獲取的語(yǔ)音模 式信息。這種語(yǔ)音模式信息為了表現(xiàn)聲學(xué)特征,由按照短區(qū)間從用戶的語(yǔ)音中提取的語(yǔ)音 特征系數(shù)構(gòu)成。
[0052] 在本說(shuō)明書(shū)中,"控制客體"是指在控制客體選擇裝置的畫(huà)面上顯示出來(lái),可接收 用戶輸入的按鍵等界面,在顯示出來(lái)的控制客體上,完成用戶輸入后,控制客體選擇裝置可 執(zhí)行事先決定的控制動(dòng)作。
[0053] 控制客體可以是用戶通過(guò)對(duì)按鍵、確認(rèn)欄、文字輸入欄等的點(diǎn)擊、輸入來(lái)選擇的界 面,但并不局限于此,也可以是用戶通過(guò)鼠標(biāo)或觸控屏等輸入裝置來(lái)選擇的所有界面。
[0054] 本說(shuō)明書(shū)中,"符號(hào)"不包括文本,是指以特定意義來(lái)解釋的圖形、記號(hào)或圖像。以 符號(hào)標(biāo)記的控制客體,該控制客體的符號(hào)一般可暗示該控制客體在應(yīng)用程序中應(yīng)執(zhí)行哪種 功能。比如說(shuō)," ?"符號(hào)一般是指播放聲音或影像等," + "符號(hào)或符號(hào)是指添加或刪減 項(xiàng)目等。
[0055] 在本說(shuō)明書(shū)中,"識(shí)別信息"是指通過(guò)控制客體選擇裝置,基于控制客體自動(dòng)獲取 的文本。與基于控制客體而獲取的符號(hào)對(duì)應(yīng)。符號(hào)和識(shí)別信息可以一對(duì)一、一對(duì)多、多對(duì)一 地對(duì)應(yīng)。與符號(hào)對(duì)應(yīng)的識(shí)別信息的相關(guān)說(shuō)明將在圖4中后述。
[0056] 分析用戶的語(yǔ)音而獲取的語(yǔ)音模式信息若與文本的識(shí)別信息匹配,識(shí)別信息中一 致概率最高的識(shí)別信息可被識(shí)別。
[0057] 識(shí)別信息中與用戶的語(yǔ)音一致概率最高的識(shí)別信息被識(shí)別時(shí),與所識(shí)別的識(shí)別信 息對(duì)應(yīng)的控制客體會(huì)被選擇。因此,即使未內(nèi)置與用戶的語(yǔ)音相匹配的控制指令,控制客體 也會(huì)因控制客體選擇裝置被選擇。
[0058] 符號(hào)基于控制客體的顯示信息或應(yīng)用程序的畫(huà)面信息而獲取,與此相關(guān)的詳細(xì)說(shuō) 明參照?qǐng)D3將另行后述。
[0059] 本說(shuō)明書(shū)中,"控制客體的顯示信息"是指顯示特定控制客體時(shí)使用的信息。比如 說(shuō),客體的圖像、符號(hào)、控制客體的大小或位置等信息可為顯示信息?;跇?gòu)成顯示信息的 各項(xiàng)目的值或該值的屬性,控制客體被顯示在控制客體選擇裝置的畫(huà)面上。
[0060] 在本說(shuō)明書(shū)中,"應(yīng)用程序的畫(huà)面信息"是指在控制客體選擇裝置所執(zhí)行的應(yīng)用程 序中,顯示特定畫(huà)面時(shí)所使用的信息。
[0061] 在本說(shuō)明書(shū)中,"用戶輸入文本"是指用戶的語(yǔ)音通過(guò)語(yǔ)音識(shí)別功能,在控制客體 選擇裝置上表現(xiàn)文字的方式。比如說(shuō),轉(zhuǎn)換為ASCII碼等的文本。
[0062] 接下來(lái),參照說(shuō)明書(shū)附圖,對(duì)本發(fā)明的多種實(shí)施方式進(jìn)行詳細(xì)的說(shuō)明。
[0063] 圖1是本發(fā)明一實(shí)施方式的控制客體選擇裝置的方塊圖。
[0064] 如圖1所示,本發(fā)明的一實(shí)施方式的控制客體選擇裝置100包括:處理器120、內(nèi) 存控制器122、內(nèi)存124。還包括:界面110、話筒140、揚(yáng)聲器142、顯示部130。
[0065] 本發(fā)明一實(shí)施方式的控制客體選擇裝置100是可通過(guò)語(yǔ)音識(shí)別選擇控制客體的 電腦裝置,包括一個(gè)以上的處理裝置,可以是具備音響輸入功能的電腦、筆記本電腦、智能 手機(jī)、平板電腦、汽車導(dǎo)航儀、掌上電腦、便攜式媒體播放器、MP3播放器、電子詞典等終端設(shè) 備,或是與這些終端設(shè)備連接的服務(wù)器或由多個(gè)電腦構(gòu)成的分散電腦系統(tǒng)。在此,一個(gè)以上 的處理裝置可包括至少一個(gè)以上的處理器120和內(nèi)存124,復(fù)數(shù)個(gè)處理器120可共享相互的 內(nèi)存124。
[0066] 內(nèi)存124儲(chǔ)存程序或指令集等,內(nèi)存124可包括隨機(jī)存取存儲(chǔ)器(RAM;random access memory)、只讀存儲(chǔ)器(ROM;read-only memory)、磁盤(pán)裝置、光盤(pán)裝置、閃存等。 [0067] 處理裝置基于用戶的語(yǔ)音獲取輸入信息,基于控制客體而獲取的與符號(hào)對(duì)應(yīng)的至 少一個(gè)的識(shí)別信息和輸入信息匹配,獲取識(shí)別信息中與輸入信息匹配的匹配識(shí)別信息,選 擇與匹配識(shí)別信息對(duì)應(yīng)的控制客體。
[0068] 內(nèi)存控制器122控制處理器120或界面110等其他組件被格式化成內(nèi)存124。
[0069] 處理器120可執(zhí)行儲(chǔ)存在內(nèi)存124上的程序或指令集進(jìn)行實(shí)行等的演算。
[0070] 界面110將控制客體選擇裝置100的話筒140或揚(yáng)聲器142等輸入輸出裝置100 連接在處理器120及內(nèi)存124上。
[0071] 話筒140可接收語(yǔ)音信號(hào),將接收的語(yǔ)音信號(hào)轉(zhuǎn)換成電子信號(hào),提供給界面110。 揚(yáng)聲器142接收來(lái)自界面110的電子信號(hào),并將其轉(zhuǎn)換成語(yǔ)音信號(hào)后輸出。
[0072] 顯示部130向用戶顯示視覺(jué)性的圖像信息,顯示部130可包括偵測(cè)觸控輸入的觸 控屏幕顯示。
[0073] 本發(fā)明的一實(shí)施方式的控制客體選擇裝置100是利用儲(chǔ)存在內(nèi)存124上,由處理 器120而實(shí)行的程序(以下稱為"控制客體選擇引擎"),通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的。
[0074] 控制客體引擎是在控制客體選擇裝置100的背景下而實(shí)行的,自應(yīng)用程序獲取控 制客體的信息,利用基于控制客體的信息獲取的識(shí)別信息,讓控制客體選擇裝置1〇〇通過(guò) 語(yǔ)音識(shí)別來(lái)選擇控制客體。
[0075] 圖2是本發(fā)明一實(shí)施方式的控制客體選擇方法的流程圖;為了便于說(shuō)明參照?qǐng)D3 一起說(shuō)明。
[0076] 圖3圖示了基于控制客體的顯示信息而獲取符號(hào)和與符號(hào)對(duì)應(yīng)識(shí)別信息。
[0077] 控制客體選擇裝置基于用戶的語(yǔ)音獲取輸入信息S100。
[0078] 在此,輸入信息是指分析用戶語(yǔ)音的特征而獲取的語(yǔ)音模式信息,但輸入信息并 不局限于此。
[0079] 獲取輸入信息后,控制客體選擇裝置將基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一 個(gè)的識(shí)別信息與輸入信息進(jìn)行匹配S110。
[0080] 如圖3所示,在控制客體選擇裝置100上實(shí)行地鐵應(yīng)用程序150時(shí),"快退按鍵 152"、"快進(jìn)按鍵154"、"播放按鍵156"屬于控制客體。
[0081] 依據(jù)本發(fā)明的一實(shí)施方式,基于控制客體的顯示信息,可獲取并實(shí)現(xiàn)符號(hào)。
[0082] 如圖3所示,在控制客體的信息200中,顯示信息252、254、256可包括決定控制 客體大小和位置的項(xiàng)目252A、254A、256A的"width"項(xiàng)目、"height"項(xiàng)目、"left"項(xiàng)目及 "top"項(xiàng)目,及提供控制客體的圖像鏈接的"img"項(xiàng)目252B、254B、256B等的值。
[0083] 前述的項(xiàng)目252A、254A、256A、252B、254B、256B是為了便于說(shuō)明任意定義的,構(gòu)成 控制客體的顯示信息252、254、256的項(xiàng)目的種類、數(shù)量、項(xiàng)目名稱等可做多種多樣的變形 來(lái)體現(xiàn)。
[0084] 如圖3所示,提供控制客體152、154、156的圖像鏈接的"img"項(xiàng)目252B、254B、 256B的值由該控制客體152、154、156的圖像文件路徑("bwd. jpg","play, jpg","fVd. jpg")或顯示圖像的文字列構(gòu)成。在此,"bwd.jpg","play.jpg","fwd. jpg"僅為一實(shí)施 方式,控制客體可由多種形式的文件顯示成圖像。
[0085] 決定控制客體大小和位置的項(xiàng)目252A、254A、256A中的"width"項(xiàng)目及"height" 項(xiàng)目的值,決定控制客體152、154、156的圖像寬度和高度;"left"項(xiàng)目及"top"項(xiàng)目的值, 決定控制客體152、154、156的顯示位置,從而可決定該控制客體152、154、156被顯示的領(lǐng) 域。
[0086] 如圖3所示,"快退按鍵152"以"img"項(xiàng)目252B的"bwd. jpg"顯示為圖像。"bwd. jpg"的相關(guān)圖像模式匹配或光學(xué)字符識(shí)別被實(shí)行后,可獲取符號(hào)。以此類推,"play, jpg"和"fwd. jpg"的相關(guān)圖像模式匹配或光學(xué)字符識(shí)別被實(shí)行后,可獲取"?"符號(hào)和"-- "符號(hào)。
[0087] 在此,"圖像模式匹配"是指對(duì)象圖像,如從前述的"bwd. jpg"、"play. jpg"、或 "fwd. jpg"等圖像提取特征(feature)后,通過(guò)事先設(shè)定或是用戶事后的說(shuō)明或經(jīng)驗(yàn)方 式,在所生成的對(duì)比群中,獲得具有相同或是近似模式的圖像,為了進(jìn)行圖像模式匹配, 可利用模板匹配(template matching)、神經(jīng)式網(wǎng)絡(luò)(neural network)、隱馬爾可夫模型 (HMM;hidden Markov model)等,但并不局限于所列舉的方法,可利用多種多樣的方法。
[0088] 符號(hào)通過(guò)控制客體選擇引擎來(lái)獲取,可儲(chǔ)存在內(nèi)存上,但并不局限于此,也可以通 過(guò)所執(zhí)行的應(yīng)用程序來(lái)獲取儲(chǔ)存在內(nèi)存上。
[0089] 如上所述,基于控制客體而獲取的符號(hào),與識(shí)別信息對(duì)應(yīng)。有關(guān)對(duì)應(yīng)于符號(hào)的識(shí)別 信息,參照?qǐng)D4進(jìn)行詳細(xì)說(shuō)明。
[0090] 圖4圖不了符號(hào)和符號(hào)對(duì)應(yīng)的識(shí)別信息的不例圖。
[0091] "快退按鍵152"(圖3)、"快進(jìn)按鍵154"(圖3)、"播放按鍵156"(圖3)的符號(hào), 分別可獲取""
[0092] 如圖4所示,所獲取的符號(hào)分別與識(shí)別信息對(duì)應(yīng)。符號(hào)352獲取"快退"識(shí) 別信息452 符號(hào)354獲取"快進(jìn)"識(shí)別信息454 符號(hào)356獲取"播放"識(shí)別信 息456。獲取與所獲取的識(shí)別信息相匹配的輸入信號(hào)時(shí),與該識(shí)別信息對(duì)應(yīng)的控制客體,即 顯示與該識(shí)別信息對(duì)應(yīng)符號(hào)的控制客體被選擇。
[0093] 另夕卜,圖4所不的符號(hào)300或與符號(hào)對(duì)應(yīng)的識(shí)別信息400僅為不例,符號(hào)的種類及 其對(duì)應(yīng)的識(shí)別信息可多種多樣。
[0094] 也就是說(shuō),沒(méi)有必要一定是一個(gè)符號(hào)對(duì)應(yīng)一個(gè)識(shí)別信息,根據(jù)應(yīng)用程序,符號(hào)意義 可為多種多樣的,一個(gè)符號(hào)可以對(duì)應(yīng)多個(gè)具有不同意義的識(shí)別信息。
[0095] 如上所述,一個(gè)符號(hào)對(duì)應(yīng)復(fù)數(shù)個(gè)識(shí)別信息時(shí),該復(fù)數(shù)個(gè)識(shí)別信息間具有優(yōu)先順序, 從而來(lái)決定匹配的識(shí)別信息。
[0096] 也就是說(shuō)," ?"符號(hào)356,因與" ?"符號(hào)358形態(tài)近似,作為識(shí)別信息,"播放"及 "快進(jìn)"均可對(duì)應(yīng)。此時(shí),自用戶的語(yǔ)音獲取"快進(jìn)"這個(gè)輸入信息時(shí),對(duì)于在"快進(jìn)按鍵154" 及"播放按鍵156"中選擇哪一個(gè)控制客體,需要一個(gè)基準(zhǔn)。
[0097] 因此,對(duì)于"快進(jìn)按鍵154"來(lái)說(shuō),"快進(jìn)"識(shí)別信息的優(yōu)先順序是最靠前的;對(duì)于 "播放按鍵156"來(lái)說(shuō),"播放"識(shí)別信息的優(yōu)先順序是最靠前的,"快進(jìn)"識(shí)別信息則是第二 位。自用戶語(yǔ)音獲取"快進(jìn)"輸入信息時(shí),"快進(jìn)"識(shí)別信息優(yōu)先選擇對(duì)應(yīng)的"快進(jìn)按鍵154"。
[0098] 另外,對(duì)于一個(gè)符號(hào),根據(jù)應(yīng)用程序可對(duì)應(yīng)相異的識(shí)別信息。比如說(shuō),"?"符號(hào) 356,在媒體播放應(yīng)用程序中,可對(duì)應(yīng)"播放";在網(wǎng)頁(yè)瀏覽或電子書(shū)閱讀的應(yīng)用程序中,可對(duì) 應(yīng)為"下一頁(yè)"。
[0099] 識(shí)別信息和輸入信息的匹配,也就是通過(guò)識(shí)別信息和語(yǔ)音模式信息的匹配,所獲 取的語(yǔ)音模式與識(shí)別信息對(duì)比,判斷具有與該語(yǔ)音模式相同或最近似模式的識(shí)別信息。 [0100] 另外,來(lái)自用戶語(yǔ)音的語(yǔ)音模式信息以代碼化的方式,將識(shí)別信息代碼化為音素 或特定區(qū)間單位,可使語(yǔ)音模式信息和識(shí)別信息互相匹配。識(shí)別信息和語(yǔ)音模式信息在匹 配時(shí),可利用靜態(tài)匹配(static matching)、余弦相似度(cosine similarity)、彈性匹配 (elastic matching)等。
[0101] 控制客體選擇裝置依據(jù)所獲取的識(shí)別信息和輸入信息的匹配結(jié)果,來(lái)判斷是否有 與輸入信息匹配的匹配識(shí)別信息S120。
[0102] 如上所述,判斷具有與所獲取的語(yǔ)音模式相同或最近似模式的識(shí)別信息是匹配識(shí) 別信息。
[0103] 若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息時(shí),也就是說(shuō),沒(méi)有與輸入信息在一 定程度上匹配的識(shí)別信息時(shí),控制客體選擇裝置在重新獲取輸入信息前呈待機(jī)狀態(tài),或是 要求用戶重新發(fā)音。比如說(shuō),如圖3所示,存在"快退"、"播放"、"快進(jìn)"識(shí)別信息時(shí),自用 戶語(yǔ)音獲取"后退"這個(gè)輸入信息后,可能不存在與所獲取的輸入信息相匹配的匹配識(shí)別信 息。此時(shí),為了獲取與識(shí)別信息匹配的輸入信息,要求輸入用戶語(yǔ)音是非常沒(méi)有效率的。
[0104] 因此,若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息的話,控制客體選擇裝置使用 戶指定識(shí)別信息與一控制客體對(duì)應(yīng),該用戶指定識(shí)別信息可為一控制客體的識(shí)別信息。
[0105] 在此,"用戶指定識(shí)別信息"是指為了使其為控制客體的識(shí)別信息,可由語(yǔ)音模式 構(gòu)成,此時(shí)語(yǔ)音模式可以是在S100步驟中自用戶語(yǔ)音而獲取的語(yǔ)音模式。
[0106] 若語(yǔ)音模式為用戶識(shí)別信息,與一控制客體對(duì)應(yīng),并可為該控制客體的識(shí)別信息 時(shí),獲取與該語(yǔ)音模式相同或最近似的語(yǔ)音模式后,該語(yǔ)音模式對(duì)應(yīng)的一控制客體可被選 擇。
[0107] 相反,判斷有與輸入信息匹配的匹配識(shí)別信息時(shí),控制客體選擇裝置獲取該匹配 識(shí)別彳目息S130。
[0108] 比如說(shuō),如圖3所示,自用戶的語(yǔ)音獲取"播放"這一輸入信息時(shí),在"快退"、"快 進(jìn)"、"播放"識(shí)別信息中,"播放"識(shí)別信息屬于匹配識(shí)別信息。
[0109] 獲取匹配的識(shí)別信息后,控制客體選擇裝置選擇與匹配的識(shí)別信息相對(duì)應(yīng)的控制 客體S140。
[0110] 在此,控制客體的選擇是可通過(guò)輸入事件或選擇事件來(lái)實(shí)現(xiàn)的。
[0111] "事件"是指程序中所偵測(cè)的活動(dòng)或事件,按照事件的類型,舉例來(lái)說(shuō)有用于處理 輸入的輸入事件、用于處理輸出的輸出事件、用于選擇特定客體的選擇事件等。
[0112] 輸入事件通常是通過(guò)鼠標(biāo)、觸控板、觸控屏幕、鍵盤(pán)等輸入裝置,進(jìn)行點(diǎn)擊、觸控、 鍵入等輸入時(shí)而發(fā)生的,但是即使不通過(guò)上述輸入裝置進(jìn)行實(shí)際輸入,也可以處理虛擬的 輸入,發(fā)生輸入事件。
[0113] 另外,選擇事件是為了選擇特定控制客體而發(fā)生的,依據(jù)特定控制客體的上述輸 入事件,如雙擊或鍵入事件的發(fā)生,來(lái)實(shí)現(xiàn)特定控制客體的選擇。
[0114] 如上所述,依據(jù)本發(fā)明的一實(shí)施方式的控制客體選擇裝置,即使事前未內(nèi)置控制 指令的應(yīng)用程序,也可以通過(guò)語(yǔ)音識(shí)別來(lái)控制電子裝置,具有提高該電子裝置的用戶接近 性的效果。
[0115] 另外,依據(jù)本發(fā)明一實(shí)施方式,符號(hào)可基于應(yīng)用程序的畫(huà)面信息而被獲取。
[0116] 在應(yīng)用程序的畫(huà)面上顯示控制客體時(shí),會(huì)實(shí)行與應(yīng)用程序畫(huà)面相關(guān)的光學(xué)字符識(shí) 另IJ,在該應(yīng)用程序的畫(huà)面內(nèi),可獲取可識(shí)別為文本或文字記號(hào)的信息。
[0117] 但是,應(yīng)用程序的畫(huà)面上,僅獲取被識(shí)別成文本或文字記號(hào)的信息時(shí),必須決定該 信息是否是符號(hào),若是符號(hào)應(yīng)對(duì)應(yīng)哪一個(gè)控制客體。
[0118] 控制客體選擇裝置判斷在應(yīng)用程序畫(huà)面內(nèi)顯示被識(shí)別成文本或文字記號(hào)識(shí)別信 息的第一領(lǐng)域和與第一領(lǐng)域?qū)?yīng)的第二領(lǐng)域內(nèi)所顯示的控制客體,在第一領(lǐng)域中將被識(shí)別 成文本或文字記號(hào)的識(shí)別信息作為符號(hào),實(shí)現(xiàn)與第二領(lǐng)域的控制客體的關(guān)聯(lián)。
[0119] 在此,與顯示被識(shí)別成文本或文字記號(hào)的第一領(lǐng)域相對(duì)應(yīng)的第二領(lǐng)域,可以是包 括顯示文本或文字記號(hào)的區(qū)段(block)的至少一部分的領(lǐng)域、與顯示文本或文字記號(hào)的區(qū) 段最臨近的領(lǐng)域、顯示文本的區(qū)段上端或下端的領(lǐng)域。與顯示文本的區(qū)段最臨近的領(lǐng)域、顯 示文本或文字記號(hào)的區(qū)段上端或下端的領(lǐng)域。在此,與第一領(lǐng)域?qū)?yīng)的第二領(lǐng)域并不局限 于上述內(nèi)容,可為多種多樣的方式。另外,為了判斷在第二領(lǐng)域中所顯示的控制客體,可參 照控制客體的顯示信息。
[0120] 另外,本發(fā)明的一實(shí)施方式的控制客體選擇裝置不論是否有控制客體或應(yīng)用程序 畫(huà)面的顯示,都可以獲取控制客體的識(shí)別信息。對(duì)此將參照?qǐng)D5進(jìn)行詳細(xì)說(shuō)明。
[0121] 圖5是本發(fā)明一實(shí)施方式的控制客體選擇裝置的示意圖。
[0122] 如圖5所示,根據(jù)控制客體選擇裝置100的畫(huà)面分辨率,向用戶所顯示的范圍也會(huì) 受限制。
[0123] 但是,識(shí)別信息基于控制客體的信息而被獲取,實(shí)際與有無(wú)顯示無(wú)關(guān)都可獲取符 號(hào),并可決定符號(hào)所對(duì)應(yīng)的識(shí)別信息。
[0124] 如圖5所示,應(yīng)用程序170不僅對(duì)于顯示的控制客體171、172、173、174、175可獲 取識(shí)別信息,還可對(duì)于沒(méi)有顯示的控制客體176、177、178、179獲取識(shí)別信息。
[0125] 由此可見(jiàn),沒(méi)有顯示的控制客體176、177、178、179也可以通過(guò)語(yǔ)音識(shí)別而被選 擇,沒(méi)有顯示的控制客體176、177、178、179被選擇時(shí),可實(shí)現(xiàn)至該控制客體所在點(diǎn)的自動(dòng) 滾動(dòng)(auto-scroll )。
[0126] 如上所述,依據(jù)本發(fā)明一實(shí)施方式的控制客體選擇裝置,即使基于未顯示的控制 客體或畫(huà)面,也可獲取控制客體的識(shí)別信息。
[0127] 另外,本發(fā)明的一實(shí)施方式的控制客體選擇裝置可將控制客體的識(shí)別信息或匹配 識(shí)別信息以語(yǔ)音輸出。
[0128] 因?yàn)榭刂瓶腕w的識(shí)別信息以語(yǔ)音輸出,所以用戶可獲取控制客體選擇裝置可識(shí)別 的單詞等;匹配識(shí)別信息以語(yǔ)音輸出,從而使用戶知道所發(fā)出的聲音最終被識(shí)別的單詞是 什么,具有即使不看控制客體選擇裝置的畫(huà)面,也可以選擇控制客體的效果。
[0129] 另外,依據(jù)本發(fā)明一實(shí)施方式,在控制客體上包含文本輸入欄時(shí),通過(guò)語(yǔ)音識(shí)別可 在文本輸入欄內(nèi)輸入文本。通過(guò)語(yǔ)音識(shí)別,使含在控制客體上的文本輸入欄活性化,文本輸 入的構(gòu)成參照?qǐng)D6及圖7進(jìn)行說(shuō)明。
[0130] 圖6是本發(fā)明一實(shí)施方式的控制客體選擇裝置的流程圖。
[0131] 圖7是本發(fā)明一實(shí)施方式的控制客體選擇方法的另一示意圖。
[0132] 控制客體選擇裝置基于用戶的語(yǔ)音而獲取輸入信息S200。
[0133] 輸入信息被獲取時(shí),控制客體選擇裝置將基于控制客體而獲取的至少一個(gè)的識(shí)別 信息與輸入信息進(jìn)行匹配S210。
[0134] 如圖7所示,基于控制客體168包括"放大按鍵" 168A和文本輸入欄168B,可獲取 基于"放大按鍵"168A的"放大"符號(hào)368 (參照?qǐng)D4),其可與識(shí)別信息468 (參照?qǐng)D4)對(duì) 應(yīng)。
[0135] 若判斷有與輸入信息匹配的匹配識(shí)別信息時(shí),控制客體選擇裝置獲取該匹配識(shí)別 信息S230。
[0136] 所獲取的識(shí)別信息和輸入信息的匹配結(jié)果,控制客體選擇裝置判斷是否有與輸入 信息匹配的匹配識(shí)別信息S220。
[0137] 若判斷有與輸入信息匹配的匹配識(shí)別信息時(shí),控制客體選擇裝置獲取該匹配識(shí)別 信息S230。
[0138] 上述 S200、S210、S220、S230 步驟,與圖 2 中的 S100、S110、S120、S130 步驟實(shí)質(zhì)上 是一樣的,在此不作重復(fù)說(shuō)明。
[0139] 獲取匹配識(shí)別信息后,控制客體選擇裝置判斷與匹配識(shí)別信息對(duì)應(yīng)的控制客體是 否包括文本輸入欄S240。
[0140] 用戶選擇文本輸入欄的意圖可看作是為了在該文本輸入欄輸入文本。因此,控制 客體包括文本輸入欄時(shí),體現(xiàn)為該文本輸入欄內(nèi)可輸入文本。
[0141] 若匹配的識(shí)別信息對(duì)應(yīng)的控制客體不包括文本輸入欄時(shí),控制客體選擇裝置選擇 與匹配的識(shí)別信息對(duì)應(yīng)的控制客體S250。S250步驟與圖2所示的S140步驟實(shí)質(zhì)上是相同 的,省略重復(fù)說(shuō)明。
[0142] 當(dāng)匹配的識(shí)別信息對(duì)應(yīng)的控制客體包括文本輸入欄時(shí),控制客體選擇裝置使該文 本輸入欄活性化S260。
[0143] 基于用戶語(yǔ)音獲取"搜索"這一輸入信息時(shí),所獲取的輸入信息可與"搜索"識(shí)別 信息匹配,與"搜索"匹配識(shí)別信息對(duì)應(yīng)的檢索控制客體168包括文本輸入欄168B,從而可 使該文本輸入欄168B活性化。
[0144] 被活性化的文本輸入欄內(nèi)設(shè)有插入臺(tái)。該文本輸入欄被活性化后,控制客體選擇 裝置利用語(yǔ)音識(shí)別功能,由用戶的語(yǔ)音來(lái)獲取用戶輸入文本S270。
[0145] 也就是說(shuō),在文本輸入欄被活性化后,所接收的用戶語(yǔ)音信號(hào),不會(huì)再被識(shí)別為用 于與識(shí)別信息匹配的輸入信息,被轉(zhuǎn)換成用戶輸入文本,可在該文本輸入欄內(nèi)輸入。
[0146] 用戶輸入文本被獲取后,控制客體選擇裝置將所獲取的用戶輸入文本輸入到控制 客體內(nèi)包括的文本輸入欄上S280。
[0147] 用戶輸入文本被輸入到文本輸入欄后,該文本輸入欄非活性化,控制客體選擇裝 置通過(guò)語(yǔ)音識(shí)別可重新選擇控制客體。
[0148] 另外,說(shuō)明用戶輸入文本的輸入結(jié)束的特定輸入信息,如"結(jié)束"、"確認(rèn)"、"下一 個(gè)"等輸入信息被獲取時(shí),該文本輸入欄非活性化,控制客體選擇裝置可通過(guò)語(yǔ)音識(shí)別重新 選擇控制客體。
[0149] 另外,依據(jù)本發(fā)明一實(shí)施方式,輸入信息也可以是通過(guò)自用戶語(yǔ)音獲取的語(yǔ)音模 式信息與語(yǔ)言模式數(shù)據(jù)庫(kù)對(duì)比的過(guò)程而被識(shí)別的文本。
[0150] 輸入信息通過(guò)語(yǔ)音識(shí)別,自用戶的語(yǔ)音識(shí)別文本時(shí),輸入信息和識(shí)別信息的匹配 因識(shí)別的文本和識(shí)別信息自身的比較而被實(shí)行。
[0151] 若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息時(shí),也就是說(shuō),沒(méi)有與輸入信息在一 定程度上匹配的識(shí)別信息時(shí),控制客體選擇裝置在重新獲取輸入信息前呈待機(jī)狀態(tài),或是 要求用戶重新發(fā)音。比如說(shuō),如圖3所示,存在"快退"、"播放"、"快進(jìn)"識(shí)別信息時(shí),自用 戶語(yǔ)音獲取"后退"這個(gè)輸入信息后,可能不存在與所獲取的輸入信息相匹配的匹配識(shí)別信 肩、。
[0152] 此時(shí),為了獲取與識(shí)別信息匹配的輸入信息,要求輸入用戶語(yǔ)音是非常沒(méi)有效率 的。
[0153] 因此,若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息的話,控制客體選擇裝置使用 戶指定識(shí)別信息與一控制客體對(duì)應(yīng),該用戶指定識(shí)別信息可為一控制客體的識(shí)別信息。
[0154] 在此,"用戶指定識(shí)別信息"是指為了使其為控制客體的識(shí)別信息,可由文本構(gòu)成, 此時(shí)文本可以是自用戶語(yǔ)音而獲取的語(yǔ)音模式信息通過(guò)和語(yǔ)言模式數(shù)據(jù)庫(kù)的比較過(guò)程而 被識(shí)別的文本。
[0155] 參附的方塊圖的各方塊和流程圖的各步驟的組合,可因電腦指令而實(shí)行。這些電 腦指令可以搭載在常用電腦、特殊電腦或其它軟件數(shù)據(jù)處理裝備的處理機(jī)上,通過(guò)電腦或 其它軟件數(shù)據(jù)處理裝備的處理機(jī)而實(shí)行的指令生成在方塊圖的各方塊或流程圖的各步驟 中實(shí)行說(shuō)明功能的手段。這些電腦軟件指令為了以特定的方式體現(xiàn)功能,可在電腦或其它 軟件數(shù)據(jù)處理裝備的可用于電腦或電腦可讀的內(nèi)存上儲(chǔ)存,因此,在可用于電腦或電腦可 讀的內(nèi)存上所儲(chǔ)存的指令包括各方塊圖的方塊或流程圖的各步驟中實(shí)行的說(shuō)明功能的指 令手段。電腦軟件指令也可搭載在電腦或其它軟件數(shù)據(jù)處理裝備上,電腦或其它軟件數(shù)據(jù) 處理裝備上,相關(guān)的動(dòng)作步驟被實(shí)行,生成電腦實(shí)行的處理器,實(shí)行電腦或其它軟件數(shù)據(jù)處 理裝備的指令可提供方塊圖各方塊及流程圖各步驟中用于說(shuō)明功能的步驟。
[0156] 在本說(shuō)明書(shū)中,各方塊可以為包括用于實(shí)現(xiàn)特定的論理功能的一個(gè)以上可實(shí)行指 令的模組、程序或代碼的一部分。另外,在幾種代替實(shí)行的舉例中,在方塊圖中所提及的功 能也可以是脫離順序而發(fā)生的。舉例來(lái)說(shuō),陸續(xù)被圖示的兩個(gè)方塊也可能是實(shí)質(zhì)上同時(shí)實(shí) 行的,也可以是該方塊有時(shí)隨著功能而逆順序?qū)嵭小?br>
[0157] 與本說(shuō)明書(shū)中所記載的實(shí)施方式相關(guān),并被說(shuō)明的方法或算法的步驟,可以是處 理器實(shí)行的硬件、軟件模組或其結(jié)合直接體現(xiàn)的。軟件模組可為在RAM內(nèi)存、閃存、ROM內(nèi) 存、EPROM內(nèi)存、EEPR0M內(nèi)存、寄存器、硬盤(pán)、裝拆性盤(pán)、⑶-ROM或本【技術(shù)領(lǐng)域】?jī)?nèi)供知的任意 形態(tài)的儲(chǔ)存媒體。示例性的儲(chǔ)存媒體在處理器上聯(lián)合,處理器可判讀來(lái)自媒體的信息,并在 儲(chǔ)存媒體上記入信息。采用其他方法,儲(chǔ)存媒體可與處理器為一體形。處理器及儲(chǔ)存媒體 可設(shè)在ASIC集成電路內(nèi)。ASIC可設(shè)置的用戶終端機(jī)內(nèi)。采用其他方法,處理器及儲(chǔ)存媒體 可各自設(shè)置在用戶終端機(jī)內(nèi)。
[0158] 以上結(jié)合本發(fā)明的實(shí)施方式,對(duì)本發(fā)明作了更加詳細(xì)的說(shuō)明,但是本發(fā)明并不局 限于此,在本發(fā)明技術(shù)思想的范圍內(nèi)可進(jìn)行多種變形。由此可見(jiàn),本發(fā)明所記載的實(shí)施方式 并不用于限定本發(fā)明的思想,僅用于說(shuō)明本發(fā)明,本發(fā)明的技術(shù)思想并不受實(shí)時(shí)方式的限 制。本發(fā)明的保護(hù)范圍在權(quán)利要求書(shū)中的權(quán)利要求項(xiàng)內(nèi),在其同等范圍內(nèi)的所有技術(shù)思想 均被看作屬于本發(fā)明的權(quán)利范疇之內(nèi)。
【權(quán)利要求】
1. 一種控制客體選擇裝置,是w語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置,其特征在于,包括一 個(gè)W上的處理裝置; 所述一個(gè)W上的處理裝置的構(gòu)成為,基于用戶的語(yǔ)音獲取輸入信息,基于控制客體獲 取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配,在所述識(shí)別信息中獲取與所 述輸入信息匹配的匹配識(shí)別信息,在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
2. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置,其特征在于,所述符號(hào)是基于所述控制 客體的顯不f旨息而獲取的。
3. 根據(jù)權(quán)利要求2所述的控制客體選擇裝置,其特征在于,所述符號(hào)是基于應(yīng)用程序 畫(huà)面信息而獲取的。
4. 根據(jù)權(quán)利要求1或2所述的控制客體選擇裝置,其特征在于,所述符號(hào)是通過(guò)光學(xué)字 符識(shí)別(〇CR:optical character reco即ition)而獲取的。
5. 根據(jù)權(quán)利要求1或2所述的控制客體選擇裝置,其特征在于,所述符號(hào)通過(guò)圖像模式 匹配(image pattern matching)而獲取。
6. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置,其特征在于,所述符號(hào)與隨著在所述裝 置上實(shí)行的應(yīng)用程序相異的識(shí)別信息對(duì)應(yīng)。
7. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置,其特征在于,所述輸入信息包括分析所 述用戶的語(yǔ)音特征而獲取的語(yǔ)音模式信息;所述識(shí)別信息和所述輸入信息的匹配包括所述 識(shí)別信息和所述語(yǔ)音模式信息的匹配。
8. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置,其特征在于,所述輸入信息包括通過(guò)語(yǔ) 音識(shí)別,由所述用戶的語(yǔ)音而識(shí)別的文本(Text);所述識(shí)別信息和所述輸入信息的匹配包 括所述識(shí)別信息和所述文本的匹配。
9. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置,其特征在于,所述一個(gè)W上的處理裝置, 不存在與所述識(shí)別信息匹配的匹配識(shí)別信息時(shí),設(shè)定用戶指定識(shí)別信息與一控制客體對(duì) 應(yīng)。
10. -種控制客體選擇方法,是在電腦裝置中通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的方法,其 特征在于,包括:基于用戶的語(yǔ)音獲取輸入信息的步驟;基于控制客體獲取的與符號(hào)對(duì)應(yīng) 的至少一個(gè)的識(shí)別信息與所述輸入信息匹配的步驟;在所述識(shí)別信息中獲取與所述輸入信 息匹配的匹配識(shí)別信息的步驟;在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體的步驟。
11. 根據(jù)權(quán)利要求10所述的控制客體選擇方法,其特征在于,所述識(shí)別信息是基于所 述控制客體的顯示信息而獲取的。
12. 根據(jù)權(quán)利要求11所述的控制客體選擇方法,其特征在于,所述符號(hào)是基于應(yīng)用程 序畫(huà)面信息而獲取的。
13. 根據(jù)權(quán)利要求10或11所述的控制客體選擇方法,其特征在于,所述符號(hào)是通過(guò)光 學(xué)字符識(shí)別(〇CR:optical character reco即ition)而獲取的。
14. 根據(jù)權(quán)利要求10或11所述的控制客體選擇方法,其特征在于,所述符號(hào)通過(guò)圖像 模式匹配(image pattern matching)而獲取。
15. 根據(jù)權(quán)利要求10所述的控制客體選擇裝置,其特征在于,所述符號(hào)與隨著在所述 裝置上實(shí)行的應(yīng)用程序相異的識(shí)別信息對(duì)應(yīng)。
16. -種可電腦判讀的媒體,是儲(chǔ)存指令集的可電腦判讀的媒體,其特征在于,所述指 令集因電腦裝置而被執(zhí)行時(shí),可讓所述電腦裝置獲取基于用戶語(yǔ)音的輸入信息,基于控制 客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配,在所述識(shí)別信息中獲 取與所述輸入信息匹配的匹配識(shí)別信息,在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
【文檔編號(hào)】G10L15/22GK104347070SQ201410103092
【公開(kāi)日】2015年2月11日 申請(qǐng)日期:2014年3月19日 優(yōu)先權(quán)日:2013年8月9日
【發(fā)明者】申宗元, 金澀冪, 鄭姜理, 多全仁, 柳惠俊, 尹延森, 金京順 申請(qǐng)人:迪歐泰克有限責(zé)任公司