以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法

文檔序號(hào)：2827374閱讀：193來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法
【專利摘要】本發(fā)明涉及一種以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法，本發(fā)明的控制客體選擇裝置是以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置，其特征在于，包括一個(gè)以上的處理裝置，所述一個(gè)以上的處理裝置，其構(gòu)成為，基于用戶的語(yǔ)音獲取輸入信息，基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與輸入信息匹配，在識(shí)別信息中獲取與輸入信息匹配的匹配識(shí)別信息，在匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體；在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過(guò)語(yǔ)音識(shí)別來(lái)控制電子裝置，具有可提高該電子裝置的用戶接近性的效果。
【專利說(shuō)明】以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置及方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置和方法，尤其是利用基于控制客體的符號(hào)的識(shí)別信息來(lái)選擇控制客體的裝置和方法。

【背景技術(shù)】
[0002] 隨著使用電腦、筆記本電腦、智能手機(jī)、平板電腦、汽車導(dǎo)航儀等電子裝置的用戶越來(lái)越多，這些電子裝置與用戶間易于人機(jī)交互的用戶界面的重要性也越來(lái)越高。
[0003] -般的用戶界面多是通過(guò)鍵盤(pán)、鼠標(biāo)、觸控屏幕等輸入裝置進(jìn)行物理性輸入，但是對(duì)于無(wú)法看到顯示畫(huà)面的視覺(jué)殘疾人，或是不便于使用操作鍵盤(pán)、鼠標(biāo)、觸控屏幕等輸入裝置的用戶來(lái)說(shuō)，通過(guò)上述的用戶界面來(lái)操作電子裝置是不容易的。
[0004] 另外，對(duì)于沒(méi)有殘疾的人來(lái)說(shuō)，在駕駛中或是雙手拿著行李不便于或是很難對(duì)電子裝置進(jìn)行操作時(shí)，通過(guò)上述用戶界面不易于操作電子裝置。
[0005] 由此可見(jiàn)，開(kāi)發(fā)出可提高電子裝置接近性的用戶界面勢(shì)在必行?？商岣唠娮友b置接近性的用戶界面中，如分析用戶語(yǔ)音控制電子裝置的語(yǔ)音識(shí)別技術(shù)就屬其一。
[0006] 為了實(shí)現(xiàn)電子裝置利用語(yǔ)音識(shí)別技術(shù)，通過(guò)用戶的語(yǔ)音來(lái)進(jìn)行控制，需要事先將可與用戶語(yǔ)音匹配的控制指令內(nèi)置在電子裝置中。
[0007] 在將可與用戶語(yǔ)音匹配的控制指令內(nèi)置在平臺(tái)端時(shí)，通過(guò)語(yǔ)音識(shí)別，可對(duì)相關(guān)電子裝置的基本設(shè)定，如電子裝置的音量或亮度等進(jìn)行控制。
[0008] 此外，為了通過(guò)語(yǔ)音識(shí)別對(duì)個(gè)性的應(yīng)用程序進(jìn)行控制，在各個(gè)應(yīng)用程序上，必須內(nèi) 置可與用戶語(yǔ)音匹配的控制指令。
[0009] 因此，為了在不支持語(yǔ)音識(shí)別的應(yīng)用程序中進(jìn)行語(yǔ)音識(shí)別，或是為了添加語(yǔ)音識(shí) 別功能，需要對(duì)應(yīng)用程序進(jìn)行新的開(kāi)發(fā)或是升級(jí)，以便在相關(guān)的應(yīng)用程序上內(nèi)置與用戶語(yǔ) 音匹配的控制指令。
[0010] 但是，電子裝置和各個(gè)電子裝置所搭載的應(yīng)用程序日新月異、多種多樣，在所有的應(yīng)用程序上內(nèi)置與用戶語(yǔ)音匹配的控制指令并不容易，在多種多樣的應(yīng)用程序中實(shí)現(xiàn)可聯(lián) 動(dòng)通用的語(yǔ)音識(shí)別系統(tǒng)就更為不易。
[0011] 綜上所述，支持語(yǔ)音識(shí)別的應(yīng)用程序很少，即使支持語(yǔ)音識(shí)別，通過(guò)語(yǔ)音識(shí)別而執(zhí) 行的動(dòng)作也很有限，實(shí)質(zhì)上提高電子裝置的接近性也是非常有限的。
[0012] 由此可見(jiàn)，開(kāi)發(fā)通過(guò)語(yǔ)音識(shí)別來(lái)提高電子裝置接近性的技術(shù)，是勢(shì)在必行的。

【發(fā)明內(nèi)容】

[0013] 為了解決上述技術(shù)問(wèn)題，本發(fā)明的目的在于，提供一種在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過(guò)語(yǔ)音識(shí)別控制電子裝置的裝置及方法。
[0014] 為了解決上述技術(shù)問(wèn)題，本發(fā)明的另一目的在于，提供一種通過(guò)語(yǔ)音識(shí)別可選擇由圖像構(gòu)成的控制客體的裝置和方法。
[0015] 本發(fā)明的目的不局限于上述目的，未提及的其他目的通過(guò)下述記載對(duì)本【技術(shù)領(lǐng)域】的技術(shù)人員來(lái)說(shuō)是顯而易見(jiàn)的。
[0016] 本發(fā)明實(shí)現(xiàn)上述目的的技術(shù)方案是：一種控制客體選擇裝置，是以語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置，其特征在于，包括一個(gè)以上的處理裝置；所述一個(gè)以上的處理裝置的構(gòu) 成為，基于用戶的語(yǔ)音獲取輸入信息，基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配，在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息，在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
[0017] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)是基于所述控制客體的顯示信息而獲取的。
[0018] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
[0019] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)是通過(guò)光學(xué)字符識(shí)別（0CR:〇ptical character recognition)而獲取的。
[0020] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)通過(guò)圖像模式匹配（image pattern matching)而獲取。
[0021] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的識(shí)別息對(duì)應(yīng)。
[0022] 本發(fā)明的另一技術(shù)特征是：所述輸入信息包括分析所述用戶的語(yǔ)音特征而獲取的語(yǔ)音模式信息；所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述語(yǔ)音模式信息的匹配。
[0023] 本發(fā)明的另一技術(shù)特征是：所述輸入信息包括通過(guò)語(yǔ)音識(shí)別，由所述用戶的語(yǔ)音而識(shí)別的文本（Text);所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述文本的匹配。
[0024] 本發(fā)明的另一技術(shù)特征是：所述一個(gè)以上的處理裝置，不存在與所述識(shí)別信息匹配的匹配識(shí)別信息時(shí)，設(shè)定用戶指定識(shí)別信息與一控制客體對(duì)應(yīng)。
[0025] 本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是：一種控制客體選擇方法，是在電腦裝置中通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的方法，其特征在于，包括：基于用戶的語(yǔ)音獲取輸入信息的步驟；基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配的步驟；在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息的步驟；在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體的步驟。
[0026] 本發(fā)明的另一技術(shù)特征是：所述識(shí)別信息是基于所述控制客體的顯示信息而獲取的。
[0027] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
[0028] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)是通過(guò)光學(xué)字符識(shí)別（0CR:〇ptical character recognition)而獲取的。
[0029] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)通過(guò)圖像模式匹配（image pattern matching)而獲取。
[0030] 本發(fā)明的另一技術(shù)特征是：所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的識(shí)別息對(duì)應(yīng)。
[0031] 本發(fā)明實(shí)現(xiàn)上述目的的另一技術(shù)方案是：一種可電腦判讀的媒體，是儲(chǔ)存指令集的可電腦判讀的媒體，其特征在于，所述指令集因電腦裝置而被執(zhí)行時(shí)，可讓所述電腦裝置獲取基于用戶語(yǔ)音的輸入信息，基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配，在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息，在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
[0032] 其他實(shí)施方式的具體事項(xiàng)包含在本發(fā)明的詳細(xì)說(shuō)明及說(shuō)明書(shū)附圖內(nèi)。
[0033] 本發(fā)明的有益效果是：依據(jù)本發(fā)明，在使用用戶事前未內(nèi)置控制指令的應(yīng)用程序時(shí)，也可以通過(guò)語(yǔ)音識(shí)別控制電子裝置，具有提高相關(guān)電子裝置接近性的效果。
[0034] 依據(jù)本發(fā)明，通過(guò)語(yǔ)音識(shí)別可選擇由圖像構(gòu)成的控制客體，具有不受構(gòu)成控制客體的構(gòu)成要素的類別影響，可通過(guò)語(yǔ)音識(shí)別選擇控制客體的效果。
[0035] 本發(fā)明的效果并不局限于上述內(nèi)容，本發(fā)明還具有其他多種效果。

【專利附圖】

【附圖說(shuō)明】
[0036] 圖1是本發(fā)明一實(shí)施方式的控制客體選擇裝置的方塊圖；
[0037] 圖2是本發(fā)明一實(shí)施方式的控制客體選擇方法的流程圖；
[0038] 圖3圖示了基于控制客體的顯示信息而獲取符號(hào)和與符號(hào)對(duì)應(yīng)識(shí)別信息；
[0039] 圖4圖不了符號(hào)和符號(hào)對(duì)應(yīng)的識(shí)別信息的不例圖；
[0040] 圖5是本發(fā)明一實(shí)施方式的控制客體選擇裝置的示意圖；
[0041] 圖6是本發(fā)明一實(shí)施方式的控制客體選擇裝置的流程圖；
[0042] 圖7是本發(fā)明一實(shí)施方式的控制客體選擇方法的另一示意圖。
[0043] 附圖符號(hào)說(shuō)明
[0044] 100、控制客體選擇裝置；110、界面；120、處理器；122、內(nèi)存控制器；124、內(nèi)存； 130、顯示部；140、話筒；142、揚(yáng)聲器；150、160、應(yīng)用程序；152、154、156、171、172、173、174、 175、176、177、178、179、控制客體；200、控制客體的信息；252、2524、2528、254、254八、2548、 256、256A、256B、控制客體的顯示信息；300、352、354、356、358、368、符號(hào)；400、452、454、 456、458、468、識(shí)別信息

【具體實(shí)施方式】
[0045] 本發(fā)明的優(yōu)點(diǎn)及特征，以及實(shí)現(xiàn)其優(yōu)點(diǎn)及特征的方法，將結(jié)合本發(fā)明的附圖，通過(guò) 以下的實(shí)施方式進(jìn)行明確的說(shuō)明。但是，本發(fā)明并不局限于以下的實(shí)施方式，可為多種形態(tài)，本發(fā)明的實(shí)施方式用于說(shuō)明本發(fā)明的特征，用于在本發(fā)明的【技術(shù)領(lǐng)域】，向相關(guān)技術(shù)人員說(shuō)明本發(fā)明的范圍，本發(fā)明的范圍取決于本發(fā)明的權(quán)利要求項(xiàng)的范圍。
[0046] "第一"、"第二"等表現(xiàn)用于說(shuō)明多種構(gòu)成要素，但是本發(fā)明的構(gòu)成要素并不局限于此。這中表現(xiàn)只用來(lái)區(qū)分不同的構(gòu)成要素，也就是說(shuō)，本發(fā)明中的第一構(gòu)成要素也可以被稱為第二構(gòu)成要素。
[0047] 在說(shuō)明書(shū)中所標(biāo)記的相同的符號(hào)是指相同的構(gòu)成要素。
[0048] 本發(fā)明的多個(gè)實(shí)施方式的各自特征可部分或全部的結(jié)合或組合，本發(fā)明【技術(shù)領(lǐng)域】的技術(shù)人員可通過(guò)充分理解其內(nèi)容，進(jìn)行多種多樣的技術(shù)性聯(lián)動(dòng)或驅(qū)動(dòng)，各實(shí)施方式可相對(duì)獨(dú)立，也可結(jié)合實(shí)施。
[0049] 在本說(shuō)明書(shū)中，在任何一個(gè)構(gòu)成要素向其他構(gòu)成要素"傳送"數(shù)據(jù)或信號(hào)時(shí)，可以是直接傳送所述數(shù)據(jù)或信號(hào)，也可以是通過(guò)至少一個(gè)以上的其他構(gòu)成要素來(lái)傳送數(shù)據(jù)和信號(hào)。
[0050] "語(yǔ)音識(shí)別"一般是指用戶所發(fā)出的聲音被電子裝置分析，并以文本來(lái)識(shí)別的作業(yè)。具體來(lái)說(shuō)，用戶所發(fā)出聲音的波形被輸入電子裝置時(shí)，參照音響型號(hào)等，語(yǔ)音波形被分析，從而獲取語(yǔ)音模式信息。另外，所獲取的語(yǔ)音模式信息與識(shí)別信息進(jìn)行對(duì)比，從而識(shí)別出識(shí)別信息中一致概率最高的文本。
[0051] 在本說(shuō)明書(shū)中，"輸入信息"是指基于用戶的語(yǔ)音，經(jīng)過(guò)前述的部分或是全部的語(yǔ) 音識(shí)別過(guò)程而獲取的信息。比如說(shuō)，輸入信息可以是分析用戶的語(yǔ)音波形而獲取的語(yǔ)音模式信息。這種語(yǔ)音模式信息為了表現(xiàn)聲學(xué)特征，由按照短區(qū)間從用戶的語(yǔ)音中提取的語(yǔ)音特征系數(shù)構(gòu)成。
[0052] 在本說(shuō)明書(shū)中，"控制客體"是指在控制客體選擇裝置的畫(huà)面上顯示出來(lái)，可接收用戶輸入的按鍵等界面，在顯示出來(lái)的控制客體上，完成用戶輸入后，控制客體選擇裝置可執(zhí)行事先決定的控制動(dòng)作。
[0053] 控制客體可以是用戶通過(guò)對(duì)按鍵、確認(rèn)欄、文字輸入欄等的點(diǎn)擊、輸入來(lái)選擇的界面，但并不局限于此，也可以是用戶通過(guò)鼠標(biāo)或觸控屏等輸入裝置來(lái)選擇的所有界面。
[0054] 本說(shuō)明書(shū)中，"符號(hào)"不包括文本，是指以特定意義來(lái)解釋的圖形、記號(hào)或圖像。以符號(hào)標(biāo)記的控制客體，該控制客體的符號(hào)一般可暗示該控制客體在應(yīng)用程序中應(yīng)執(zhí)行哪種功能。比如說(shuō)，" ?"符號(hào)一般是指播放聲音或影像等，" + "符號(hào)或符號(hào)是指添加或刪減項(xiàng)目等。
[0055] 在本說(shuō)明書(shū)中，"識(shí)別信息"是指通過(guò)控制客體選擇裝置，基于控制客體自動(dòng)獲取的文本。與基于控制客體而獲取的符號(hào)對(duì)應(yīng)。符號(hào)和識(shí)別信息可以一對(duì)一、一對(duì)多、多對(duì)一地對(duì)應(yīng)。與符號(hào)對(duì)應(yīng)的識(shí)別信息的相關(guān)說(shuō)明將在圖4中后述。
[0056] 分析用戶的語(yǔ)音而獲取的語(yǔ)音模式信息若與文本的識(shí)別信息匹配，識(shí)別信息中一致概率最高的識(shí)別信息可被識(shí)別。
[0057] 識(shí)別信息中與用戶的語(yǔ)音一致概率最高的識(shí)別信息被識(shí)別時(shí)，與所識(shí)別的識(shí)別信息對(duì)應(yīng)的控制客體會(huì)被選擇。因此，即使未內(nèi)置與用戶的語(yǔ)音相匹配的控制指令，控制客體也會(huì)因控制客體選擇裝置被選擇。
[0058] 符號(hào)基于控制客體的顯示信息或應(yīng)用程序的畫(huà)面信息而獲取，與此相關(guān)的詳細(xì)說(shuō) 明參照?qǐng)D3將另行后述。
[0059] 本說(shuō)明書(shū)中，"控制客體的顯示信息"是指顯示特定控制客體時(shí)使用的信息。比如說(shuō)，客體的圖像、符號(hào)、控制客體的大小或位置等信息可為顯示信息?；跇?gòu)成顯示信息的各項(xiàng)目的值或該值的屬性，控制客體被顯示在控制客體選擇裝置的畫(huà)面上。
[0060] 在本說(shuō)明書(shū)中，"應(yīng)用程序的畫(huà)面信息"是指在控制客體選擇裝置所執(zhí)行的應(yīng)用程序中，顯示特定畫(huà)面時(shí)所使用的信息。
[0061] 在本說(shuō)明書(shū)中，"用戶輸入文本"是指用戶的語(yǔ)音通過(guò)語(yǔ)音識(shí)別功能，在控制客體選擇裝置上表現(xiàn)文字的方式。比如說(shuō)，轉(zhuǎn)換為ASCII碼等的文本。
[0062] 接下來(lái)，參照說(shuō)明書(shū)附圖，對(duì)本發(fā)明的多種實(shí)施方式進(jìn)行詳細(xì)的說(shuō)明。
[0063] 圖1是本發(fā)明一實(shí)施方式的控制客體選擇裝置的方塊圖。
[0064] 如圖1所示，本發(fā)明的一實(shí)施方式的控制客體選擇裝置100包括：處理器120、內(nèi) 存控制器122、內(nèi)存124。還包括：界面110、話筒140、揚(yáng)聲器142、顯示部130。
[0065] 本發(fā)明一實(shí)施方式的控制客體選擇裝置100是可通過(guò)語(yǔ)音識(shí)別選擇控制客體的電腦裝置，包括一個(gè)以上的處理裝置，可以是具備音響輸入功能的電腦、筆記本電腦、智能手機(jī)、平板電腦、汽車導(dǎo)航儀、掌上電腦、便攜式媒體播放器、MP3播放器、電子詞典等終端設(shè) 備，或是與這些終端設(shè)備連接的服務(wù)器或由多個(gè)電腦構(gòu)成的分散電腦系統(tǒng)。在此，一個(gè)以上的處理裝置可包括至少一個(gè)以上的處理器120和內(nèi)存124,復(fù)數(shù)個(gè)處理器120可共享相互的內(nèi)存124。
[0066] 內(nèi)存124儲(chǔ)存程序或指令集等，內(nèi)存124可包括隨機(jī)存取存儲(chǔ)器（RAM;random access memory)、只讀存儲(chǔ)器（ROM;read-only memory)、磁盤(pán)裝置、光盤(pán)裝置、閃存等。 [0067] 處理裝置基于用戶的語(yǔ)音獲取輸入信息，基于控制客體而獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息和輸入信息匹配，獲取識(shí)別信息中與輸入信息匹配的匹配識(shí)別信息，選擇與匹配識(shí)別信息對(duì)應(yīng)的控制客體。
[0068] 內(nèi)存控制器122控制處理器120或界面110等其他組件被格式化成內(nèi)存124。
[0069] 處理器120可執(zhí)行儲(chǔ)存在內(nèi)存124上的程序或指令集進(jìn)行實(shí)行等的演算。
[0070] 界面110將控制客體選擇裝置100的話筒140或揚(yáng)聲器142等輸入輸出裝置100 連接在處理器120及內(nèi)存124上。
[0071] 話筒140可接收語(yǔ)音信號(hào)，將接收的語(yǔ)音信號(hào)轉(zhuǎn)換成電子信號(hào)，提供給界面110。揚(yáng)聲器142接收來(lái)自界面110的電子信號(hào)，并將其轉(zhuǎn)換成語(yǔ)音信號(hào)后輸出。
[0072] 顯示部130向用戶顯示視覺(jué)性的圖像信息，顯示部130可包括偵測(cè)觸控輸入的觸控屏幕顯示。
[0073] 本發(fā)明的一實(shí)施方式的控制客體選擇裝置100是利用儲(chǔ)存在內(nèi)存124上，由處理器120而實(shí)行的程序（以下稱為"控制客體選擇引擎")，通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的。
[0074] 控制客體引擎是在控制客體選擇裝置100的背景下而實(shí)行的，自應(yīng)用程序獲取控制客體的信息，利用基于控制客體的信息獲取的識(shí)別信息，讓控制客體選擇裝置1〇〇通過(guò) 語(yǔ)音識(shí)別來(lái)選擇控制客體。
[0075] 圖2是本發(fā)明一實(shí)施方式的控制客體選擇方法的流程圖；為了便于說(shuō)明參照?qǐng)D3 一起說(shuō)明。
[0076] 圖3圖示了基于控制客體的顯示信息而獲取符號(hào)和與符號(hào)對(duì)應(yīng)識(shí)別信息。
[0077] 控制客體選擇裝置基于用戶的語(yǔ)音獲取輸入信息S100。
[0078] 在此，輸入信息是指分析用戶語(yǔ)音的特征而獲取的語(yǔ)音模式信息，但輸入信息并不局限于此。
[0079] 獲取輸入信息后，控制客體選擇裝置將基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與輸入信息進(jìn)行匹配S110。
[0080] 如圖3所示，在控制客體選擇裝置100上實(shí)行地鐵應(yīng)用程序150時(shí)，"快退按鍵 152"、"快進(jìn)按鍵154"、"播放按鍵156"屬于控制客體。
[0081] 依據(jù)本發(fā)明的一實(shí)施方式，基于控制客體的顯示信息，可獲取并實(shí)現(xiàn)符號(hào)。
[0082] 如圖3所示，在控制客體的信息200中，顯示信息252、254、256可包括決定控制客體大小和位置的項(xiàng)目252A、254A、256A的"width"項(xiàng)目、"height"項(xiàng)目、"left"項(xiàng)目及 "top"項(xiàng)目，及提供控制客體的圖像鏈接的"img"項(xiàng)目252B、254B、256B等的值。
[0083] 前述的項(xiàng)目252A、254A、256A、252B、254B、256B是為了便于說(shuō)明任意定義的，構(gòu)成控制客體的顯示信息252、254、256的項(xiàng)目的種類、數(shù)量、項(xiàng)目名稱等可做多種多樣的變形來(lái)體現(xiàn)。
[0084] 如圖3所示，提供控制客體152、154、156的圖像鏈接的"img"項(xiàng)目252B、254B、 256B的值由該控制客體152、154、156的圖像文件路徑（"bwd. jpg"，"play, jpg"，"fVd. jpg"）或顯示圖像的文字列構(gòu)成。在此，"bwd.jpg"，"play.jpg"，"fwd. jpg"僅為一實(shí)施方式，控制客體可由多種形式的文件顯示成圖像。
[0085] 決定控制客體大小和位置的項(xiàng)目252A、254A、256A中的"width"項(xiàng)目及"height" 項(xiàng)目的值，決定控制客體152、154、156的圖像寬度和高度；"left"項(xiàng)目及"top"項(xiàng)目的值，決定控制客體152、154、156的顯示位置，從而可決定該控制客體152、154、156被顯示的領(lǐng) 域。
[0086] 如圖3所示，"快退按鍵152"以"img"項(xiàng)目252B的"bwd. jpg"顯示為圖像。"bwd. jpg"的相關(guān)圖像模式匹配或光學(xué)字符識(shí)別被實(shí)行后，可獲取符號(hào)。以此類推，"play, jpg"和"fwd. jpg"的相關(guān)圖像模式匹配或光學(xué)字符識(shí)別被實(shí)行后，可獲取"?"符號(hào)和"-- "符號(hào)。
[0087] 在此，"圖像模式匹配"是指對(duì)象圖像，如從前述的"bwd. jpg"、"play. jpg"、或 "fwd. jpg"等圖像提取特征（feature)后，通過(guò)事先設(shè)定或是用戶事后的說(shuō)明或經(jīng)驗(yàn)方式，在所生成的對(duì)比群中，獲得具有相同或是近似模式的圖像，為了進(jìn)行圖像模式匹配，可利用模板匹配（template matching)、神經(jīng)式網(wǎng)絡(luò)（neural network)、隱馬爾可夫模型 (HMM;hidden Markov model)等，但并不局限于所列舉的方法，可利用多種多樣的方法。
[0088] 符號(hào)通過(guò)控制客體選擇引擎來(lái)獲取，可儲(chǔ)存在內(nèi)存上，但并不局限于此，也可以通過(guò)所執(zhí)行的應(yīng)用程序來(lái)獲取儲(chǔ)存在內(nèi)存上。
[0089] 如上所述，基于控制客體而獲取的符號(hào)，與識(shí)別信息對(duì)應(yīng)。有關(guān)對(duì)應(yīng)于符號(hào)的識(shí)別信息，參照?qǐng)D4進(jìn)行詳細(xì)說(shuō)明。
[0090] 圖4圖不了符號(hào)和符號(hào)對(duì)應(yīng)的識(shí)別信息的不例圖。
[0091] "快退按鍵152"（圖3)、"快進(jìn)按鍵154"（圖3)、"播放按鍵156"（圖3)的符號(hào)，分別可獲取""
[0092] 如圖4所示，所獲取的符號(hào)分別與識(shí)別信息對(duì)應(yīng)。符號(hào)352獲取"快退"識(shí) 別信息452 符號(hào)354獲取"快進(jìn)"識(shí)別信息454 符號(hào)356獲取"播放"識(shí)別信息456。獲取與所獲取的識(shí)別信息相匹配的輸入信號(hào)時(shí)，與該識(shí)別信息對(duì)應(yīng)的控制客體，即顯示與該識(shí)別信息對(duì)應(yīng)符號(hào)的控制客體被選擇。
[0093] 另夕卜，圖4所不的符號(hào)300或與符號(hào)對(duì)應(yīng)的識(shí)別信息400僅為不例，符號(hào)的種類及其對(duì)應(yīng)的識(shí)別信息可多種多樣。
[0094] 也就是說(shuō)，沒(méi)有必要一定是一個(gè)符號(hào)對(duì)應(yīng)一個(gè)識(shí)別信息，根據(jù)應(yīng)用程序，符號(hào)意義可為多種多樣的，一個(gè)符號(hào)可以對(duì)應(yīng)多個(gè)具有不同意義的識(shí)別信息。
[0095] 如上所述，一個(gè)符號(hào)對(duì)應(yīng)復(fù)數(shù)個(gè)識(shí)別信息時(shí)，該復(fù)數(shù)個(gè)識(shí)別信息間具有優(yōu)先順序，從而來(lái)決定匹配的識(shí)別信息。
[0096] 也就是說(shuō)，" ?"符號(hào)356,因與" ?"符號(hào)358形態(tài)近似，作為識(shí)別信息，"播放"及 "快進(jìn)"均可對(duì)應(yīng)。此時(shí)，自用戶的語(yǔ)音獲取"快進(jìn)"這個(gè)輸入信息時(shí)，對(duì)于在"快進(jìn)按鍵154" 及"播放按鍵156"中選擇哪一個(gè)控制客體，需要一個(gè)基準(zhǔn)。
[0097] 因此，對(duì)于"快進(jìn)按鍵154"來(lái)說(shuō)，"快進(jìn)"識(shí)別信息的優(yōu)先順序是最靠前的；對(duì)于 "播放按鍵156"來(lái)說(shuō)，"播放"識(shí)別信息的優(yōu)先順序是最靠前的，"快進(jìn)"識(shí)別信息則是第二位。自用戶語(yǔ)音獲取"快進(jìn)"輸入信息時(shí)，"快進(jìn)"識(shí)別信息優(yōu)先選擇對(duì)應(yīng)的"快進(jìn)按鍵154"。
[0098] 另外，對(duì)于一個(gè)符號(hào)，根據(jù)應(yīng)用程序可對(duì)應(yīng)相異的識(shí)別信息。比如說(shuō)，"?"符號(hào) 356,在媒體播放應(yīng)用程序中，可對(duì)應(yīng)"播放";在網(wǎng)頁(yè)瀏覽或電子書(shū)閱讀的應(yīng)用程序中，可對(duì) 應(yīng)為"下一頁(yè)"。
[0099] 識(shí)別信息和輸入信息的匹配，也就是通過(guò)識(shí)別信息和語(yǔ)音模式信息的匹配，所獲取的語(yǔ)音模式與識(shí)別信息對(duì)比，判斷具有與該語(yǔ)音模式相同或最近似模式的識(shí)別信息。 [0100] 另外，來(lái)自用戶語(yǔ)音的語(yǔ)音模式信息以代碼化的方式，將識(shí)別信息代碼化為音素或特定區(qū)間單位，可使語(yǔ)音模式信息和識(shí)別信息互相匹配。識(shí)別信息和語(yǔ)音模式信息在匹配時(shí)，可利用靜態(tài)匹配（static matching)、余弦相似度（cosine similarity)、彈性匹配 (elastic matching)等。
[0101] 控制客體選擇裝置依據(jù)所獲取的識(shí)別信息和輸入信息的匹配結(jié)果，來(lái)判斷是否有與輸入信息匹配的匹配識(shí)別信息S120。
[0102] 如上所述，判斷具有與所獲取的語(yǔ)音模式相同或最近似模式的識(shí)別信息是匹配識(shí) 別信息。
[0103] 若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息時(shí)，也就是說(shuō)，沒(méi)有與輸入信息在一定程度上匹配的識(shí)別信息時(shí)，控制客體選擇裝置在重新獲取輸入信息前呈待機(jī)狀態(tài)，或是要求用戶重新發(fā)音。比如說(shuō)，如圖3所示，存在"快退"、"播放"、"快進(jìn)"識(shí)別信息時(shí)，自用戶語(yǔ)音獲取"后退"這個(gè)輸入信息后，可能不存在與所獲取的輸入信息相匹配的匹配識(shí)別信息。此時(shí)，為了獲取與識(shí)別信息匹配的輸入信息，要求輸入用戶語(yǔ)音是非常沒(méi)有效率的。
[0104] 因此，若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息的話，控制客體選擇裝置使用戶指定識(shí)別信息與一控制客體對(duì)應(yīng)，該用戶指定識(shí)別信息可為一控制客體的識(shí)別信息。
[0105] 在此，"用戶指定識(shí)別信息"是指為了使其為控制客體的識(shí)別信息，可由語(yǔ)音模式構(gòu)成，此時(shí)語(yǔ)音模式可以是在S100步驟中自用戶語(yǔ)音而獲取的語(yǔ)音模式。
[0106] 若語(yǔ)音模式為用戶識(shí)別信息，與一控制客體對(duì)應(yīng)，并可為該控制客體的識(shí)別信息時(shí)，獲取與該語(yǔ)音模式相同或最近似的語(yǔ)音模式后，該語(yǔ)音模式對(duì)應(yīng)的一控制客體可被選擇。
[0107] 相反，判斷有與輸入信息匹配的匹配識(shí)別信息時(shí)，控制客體選擇裝置獲取該匹配識(shí)別彳目息S130。
[0108] 比如說(shuō)，如圖3所示，自用戶的語(yǔ)音獲取"播放"這一輸入信息時(shí)，在"快退"、"快進(jìn)"、"播放"識(shí)別信息中，"播放"識(shí)別信息屬于匹配識(shí)別信息。
[0109] 獲取匹配的識(shí)別信息后，控制客體選擇裝置選擇與匹配的識(shí)別信息相對(duì)應(yīng)的控制客體S140。
[0110] 在此，控制客體的選擇是可通過(guò)輸入事件或選擇事件來(lái)實(shí)現(xiàn)的。
[0111] "事件"是指程序中所偵測(cè)的活動(dòng)或事件，按照事件的類型，舉例來(lái)說(shuō)有用于處理輸入的輸入事件、用于處理輸出的輸出事件、用于選擇特定客體的選擇事件等。
[0112] 輸入事件通常是通過(guò)鼠標(biāo)、觸控板、觸控屏幕、鍵盤(pán)等輸入裝置，進(jìn)行點(diǎn)擊、觸控、鍵入等輸入時(shí)而發(fā)生的，但是即使不通過(guò)上述輸入裝置進(jìn)行實(shí)際輸入，也可以處理虛擬的輸入，發(fā)生輸入事件。
[0113] 另外，選擇事件是為了選擇特定控制客體而發(fā)生的，依據(jù)特定控制客體的上述輸入事件，如雙擊或鍵入事件的發(fā)生，來(lái)實(shí)現(xiàn)特定控制客體的選擇。
[0114] 如上所述，依據(jù)本發(fā)明的一實(shí)施方式的控制客體選擇裝置，即使事前未內(nèi)置控制指令的應(yīng)用程序，也可以通過(guò)語(yǔ)音識(shí)別來(lái)控制電子裝置，具有提高該電子裝置的用戶接近性的效果。
[0115] 另外，依據(jù)本發(fā)明一實(shí)施方式，符號(hào)可基于應(yīng)用程序的畫(huà)面信息而被獲取。
[0116] 在應(yīng)用程序的畫(huà)面上顯示控制客體時(shí)，會(huì)實(shí)行與應(yīng)用程序畫(huà)面相關(guān)的光學(xué)字符識(shí) 另IJ，在該應(yīng)用程序的畫(huà)面內(nèi)，可獲取可識(shí)別為文本或文字記號(hào)的信息。
[0117] 但是，應(yīng)用程序的畫(huà)面上，僅獲取被識(shí)別成文本或文字記號(hào)的信息時(shí)，必須決定該信息是否是符號(hào)，若是符號(hào)應(yīng)對(duì)應(yīng)哪一個(gè)控制客體。
[0118] 控制客體選擇裝置判斷在應(yīng)用程序畫(huà)面內(nèi)顯示被識(shí)別成文本或文字記號(hào)識(shí)別信息的第一領(lǐng)域和與第一領(lǐng)域?qū)?yīng)的第二領(lǐng)域內(nèi)所顯示的控制客體，在第一領(lǐng)域中將被識(shí)別成文本或文字記號(hào)的識(shí)別信息作為符號(hào)，實(shí)現(xiàn)與第二領(lǐng)域的控制客體的關(guān)聯(lián)。
[0119] 在此，與顯示被識(shí)別成文本或文字記號(hào)的第一領(lǐng)域相對(duì)應(yīng)的第二領(lǐng)域，可以是包括顯示文本或文字記號(hào)的區(qū)段（block)的至少一部分的領(lǐng)域、與顯示文本或文字記號(hào)的區(qū) 段最臨近的領(lǐng)域、顯示文本的區(qū)段上端或下端的領(lǐng)域。與顯示文本的區(qū)段最臨近的領(lǐng)域、顯示文本或文字記號(hào)的區(qū)段上端或下端的領(lǐng)域。在此，與第一領(lǐng)域?qū)?yīng)的第二領(lǐng)域并不局限于上述內(nèi)容，可為多種多樣的方式。另外，為了判斷在第二領(lǐng)域中所顯示的控制客體，可參照控制客體的顯示信息。
[0120] 另外，本發(fā)明的一實(shí)施方式的控制客體選擇裝置不論是否有控制客體或應(yīng)用程序畫(huà)面的顯示，都可以獲取控制客體的識(shí)別信息。對(duì)此將參照?qǐng)D5進(jìn)行詳細(xì)說(shuō)明。
[0121] 圖5是本發(fā)明一實(shí)施方式的控制客體選擇裝置的示意圖。
[0122] 如圖5所示，根據(jù)控制客體選擇裝置100的畫(huà)面分辨率，向用戶所顯示的范圍也會(huì) 受限制。
[0123] 但是，識(shí)別信息基于控制客體的信息而被獲取，實(shí)際與有無(wú)顯示無(wú)關(guān)都可獲取符號(hào)，并可決定符號(hào)所對(duì)應(yīng)的識(shí)別信息。
[0124] 如圖5所示，應(yīng)用程序170不僅對(duì)于顯示的控制客體171、172、173、174、175可獲取識(shí)別信息，還可對(duì)于沒(méi)有顯示的控制客體176、177、178、179獲取識(shí)別信息。
[0125] 由此可見(jiàn)，沒(méi)有顯示的控制客體176、177、178、179也可以通過(guò)語(yǔ)音識(shí)別而被選擇，沒(méi)有顯示的控制客體176、177、178、179被選擇時(shí)，可實(shí)現(xiàn)至該控制客體所在點(diǎn)的自動(dòng) 滾動(dòng)（auto-scroll )。
[0126] 如上所述，依據(jù)本發(fā)明一實(shí)施方式的控制客體選擇裝置，即使基于未顯示的控制客體或畫(huà)面，也可獲取控制客體的識(shí)別信息。
[0127] 另外，本發(fā)明的一實(shí)施方式的控制客體選擇裝置可將控制客體的識(shí)別信息或匹配識(shí)別信息以語(yǔ)音輸出。
[0128] 因?yàn)榭刂瓶腕w的識(shí)別信息以語(yǔ)音輸出，所以用戶可獲取控制客體選擇裝置可識(shí)別的單詞等；匹配識(shí)別信息以語(yǔ)音輸出，從而使用戶知道所發(fā)出的聲音最終被識(shí)別的單詞是什么，具有即使不看控制客體選擇裝置的畫(huà)面，也可以選擇控制客體的效果。
[0129] 另外，依據(jù)本發(fā)明一實(shí)施方式，在控制客體上包含文本輸入欄時(shí)，通過(guò)語(yǔ)音識(shí)別可在文本輸入欄內(nèi)輸入文本。通過(guò)語(yǔ)音識(shí)別，使含在控制客體上的文本輸入欄活性化，文本輸入的構(gòu)成參照?qǐng)D6及圖7進(jìn)行說(shuō)明。
[0130] 圖6是本發(fā)明一實(shí)施方式的控制客體選擇裝置的流程圖。
[0131] 圖7是本發(fā)明一實(shí)施方式的控制客體選擇方法的另一示意圖。
[0132] 控制客體選擇裝置基于用戶的語(yǔ)音而獲取輸入信息S200。
[0133] 輸入信息被獲取時(shí)，控制客體選擇裝置將基于控制客體而獲取的至少一個(gè)的識(shí)別信息與輸入信息進(jìn)行匹配S210。
[0134] 如圖7所示，基于控制客體168包括"放大按鍵" 168A和文本輸入欄168B，可獲取基于"放大按鍵"168A的"放大"符號(hào)368 (參照?qǐng)D4)，其可與識(shí)別信息468 (參照?qǐng)D4)對(duì) 應(yīng)。
[0135] 若判斷有與輸入信息匹配的匹配識(shí)別信息時(shí)，控制客體選擇裝置獲取該匹配識(shí)別信息S230。
[0136] 所獲取的識(shí)別信息和輸入信息的匹配結(jié)果，控制客體選擇裝置判斷是否有與輸入信息匹配的匹配識(shí)別信息S220。
[0137] 若判斷有與輸入信息匹配的匹配識(shí)別信息時(shí)，控制客體選擇裝置獲取該匹配識(shí)別信息S230。
[0138] 上述 S200、S210、S220、S230 步驟，與圖 2 中的 S100、S110、S120、S130 步驟實(shí)質(zhì)上是一樣的，在此不作重復(fù)說(shuō)明。
[0139] 獲取匹配識(shí)別信息后，控制客體選擇裝置判斷與匹配識(shí)別信息對(duì)應(yīng)的控制客體是否包括文本輸入欄S240。
[0140] 用戶選擇文本輸入欄的意圖可看作是為了在該文本輸入欄輸入文本。因此，控制客體包括文本輸入欄時(shí)，體現(xiàn)為該文本輸入欄內(nèi)可輸入文本。
[0141] 若匹配的識(shí)別信息對(duì)應(yīng)的控制客體不包括文本輸入欄時(shí)，控制客體選擇裝置選擇與匹配的識(shí)別信息對(duì)應(yīng)的控制客體S250。S250步驟與圖2所示的S140步驟實(shí)質(zhì)上是相同的，省略重復(fù)說(shuō)明。
[0142] 當(dāng)匹配的識(shí)別信息對(duì)應(yīng)的控制客體包括文本輸入欄時(shí)，控制客體選擇裝置使該文本輸入欄活性化S260。
[0143] 基于用戶語(yǔ)音獲取"搜索"這一輸入信息時(shí)，所獲取的輸入信息可與"搜索"識(shí)別信息匹配，與"搜索"匹配識(shí)別信息對(duì)應(yīng)的檢索控制客體168包括文本輸入欄168B，從而可使該文本輸入欄168B活性化。
[0144] 被活性化的文本輸入欄內(nèi)設(shè)有插入臺(tái)。該文本輸入欄被活性化后，控制客體選擇裝置利用語(yǔ)音識(shí)別功能，由用戶的語(yǔ)音來(lái)獲取用戶輸入文本S270。
[0145] 也就是說(shuō)，在文本輸入欄被活性化后，所接收的用戶語(yǔ)音信號(hào)，不會(huì)再被識(shí)別為用于與識(shí)別信息匹配的輸入信息，被轉(zhuǎn)換成用戶輸入文本，可在該文本輸入欄內(nèi)輸入。
[0146] 用戶輸入文本被獲取后，控制客體選擇裝置將所獲取的用戶輸入文本輸入到控制客體內(nèi)包括的文本輸入欄上S280。
[0147] 用戶輸入文本被輸入到文本輸入欄后，該文本輸入欄非活性化，控制客體選擇裝置通過(guò)語(yǔ)音識(shí)別可重新選擇控制客體。
[0148] 另外，說(shuō)明用戶輸入文本的輸入結(jié)束的特定輸入信息，如"結(jié)束"、"確認(rèn)"、"下一個(gè)"等輸入信息被獲取時(shí)，該文本輸入欄非活性化，控制客體選擇裝置可通過(guò)語(yǔ)音識(shí)別重新選擇控制客體。
[0149] 另外，依據(jù)本發(fā)明一實(shí)施方式，輸入信息也可以是通過(guò)自用戶語(yǔ)音獲取的語(yǔ)音模式信息與語(yǔ)言模式數(shù)據(jù)庫(kù)對(duì)比的過(guò)程而被識(shí)別的文本。
[0150] 輸入信息通過(guò)語(yǔ)音識(shí)別，自用戶的語(yǔ)音識(shí)別文本時(shí)，輸入信息和識(shí)別信息的匹配因識(shí)別的文本和識(shí)別信息自身的比較而被實(shí)行。
[0151] 若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息時(shí)，也就是說(shuō)，沒(méi)有與輸入信息在一定程度上匹配的識(shí)別信息時(shí)，控制客體選擇裝置在重新獲取輸入信息前呈待機(jī)狀態(tài)，或是要求用戶重新發(fā)音。比如說(shuō)，如圖3所示，存在"快退"、"播放"、"快進(jìn)"識(shí)別信息時(shí)，自用戶語(yǔ)音獲取"后退"這個(gè)輸入信息后，可能不存在與所獲取的輸入信息相匹配的匹配識(shí)別信肩、。
[0152] 此時(shí)，為了獲取與識(shí)別信息匹配的輸入信息，要求輸入用戶語(yǔ)音是非常沒(méi)有效率的。
[0153] 因此，若判斷沒(méi)有與輸入信息匹配的匹配識(shí)別信息的話，控制客體選擇裝置使用戶指定識(shí)別信息與一控制客體對(duì)應(yīng)，該用戶指定識(shí)別信息可為一控制客體的識(shí)別信息。
[0154] 在此，"用戶指定識(shí)別信息"是指為了使其為控制客體的識(shí)別信息，可由文本構(gòu)成，此時(shí)文本可以是自用戶語(yǔ)音而獲取的語(yǔ)音模式信息通過(guò)和語(yǔ)言模式數(shù)據(jù)庫(kù)的比較過(guò)程而被識(shí)別的文本。
[0155] 參附的方塊圖的各方塊和流程圖的各步驟的組合，可因電腦指令而實(shí)行。這些電腦指令可以搭載在常用電腦、特殊電腦或其它軟件數(shù)據(jù)處理裝備的處理機(jī)上，通過(guò)電腦或其它軟件數(shù)據(jù)處理裝備的處理機(jī)而實(shí)行的指令生成在方塊圖的各方塊或流程圖的各步驟中實(shí)行說(shuō)明功能的手段。這些電腦軟件指令為了以特定的方式體現(xiàn)功能，可在電腦或其它軟件數(shù)據(jù)處理裝備的可用于電腦或電腦可讀的內(nèi)存上儲(chǔ)存，因此，在可用于電腦或電腦可讀的內(nèi)存上所儲(chǔ)存的指令包括各方塊圖的方塊或流程圖的各步驟中實(shí)行的說(shuō)明功能的指令手段。電腦軟件指令也可搭載在電腦或其它軟件數(shù)據(jù)處理裝備上，電腦或其它軟件數(shù)據(jù) 處理裝備上，相關(guān)的動(dòng)作步驟被實(shí)行，生成電腦實(shí)行的處理器，實(shí)行電腦或其它軟件數(shù)據(jù)處理裝備的指令可提供方塊圖各方塊及流程圖各步驟中用于說(shuō)明功能的步驟。
[0156] 在本說(shuō)明書(shū)中，各方塊可以為包括用于實(shí)現(xiàn)特定的論理功能的一個(gè)以上可實(shí)行指令的模組、程序或代碼的一部分。另外，在幾種代替實(shí)行的舉例中，在方塊圖中所提及的功能也可以是脫離順序而發(fā)生的。舉例來(lái)說(shuō)，陸續(xù)被圖示的兩個(gè)方塊也可能是實(shí)質(zhì)上同時(shí)實(shí) 行的，也可以是該方塊有時(shí)隨著功能而逆順序?qū)嵭小?br> [0157] 與本說(shuō)明書(shū)中所記載的實(shí)施方式相關(guān)，并被說(shuō)明的方法或算法的步驟，可以是處理器實(shí)行的硬件、軟件模組或其結(jié)合直接體現(xiàn)的。軟件模組可為在RAM內(nèi)存、閃存、ROM內(nèi) 存、EPROM內(nèi)存、EEPR0M內(nèi)存、寄存器、硬盤(pán)、裝拆性盤(pán)、⑶-ROM或本【技術(shù)領(lǐng)域】?jī)?nèi)供知的任意形態(tài)的儲(chǔ)存媒體。示例性的儲(chǔ)存媒體在處理器上聯(lián)合，處理器可判讀來(lái)自媒體的信息，并在儲(chǔ)存媒體上記入信息。采用其他方法，儲(chǔ)存媒體可與處理器為一體形。處理器及儲(chǔ)存媒體可設(shè)在ASIC集成電路內(nèi)。ASIC可設(shè)置的用戶終端機(jī)內(nèi)。采用其他方法，處理器及儲(chǔ)存媒體可各自設(shè)置在用戶終端機(jī)內(nèi)。
[0158] 以上結(jié)合本發(fā)明的實(shí)施方式，對(duì)本發(fā)明作了更加詳細(xì)的說(shuō)明，但是本發(fā)明并不局限于此，在本發(fā)明技術(shù)思想的范圍內(nèi)可進(jìn)行多種變形。由此可見(jiàn)，本發(fā)明所記載的實(shí)施方式并不用于限定本發(fā)明的思想，僅用于說(shuō)明本發(fā)明，本發(fā)明的技術(shù)思想并不受實(shí)時(shí)方式的限制。本發(fā)明的保護(hù)范圍在權(quán)利要求書(shū)中的權(quán)利要求項(xiàng)內(nèi)，在其同等范圍內(nèi)的所有技術(shù)思想均被看作屬于本發(fā)明的權(quán)利范疇之內(nèi)。
【權(quán)利要求】
1. 一種控制客體選擇裝置，是w語(yǔ)音識(shí)別來(lái)選擇控制客體的裝置，其特征在于，包括一個(gè)W上的處理裝置；所述一個(gè)W上的處理裝置的構(gòu)成為，基于用戶的語(yǔ)音獲取輸入信息，基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配，在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息，在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
2. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置，其特征在于，所述符號(hào)是基于所述控制客體的顯不f旨息而獲取的。
3. 根據(jù)權(quán)利要求2所述的控制客體選擇裝置，其特征在于，所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
4. 根據(jù)權(quán)利要求1或2所述的控制客體選擇裝置，其特征在于，所述符號(hào)是通過(guò)光學(xué)字符識(shí)別（〇CR:optical character reco即ition)而獲取的。
5. 根據(jù)權(quán)利要求1或2所述的控制客體選擇裝置，其特征在于，所述符號(hào)通過(guò)圖像模式匹配（image pattern matching)而獲取。
6. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置，其特征在于，所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的識(shí)別信息對(duì)應(yīng)。
7. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置，其特征在于，所述輸入信息包括分析所述用戶的語(yǔ)音特征而獲取的語(yǔ)音模式信息；所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述語(yǔ)音模式信息的匹配。
8. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置，其特征在于，所述輸入信息包括通過(guò)語(yǔ) 音識(shí)別，由所述用戶的語(yǔ)音而識(shí)別的文本（Text);所述識(shí)別信息和所述輸入信息的匹配包括所述識(shí)別信息和所述文本的匹配。
9. 根據(jù)權(quán)利要求1所述的控制客體選擇裝置，其特征在于，所述一個(gè)W上的處理裝置，不存在與所述識(shí)別信息匹配的匹配識(shí)別信息時(shí)，設(shè)定用戶指定識(shí)別信息與一控制客體對(duì) 應(yīng)。
10. -種控制客體選擇方法，是在電腦裝置中通過(guò)語(yǔ)音識(shí)別來(lái)選擇控制客體的方法，其特征在于，包括：基于用戶的語(yǔ)音獲取輸入信息的步驟；基于控制客體獲取的與符號(hào)對(duì)應(yīng) 的至少一個(gè)的識(shí)別信息與所述輸入信息匹配的步驟；在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息的步驟；在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體的步驟。
11. 根據(jù)權(quán)利要求10所述的控制客體選擇方法，其特征在于，所述識(shí)別信息是基于所述控制客體的顯示信息而獲取的。
12. 根據(jù)權(quán)利要求11所述的控制客體選擇方法，其特征在于，所述符號(hào)是基于應(yīng)用程序畫(huà)面信息而獲取的。
13. 根據(jù)權(quán)利要求10或11所述的控制客體選擇方法，其特征在于，所述符號(hào)是通過(guò)光學(xué)字符識(shí)別（〇CR:optical character reco即ition)而獲取的。
14. 根據(jù)權(quán)利要求10或11所述的控制客體選擇方法，其特征在于，所述符號(hào)通過(guò)圖像模式匹配（image pattern matching)而獲取。
15. 根據(jù)權(quán)利要求10所述的控制客體選擇裝置，其特征在于，所述符號(hào)與隨著在所述裝置上實(shí)行的應(yīng)用程序相異的識(shí)別信息對(duì)應(yīng)。
16. -種可電腦判讀的媒體，是儲(chǔ)存指令集的可電腦判讀的媒體，其特征在于，所述指令集因電腦裝置而被執(zhí)行時(shí)，可讓所述電腦裝置獲取基于用戶語(yǔ)音的輸入信息，基于控制客體獲取的與符號(hào)對(duì)應(yīng)的至少一個(gè)的識(shí)別信息與所述輸入信息匹配，在所述識(shí)別信息中獲取與所述輸入信息匹配的匹配識(shí)別信息，在所述匹配識(shí)別信息中選擇對(duì)應(yīng)的控制客體。
【文檔編號(hào)】G10L15/22GK104347070SQ201410103092
【公開(kāi)日】2015年2月11日申請(qǐng)日期:2014年3月19日優(yōu)先權(quán)日:2013年8月9日
【發(fā)明者】申宗元, 金澀冪, 鄭姜理, 多全仁, 柳惠俊, 尹延森, 金京順申請(qǐng)人:迪歐泰克有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載