本發(fā)明涉及語音控制技術(shù)領(lǐng)域,尤其涉及一種照明燈具的語音控制方法。
背景技術(shù):
隨著語音識別技術(shù)的發(fā)展,現(xiàn)有技術(shù)中考慮在照明燈具中引入語音控制功能,實(shí)現(xiàn)用戶可通過說出語音控制命令的方法來控制照明燈具的開、關(guān)、調(diào)光等操作。
考慮到照明燈具并不期望限定對其進(jìn)行語音控制的使用者的身份,而傾向于實(shí)現(xiàn)任一口音、年齡段、性別和發(fā)聲特性的使用者都可以對其進(jìn)行語音控制,因此在照明燈具中實(shí)現(xiàn)語音控制的方法通常是使用非特定人語音識別芯片來識別語音控制命令。在實(shí)際應(yīng)用中,往往要求此類非特定人語音識別芯片保持較高的語音識別率,同時(shí)要求拒絕識別率和誤識別率保持在較低的水平。由于該非特定人語音識別芯片僅需要識別數(shù)量有限的特定詞語即可,出于成本考慮,在構(gòu)建其語音識別的邏輯時(shí)可以使用包含少量的聲音樣本(例如200個(gè)聲音樣本)的集合進(jìn)行算法處理得到上述特定詞語的特征數(shù)據(jù),并以此作為語音識別的特征比對基礎(chǔ)數(shù)據(jù),而無需使用復(fù)雜的隱藏馬爾可夫模型來進(jìn)行語音識別。此類非特定人語音識別芯片在提升語音識別率同時(shí)可以使拒絕識別率降低,但會提升誤識別率,也即非特定人語音識別芯片容易將照明燈具工作場景內(nèi)正常對話中的其他語音或不相關(guān)噪音錯誤地識別為語音命令,從而導(dǎo)致照明燈具出現(xiàn)錯誤的開啟、關(guān)閉、調(diào)光等,從而影響用戶體驗(yàn)和降低了語音控制照明燈具的效率。
技術(shù)實(shí)現(xiàn)要素:
為了克服現(xiàn)有技術(shù)中的上述缺陷,本發(fā)明提供了一種照明燈具的語音控制方法,該方法包括:
在照明燈具內(nèi)設(shè)置語音識別芯片;
所述語音識別芯片采集用戶的自定義語音流,根據(jù)所述自定義語音流生成語音特征值,并存儲所述語音特征值;
所述語音識別芯片采集外界輸入的第一語音流,并判斷所述第一語音流中是否存在與所述語音特征值相匹配的第一特征語句;
若存在所述第一特征語句,則所述語音識別芯片在預(yù)定時(shí)間內(nèi)采集外界輸入的第二語音流,并判斷所述第二語音流中是否存在第二特征語句;
若存在所述第二特征語句,根據(jù)所述第二特征語句生成用于變更所述照明燈具的工作狀態(tài)的控制命令。
根據(jù)本發(fā)明的一個(gè)方面,若存在所述第一特征語句,該方法還包括:觸發(fā)所述照明燈具呈現(xiàn)預(yù)設(shè)的提示信號。
根據(jù)本發(fā)明的另一個(gè)方面,該方法中觸發(fā)所述照明燈具呈現(xiàn)預(yù)設(shè)的提示信號包括:觸發(fā)所述照明燈具內(nèi)設(shè)置的揚(yáng)聲器播放預(yù)定義聲音信號;和/或觸發(fā)所述照明燈具的光源發(fā)出預(yù)定義的燈光信號。
根據(jù)本發(fā)明的又一個(gè)方面,該方法中所述預(yù)定時(shí)間的取值范圍是0秒至2秒。
根據(jù)本發(fā)明的又一個(gè)方面,該方法中判斷所述第二語音流中是否存在第二特征語句包括:判斷所述第二語音流中是否存在與所述語音特征值相匹配的第二特征語句;或判斷所述第二語音流中是否存在與所述語音識別芯片內(nèi)存儲的語音模型相匹配的第二特征語句。
根據(jù)本發(fā)明的又一個(gè)方面,該方法中所述第二特征語句包括:用于描述針對所述照明燈具的開燈操作、關(guān)燈操作、調(diào)整光源亮度操作或更改光源顏色操作的自然語言字符序列。
根據(jù)本發(fā)明的又一個(gè)方面,該方法中所述照明燈具的光源是LED光源。
本發(fā)明所提供的照明燈具的語音控制方法具有如下優(yōu)點(diǎn):
一方面,通過在整個(gè)語音識別過程中首先識別出第一特征語句觸發(fā)進(jìn)入后續(xù)的語音識別,再識別出用于生成控制命令的第二特征語句,在保持較高語音識別率的前提下降低了拒絕識別率和誤識別率,因此提升了照明燈具的語音控制的準(zhǔn)確度和用戶體驗(yàn),另一方面,從第一語音流中識別所述第一特征語句是使用用戶自定義語音流中提取的語音特征值來進(jìn)行識別,在提升語音識別率的同時(shí)還滿足了用戶個(gè)性化語音識別的需求。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會變得更明顯:
圖1是根據(jù)本發(fā)明的照明燈具的語音控制方法的一個(gè)具體實(shí)施方式的流程圖。
具體實(shí)施方式
為了更好地理解和闡釋本發(fā)明,下面將結(jié)合附圖對本發(fā)明作進(jìn)一步的詳細(xì)描述。
本發(fā)明提供了一種照明燈具的語音控制方法,請參考圖1,圖1是根據(jù)本發(fā)明的照明燈具的語音控制方法的一個(gè)具體實(shí)施方式的流程圖,該方法包括以下步驟:
步驟S100,在照明燈具內(nèi)設(shè)置語音識別芯片;
步驟S200,所述語音識別芯片采集用戶的自定義語音流,根據(jù)所述自定義語音流生成語音特征值,并存儲所述語音特征值;
步驟S300,所述語音識別芯片采集外界輸入的第一語音流,并判斷所述第一語音流中是否存在與所述語音特征值相匹配的第一特征語句,若是則執(zhí)行步驟S400;
步驟S400,所述語音識別芯片在預(yù)定時(shí)間內(nèi)采集外界輸入的第二語音流,并判斷所述第二語音流中是否存在第二特征語句,若是則執(zhí)行步驟S500;
步驟S500,根據(jù)所述第二特征語句生成用于變更所述照明燈具的工作狀態(tài)的控制命令。
具體地,步驟S100中在所述照明燈具內(nèi)設(shè)置的語音識別芯片典型地選用例如本文背景技術(shù)部分所述的非特定人語音識別芯片,該語音識別芯片可以設(shè)置在所述照明燈具光源的控制電路上,用于向所述控制電路中的主機(jī)傳輸控制命令以達(dá)到控制所述照明燈具的光源的目的。所述語音識別芯片可以集成在所述控制電路上,也可以與所述控制電路分離地設(shè)置并電連接。本領(lǐng)域技術(shù)人員可以理解,所述語音識別芯片還應(yīng)與麥克風(fēng)電連接,所述麥克風(fēng)用于采集外界的語音信號,相應(yīng)地所述語音識別芯片內(nèi)還包括模數(shù)裝換模塊,用于將麥克風(fēng)采集到的語音信號對應(yīng)的模擬信號轉(zhuǎn)變?yōu)閿?shù)字信號。典型地,所述照明燈具的光源選用LED光源,所述照明燈具中的LED光源數(shù)據(jù)可以根據(jù)所述照明燈具的使用場景來確定,本發(fā)明并不做限定。
執(zhí)行步驟S200的目的是為了對所述語音識別芯片進(jìn)行預(yù)設(shè)值,便于語音控制所述照明燈具的用戶預(yù)先對所述照明燈具進(jìn)行語音配置,也即所述用戶可以預(yù)先使用自定義語音訓(xùn)練所述語音識別芯片,使該語音識別芯片在后續(xù)的語音識別中能夠快速地識別出所述自定義語音。典型的處理方法是所述語音識別芯片采集所述用戶的自定義語音流,并從該自定義語音流中提取并存儲語音特征值,提取所述語音特征值的方法例如可以使用計(jì)算機(jī)算法計(jì)算所述自定義語音流的數(shù)字信號的方法來實(shí)現(xiàn)。具體地,所述自定義語音流包含了所述用戶自定義的自然語言詞語,例如詞語“阿拉丁”。所述語音特征值可記錄所述用戶在說出至少部分所述自然語言詞語時(shí)的數(shù)字波形的關(guān)鍵數(shù)據(jù)。執(zhí)行步驟S200之后,所述語音識別芯片通過存儲所述語音特征值從而完成了預(yù)設(shè)值,所述照明燈具可進(jìn)入語音控制的等待狀態(tài)。
在步驟S300中,所述語音識別芯片采集外界輸入的第一語音流,并判斷所述第一語音流中是否存在與所述語音特征值相匹配的第一特征語句,執(zhí)行步驟S300的目的是通過識別出所述第一特征語句來判斷出所述第一語音流中存在與步驟S200中的所述自定義語音流的至少部分相同或相似的語音信號,進(jìn)一步觸發(fā)所述語音識別芯片進(jìn)入后續(xù)的識別語音控制命令的狀態(tài)。也即所述第一特征語句是所述語音識別芯片進(jìn)入后續(xù)語音識別步驟的喚醒觸發(fā)語句。典型地,所述第一特征語句中包含的詞語和所述自定義語音流中包含的詞語至少部分重合或完全相同,例如所述自定義語音流包含用戶自定義的詞語“阿拉丁”,則相應(yīng)地所述第一特征語句可設(shè)置為詞語“阿拉丁”。執(zhí)行步驟S300過程時(shí)若判斷所述第一語音流中是否存在與所述語音特征值相匹配的第一特征語句的判斷結(jié)果為是,則觸發(fā)步驟S400執(zhí)行。
在步驟S400中,所述語音識別芯片在預(yù)定時(shí)間內(nèi)采集外界輸入的第二語音流,并判斷所述第二語音流中是否存在第二特征語句。執(zhí)行步驟S400的目的是在步驟S300中所述語音識別芯片以識別出所述第一特征語句為喚醒條件后,在后續(xù)的所述預(yù)定時(shí)間內(nèi)判斷是否有用戶說出針對所述照明燈具的語音命令,典型地,所述第二特征語句包括:用于描述針對所述照明燈具的開燈操作、關(guān)燈操作、調(diào)整光源亮度操作或更改光源顏色操作的自然語言字符序列。例如所述第二特征語句包括如下詞語:“開燈”、“關(guān)燈”、“調(diào)亮度”、“調(diào)顏色”。
本領(lǐng)域技術(shù)人員可以理解,所述語音識別芯片在識別接收到的語音流中的語音命令時(shí),若按照現(xiàn)有技術(shù)的方法是僅識別單個(gè)的語音命令詞語,這樣無關(guān)的對話語音流或噪音都有可能造成誤識別。而本發(fā)明采用的先識別出所述第一特征語句再觸發(fā)識別所述第二特征語句的方法,可以有效地降低誤識別率。所述第一特征語句和所述第二特征語句在一段時(shí)間內(nèi)的語音流中先后出現(xiàn)的情況,通常是用戶對所述照明燈具具有真實(shí)的語音控制意愿才容易出現(xiàn),而在無關(guān)的對話語音流中或噪音中僅有較小概率會出現(xiàn)所述第一特征語句和所述第二特征語句先后連續(xù)出現(xiàn)的情況,尤其是所述第一特征語句與用戶的所述自定義語音流中包含的自定義詞語相匹配的前提下,若所述第一特征語句選用較為冷僻的詞語(例如前文中的詞語“阿拉丁”),降低所述語音識別芯片的誤識別率的效果更佳明顯。
在用戶對所述照明燈具進(jìn)行語音控制時(shí),用于喚醒所述語音識別芯片的第一特征語句和用于進(jìn)行語音控制的第二特征語句可能是連續(xù)地說出,也可能是相隔一個(gè)較短的時(shí)間間隔的情況下時(shí)間離散地先后說出。因此步驟S400中所述預(yù)定時(shí)間的取值范圍應(yīng)考慮正常人類普遍的語言習(xí)慣,根據(jù)實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),優(yōu)選地所述預(yù)定時(shí)間的取值范圍是0秒至2秒能保持較低的誤識別率。
典型地在一個(gè)實(shí)施例中,判斷所述第二語音流中是否存在所述第二特征語句的具體方法是:判斷所述第二語音流中是否存在與所述語音特征值相匹配的第二特征語句。該方法是以步驟S200中采集到的所述自定義語音流作為識別所述第二特征語句的識別數(shù)據(jù),相應(yīng)地所述第二特征語句中包含的詞語和所述自定義語音流中包含的詞語至少部分重合或完全相同。這樣的安排便于用戶自定義第二特征語句包含的具體詞語,可以進(jìn)一步降低誤識別率。在另一實(shí)施例中,斷所述第二語音流中是否存在第二特征語句的具體方法是:判斷所述第二語音流中是否存在與所述語音識別芯片內(nèi)存儲的語音模型相匹配的第二特征語句。該方法是以所述語音識別芯片內(nèi)存儲的語音模型作為識別所述第二特征語句的識別數(shù)據(jù),所述語音模型可以使用現(xiàn)有的常規(guī)技術(shù)來創(chuàng)建(例如使用包含200個(gè)聲音樣本的集合進(jìn)行算法處理得到),這樣便于降低所述語音識別芯片的開發(fā)難度。根據(jù)所述照明燈具的實(shí)際使用場景,本發(fā)明的實(shí)施人員在選用判斷所述第二語音流中是否存在所述第二特征語句的具體方法時(shí)可以使用上述兩個(gè)實(shí)施例中任一方法或其組合。
在優(yōu)選的實(shí)施例中,所述第一語音流和所述第二語音流是所述語音識別芯片在不同時(shí)間分別采集的,步驟S200和步驟S300的執(zhí)行具有時(shí)間上的先后執(zhí)行順序。在可選的實(shí)施例中,所述第一語音流和所述第二語音流是從所述語音識別芯片接收到的連續(xù)語音流中分離出來的,在這種情況中步驟S200中所述語音識別芯片采集外界輸入的第一語音流的具體步驟和步驟S300中所述語音識別芯片在預(yù)定時(shí)間內(nèi)采集外界輸入的第二語音流可能是并行執(zhí)行的情況。
本領(lǐng)域技術(shù)人員可以理解,基于語音識別芯片的性能和成本考慮,本發(fā)明識別所述第一特征語句和所述第二特征語句時(shí)優(yōu)先使用的是簡單的語音特征對比方法,而不需要使用更為復(fù)雜的語音識別概率算法(例如隱藏的馬爾可夫模型)來進(jìn)行識別。
若步驟S400中判斷所述第二語音流中是否存在第二特征語句的判斷結(jié)果為是,則進(jìn)一步執(zhí)行步驟S500,也即根據(jù)所述第二特征語句生成用于變更所述照明燈具的工作狀態(tài)的控制命令。其中變更所述照明燈具的工作狀態(tài)例如是開啟、關(guān)閉所述照明燈具的光源,或調(diào)整所述照明燈具的光源的亮度或顏色。根據(jù)所述第二特征語句生成用于變更所述照明燈具的工作狀態(tài)的控制命令的步驟可以是所述語音識別芯片所實(shí)現(xiàn)的,也可以是所述語音識別芯片觸發(fā)與其電連接的主機(jī)芯片來實(shí)現(xiàn)。本領(lǐng)域技術(shù)人員可以理解,實(shí)際上控制所述照明燈具的控制命令是根據(jù)所述第二特征語句生成的,并不會根據(jù)所述第一特征語句生成上述控制命令。
需要說明的是,盡管在附圖中以特定順序描述了本發(fā)明方法的操作,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些操作,或是必須執(zhí)行全部所示的操作才能實(shí)現(xiàn)期望的結(jié)果。相反,流程圖中描繪的步驟可以改變執(zhí)行順序。附加地或備選地,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,和/或?qū)⒁粋€(gè)步驟分解為多個(gè)步驟執(zhí)行。
本發(fā)明提供的照明燈具的語音控制方法可以使用可編程邏輯器件來實(shí)現(xiàn),也可以實(shí)施為計(jì)算機(jī)程序軟件,例如根據(jù)本發(fā)明的實(shí)施例可以是一種計(jì)算機(jī)程序產(chǎn)品,運(yùn)行該程序產(chǎn)品使計(jì)算機(jī)執(zhí)行用于所示范的方法。所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)可讀存儲介質(zhì),該介質(zhì)上包含計(jì)算機(jī)程序邏輯或代碼部分,用于實(shí)現(xiàn)上述方法的各個(gè)步驟。所述計(jì)算機(jī)可讀存儲介質(zhì)可以是被安裝在計(jì)算機(jī)中的內(nèi)置介質(zhì)或者可從計(jì)算機(jī)主體拆卸的可移動介質(zhì)(例如熱拔插技術(shù)存儲設(shè)備)。所述內(nèi)置介質(zhì)包括但不限于可重寫的非易失性存儲器,例如RAM、ROM、快閃存儲器和硬盤。所述可移動介質(zhì)包括但不限于:光存儲媒體(例如CD-ROM和DVD)、磁光存儲媒體(例如MO)、磁存儲媒體(例如盒帶或移動硬盤)、具有內(nèi)置的可重寫的非易失性存儲器的媒體(例如存儲卡)和具有內(nèi)置ROM的媒體(例如ROM盒)。
本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,任何具有適當(dāng)編程裝置的計(jì)算機(jī)系統(tǒng)都將能夠執(zhí)行包含在程序產(chǎn)品中的本發(fā)明的方法的諸步驟。盡管本說明書中描述的多數(shù)具體實(shí)施方式都側(cè)重于軟件程序,但是作為固件和硬件實(shí)現(xiàn)本發(fā)明提供的方法的替代實(shí)施例同樣在本發(fā)明要求保護(hù)的范圍之內(nèi)。
對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此外,顯然“包括”一詞不排除其他部件、單元或步驟,單數(shù)不排除復(fù)數(shù)。
本發(fā)明所提供的照明燈具的語音控制方法具有如下優(yōu)點(diǎn):一方面,通過在整個(gè)語音識別過程中首先識別出第一特征語句觸發(fā)進(jìn)入后續(xù)的語音識別,再識別出用于生成控制命令的第二特征語句,在保持較高語音識別率的前提下降低了拒絕識別率和誤識別率,因此提升了照明燈具的語音控制的準(zhǔn)確度和用戶體驗(yàn),另一方面,從第一語音流中識別所述第一特征語句是使用用戶自定義語音流中提取的語音特征值來進(jìn)行識別,在提升語音識別率的同時(shí)還滿足了用戶個(gè)性化語音識別的需求。
以上所揭露的僅為本發(fā)明的一些較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。