国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于聲學(xué)的智能設(shè)備的文本輸入識別方法

      文檔序號:10577240閱讀:391來源:國知局
      基于聲學(xué)的智能設(shè)備的文本輸入識別方法
      【專利摘要】本發(fā)明涉及智能識別領(lǐng)域,其公開了一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法,包括如下步驟:(S1)使用手指在文本輸入?yún)^(qū)域輸入文本字符,采集聲波信號;(S2)對采集到的聲波信號進(jìn)行處理;(S3)對聲波信號進(jìn)行識別。提供了一種用戶體驗(yàn)比較好、同時設(shè)備輕巧抗噪聲強(qiáng)的一種聲波信號識別的方法,進(jìn)而提高了文本識別的效率。
      【專利說明】
      基于聲學(xué)的智能設(shè)備的文本輸入識別方法
      技術(shù)領(lǐng)域
      [0001]本發(fā)明涉及智能識別領(lǐng)域,尤其涉及一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法。
      【背景技術(shù)】
      [0002]如今,隨著計(jì)算機(jī)技術(shù)和可穿戴智能設(shè)備行業(yè)的快速發(fā)展,智能設(shè)備逐漸在人們的生活中普及,而且智能設(shè)備的功能越來越多,數(shù)據(jù)處理能力越來越強(qiáng)大,同時這些設(shè)備的體積卻越來越小。智能設(shè)備的小型化帶來諸多便利的同時,在需要文本字符輸入進(jìn)行交互時,傳統(tǒng)的一些文本字符輸入方法已不能夠很好適應(yīng)新的輸入環(huán)境,尋找一種新的更佳的文本字符輸入方法顯得極為迫切。
      [0003]經(jīng)過近年來的發(fā)展,可穿戴設(shè)備的形態(tài)正在逐步完善。其中,交互形式一直是人們所關(guān)注的,尤其是文字輸入體驗(yàn)。目前的解決方案主要集中在三個方面:第一是傳統(tǒng)鍵盤型,又稱為傳統(tǒng)派,便是堅(jiān)持在可傳達(dá)設(shè)備中集成物理或虛擬QWERTY鍵盤,來實(shí)現(xiàn)輸入體驗(yàn),比如擁有物理鍵盤的智能手套、配備完整輸入法的智能手表等,這種形式更容易上手,但缺點(diǎn)很明顯,便是容易造成設(shè)備體積偏大,同時鍵盤使用體驗(yàn)依然不佳;第二種是文本預(yù)測型,主要采用QWERTY布局方式帶來一種擁擠的感覺,推測學(xué)派在節(jié)省空間上很有優(yōu)勢,當(dāng)你打出一個字的時候,系統(tǒng)根據(jù)輸入習(xí)慣推薦相應(yīng)的字詞,這樣就不需要把所有的字都打出來也不需要用到所有的鍵盤,比如很流行的涂鴉社交鍵盤Inkboard;表達(dá)情感的emo j i鍵盤,此外,在大部分的智能手機(jī)上都有這種打字推測系統(tǒng),使得這種推測更加容易在可穿戴設(shè)備上應(yīng)用,但是限于可穿戴設(shè)備的顯示屏體積小,以上兩種輸入方式的用戶體驗(yàn)不佳;第三種是語言識別方式,語音識別無疑是最具未來感的,也是目前很多智能手表配備的功能,雖然語音輸入已經(jīng)存在一些時間了,人們?nèi)匀幌矚g鍵盤輸入,其中的一個原因是,在涉及到私人交流的時候,語音輸入會讓人們有不舒服的感覺,而且由于語音識別技術(shù)對用戶所處環(huán)境有一定的要求,抗噪音能力方面也有待加強(qiáng)。

      【發(fā)明內(nèi)容】

      [0004]為了解決現(xiàn)有技術(shù)中的問題,本發(fā)明提供了一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法,解決現(xiàn)有技術(shù)中設(shè)備體積龐大、用戶體驗(yàn)不佳和抗噪音能力較差的問題。
      [0005]本發(fā)明是通過以下技術(shù)方案實(shí)現(xiàn)的:設(shè)計(jì)、制造了一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法,包括如下步驟:(SI)使用手指在文本輸入?yún)^(qū)域輸入文本字符,采集聲波信號;(S2)對采集到的聲波信號進(jìn)行處理;(S3)對聲波信號進(jìn)行識別。
      [0006]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(S3)中,提取聲波信號的包絡(luò),并提取不同字符所具有的包絡(luò)特征,對聲波信號進(jìn)行變換,對采集到信號進(jìn)行頻域特征進(jìn)行分析,提取不同字符所具有的頻率特征,并通過對以上特征的綜合,對字符特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,用戶按照語法規(guī)則輸入時,通過對比現(xiàn)有的字符特征進(jìn)行分類判斷,從而識別出用戶輸入的字符。
      [0007]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(SI)中,激活智能設(shè)備揚(yáng)聲器使其發(fā)出經(jīng)過調(diào)制的特定頻率的聲波信號,使用手指在文本輸入?yún)^(qū)域輸入文本字符,激活揚(yáng)聲器的同時也激活麥克風(fēng)采集聲波信號;該聲波信號為經(jīng)過調(diào)制的具有一定頻率的聲波信號。
      [0008]作為本發(fā)明的進(jìn)一步改進(jìn):麥克風(fēng)采集數(shù)據(jù)的頻率是固定的,至少是揚(yáng)聲器所發(fā)出的聲波信號的頻率的兩倍。
      [0009]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(S2)中,首先對聲波信號進(jìn)行分幀,并對每個窗口數(shù)據(jù)進(jìn)行處理;對采集到的聲波信號進(jìn)行降噪處理,并使用濾波器對聲波信號進(jìn)行帶通濾波處理,去除噪聲和雜波。
      [0010]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(S3)進(jìn)一步包括:對步驟(S2)中所得到的聲波信號數(shù)據(jù),提取聲波信號的包絡(luò)信息,并對包絡(luò)進(jìn)行平滑,然后找出包絡(luò)的峰值點(diǎn)與波峰之間的距離,通過對上述信息的提取對聲波信號數(shù)據(jù)時域方面進(jìn)行分析。
      [0011]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(S3)中,使用短時傅里葉變換函數(shù)對聲波數(shù)據(jù)信號進(jìn)行傅里葉變換,對音頻聲波信號頻域進(jìn)行分析。
      [0012]作為本發(fā)明的進(jìn)一步改進(jìn):所述步驟(S3)中,對提取的特征信息,進(jìn)行機(jī)器學(xué)習(xí),通過對特征進(jìn)行SVM訓(xùn)練,進(jìn)行建模。
      [0013]作為本發(fā)明的進(jìn)一步改進(jìn):提取的字符特征使用建立的匹配模型并結(jié)合語法規(guī)則進(jìn)行匹配分類,識別出用戶輸入的字符和文本,同時進(jìn)行學(xué)習(xí),優(yōu)化匹配模型。
      [0014]本發(fā)明的有益效果是:提供了一種用戶體驗(yàn)比較好、同時設(shè)備輕巧抗噪聲強(qiáng)的一種聲波信號識別的方法,進(jìn)而提高了文本識別的效率。
      [0015]【【附圖說明】】
      圖1是本發(fā)明基于聲學(xué)的智能設(shè)備的文本輸入識別方法步驟示意圖。
      [0016]圖2是本發(fā)明中一種基于聲學(xué)的智能設(shè)備的文本輸入識別系統(tǒng)的結(jié)構(gòu)示意圖。
      [0017]【【具體實(shí)施方式】】
      下面結(jié)合【附圖說明】及【具體實(shí)施方式】對本發(fā)明進(jìn)一步說明。
      [0018]—種基于聲學(xué)的智能設(shè)備的文本輸入識別方法,包括如下步驟:(SI)使用手指在文本輸入?yún)^(qū)域輸入文本字符,采集聲波信號;(S2)對采集到的聲波信號進(jìn)行處理;(S3)對聲波信號進(jìn)行識別。
      [0019]所述步驟(S3)中,提取聲波信號的包絡(luò),并提取不同字符所具有的包絡(luò)特征,對聲波信號進(jìn)行變換,對采集到信號進(jìn)行頻域特征進(jìn)行分析,提取不同字符所具有的頻率特征,并通過對以上特征的綜合,對字符特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,用戶按照語法規(guī)則輸入時,通過對比現(xiàn)有的字符特征進(jìn)行分類判斷,從而識別出用戶輸入的字符。
      [0020]所述步驟(SI)中,激活智能設(shè)備揚(yáng)聲器使其發(fā)出經(jīng)過調(diào)制的特定頻率的聲波信號,使用手指在文本輸入?yún)^(qū)域輸入文本字符,激活揚(yáng)聲器的同時也激活麥克風(fēng)采集聲波信號;該聲波信號為經(jīng)過調(diào)制的具有一定頻率的聲波信號。
      [0021]麥克風(fēng)采集數(shù)據(jù)的頻率是固定的,至少是揚(yáng)聲器所發(fā)出的聲波信號的頻率的兩倍。
      [0022]所述步驟(S2)中,首先對聲波信號進(jìn)行分幀,并對每個窗口數(shù)據(jù)進(jìn)行處理;對采集到的聲波信號進(jìn)行降噪處理,并使用濾波器對聲波信號進(jìn)行帶通濾波處理,去除噪聲和雜波。
      [0023]所述步驟(S3)進(jìn)一步包括:對步驟(S2)中所得到的聲波信號數(shù)據(jù),提取聲波信號的包絡(luò)信息,并對包絡(luò)進(jìn)行平滑,然后找出包絡(luò)的峰值點(diǎn)與波峰之間的距離,通過對上述信息的提取對聲波信號數(shù)據(jù)時域方面進(jìn)行分析。
      [0024]所述步驟(S3)中,使用短時傅里葉變換函數(shù)對聲波數(shù)據(jù)信號進(jìn)行傅里葉變換,對音頻聲波信號頻域進(jìn)行分析。
      [0025]所述步驟(S3)中,對提取的特征信息,進(jìn)行機(jī)器學(xué)習(xí),通過對特征進(jìn)行SVM訓(xùn)練,進(jìn)行建模。
      [0026]提取的字符特征使用建立的匹配模型并結(jié)合語法規(guī)則進(jìn)行匹配分類,識別出用戶輸入的字符和文本,同時進(jìn)行學(xué)習(xí),優(yōu)化匹配模型。
      [0027]在一實(shí)施例中,如圖2,提出了一種基于聲學(xué)原理的智能設(shè)備文本字符輸入系統(tǒng),該方法通過利用智能設(shè)備普遍內(nèi)置的商用級麥克風(fēng)與揚(yáng)聲器,結(jié)合數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)算法,實(shí)現(xiàn)無需額外輸入設(shè)備的文本輸入系統(tǒng),通過智能設(shè)備中的揚(yáng)聲器發(fā)出經(jīng)過一定方式調(diào)制的聲波信號,使用手指在文本輸入?yún)^(qū)域輸入字符與文本;與此同時,智能設(shè)備內(nèi)置的麥克風(fēng)以一定的采樣頻率采集被手指反射回的聲波信號;通過對上述步驟采集到的音頻信號進(jìn)行處理,包括:降噪濾波,包絡(luò)提取,信號切分,時頻分析,特征提取,模型訓(xùn)練,利用機(jī)器學(xué)習(xí)訓(xùn)練出的分類模型,識別用戶輸入的字符與文本。
      [0028]在一具體實(shí)施例中,如圖1,一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法通過以下步驟實(shí)現(xiàn):
      S1、激活智能設(shè)備揚(yáng)聲器使其發(fā)出經(jīng)過調(diào)制的特定頻率的聲波信號,使用手指在文本輸入?yún)^(qū)域輸入文本字符,激活揚(yáng)聲器的同時也激活麥克風(fēng)米集聲波信號,揚(yáng)聲器所發(fā)出的聲波信號,是經(jīng)過調(diào)制的具有一定頻率的聲波信號;麥克風(fēng)采集數(shù)據(jù)的頻率是一定的,至少是揚(yáng)聲器所發(fā)出的聲波信號的頻率的兩倍。
      [0029]S2、對麥克風(fēng)采集到的聲波數(shù)據(jù)進(jìn)行處理。首先對采集到的信號進(jìn)行分幀,然后對信號進(jìn)行降噪,并通過使用濾波器對信號進(jìn)行濾波處理;S2還包括,S21、首先對步驟SI采集的聲波信號進(jìn)行分幀,從而可以對每個窗口數(shù)據(jù)進(jìn)行處理;S22、對采集到的聲波信號進(jìn)行降噪處理,并使用巴特沃斯濾波器對聲波信號進(jìn)行帶通濾波處理,去除噪聲和雜波。
      [0030]S3、提取聲波信號的包絡(luò),并提取不同字符所具有的包絡(luò)特征,對聲波信號進(jìn)行傅里葉變換,對采集到信號進(jìn)行頻域特征進(jìn)行分析,提取不同字符所具有的頻率特征,并通過對以上特征的綜合,對字符特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,用戶按照語法規(guī)則輸入時,通過對比現(xiàn)有的字符特征進(jìn)行分類判斷,從而識別出用戶輸入的字符。
      [0031]將S3進(jìn)行細(xì)化為:
      S31A:結(jié)合步驟S2中所得到的聲波信號數(shù)據(jù),提取聲波信號的包絡(luò)信息,并對包絡(luò)進(jìn)行平滑,然后找出包絡(luò)的峰值點(diǎn)與波峰之間的距離,通過對上述信息的提取對聲波信號數(shù)據(jù)時域方面進(jìn)行分析;
      S31B:由于使用手指輸入文本字符時,手指的移動會產(chǎn)生多普勒效應(yīng),從而揚(yáng)聲器所采集到的聲波信號的頻率會受到影響,結(jié)合步驟S2中所得到的聲波數(shù)據(jù)信號,使用短時傅里葉變換函數(shù)對聲波數(shù)據(jù)信號進(jìn)行傅里葉變換,對音頻聲波信號頻域進(jìn)行分析;
      S31C:結(jié)合訓(xùn)練的匹配模型,使用語法規(guī)則來提高識別的準(zhǔn)確率;
      S32:結(jié)合步驟S31A和S31B中經(jīng)過包絡(luò)提取所得到的時域包絡(luò)信息和經(jīng)過傅里葉變換所得到的頻域信息的分析,從而提取出特征;
      S33:通過結(jié)合步驟S32中提取的特征信息,進(jìn)行機(jī)器學(xué)習(xí),通過對特征進(jìn)行SVM訓(xùn)練,進(jìn)行建模。
      [0032]還包括步驟S4:通過步驟S3中提取的字符特征使用步驟S3中所建立的匹配模型并結(jié)合語法規(guī)則進(jìn)行匹配分類,識別出用戶輸入的字符和文本,同時進(jìn)行學(xué)習(xí),優(yōu)化匹配模型S31A:結(jié)合步驟S2中所得到的聲波信號數(shù)據(jù),提取聲波信號的包絡(luò)信息,并對包絡(luò)進(jìn)行平滑,然后找出包絡(luò)的峰值點(diǎn)與波峰之間的距離,通過對上述信息的提取對聲波信號數(shù)據(jù)時域方面進(jìn)行分析。
      [0033]以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對本發(fā)明所作的進(jìn)一步詳細(xì)說明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對于本發(fā)明所屬技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干簡單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。
      【主權(quán)項(xiàng)】
      1.一種基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:包括如下步驟:(SI)使用手指在文本輸入?yún)^(qū)域輸入文本字符,采集聲波信號;(S2)對采集到的聲波信號進(jìn)行處理;(S3)對聲波信號進(jìn)行識別。2.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(S3)中,提取聲波信號的包絡(luò),并提取不同字符所具有的包絡(luò)特征,對聲波信號進(jìn)行變換,對采集到信號進(jìn)行頻域特征進(jìn)行分析,提取不同字符所具有的頻率特征,并通過對以上特征的綜合,對字符特征數(shù)據(jù)進(jìn)行模型訓(xùn)練,用戶按照語法規(guī)則輸入時,通過對比現(xiàn)有的字符特征進(jìn)行分類判斷,從而識別出用戶輸入的字符。3.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(SI)中,激活智能設(shè)備揚(yáng)聲器使其發(fā)出經(jīng)過調(diào)制的特定頻率的聲波信號,使用手指在文本輸入?yún)^(qū)域輸入文本字符,激活揚(yáng)聲器的同時也激活麥克風(fēng)米集聲波信號;該聲波信號為經(jīng)過調(diào)制的具有一定頻率的聲波信號。4.根據(jù)權(quán)利要求3所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:麥克風(fēng)采集數(shù)據(jù)的頻率是固定的,至少是揚(yáng)聲器所發(fā)出的聲波信號的頻率的兩倍。5.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(S2)中,首先對聲波信號進(jìn)行分幀,并對每個窗口數(shù)據(jù)進(jìn)行處理;對采集到的聲波信號進(jìn)行降噪處理,并使用濾波器對聲波信號進(jìn)行帶通濾波處理,去除噪聲和雜波。6.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(S3)進(jìn)一步包括:對步驟(S2)中所得到的聲波信號數(shù)據(jù),提取聲波信號的包絡(luò)信息,并對包絡(luò)進(jìn)行平滑,然后找出包絡(luò)的峰值點(diǎn)與波峰之間的距離,通過對上述信息的提取對聲波信號數(shù)據(jù)時域方面進(jìn)行分析。7.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(S3)中,使用短時傅里葉變換函數(shù)對聲波數(shù)據(jù)信號進(jìn)行傅里葉變換,對音頻聲波信號頻域進(jìn)行分析。8.根據(jù)權(quán)利要求1所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:所述步驟(S3)中,對提取的特征信息,進(jìn)行機(jī)器學(xué)習(xí),通過對特征進(jìn)行SVM訓(xùn)練,進(jìn)行建模。9.根據(jù)權(quán)利要求8所述的基于聲學(xué)的智能設(shè)備的文本輸入識別方法,其特征在于:提取的字符特征使用建立的匹配模型并結(jié)合語法規(guī)則進(jìn)行匹配分類,識別出用戶輸入的字符和文本,同時進(jìn)行學(xué)習(xí),優(yōu)化匹配模型。
      【文檔編號】G06F3/023GK105938399SQ201510878499
      【公開日】2016年9月14日
      【申請日】2015年12月4日
      【發(fā)明人】伍楷舜, 鄒永攀, 劉巍峰
      【申請人】深圳大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1