一種語音交互式門禁系統(tǒng)及其實(shí)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于人工智能和安防領(lǐng)域,特別涉及一種帶聲紋識(shí)別、語音識(shí)別、語義分析、語音合成技術(shù)的智能門禁系統(tǒng)。
【背景技術(shù)】
[0002]傳統(tǒng)的門禁通?;趩纹瑱C(jī)和嵌入式操作系統(tǒng)開發(fā),一般采用刷卡和密碼的方式打開門鎖,部分門禁也有指紋、虹膜、人臉等生物識(shí)別功能。但傳統(tǒng)的門禁缺少人工智能技術(shù),無法理解用戶的自然語言,不能與用戶對(duì)話交流。物聯(lián)網(wǎng)技術(shù)逐漸興起,Android,Windows等智能操作系統(tǒng)已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域。隨著信息技術(shù)的發(fā)展,聲紋識(shí)別技術(shù)和語音識(shí)別技術(shù)日臻成熟。一種帶觸摸顯示屏,能夠通過聲音識(shí)別用戶,并用自然語言和用戶交流的門禁會(huì)使我們的生活更加美好。
【發(fā)明內(nèi)容】
[0003]本發(fā)明提供了一種能夠用語音交流的門禁系統(tǒng)及其交互方式,用戶可以用自然語言和門禁對(duì)話交流。門禁系統(tǒng)通過聲紋識(shí)別開門口令,自動(dòng)為用戶打開門鎖。還能通過語音識(shí)別、語義分析和語音合成技術(shù)識(shí)別用戶的語音并給出語音答復(fù)。
[0004]本發(fā)明公開了一種語音交互式門禁系統(tǒng),包括門禁控制器、電子鎖,其特征在于:所述門禁控制器包括主板、與主板相連接的CPU、內(nèi)存、存儲(chǔ)器、麥克風(fēng)、揚(yáng)聲器、無線網(wǎng)絡(luò)模塊和電源模塊,所述門禁控制器還包括用于比對(duì)語音端點(diǎn)的聲紋識(shí)別模塊、用于將語音轉(zhuǎn)換為文本的語音識(shí)別模塊、用于分析語句文本并返回答復(fù)文本的語義分析模塊、用于將文本轉(zhuǎn)換為語音的語音合成模塊,所述門禁控制器連接控制電子鎖。
[0005]優(yōu)選的,所述門禁系統(tǒng)包括還包括人體感應(yīng)模塊、門磁。
[0006]優(yōu)選的,所述門禁控制器還包括觸摸顯示屏、攝像頭。
[0007]優(yōu)選的,所述門禁控制器運(yùn)行Android或Windows操作系統(tǒng),所述CPU為ARM或X86處理器。
[0008]優(yōu)選的,所述電子鎖為電機(jī)鎖、電控鎖、電磁鎖或電鎖口。
[0009]本發(fā)明還公開了一種語音交互式門禁實(shí)現(xiàn)方法,其特征在于,包括以下步驟:
麥克風(fēng)接受用戶輸入語音;
聲紋識(shí)別模塊檢測(cè)用戶輸入語音端點(diǎn),如果與預(yù)設(shè)的口令聲紋匹配,則系統(tǒng)打開電子鎖;
語音識(shí)別模塊將用戶輸入語音轉(zhuǎn)換為用戶輸入文本;
語義分析模塊分析用戶輸入文本返回系統(tǒng)答復(fù)文本;
語音合成模塊將系統(tǒng)答復(fù)文本轉(zhuǎn)換為系統(tǒng)答復(fù)語音;
揚(yáng)聲器播放系統(tǒng)答復(fù)語音。
[0010]優(yōu)選的,還包括以下步驟:
用戶在觸摸顯示屏上輸入密碼,如果與預(yù)設(shè)的密碼匹配,則系統(tǒng)打開電子鎖。
[0011]優(yōu)選的,還包括以下步驟:
人體感應(yīng)器檢測(cè)到門禁前有人逗留時(shí),系統(tǒng)自動(dòng)點(diǎn)亮觸摸顯示屏;
人體感應(yīng)器檢測(cè)到門禁前無人逗留時(shí),系統(tǒng)自動(dòng)關(guān)閉觸摸顯示屏。
[0012]優(yōu)選的,還包括以下步驟:
門磁檢測(cè)到門開啟時(shí),系統(tǒng)自動(dòng)發(fā)送通知信息到業(yè)主的移動(dòng)設(shè)備上。
[0013]優(yōu)選的,還包括以下步驟:
麥克風(fēng)、攝像頭接受用戶語音留言或視頻留言;
系統(tǒng)將用戶語音留言或視頻留言保存在存儲(chǔ)器中;
系統(tǒng)將用戶的圖像、語音、視頻通過互聯(lián)網(wǎng)發(fā)送到業(yè)主的移動(dòng)設(shè)備上。
【附圖說明】
[0014]圖1為系統(tǒng)連接示意圖。
[0015]圖2為實(shí)施例1系統(tǒng)組成。
[0016]圖3為實(shí)施例2系統(tǒng)組成。
[0017]圖4為實(shí)施例3系統(tǒng)組成。
[0018]圖5為用戶語音交互步驟。
【具體實(shí)施方式】
[0019]下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)介紹。
[0020]參見圖1,本發(fā)明門禁系統(tǒng)通常安裝在門上,包括門禁控制器和電子鎖。門禁控制器連接控制電子鎖,并通過WIFI或3G/4G無線網(wǎng)絡(luò)連接到互聯(lián)網(wǎng)。
[0021]實(shí)施例1:
系統(tǒng)組成
參見圖2,門禁系統(tǒng)包括門禁控制器和電子鎖。
[0022]門禁控制器包括主板、CPU、內(nèi)存、存儲(chǔ)器、麥克風(fēng)、揚(yáng)聲器、WIFI模塊和直流電源。CPU、內(nèi)存、存儲(chǔ)器、WIFI模塊集成在主板上,麥克風(fēng)、揚(yáng)聲器通過音頻信號(hào)線與主板相連,直流電源給主板供電。門禁控制器上運(yùn)行Linux操作系統(tǒng)。聲紋識(shí)別模塊、語音合成模塊、語義分析模塊、語音識(shí)別模塊都是帶MCU的硬件處理模塊,均通過I2C接口與主板相連接。電子鎖與主板上的GP1 口相連接,門禁控制器控制電子鎖。
[0023]實(shí)現(xiàn)方法
參見圖5,門禁控制器啟動(dòng)后自動(dòng)運(yùn)行門禁服務(wù)程序,控制器通過WIFI模塊連接互聯(lián)網(wǎng)。門禁控制器通過麥克風(fēng)獲取用戶說話語音,并將用戶語音發(fā)送給聲紋識(shí)別模塊。聲紋識(shí)別模塊將用戶語音端點(diǎn)與預(yù)設(shè)的口令語音端點(diǎn)進(jìn)行對(duì)比,并返回對(duì)比結(jié)果。如果聲紋匹配,則打開電子鎖。如果聲紋不匹配,則將用戶語音發(fā)送給語音識(shí)別模塊。語音識(shí)別模塊將用戶語音轉(zhuǎn)換為用戶說話內(nèi)容文本,再將用戶說話文本發(fā)送給語義分析模塊,語義分析模塊對(duì)用戶說話文本進(jìn)行分詞,并根據(jù)分詞結(jié)果檢索知識(shí)庫返回相應(yīng)答復(fù)文本。語音合成模塊將答復(fù)文本合成系統(tǒng)答復(fù)語音,再通過揚(yáng)聲器播放系統(tǒng)答復(fù)語音。實(shí)現(xiàn)門禁系統(tǒng)與用戶的自然語言交流。
[0024]實(shí)施例2: 系統(tǒng)組成
參見圖3,門禁系統(tǒng)包括門禁控制器、超聲波傳感器、門磁和電控鎖。
[0025]門禁控制器包括主板、ARM處理器、內(nèi)存、存儲(chǔ)器、3G/4G模塊、觸摸顯示屏、攝像頭、麥克風(fēng)、揚(yáng)聲器和充電電池。ARM處理器、內(nèi)存、存儲(chǔ)器、3G/4G模塊集成在主板上,觸摸顯示屏、攝像頭、麥克風(fēng)、揚(yáng)聲器通過排線與主板相連,充電電池給主板供電。門禁控制器運(yùn)行Android操作系統(tǒng)。聲紋識(shí)別模塊為基于谷歌、訊飛或百度的聲紋識(shí)別程序,語音合成模塊為基于谷歌、訊飛或百度的TTS語音合成引擎,語義分析模塊為基于谷歌、訊飛或百度的語義分析程序,語音識(shí)別模塊為基于谷歌、訊飛或百度的語音識(shí)別程序。超聲波傳感器、門磁、電控鎖與主板上的GP1 口相連接。門禁控制器獲取超聲波傳感器和門磁數(shù)據(jù),并控制電控鎖。
[0026]實(shí)現(xiàn)方法
參見圖5,門禁控制器啟動(dòng)后自動(dòng)運(yùn)行APP服務(wù)程序,控制器通過3G/4G模塊連接互聯(lián)網(wǎng)。門禁控制器定時(shí)獲取超聲波傳感器和門磁狀態(tài),超聲波傳感器檢測(cè)到門禁前有人逗留時(shí),系統(tǒng)自動(dòng)點(diǎn)亮觸摸顯示屏,并通過揚(yáng)聲器播放問候語音,例如“您好,歡迎光臨”。麥克風(fēng)等待接受用戶說話語音,并將用戶語音發(fā)送給聲紋識(shí)別模塊。聲紋識(shí)別模塊將用戶語音端點(diǎn)與預(yù)設(shè)的口令語音端點(diǎn)進(jìn)行對(duì)比,并返回對(duì)比結(jié)果。
[0027]預(yù)設(shè)的口令為各用戶預(yù)先通過麥克風(fēng)錄制的口令語音。對(duì)于同樣的口令短語,不同的用戶聲紋是不同的。例如張三預(yù)設(shè)的口令為“芝麻開門”,李四預(yù)設(shè)的口令為“我回來啦”。如果張三說“芝麻開門”或李四說“我回來啦”,則認(rèn)為聲紋匹配。如果張三說“西瓜開門”或“我回來啦”,又或者李四說“芝麻開門”或“我到家啦”,則認(rèn)為聲紋不匹配。
[0028]如果聲紋匹配,則門禁系統(tǒng)發(fā)送開門信號(hào)給電控鎖打開門禁。如果聲紋不匹配,則將用戶語音發(fā)送給語音識(shí)別模塊。語音識(shí)別模塊將用戶語音轉(zhuǎn)換為用戶說話內(nèi)容文本,再將用戶說話文本發(fā)送給語義分析模塊,語義分析模塊對(duì)用戶說話文本進(jìn)行分詞,并根據(jù)分詞結(jié)果檢索知識(shí)庫返回相應(yīng)答復(fù)文本。語音合成模塊將答復(fù)文本合成系統(tǒng)答復(fù)語音,再通過揚(yáng)聲器播放系統(tǒng)答復(fù)語音。
[0029]門禁系統(tǒng)提供類似于Goolge Now、Siri或Cortana這樣的語音助手與用戶進(jìn)行自然語言交流。
[0030]例如用戶說“今天天氣怎么樣”,系統(tǒng)將結(jié)合地理位置并查詢網(wǎng)絡(luò)天氣數(shù)據(jù)給出答復(fù)“麗水市今天天晴,最低溫度18攝氏度,最高溫度25攝氏度”。
[0031]例如用戶說“現(xiàn)在幾點(diǎn)鐘”,系統(tǒng)將結(jié)合時(shí)間給出答復(fù)“現(xiàn)在時(shí)間早上10點(diǎn)45分”。
[0032]系統(tǒng)還能結(jié)合自身功能給出相應(yīng)的答復(fù)。
[0033]例如用戶說“請(qǐng)開門”,系統(tǒng)將在觸摸顯示屏上顯示密碼解鎖界面,并答復(fù)“請(qǐng)說出您的口令或輸入您的密碼”。用戶可以說出自己的開門口令或在觸摸屏上輸入密碼,如果口令聲紋或密碼匹配,則系統(tǒng)發(fā)送開門信號(hào)給電控鎖打開門禁,并答復(fù)“歡迎光臨”,如果密碼不匹配,則答復(fù)“對(duì)不起,您的密碼錯(cuò)誤”。
[0034]例如用戶說“我要和主人通話”,系統(tǒng)將通過互聯(lián)網(wǎng)撥打業(yè)主的網(wǎng)絡(luò)通信號(hào)碼,并答復(fù)“正在呼叫,請(qǐng)稍候”。如果業(yè)主接聽了呼叫請(qǐng)求,則系統(tǒng)將本地用戶的圖像、聲音、視頻發(fā)送到業(yè)主的智能移動(dòng)設(shè)備上,并接收業(yè)主的圖像、聲音、視頻,開始網(wǎng)絡(luò)通話過程。如果業(yè)主未接聽或拒絕了呼叫請(qǐng)求,則系統(tǒng)答復(fù)“對(duì)不起,暫時(shí)無法接通。您是否需要留言”。
[0035]例如用戶說“我要留言”,系統(tǒng)將進(jìn)入留言模式,屏幕上顯示當(dāng)前留言時(shí)間和停止留言的按鈕,并答復(fù)“現(xiàn)在開始留言”。麥克風(fēng)、攝像頭接受用戶語音留言或視頻留言。當(dāng)用戶留言完畢,可以點(diǎn)擊觸摸顯示屏上停止留言的按鈕停止留言?;蛘弋?dāng)留言時(shí)間達(dá)到設(shè)定的時(shí)間長度,系統(tǒng)也會(huì)自動(dòng)停止留言。停止留言時(shí),系統(tǒng)將