一種基于機器語音對話的情感發(fā)泄方法及手機的制作方法
【技術(shù)領域】
[0001] 本發(fā)明涉及一種基于機器語音對話的情感發(fā)泄方法及手機,屬于醫(yī)療健康、機器 學習和移動互聯(lián)網(wǎng)技術(shù)領域。
【背景技術(shù)】
[0002] 情感狀態(tài)體現(xiàn)了也理的健康狀態(tài),目前很多人都面臨也理壓力,或多或少會出現(xiàn) 一些也理情感問題,表現(xiàn)為煩躁,焦慮,抑郁,生氣等,需要及時引導,但是該些信號,對于也 理學知識缺乏的人很難覺察,也找不到合適的發(fā)泄方式,因此借助信息技術(shù),自動監(jiān)測并提 供合適的發(fā)泄方式有利于恢復也理健康。語音包含了豐富的情感信息,是理解和檢測情感 的重要途徑,通過語音分析就可W實現(xiàn)人類情感狀態(tài)判別,進而提供合適的發(fā)泄方法。也理 學研究表明與他人激烈爭吵是一種很有效的情感發(fā)泄方法,如果局限于需要發(fā)泄情緒的人 的范圍,而不影響他人,那么為該類人提供一種可W激烈爭吵的環(huán)境是合適的。目前有通過 人與人激烈爭吵的方法來發(fā)泄情緒,但沒有發(fā)現(xiàn)人與機器激烈爭吵的情感發(fā)泄方法。
[0003] 手機是人們經(jīng)常使用的工具,能夠很方便地通過采集用戶發(fā)泄情感時的語音,通 過語音分析判別用戶的情感狀態(tài),進而提供合適的對話語音,與用戶激烈爭吵,配合用戶實 現(xiàn)情感發(fā)泄。目前國內(nèi)外還沒有發(fā)現(xiàn)通過人與手機激烈爭吵的情感發(fā)泄手機。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明要解決的技術(shù)問題是;機器能夠理解用戶發(fā)泄情感時的說話語音,并自動 生成合適的對話語音,與用戶激烈爭吵,配合用戶實現(xiàn)情感發(fā)泄。針對上述問題,本發(fā)明提 供一種基于機器語音對話的情感發(fā)泄方法及手機。
[0005] -種基于機器語音對話的情感發(fā)泄方法,其特征在于,所述方法包括步驟:
[1] 采集用戶發(fā)泄情感時的說話語音
[2] 語音情感分類,判斷用戶情感是否健康
[3] 若語音情感不健康,則利用情感發(fā)泄對話語音知識庫實現(xiàn)情感發(fā)泄對話語音知識 推理,生成合適的情感發(fā)泄對話語音,否則轉(zhuǎn)[5]
[4] 向用戶播放情感發(fā)泄對話語音
[引從音樂和幽默笑話語音知識庫中選擇音樂和幽默笑話,然后向用戶播放。
[0006] -種基于機器語音對話的情感發(fā)泄手機,其特征在于,所述的手機包括;一個語音 情感學習樣本庫,一個音樂和幽默笑話語音知識庫,一個情感發(fā)泄對話語音知識庫。手機還 包含:手機拾音器控制模塊;情感發(fā)泄用戶語音采集模塊;語音特征向量構(gòu)造模塊;語音情 感分類模型學習模塊;語音情感分類模塊;音樂和幽默笑話語音播放模塊;情感發(fā)泄對話 語音知識推理模塊;情感發(fā)泄對話語音播放模塊。其中手機拾音器控制模塊的輸出與情感 發(fā)泄用戶語音采集模塊的輸入連接;情感發(fā)泄用戶語音采集模塊的輸出與語音特征向量構(gòu) 造模塊的輸入連接;語音特征向量構(gòu)造模塊的輸出與語音情感分類模塊的輸入連接;語音 情感分類模型學習模塊的輸出與語音情感分類模塊的輸入連接;語音情感分類模塊的輸出 與音樂和幽默笑話語音播放模塊的輸入連接;語音情感分類模塊的輸出與情感發(fā)泄對話語 音知識推理模塊的輸入連接;情感發(fā)泄對話語音知識推理模塊的輸出與情感發(fā)泄對話語音 播放模塊的輸入連接。
[0007] 有益效果 與現(xiàn)有技術(shù)相比,本發(fā)明的一種基于機器語音對話的情感發(fā)泄方法及手機具有W下優(yōu) 占. ;、、、?
[1] 通過與機器實現(xiàn)情感發(fā)泄語音對話,能說出任何難聽的話而不用難為情,該樣用戶 的情感發(fā)泄更自然,更激烈,發(fā)泄效果更好;
[2] 機器只向情感需要發(fā)泄的用戶播放情感發(fā)泄對話語音,使得情感發(fā)泄更準確,發(fā)泄 效果更好;
[3] 機器對情感健康的用戶不播放情感發(fā)泄對話語音,而是播放音樂和幽默笑話,該樣 情感健康的用戶也能使用,應用更廣泛;
[4] 采用手機實現(xiàn)機器情感發(fā)泄語音對話,可W在任何時候、任何地點,例如在沒有人 的地方用語音大喊發(fā)泄情緒,使用方便。
【附圖說明】
[0008] 圖1一種基于機器語音對話的情感發(fā)泄方法的流程圖 圖2 -種基于機器語音對話的情感發(fā)泄手機的結(jié)構(gòu)圖
【具體實施方式】 本發(fā)明提出的一種基于機器語音對話的情感發(fā)泄方法,結(jié)合附圖和實施例說明如下。 如圖1所示,為一種基于機器語音對話的情感發(fā)泄方法的流程圖,該方法包括W下步驟: 第1步:通過拾音器采集用戶發(fā)泄情感時的說話語音,并保存為MP3音頻文件到本機。
[0009] 第2步;提取MP3音頻文件的語音情感特征,形成一個語音情感特征向量。語音情 感特征包括短時過零率,短時能量,基音頻率,共振峰,諧波噪聲比,MFCC參數(shù),一階MFCC參 數(shù),二階MFCC參數(shù),LPC倒譜系數(shù),線性預測系數(shù),子帶能量,和頻率中也的平均值,標準方 差,最大值,和最小值。然后采用支持向量機作為語音情感分類器,對語音情感特征向量分 類,判斷的情感類別為2類;健康(高興、梅訝和平靜),不健康(憤怒、悲傷、厭惡、恐懼)。
[0010] 支持向量機分類器需要訓練,其訓練過程包括W下步驟: ①獲取大量的情感語音文件及其情感類別,對每個語音文件抽取語音情感特征,形成語音 情感特征向量,將語音情感特征向量及其對應的情感類別作為訓練樣本。③在訓練樣本集 上訓練支持向量機分類器,保存訓練結(jié)果,W便在語音情感分類時使用。
[0011] 第3步;若用戶發(fā)泄情感時的說話語音的情感類別被分類為健康類別,則從音樂 和幽默笑話語音知識庫中選擇音樂和幽默笑話,并向用戶播放。
[0012] 本實施案例采用的音樂和幽默笑話語音知識庫的格式如下:
【主權(quán)項】
1. 一種基于機器語音對話的情感發(fā)泄方法,其特征在于包括以下步驟:[1]采集用戶 發(fā)泄情感時的說話語音;[2]語音情感分類,判斷用戶情感是否健康;[3]若語音情感不健 康,則利用情感發(fā)泄對話語音知識庫實現(xiàn)情感發(fā)泄對話語音知識推理,生成合適的情感發(fā) 泄對話語音,否則轉(zhuǎn)[5] ; [4]向用戶播放情感發(fā)泄對話語音;[5]從音樂和幽默笑話語音知 識庫中選擇音樂和幽默笑話,然后向用戶播放。
2. 根據(jù)權(quán)利要求1所述的一種基于機器語音對話的情感發(fā)泄方法,其特征在于所述 的步驟[2]通過語音情感分類,判斷情感是否健康。
3. 根據(jù)權(quán)利要求1所述的一種基于機器語音對話的情感發(fā)泄方法,其特征在于所述 的步驟[3]對不健康情感的語音,利用情感發(fā)泄對話語音知識庫實現(xiàn)情感發(fā)泄對話語音知 識推理,生成合適的情感發(fā)泄對話語音。
4. 根據(jù)權(quán)利要求1所述的一種基于機器語音對話的情感發(fā)泄方法,其特征在于所述 的步驟[3]預先建立了情感發(fā)泄對話語音知識庫,其由大量樣本組成,每個樣本包含了用 戶發(fā)泄情感時的說話語音及其對應的機器對話語音。
5. 根據(jù)權(quán)利要求1所述的一種基于機器語音對話的情感發(fā)泄方 法,其特征在于所述的步驟[3]情感發(fā)泄對話語音知識推理包括步驟: ①根據(jù)當前用戶發(fā)泄情感時的說話語音,從情感發(fā)泄對話語音知識庫中搜索最相似的k個 樣本,k為參數(shù)②從k個樣本中隨機選擇一個樣本,讀取此樣本所包含的機器對話語音作為 情感發(fā)泄對話語音知識推理的結(jié)果。
6. 根據(jù)權(quán)利要求1所述的一種基于機器語音對話的情感發(fā)泄方法,其特征在于所述 的步驟[5]對健康情感的語音,從音樂和幽默笑話語音知識庫中選擇音樂和幽默笑話,然 后播放。
7. -種基于機器語音對話的情感發(fā)泄手機,其特征在于,所述的手機包括:一個語音 情感學習樣本庫,一個音樂和幽默笑話語音知識庫,一個情感發(fā)泄對話語音知識庫;手機還 包含:手機拾音器控制模塊;情感發(fā)泄用戶語音采集模塊;語音特征向量構(gòu)造模塊;語音情 感分類模型學習模塊;語音情感分類模塊;音樂和幽默笑話語音播放模塊;情感發(fā)泄對話 語音知識推理模塊;情感發(fā)泄對話語音播放模塊,其中手機拾音器控制模塊的輸出與情感 發(fā)泄用戶語音采集模塊的輸入連接;情感發(fā)泄用戶語音采集模塊的輸出與語音特征向量構(gòu) 造模塊的輸入連接;語音特征向量構(gòu)造模塊的輸出與語音情感分類模塊的輸入連接;語音 情感分類模型學習模塊的輸出與語音情感分類模塊的輸入連接;語音情感分類模塊的輸出 與音樂和幽默笑話語音播放模塊的輸入連接;語音情感分類模塊的輸出與情感發(fā)泄對話語 音知識推理模塊的輸入連接;情感發(fā)泄對話語音知識推理模塊的輸出與情感發(fā)泄對話語音 播放模塊的輸入連接。
【專利摘要】本發(fā)明公開了一種基于機器語音對話的情感發(fā)泄方法,其特征在于包括步驟;采集用戶發(fā)泄情感時的語音;語音情感分類;若情感分類為健康,則播放音樂和幽默笑話;若情感分類為不健康,則利用情感發(fā)泄對話語音知識庫實現(xiàn)情感發(fā)泄對話語音推理,生成合適的情感發(fā)泄對話語音;播放情感發(fā)泄對話語音。本發(fā)明還公開了一種基于機器語音對話的情感發(fā)泄手機,包括:用戶發(fā)泄情感語音采集模塊,語音情感分類模塊,音樂和幽默笑話語音播放模塊,情感發(fā)泄對話語音知識推理模塊;情感發(fā)泄對話語音播放模塊。本發(fā)明效果是用戶發(fā)泄情感自然,發(fā)泄效果好。
【IPC分類】G10L25-63, H04M1-725
【公開號】CN104754110
【申請?zhí)枴緾N201310748667
【發(fā)明人】不公告發(fā)明人
【申請人】廣州華久信息科技有限公司
【公開日】2015年7月1日
【申請日】2013年12月31日