一種erp數(shù)據(jù)語音搜索方法
【專利摘要】為了提升ERP數(shù)據(jù)語音檢索的效率和便捷性,本發(fā)明提供了一種erp數(shù)據(jù)語音搜索方法。該方法包括:(1)建立可供語音搜索的ERP數(shù)據(jù)庫;(2)解析采集到的用戶查詢語音;(3)對所輸入的語音進(jìn)行喉音識別,獲得發(fā)音者的權(quán)限信息;當(dāng)權(quán)限信息有效時,得到所輸入的語音對應(yīng)的語音識別文本;(4)根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索。本發(fā)明不僅提高了檢索的效率,而且使ERP數(shù)據(jù)檢索智能化地識別了當(dāng)前查詢者的身份認(rèn)證信息并獲得了相應(yīng)的查詢權(quán)限,使用戶得到人性化的用戶體驗。
【專利說明】—種erp數(shù)據(jù)語音搜索方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)檢索領(lǐng)域。更具體地,涉及一種erp數(shù)據(jù)語音搜索方法。
【背景技術(shù)】
[0002]目前,互聯(lián)網(wǎng)和信息技術(shù)的應(yīng)用已經(jīng)深入到企業(yè)行為和個人生活的方方面面,許多企業(yè)已經(jīng)基于互聯(lián)網(wǎng)建立自己的企業(yè)應(yīng)用系統(tǒng)和網(wǎng)站,用于改善內(nèi)部管理、降低成本、提高效率,從而提升企業(yè)的競爭力;個人也可能充分享受互聯(lián)網(wǎng)和信息技術(shù)帶來的種種好處,諸如開闊視野、縮短時空距離等。更多的資訊網(wǎng)及分類生活網(wǎng)站更開辟出大量廣告版面增加企業(yè)效益。
[0003]搜索是一種在網(wǎng)絡(luò)上應(yīng)用的具有大數(shù)據(jù)量的軟件系統(tǒng)通常具有的功能,其以一定的策略在網(wǎng)絡(luò)上搜集和發(fā)現(xiàn)信息,并在對信息進(jìn)行處理和組織后,為用戶提供互聯(lián)網(wǎng)上的信息搜索服務(wù)。
[0004]隨著ERP系統(tǒng)的發(fā)展,ERP系統(tǒng)的網(wǎng)絡(luò)上的數(shù)據(jù)總量在以爆炸式的速度增長。一方面,搜索無疑是幫助人們快速找到所需數(shù)據(jù)資源的一種重要方式。另一方面,隨著語音識別技術(shù)的應(yīng)用,語音搜索也逐漸成為搜索方式的發(fā)展趨勢之一。
[0005]一些相關(guān)技術(shù)方案已經(jīng)提出用于這種數(shù)據(jù)搜索方案。例如,申請?zhí)枮?00510034210.3的中國專利申請公開了一種基于INTERNET的多語鐘語音域名和語音搜索方法,其基于Internet的域名解釋技術(shù),語音識別(ASR)技術(shù),語音合成(TTS)技術(shù),結(jié)合了 Internet、語音CODEC、視頻C0DEC、TCP/IP、數(shù)據(jù)庫技術(shù)和軟件技術(shù)的多語種因特網(wǎng)語音訪問及搜索系統(tǒng),根據(jù)用戶用語音發(fā)出目標(biāo)網(wǎng)站或其它平臺的名稱后直達(dá)訪問,用語音發(fā)出搜索網(wǎng)站的名稱到達(dá)搜索站,并發(fā)出搜索關(guān)鍵詞語音,完成目標(biāo)搜索。
[0006]然而,現(xiàn)有搜索在網(wǎng)絡(luò)上對語音的搜索效率還不能令人滿意。
[0007]此外,對于ERP這種復(fù)雜龐大的系統(tǒng)來說,語音搜索多數(shù)情況下仍然依賴于使用ERP系統(tǒng)自身的權(quán)限管理模塊實(shí)現(xiàn)權(quán)限管理,面對不同的使用者使用查詢和數(shù)據(jù)搜索功能時,必須退出當(dāng)前用戶的系統(tǒng)并讓其他人重新其自身的身份登陸到系統(tǒng)中。這給使用者帶來了極大的不便。尤其是在登陸手機(jī)端等鍵盤或點(diǎn)擊操作方式不便輸入的客戶界面時,這種低效率的問題就更加明顯。
【發(fā)明內(nèi)容】
[0008]為了克服現(xiàn)有技術(shù)的上述不足,本發(fā)明提供了一種erp數(shù)據(jù)語音搜索方法。該方法包括:
[0009](I)建立可供語音搜索的ERP數(shù)據(jù)庫;
[0010](2)解析采集到的用戶查詢語音;
[0011](3)對所輸入的語音進(jìn)行喉音識別,獲得發(fā)音者的權(quán)限信息;當(dāng)權(quán)限信息有效時,得到所輸入的語音對應(yīng)的語音識別文本;
[0012](4)根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索。
[0013]進(jìn)一步地,所述建立可供語音搜索的ERP數(shù)據(jù)庫進(jìn)一步包括:
[0014]獲取ERP數(shù)據(jù)的標(biāo)引信息和屬性信息;
[0015]關(guān)聯(lián)所述標(biāo)引信息和屬性信息,建立ERP數(shù)據(jù)索引。
[0016]進(jìn)一步地,所述獲取ERP數(shù)據(jù)的標(biāo)引信息,具體包括:
[0017]將原始的ERP數(shù)據(jù)變換為預(yù)設(shè)的編碼格式;
[0018]對變換后的ERP數(shù)據(jù)內(nèi)容方面和文件大小方面標(biāo)引;
[0019]對所述內(nèi)容方面的標(biāo)弓丨找出關(guān)鍵詞。
[0020]進(jìn)一步地,所述關(guān)鍵詞為動詞。
[0021]進(jìn)一步地,所述關(guān)鍵詞為出現(xiàn)頻次高的名詞。
[0022]進(jìn)一步地,所述ERP數(shù)據(jù)還包括語音數(shù)據(jù)。
[0023]進(jìn)一步地,獲得ERP數(shù)據(jù)的標(biāo)引信息包括獲得語音數(shù)據(jù)的標(biāo)引信息,具體包括:
[0024]獲取識別路徑和所述識別路徑對應(yīng)的語音識別文本;
[0025]獲得語音識別文本中的人名信息,并對人名信息進(jìn)行標(biāo)引;
[0026]獲得語音識別文本中的關(guān)鍵詞。
[0027]進(jìn)一步地,所述屬性信息包括ERP數(shù)據(jù)中的以往檢索者信息權(quán)限信息。
[0028]進(jìn)一步地,所述得到對應(yīng)的語音識別文本,具體包括:
[0029]獲得解析采集到的用戶查詢語音的結(jié)果;
[0030]將上述結(jié)果進(jìn)行區(qū)間劃分;
[0031]對每個區(qū)間音頻信號分別進(jìn)行語音識別獲得段識別文本;
[0032]拼接每個區(qū)間音頻信號的所述段識別文本得到所述語音識別文本。
[0033]進(jìn)一步地,所述根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索,具體包括:
[0034]根據(jù)所述屬性信息,在ERP數(shù)據(jù)庫中查找低于語音輸入者權(quán)限的信息。
[0035]本發(fā)明的有益效果如下:基于使用者輸入的語音信息,ERP數(shù)據(jù)檢索智能化地識別了當(dāng)前查詢者的身份認(rèn)證信息并獲得了相應(yīng)的查詢權(quán)限。而且,在建立高頻動詞、名詞和人名的索引這種高效率檢索索引的基礎(chǔ)上將待檢索的數(shù)據(jù)范圍按照權(quán)限進(jìn)行了縮小,提高了搜索效率。在會議或移動辦公場合中,本發(fā)明提供的搜索技術(shù)具有免于用戶身份切換的極其人性化的用戶體驗。
【專利附圖】
【附圖說明】
[0036]圖1示出了本發(fā)明的語音搜索方法的流程圖。
【具體實(shí)施方式】
[0037]下面將結(jié)合本發(fā)明的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0038]如圖1所示,根據(jù)優(yōu)選的實(shí)施例的ERP數(shù)據(jù)語音搜索方法包括以下步驟:
[0039]步驟100:建立可供語音搜索的ERP數(shù)據(jù)庫;
[0040]步驟200:解析采集到的用戶查詢語音;
[0041]步驟300:對所輸入的語音進(jìn)行喉音識別,獲得發(fā)音者的權(quán)限信息;當(dāng)權(quán)限信息有效時,得到所輸入的語音對應(yīng)的語音識別文本;
[0042]步驟400:根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索。
[0043]所述建立可供語音搜索的ERP數(shù)據(jù)庫進(jìn)一步包括:獲取ERP數(shù)據(jù)的標(biāo)引信息和屬性信息;
[0044]關(guān)聯(lián)所述標(biāo)引信息和屬性信息,建立ERP數(shù)據(jù)索引。
[0045]所述獲取ERP數(shù)據(jù)的標(biāo)引信息,具體包括:
[0046]首先,將原始的ERP數(shù)據(jù)變換為預(yù)設(shè)的編碼格式。將從不同信號源獲取的ERP數(shù)據(jù)變換到預(yù)設(shè)的格式。這里,不同信號源主要包括兩個方面:一是通過ERP系統(tǒng)直接錄入的信息;二是通過ERP系統(tǒng)的數(shù)據(jù)接口從外部導(dǎo)入的信息。在此,要被預(yù)設(shè)的格式主要包括采樣率和存儲格式。例如,將ERP數(shù)據(jù)文件B、C、D中的語音數(shù)據(jù)轉(zhuǎn)換成待混音以發(fā)送給宿客戶端A的16k采樣率、單聲道的PCM數(shù)據(jù);將ERP數(shù)據(jù)文件A、C、D的語音數(shù)據(jù)轉(zhuǎn)換成待混音以發(fā)送給宿客戶端B的Ilk采樣率、單聲道的PCM數(shù)據(jù)^fERP數(shù)據(jù)文件A、B、D的語音數(shù)據(jù)轉(zhuǎn)換成待混音以發(fā)送給宿客戶端C的22k采樣率、雙聲道的PCM數(shù)據(jù);或者是,將ERP數(shù)據(jù)文件A、B、C的語音數(shù)據(jù)轉(zhuǎn)換成待混音以發(fā)送給宿客戶端D的44k采樣率、雙聲道的PCM數(shù)據(jù)。
[0047]然后,對變換后的ERP數(shù)據(jù)內(nèi)容方面和文件大小方面標(biāo)引。在這一步驟中,要檢測每個ERP數(shù)據(jù)字段或者ERP數(shù)據(jù)文件的大小,并且從語音文件名中提取內(nèi)容方面的信息,例如:“2014年零售部上半年業(yè)績總結(jié)大會會議記錄”、“人力資源管理能力培訓(xùn)系列講座(一)”、“申請增開廣州黃浦區(qū)物流中心的報文”等等。
[0048]最后,對所述內(nèi)容方面的標(biāo)引找出關(guān)鍵詞。所述關(guān)鍵詞為動詞或者出現(xiàn)頻次高的名詞。根據(jù)上面的例子,這里的關(guān)鍵詞可以選為“總結(jié)”、“講座”、“增開”、“物流中心”等。每個ERP數(shù)據(jù)字段或者ERP數(shù)據(jù)文件對應(yīng)的關(guān)鍵詞的數(shù)量至少為一個。
[0049]所述ERP數(shù)據(jù)還包括語音數(shù)據(jù)。例如,上述ERP實(shí)例中就包括了 “2014年零售部上半年業(yè)績總結(jié)大會會議記錄”這種語音信息記錄。對于這類信息,獲得ERP數(shù)據(jù)的標(biāo)引信息包括獲得語音數(shù)據(jù)的標(biāo)引信息,具體包括:獲取識別路徑和所述識別路徑對應(yīng)的語音識別文本;
[0050]獲得語音識別文本中的人名信息,并對人名信息進(jìn)行標(biāo)引;獲得語音識別文本中的關(guān)鍵詞。
[0051]在本發(fā)明的另一個實(shí)施例中,在上述獲取識別路徑和所述識別路徑對應(yīng)的語音識別文本的步驟中,利用自動連續(xù)語音識別方法,得到語音識別的前M條優(yōu)選識別路徑,以及每條路徑對應(yīng)的識別結(jié)果。在獲得語音識別文本中的人名信息步驟中,獲取人名信息。然后,將上述識別結(jié)果和人名信息進(jìn)行信息匹配融合,并按照得分規(guī)則選擇匹配得分最高的結(jié)果作為語音識別文本。
[0052]對于語音數(shù)據(jù),所述屬性信息包括ERP數(shù)據(jù)中的以往檢索者信息權(quán)限信息。這樣,在上述得到對應(yīng)的語音識別文本的步驟中,具體包括:接收來自客戶端的音頻信號,并進(jìn)行解碼。
[0053]可將音頻解碼為PCM格式;將解碼后的音頻信號根據(jù)靜音進(jìn)行端點(diǎn)檢測,從而將連續(xù)的音頻信號切分為幾段;將每段音頻分別送入到分布式連續(xù)語音識別引擎中,并行進(jìn)行語音識別的處理;回收所有并行處理的語音識別的結(jié)果片段,并拼接得到完整的語音識別結(jié)果。
[0054]在具體查找的過程中,文本搜索范圍基于權(quán)限識別的結(jié)果。也就是說,所述根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索是根據(jù)所述屬性信息,在ERP數(shù)據(jù)庫中查找低于語音輸入者權(quán)限的信息。這樣,搜索范圍被合理地縮小,在海量數(shù)據(jù)中極大地提高了搜索效率。
[0055]根據(jù)本發(fā)明的實(shí)施例,上述屬性信息可以被通過如下的方式獲得:對語音識別的文本結(jié)果進(jìn)行語義理解,觸發(fā)對ERP數(shù)據(jù)的搜索命令,并將搜索結(jié)果返回給用戶,語音識別的文本結(jié)果作為查詢文本,對文本進(jìn)行語義理解是指對提取文本中關(guān)鍵的、有意義的詞,作為查詢檢索的查詢詞。
[0056]本步驟提供兩種提取查詢詞的方法,一種是基于屬性的查詢詞提取,另一種是基于實(shí)體、概念的查詢詞的抽取。觸發(fā)對ERP數(shù)據(jù)的知識庫的搜索命令,并將搜索結(jié)果返回給用戶,其具體包括:基于預(yù)定義的屬性詞典和用戶查詢語法規(guī)則提取語音識別的文本結(jié)果中的屬性信息。
[0057]對于屬性信息進(jìn)行擴(kuò)展,得到擴(kuò)展后的屬性信息。所述的擴(kuò)展主要是根據(jù)知識圖譜進(jìn)行同義詞、相關(guān)詞等的擴(kuò)展。
[0058]從語音識別的文本結(jié)果中抽取實(shí)體、概念等關(guān)鍵詞信息。利用機(jī)器學(xué)習(xí)的方法從海量的語料中學(xué)習(xí)到實(shí)體、概念等關(guān)鍵詞信息。再利用這些信息從語音識別的文本結(jié)果中抽取實(shí)體、概念等關(guān)鍵詞。
[0059]對關(guān)鍵詞信息進(jìn)行擴(kuò)展,得到擴(kuò)展后的關(guān)鍵詞信息。所述的擴(kuò)展主要是根據(jù)知識圖譜進(jìn)行同義詞、相關(guān)詞等的擴(kuò)展。
[0060]利用屬性信息從ERP數(shù)據(jù)的知識庫中進(jìn)行屬性搜索,得到基于元數(shù)據(jù)的搜索結(jié)果O
[0061]利用關(guān)鍵詞信息并從ERP數(shù)據(jù)的知識庫中進(jìn)行關(guān)鍵詞搜索,得到基于關(guān)鍵詞的搜索結(jié)果;
[0062]對基于屬性的搜索結(jié)果和基于關(guān)鍵詞的搜索結(jié)果融合,得到最終的搜索結(jié)果,并將結(jié)果返回給用戶。
[0063]本發(fā)明中,喉音是指用戶在發(fā)音時喉部產(chǎn)生的振動,其與普通的語音區(qū)別在于沒有考慮聲道和鼻腔發(fā)音。
[0064]盡管已經(jīng)顯示并描述了本發(fā)明的示例性實(shí)施例,但是本領(lǐng)域的技術(shù)人員應(yīng)該理解,在不脫離本發(fā)明的原理和精神的情況下,可對這些實(shí)施例進(jìn)行各種改變。本發(fā)明的范圍由所附的權(quán)利要求和等同物所限定。
【權(quán)利要求】
1.一種erp數(shù)據(jù)語音搜索方法,其特征在于,該方法包括: (1)建立可供語音搜索的ERP數(shù)據(jù)庫; (2)解析采集到的用戶查詢語音; (3)對所輸入的語音進(jìn)行喉音識別,獲得發(fā)音者的權(quán)限信息;當(dāng)權(quán)限信息有效時,得到所輸入的語音對應(yīng)的語音識別文本; (4)根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述建立可供語音搜索的ERP數(shù)據(jù)庫進(jìn)一步包括: 獲取ERP數(shù)據(jù)的標(biāo)引信息和屬性信息; 關(guān)聯(lián)所述標(biāo)引信息和屬性信息,建立ERP數(shù)據(jù)索引。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述獲取ERP數(shù)據(jù)的標(biāo)引信息,具體包括: 將原始的ERP數(shù)據(jù)變換為預(yù)設(shè)的編碼格式; 對變換后的ERP數(shù)據(jù)內(nèi)容方面和文件大小方面標(biāo)引; 對所述內(nèi)容方面的標(biāo)引找出關(guān)鍵詞。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述關(guān)鍵詞為動詞。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述關(guān)鍵詞為出現(xiàn)頻次高的名詞。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述ERP數(shù)據(jù)還包括語音數(shù)據(jù)。
7.根據(jù)權(quán)利要求2所述的方法,其特征在于,獲得ERP數(shù)據(jù)的標(biāo)引信息包括獲得語音數(shù)據(jù)的標(biāo)引信息,具體包括: 獲取識別路徑和所述識別路徑對應(yīng)的語音識別文本; 獲得語音識別文本中的人名信息,并對人名信息進(jìn)行標(biāo)引; 獲得語音識別文本中的關(guān)鍵詞。
8.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述屬性信息包括ERP數(shù)據(jù)中的以往檢索者信息權(quán)限信息。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述得到所輸入的對應(yīng)的語音識別文本,具體包括: 獲得解析采集到的用戶查詢語音的結(jié)果; 將上述結(jié)果進(jìn)行區(qū)間劃分; 對每個區(qū)間音頻信號分別進(jìn)行語音識別獲得段識別文本; 拼接每個區(qū)間音頻信號的所述段識別文本得到所述語音識別文本。
10.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述語音識別文本對所述ERP數(shù)據(jù)庫進(jìn)行ERP數(shù)據(jù)搜索,具體包括: 根據(jù)所述屬性信息,在ERP數(shù)據(jù)庫中查找低于語音輸入者權(quán)限的信息。
【文檔編號】G06F17/30GK104199956SQ201410471323
【公開日】2014年12月10日 申請日期:2014年9月16日 優(yōu)先權(quán)日:2014年9月16日
【發(fā)明者】曹毅 申請人:成都博智維訊信息技術(shù)有限公司