本申請(qǐng)涉及電子設(shè)備,特別涉及一種語(yǔ)音處理方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備。
背景技術(shù):
1、隨著技術(shù)的發(fā)展,越來(lái)越多的電子設(shè)備中搭載有語(yǔ)音助手,用戶可以通過(guò)語(yǔ)音與語(yǔ)音助手進(jìn)行智能交互,極大方便用戶的日常生活,比如用戶通過(guò)語(yǔ)音可以控制語(yǔ)音助手幫助用戶打電話、播放音樂(lè)、查詢天氣、控制智能家居等,但是在用戶和語(yǔ)音助手交互的場(chǎng)景中,語(yǔ)音助手經(jīng)常會(huì)接收到一些無(wú)效語(yǔ)音信息,比如:噪音、背景音、非用戶交互產(chǎn)生的語(yǔ)音信息等,相關(guān)技術(shù)中,不能準(zhǔn)確識(shí)別無(wú)效的語(yǔ)音信息,而對(duì)無(wú)效的語(yǔ)音信息進(jìn)行回復(fù),容易對(duì)用戶產(chǎn)生打擾,影響用戶的使用體驗(yàn)。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)實(shí)施例提供一種語(yǔ)音處理方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備,能夠提高識(shí)別無(wú)效語(yǔ)音信息的準(zhǔn)確性,進(jìn)而不回復(fù)無(wú)效的語(yǔ)音信息,減少對(duì)用戶的打擾。
2、第一方面,本申請(qǐng)實(shí)施例提供一種語(yǔ)音處理方法,所述方法包括:
3、獲取語(yǔ)音信息;
4、將所述語(yǔ)音信息輸入語(yǔ)音識(shí)別模型,得到所述語(yǔ)音信息對(duì)應(yīng)的識(shí)別文本,以及所述識(shí)別文本的置信度;
5、將所述語(yǔ)音信息和所述識(shí)別文本輸入語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率;
6、根據(jù)所述置信度和所述概率,確定是否回復(fù)所述語(yǔ)音信息。
7、第二方面,本申請(qǐng)實(shí)施例提供一種的語(yǔ)音處理裝置,所述裝置包括:
8、第一獲取模塊,用于獲取語(yǔ)音信息;
9、第二獲取模塊,用于將所述語(yǔ)音信息輸入語(yǔ)音識(shí)別模型,得到所述語(yǔ)音信息對(duì)應(yīng)的識(shí)別文本,以及所述識(shí)別文本的置信度;
10、第三獲取模塊,用于將所述語(yǔ)音信息和所述識(shí)別文本輸入語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率;
11、確定模塊,用于根據(jù)所述置信度和所述概率,確定是否回復(fù)所述語(yǔ)音信息。
12、第三方面,本申請(qǐng)實(shí)施例提供一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí),使得所述計(jì)算機(jī)執(zhí)行本申請(qǐng)實(shí)施例提供的方法。
13、第四方面,本申請(qǐng)實(shí)施例還提供一種電子設(shè)備,包括存儲(chǔ)器,處理器,所述處理器通過(guò)調(diào)用所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序,用于執(zhí)行本申請(qǐng)實(shí)施例提供的方法。
14、本申請(qǐng)實(shí)施例的語(yǔ)音處理方法,一方面,通過(guò)語(yǔ)音識(shí)別模型得到該語(yǔ)音信息轉(zhuǎn)換成識(shí)別文本的置信性,可以理解的,若語(yǔ)音信息轉(zhuǎn)換成識(shí)別文本的置信度越高,則說(shuō)明獲取的語(yǔ)音信息清晰且語(yǔ)音信息的語(yǔ)義表達(dá)清楚,那么獲取的語(yǔ)音信息是噪音或背景音的可能性較小,若語(yǔ)音信息轉(zhuǎn)換成識(shí)別文本的置信度越低,則說(shuō)明獲取的語(yǔ)音信息越模糊不清或者語(yǔ)音信息的語(yǔ)義表達(dá)不清楚,那么獲取的語(yǔ)音信息是噪音或背景音的可能性則較大。另一方面,通過(guò)語(yǔ)音評(píng)價(jià)模型可以判斷該語(yǔ)音信息為與用戶交互產(chǎn)生的概率,若概率越高,則說(shuō)明該語(yǔ)音信息是用戶與語(yǔ)音助手交互產(chǎn)生的可能性越高,若概率越低,則說(shuō)明該語(yǔ)音信息不是用戶與語(yǔ)音助手進(jìn)行交互產(chǎn)生的可能性越高。本申請(qǐng)實(shí)施例綜合考慮了該語(yǔ)音信息轉(zhuǎn)換成識(shí)別文本的置信度、以及該語(yǔ)音信息為與用戶交互產(chǎn)生的概率,以共同確定所述語(yǔ)音信息是否為無(wú)效語(yǔ)音信息,從而能夠更加準(zhǔn)確識(shí)別出無(wú)效語(yǔ)音信息,若為有效的語(yǔ)音信息,則回復(fù)該語(yǔ)音信息,若為無(wú)效語(yǔ)音信息,則不回復(fù)該語(yǔ)音信息,比如可以將模糊不清的語(yǔ)音信息、或者不是用戶與語(yǔ)音助手交互產(chǎn)生的語(yǔ)音信息確定為無(wú)效語(yǔ)音信息,不對(duì)這些無(wú)效語(yǔ)音信息進(jìn)行回復(fù),因此也提高了對(duì)無(wú)效語(yǔ)音信息的召回率,更好地避免了對(duì)用戶的干擾,同時(shí)也減少了回復(fù)無(wú)效語(yǔ)音信息造成對(duì)服務(wù)資源的占用,提升了用戶使用電子設(shè)備中語(yǔ)音助手的流暢度,提升用戶的使用體驗(yàn)。
1.一種語(yǔ)音處理方法,應(yīng)用于電子設(shè)備,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,其特征在于,所述根據(jù)所述置信度和所述概率,確定是否回復(fù)所述語(yǔ)音信息包括:
3.根據(jù)權(quán)利要求2所述的語(yǔ)音處理方法,其特征在于,在所述將所述語(yǔ)音信息和所述識(shí)別文本輸入語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率時(shí),所述方法還包括:
4.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,其特征在于,所述確定是否回復(fù)所述語(yǔ)音信息之后,所述方法還包括:
5.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,其特征在于,所述將所述語(yǔ)音信息和所述識(shí)別文本輸入語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率包括:
6.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,其特征在于,所述將所述語(yǔ)音信息和所述識(shí)別文本輸入所述語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率包括:
7.根據(jù)權(quán)利要求1所述的語(yǔ)音處理方法,其特征在于,所述將所述語(yǔ)音信息和所述識(shí)別文本輸入所述語(yǔ)音評(píng)價(jià)模型,得到所述語(yǔ)音信息為與用戶交互產(chǎn)生的概率包括:
8.一種語(yǔ)音處理裝置,其特征在于,所述裝置包括:
9.一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí),使得所述計(jì)算機(jī)執(zhí)行如權(quán)利要求1至7中任一項(xiàng)所述的方法。
10.一種電子設(shè)備,包括存儲(chǔ)器,處理器,其特征在于,所述處理器通過(guò)調(diào)用所述存儲(chǔ)器中存儲(chǔ)的計(jì)算機(jī)程序,用于執(zhí)行如權(quán)利要求1至7中任一項(xiàng)所述的方法。