一種信息處理方法、服務(wù)器和用戶(hù)設(shè)備的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及電子技術(shù)領(lǐng)域,尤其涉及一種信息處理方法、服務(wù)器和用戶(hù)設(shè)備。
【背景技術(shù)】
[0002]從前,用戶(hù)為了搜索一首歌曲,需要在搜索引擎中輸入正確的歌曲名或者一段歌詞。然而,有時(shí)候用戶(hù)并不知道歌曲名或者歌詞。例如:用戶(hù)希望將當(dāng)前聽(tīng)到正在播放一首歌曲下載到手機(jī)中,但是卻不知道歌曲名;或者僅僅能哼唱出歌曲中某一段等。
[0003]隨時(shí)音頻識(shí)別技術(shù)的發(fā)展,現(xiàn)在音樂(lè)播放器軟件已經(jīng)可以根據(jù)錄制的音頻,識(shí)別出音頻對(duì)應(yīng)的歌曲,并將歌曲名提供給用戶(hù)。具體來(lái)講,為了識(shí)別音頻,音樂(lè)播放器軟件需要先錄制一定時(shí)間的音頻,如10秒、12秒等,然后再將錄制的音頻發(fā)送到服務(wù)器進(jìn)行識(shí)別。然而,這樣的識(shí)別過(guò)程效率較低。
【發(fā)明內(nèi)容】
[0004]本申請(qǐng)實(shí)施例提供了一種信息處理方法、服務(wù)器和用戶(hù)設(shè)備,用于減少音頻識(shí)別過(guò)程的耗時(shí),提高識(shí)別效率。
[0005]第一方面,本申請(qǐng)?zhí)峁┝艘环N信息處理方法,包括:
[0006]接收用戶(hù)設(shè)備發(fā)送的待識(shí)別音頻流;
[0007]在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成接收所述待識(shí)別音頻流的時(shí)刻之前。
[0008]可選的,在接收所述待識(shí)別音頻流的同時(shí),所述方法還包括:
[0009]獲取在所述第一時(shí)刻之后,且在第二時(shí)刻之前接收的第二部分待識(shí)別音頻,其中,所述第二時(shí)刻為所述第一時(shí)刻之后;
[0010]基于所述第二部分待識(shí)別音頻以及所述第一匹配結(jié)果,獲取第二匹配結(jié)果。
[0011]可選的,基于所述第二部分待識(shí)別音頻以及所述第一匹配結(jié)果,獲取第二匹配結(jié)果,包括:
[0012]基于所述第一部分待識(shí)別音頻和所述第二部分待識(shí)別音頻在所述特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第二次匹配,以獲得第三匹配結(jié)果;
[0013]基于所述第二部分待識(shí)別音頻,在所述第一匹配結(jié)果中進(jìn)行匹配,以從所述第一匹配結(jié)果中篩選出與所述第二部分待識(shí)別音頻匹配的第四匹配結(jié)果;
[0014]從所述第三匹配結(jié)果和所述第四匹配結(jié)果中,確定匹配度滿(mǎn)足預(yù)設(shè)條件的匹配結(jié)果為所述第二匹配結(jié)果。
[0015]可選的,基于所述第一部分待識(shí)別音頻和所述第二部分待識(shí)別音頻在所述特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第二次匹配,以獲得第三匹配結(jié)果,包括:
[0016]判斷在所述第二時(shí)刻所述第一次匹配是否遍歷完所述特征數(shù)據(jù)庫(kù);
[0017]當(dāng)所述第一次匹配未遍歷完所述特征數(shù)據(jù)庫(kù)時(shí),終止所述第一次匹配;
[0018]基于所述第一部分待識(shí)別音頻以及所述第二部分待識(shí)別音頻,從所述特征數(shù)據(jù)庫(kù)的第一位置開(kāi)始進(jìn)行所述第二次匹配,以獲得所述第三匹配結(jié)果;其中,所述第一位置為所述第二時(shí)刻所述第一次匹配終止時(shí)在所述特征數(shù)據(jù)庫(kù)中的位置。
[0019]可選的,基于所述第二部分待識(shí)別音頻以及所述第一匹配結(jié)果,獲取第二匹配結(jié)果,包括:
[0020]基于所述第二部分待識(shí)別音頻在所述第一匹配結(jié)果中開(kāi)始進(jìn)行匹配,以獲得所述第二匹配結(jié)果。
[0021]可選的,所述第二匹配結(jié)果包括所述待識(shí)別音頻流對(duì)應(yīng)歌曲的歌曲名,以及所述第二部分待識(shí)別音頻在所述歌曲中的偏移位置,在獲取第二匹配結(jié)果之后,還包括:
[0022]基于所述歌曲名,從所述特征數(shù)據(jù)庫(kù)對(duì)應(yīng)的歌曲數(shù)據(jù)庫(kù)中獲得所述歌曲;
[0023]將所述偏移位置和所述歌曲發(fā)送給所述用戶(hù)設(shè)備,以使所述用戶(hù)設(shè)備從所述偏移位置播放所述歌曲;或者
[0024]將所述歌曲在所述偏移位置之后的剩余部分發(fā)送給所述用戶(hù)設(shè)備。
[0025]第二方面,本申請(qǐng)?zhí)峁┝艘环N信息處理方法,包括:
[0026]通過(guò)音頻輸入裝置錄制待識(shí)別音頻流;
[0027]在錄制所述待識(shí)別音頻流的同時(shí),將所述待識(shí)別音頻流發(fā)送到服務(wù)器,以使所述服務(wù)器在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成錄制所述待識(shí)別音頻流的時(shí)刻之前。
[0028]第三方面,本申請(qǐng)?zhí)峁┝艘环N服務(wù)器,包括:
[0029]接收器,用于接收用戶(hù)設(shè)備發(fā)送的待識(shí)別音頻流;
[0030]處理器,用于在所述接收器接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成接收所述待識(shí)別音頻流的時(shí)刻之前。
[0031]可選的,在所述接收器接收所述待識(shí)別音頻流的同時(shí),所述處理器還用于獲取在所述第一時(shí)刻之后,且在第二時(shí)刻之前接收的第二部分待識(shí)別音頻,其中,所述第二時(shí)刻為所述第一時(shí)刻之后;基于所述第二部分待識(shí)別音頻以及所述第一匹配結(jié)果,獲取第二匹配結(jié)果。
[0032]可選的,所述處理器用于基于所述第一部分待識(shí)別音頻和所述第二部分待識(shí)別音頻在所述特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第二次匹配,以獲得第三匹配結(jié)果;基于所述第二部分待識(shí)別音頻,在所述第一匹配結(jié)果中進(jìn)行匹配,以從所述第一匹配結(jié)果中篩選出與所述第二部分待識(shí)別音頻匹配的第四匹配結(jié)果;從所述第三匹配結(jié)果和所述第四匹配結(jié)果中,確定匹配度滿(mǎn)足預(yù)設(shè)條件的匹配結(jié)果為所述第二匹配結(jié)果。
[0033]可選的,所述服務(wù)器用于判斷在所述第二時(shí)刻所述第一次匹配是否遍歷完所述特征數(shù)據(jù)庫(kù);當(dāng)所述第一次匹配未遍歷完所述特征數(shù)據(jù)庫(kù)時(shí),終止所述第一次匹配;基于所述第一部分待識(shí)別音頻以及所述第二部分待識(shí)別音頻,從所述特征數(shù)據(jù)庫(kù)的第一位置開(kāi)始進(jìn)行所述第二次匹配,以獲得所述第三匹配結(jié)果;其中,所述第一位置為所述第二時(shí)刻所述第一次匹配終止時(shí)在所述特征數(shù)據(jù)庫(kù)中的位置。
[0034]可選的,所述處理器用于基于所述第二部分待識(shí)別音頻在所述第一匹配結(jié)果中開(kāi)始進(jìn)行匹配,以獲得所述第二匹配結(jié)果。
[0035]可選的,所述第二匹配結(jié)果包括所述待識(shí)別音頻流對(duì)應(yīng)歌曲的歌曲名,以及所述第二部分待識(shí)別音頻在所述歌曲中的偏移位置,所述處理器還用于在獲取第二匹配結(jié)果之后,基于所述歌曲名,從所述特征數(shù)據(jù)庫(kù)對(duì)應(yīng)的歌曲數(shù)據(jù)庫(kù)中獲得所述歌曲;
[0036]所述服務(wù)器還包括:
[0037]發(fā)送器,用于將所述偏移位置和所述歌曲發(fā)送給所述用戶(hù)設(shè)備,以使所述用戶(hù)設(shè)備從所述偏移位置播放所述歌曲;或者將所述歌曲在所述偏移位置之后的剩余部分發(fā)送給所述用戶(hù)設(shè)備。
[0038]第四方面,本申請(qǐng)?zhí)峁┝艘环N用戶(hù)設(shè)備,包括:
[0039]音頻輸入裝置,用于錄制待識(shí)別音頻流;
[0040]發(fā)送器,用于在錄制所述待識(shí)別音頻流的同時(shí),將所述待識(shí)別音頻流發(fā)送到服務(wù)器,以使所述服務(wù)器在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成錄制所述待識(shí)別音頻流的時(shí)刻之前。
[0041]第五方面,本申請(qǐng)?zhí)峁┝艘环N服務(wù)器,包括:
[0042]接收單元,用于接收用戶(hù)設(shè)備發(fā)送的待識(shí)別音頻流;
[0043]第一匹配單元,用于在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成接收所述待識(shí)別音頻流的時(shí)刻之前。
[0044]可選的,所述服務(wù)器還包括:
[0045]獲取單元,用于在接收所述待識(shí)別音頻流的同時(shí),獲取在所述第一時(shí)刻之后,且在第二時(shí)刻之前接收的第二部分待識(shí)別音頻,其中,所述第二時(shí)刻為所述第一時(shí)刻之后;
[0046]第二匹配單元,用于基于所述第二部分待識(shí)別音頻以及所述第一匹配結(jié)果,獲取第二匹配結(jié)果。
[0047]可選的,所述第二匹配單元用于基于所述第一部分待識(shí)別音頻和所述第二部分待識(shí)別音頻在所述特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第二次匹配,以獲得第三匹配結(jié)果;基于所述第二部分待識(shí)別音頻,在所述第一匹配結(jié)果中進(jìn)行匹配,以從所述第一匹配結(jié)果中篩選出與所述第二部分待識(shí)別音頻匹配的第四匹配結(jié)果;從所述第三匹配結(jié)果和所述第四匹配結(jié)果中,確定匹配度滿(mǎn)足預(yù)設(shè)條件的匹配結(jié)果為所述第二匹配結(jié)果。
[0048]可選的,所述第二匹配單元用于判斷在所述第二時(shí)刻所述第一次匹配是否遍歷完所述特征數(shù)據(jù)庫(kù);當(dāng)所述第一次匹配未遍歷完所述特征數(shù)據(jù)庫(kù)時(shí),終止所述第一次匹配;基于所述第一部分待識(shí)別音頻以及所述第二部分待識(shí)別音頻,從所述特征數(shù)據(jù)庫(kù)的第一位置開(kāi)始進(jìn)行所述第二次匹配,以獲得所述第三匹配結(jié)果;其中,所述第一位置為所述第二時(shí)刻所述第一次匹配終止時(shí)在所述特征數(shù)據(jù)庫(kù)中的位置。
[0049]可選的,所述第二匹配單元用于基于所述第二部分待識(shí)別音頻在所述第一匹配結(jié)果中開(kāi)始進(jìn)行匹配,以獲得所述第二匹配結(jié)果。
[0050]可選的,所述第二匹配結(jié)果包括所述待識(shí)別音頻流對(duì)應(yīng)歌曲的歌曲名,以及所述第二部分待識(shí)別音頻在所述歌曲中的偏移位置,所述服務(wù)器還包括:
[0051]獲得單元,用于基于所述歌曲名,從所述特征數(shù)據(jù)庫(kù)對(duì)應(yīng)的歌曲數(shù)據(jù)庫(kù)中獲得所述歌曲;
[0052]第一發(fā)送單元,用于將所述偏移位置和所述歌曲發(fā)送給所述用戶(hù)設(shè)備,以使所述用戶(hù)設(shè)備從所述偏移位置播放所述歌曲;或者將所述歌曲在所述偏移位置之后的剩余部分發(fā)送給所述用戶(hù)設(shè)備。
[0053]第六方面,本申請(qǐng)?zhí)峁┝艘环N用戶(hù)設(shè)備,包括:
[0054]錄制單元,用于通過(guò)音頻輸入裝置錄制待識(shí)別音頻流;
[0055]第二發(fā)送單元,用于在錄制所述待識(shí)別音頻流的同時(shí),將所述待識(shí)別音頻流發(fā)送到服務(wù)器,以使所述服務(wù)器在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成錄制所述待識(shí)別音頻流的時(shí)刻之前。
[0056]本申請(qǐng)實(shí)施例中的上述一個(gè)或多個(gè)技術(shù)方案,至少具有如下一種或多種技術(shù)效果:
[0057]在本申請(qǐng)的技術(shù)方案中,接收用戶(hù)設(shè)備發(fā)送的待識(shí)別音頻流;在接收所述待識(shí)別音頻流的同時(shí),基于截止到第一時(shí)刻為止已接收的第一部分待識(shí)別音頻在特征數(shù)據(jù)庫(kù)中開(kāi)始進(jìn)行第一次匹配,以獲得第一匹配結(jié)果;其中,所述第一時(shí)刻在完成接收所述待識(shí)別音頻流的時(shí)刻之前。所以,本申請(qǐng)實(shí)施例中的服務(wù)器在接收用戶(hù)終端發(fā)送的待識(shí)別音頻流的同時(shí),就開(kāi)始基于已接收的第一部分待識(shí)別音頻進(jìn)行匹配,換言之,服務(wù)器能夠一邊接收待識(shí)別音頻流,一邊進(jìn)行匹配。由于不像現(xiàn)