利用語音識別訪問和檢索媒體文件的系統(tǒng)和方法

文檔序號：2821103閱讀：223來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：利用語音識別訪問和檢索媒體文件的系統(tǒng)和方法
技術(shù)領(lǐng)域：
本發(fā)明主要涉及索引與檢索的方法和系統(tǒng)，更具體地，涉及基于文件的文本描述利用語音識別來選擇媒體文件。
背景技術(shù)：
諸如MP3播放器等用于播放媒體文件的嵌入式設(shè)備的顯示和手動輸入能力有限。例如，由于空間有限，顯示空間因此不會很大，所以不能顯示大量的信息。而且，由于空間有限，因此不能提供很多的功能鍵，所以完整的正文輸入很困難和經(jīng)常不可能有完整的正文輸入。結(jié)果，查找、存儲和檢索MP3文件等任務(wù)的工作量就很大，并且經(jīng)常使得用戶執(zhí)行起來很費勁。由于這些原因以及一些類似的原因，已經(jīng)開發(fā)出使用語音識別來訪問各種數(shù)據(jù)庫的嵌入式設(shè)備。
遺憾的是，語音識別應(yīng)用于嵌入式設(shè)備并沒有使得語音識別不再僅僅作為一個人機(jī)交互中的輸入，其中人機(jī)交互的范例主要有按鍵、微調(diào)度盤和觸摸屏等。因此，在先前的應(yīng)用中，只是將輸入語音作為同使用微調(diào)度盤或某項功能的工作方式相類似的另一個操縱菜單的命令。因此，對于嵌入式設(shè)備來說，仍然需要圍繞著語音識別和語音設(shè)別技術(shù)來獲取信息。本發(fā)明提供了這樣的設(shè)備。

發(fā)明內(nèi)容
根據(jù)本發(fā)明，播放媒體文件的嵌入式設(shè)備可以基于用戶的輸入語音生成媒體文件播放列表。該嵌入式設(shè)備包括用于產(chǎn)生多個語音識別語法的索引器(indexer)。根據(jù)本發(fā)明的一個方面，索引器基于媒體文件的媒體文件頭內(nèi)容生成語音識別語法。根據(jù)本發(fā)明的另一方面，索引器基于用于從用戶位置(user location)檢索媒體文件的文件路徑中的種類生成語音識別語法。當(dāng)語音識別器在選擇模式中從用戶接收輸入語音時，媒體文件選擇器將在選擇模式中接收到的輸入語音與多個語音識別語法進(jìn)行比較，從而選擇媒體文件。
由于用戶可以通過語音輸入選擇媒體文件，而不需要費勁去產(chǎn)生用于檢索文件的索引系統(tǒng)，所以根據(jù)本發(fā)明的嵌入式設(shè)備比之前的媒體文件播放器更有優(yōu)勢。本發(fā)明在播放MP3格式的聲音文件中特別具有優(yōu)勢，特別是播放音樂文件中具有優(yōu)勢，該類文件的文件頭中通常包含了描述性文本(例如名稱、藝術(shù)家、日期)。描述性文本對產(chǎn)生語音識別語法非常有幫助，其中語音識別語法有助于以對于用戶是直覺的方式進(jìn)行語音驅(qū)動搜索。不過，本發(fā)明并不局限于MP3格式的聲音文件或者音樂文件，而對于選擇多種內(nèi)容類型、不同格式和多層的媒體文件都非常有用。根據(jù)下面的詳細(xì)描述可以清楚了解本發(fā)明的其它應(yīng)用范圍。可以意識到，下面的詳細(xì)說明以及特定的示例指明了本發(fā)明的較佳實施例，但僅僅用于對本發(fā)明進(jìn)行說明，并不用于對本發(fā)明的范圍進(jìn)行限定。

從下面的詳細(xì)說明以及附圖可以更好地理解本發(fā)明，其中圖1為根據(jù)本發(fā)明的嵌入式設(shè)備訪問計算機(jī)網(wǎng)絡(luò)中媒體文件的局部結(jié)構(gòu)圖。
圖2為根據(jù)本發(fā)明用于給媒體文件編索引而生成語法的方法的數(shù)據(jù)流程圖。
圖3A和圖3B為根據(jù)本發(fā)明的給媒體文件編索引的可選方法的流程圖。
圖4為根據(jù)本發(fā)明產(chǎn)生臨時播放列表的方法的流程圖。
圖5為根據(jù)本發(fā)明產(chǎn)生存儲的、可編輯播放列表的方法的流程圖。
具體實施例方式
下面對優(yōu)選實施例的詳細(xì)說明實質(zhì)上只是示范性的，并不用于對本發(fā)明及其應(yīng)用或者使用進(jìn)行限定。
根據(jù)本發(fā)明和參照圖1，嵌入式設(shè)備100具有有限的用于顯示播放列表的顯示器102和多功能操作按鈕104。連同音頻輸入108和音頻輸出110一起，還提供了微調(diào)度盤106。還提供了例如安全數(shù)碼(Secure Digital，SD)卡等的數(shù)據(jù)存儲器112。嵌入式設(shè)備100可以通過無線或者藍(lán)牙等數(shù)據(jù)鏈接116訪問諸如互聯(lián)網(wǎng)等計算機(jī)網(wǎng)絡(luò)114。
在操作中，用戶利用語音輸入和/或手動輸入來瀏覽計算機(jī)網(wǎng)絡(luò)114，并定位感興趣的媒體文件118。例如，用戶可以下載媒體文件118到數(shù)據(jù)存儲器112，以便將來閑暇時進(jìn)行訪問。在另一個例子中，用戶可以使用諸如由專有服務(wù)器122提供的電子活動指南(EAG)120來確定互聯(lián)網(wǎng)上包含媒體文件的流媒體的可用性。用戶可以選擇保存用于發(fā)出流請求的信息，從而以流媒體的形式接收媒體文件118。
根據(jù)本發(fā)明，創(chuàng)建索引以檢索包括語音識別語法的媒體文件，語音識別語法由媒體文件頭124的內(nèi)容，指向計算機(jī)網(wǎng)絡(luò)上媒體文件的文件路徑的描述性文本，比如描述性地對數(shù)據(jù)庫內(nèi)容進(jìn)行分類的數(shù)據(jù)庫126的名字，和/或例如由EAG 120提供的流派、致謝名單(作曲者，樂隊組成，制作者)、和/或次要信息(視頻拍攝位置、原產(chǎn)國、樂器類型)等補(bǔ)充信息127所生成。用戶還可以進(jìn)入聲音綁定來描述媒體文件，這種方式對用戶很有意義。另外，可以基于包含語音的媒體文件內(nèi)容執(zhí)行的語音識別產(chǎn)生用于生成語音識別語法的文本。根據(jù)可選實施方式和/或使用環(huán)境，由此產(chǎn)生的索引可以保存在數(shù)據(jù)存儲器112、專有服務(wù)器122的用戶賬戶數(shù)據(jù)庫128、和/或本地服務(wù)器130。用戶此后可以通過在選擇模式中輸入語音來選擇媒體文件。嵌入式設(shè)備100的語音識別器通過產(chǎn)生多個語音識別假設(shè)(hypotheses)來識別該語音。把這些假設(shè)與索引的識別語法相比較，以選擇媒體文件。如果需要，一些或者所有的語音識別假設(shè)都可以傳送到本地服務(wù)器130和/或?qū)Ｓ蟹?wù)器122，從而可以在合適的位置進(jìn)行比較。
圖2所示為根據(jù)本發(fā)明產(chǎn)生語音識別語法索引200的數(shù)據(jù)流程圖。其中，從多個源中提取出描述媒體文件內(nèi)容的描述性文本。例如，從已定位媒體文件的文件頭提取文本202，還可以從指向計算機(jī)網(wǎng)絡(luò)上媒體文件的文件路徑提取文本204。另外，也可以從例如EAG等補(bǔ)充源提取附加文本206。再另外，可以從媒體文件的內(nèi)容提取已識別語音208。如果存在，同樣可以使用來自于用戶的已識別語音210。將由此獲得的描述性文本傳送到濾波函數(shù)212。
濾波函數(shù)212通過丟棄低音值的詞來過濾已獲得的描述性文本。例如，可以丟棄歌曲標(biāo)題中的介詞和不包括詞的文件路徑的內(nèi)容。這樣，將視為重要的詞214傳送到擴(kuò)展函數(shù)216，擴(kuò)展函數(shù)216產(chǎn)生同義詞、和/或重要詞的刪節(jié)版本(可用作通配符)218。例如，視為重要的詞“悲傷地(sadly)”可以擴(kuò)展為同義詞“不高興地(unhappily)”、“悲慘地(miserably)”和/或刪節(jié)為“悲傷(sad)”。刪節(jié)詞“悲傷(sad)”還可以進(jìn)一步擴(kuò)展為同義詞來產(chǎn)生“不高興的(unhappy)”和“悲慘的(miserable)”。擴(kuò)展詞“不高興地(unhappily)”和/或“不高興的(unhappy)”也可以刪節(jié)為“unhap”，進(jìn)一步擴(kuò)展成“不高興(unhappiness)”。
因此，基于視為重要的詞214和/或從視為重要的詞214獲得的擴(kuò)展(和/或刪節(jié))218可以生成關(guān)鍵字列表220。利用字母到聲音規(guī)則224將關(guān)鍵字列表220中的每個詞轉(zhuǎn)化為音素串222。最后，隱馬爾可夫模型(HMM)串接器226通過串接音素串222生成語音識別語法索引200，并且媒體文件由生成的語音識別語法索引200編索引。
圖3A和圖3B示出了根據(jù)本發(fā)明利用語音識別語法給媒體文件編索引的可選方法的流程圖。例如，根據(jù)第一可選方法，在300A開始該方法，在302下載媒體文件。根據(jù)圖2所示的方法在304A產(chǎn)生語音識別語法索引。在305A，進(jìn)一步產(chǎn)生字段類型，并將字段類型與產(chǎn)生的語法相關(guān)聯(lián)作為元數(shù)據(jù)。在306，下載的媒體文件存儲在諸如數(shù)據(jù)存儲器112(圖1)、本地存儲器130的存儲器、或者數(shù)據(jù)庫128等數(shù)據(jù)存儲器中，并將保存的文件和產(chǎn)生的語音識別語法索引相關(guān)聯(lián)。然后，第一可選方法在308A結(jié)束。另外，根據(jù)第二可選方法，在300B開始該方法，在310判定計算機(jī)網(wǎng)絡(luò)上媒體文件的可用性。在304B，根據(jù)圖2所示方法，基于可用媒體文件產(chǎn)生語音識別語法索引。在305B進(jìn)一步生成字段類型，并將字段類型與生成的語法相關(guān)聯(lián)作為元數(shù)據(jù)。在312，在諸如數(shù)據(jù)存儲器112(圖1)、本地存儲器130的存儲器、或者數(shù)據(jù)庫128等數(shù)據(jù)存儲器中存儲文件的可用性記錄，并且將該可用性記錄與生成的語音識別語法索引相關(guān)聯(lián)。然后，第二可選方法在308B結(jié)束(圖3B)。
本發(fā)明使用戶方便地使用嵌入式設(shè)備來播放多種媒體文件。圖4示出了根據(jù)本發(fā)明利用本發(fā)明選擇媒體文件的方法，產(chǎn)生臨時播放列表的方法。其中，響應(yīng)于用戶播放某種類型文件的語音輸入，該方法在400開始。例如，如果用戶輸入對應(yīng)于“播放U2除了專輯血腥星期天的所有歌曲”，那么進(jìn)入選擇模式并在步驟402初始建立臨時播放列表。在步驟404，接收剩下的語音輸入“U2除了專輯血腥星期天的所有歌曲“，并且在步驟406生成語音識別假設(shè)。
在步驟408，基于某些關(guān)鍵字的識別生成搜索串，例如“所有歌曲(指定對所有可選MP3文件的搜索)”“U2(指定為由于不被視為關(guān)鍵字而以多個語音識別假設(shè)的形式存在的搜索項的第一槽位)，“除了”(指定為布爾邏輯AND NOT)，“專輯”(指定為與后續(xù)搜索項槽位相關(guān)聯(lián)的字段類型)，“血腥星期天”(指定為由于不被視為關(guān)鍵字而以多個語音識別假設(shè)的形式存在的搜索項的第二槽位)。因此，大概地產(chǎn)生了形式為“所有MP3文件＝＝第一槽位AND NOT(<專輯>AND第二槽位)”的搜索串。
作為上述形成的搜索串的結(jié)果，在步驟410，當(dāng)在選擇過程中，非關(guān)鍵術(shù)語“U2”和“血腥星期天”的語音識別假設(shè)與可用文件的語法索引相比較時，選中了藝術(shù)家U2除了專輯血腥星期天之外的可選MP3文件。特別地，多個語音識別假設(shè)與根據(jù)本發(fā)明生成的識別語法的比較呈現(xiàn)出如先前所述的固有的“通配符”屬性，其中識別語法也根據(jù)語音識別過程的特性而生成。例如，根據(jù)先前所述的查詢，還可能選中不是U2的另一位藝術(shù)家的標(biāo)題為“我也愛你”的歌曲，這樣用戶也許期望能夠在第一槽位指明字段類型<藝術(shù)家>。因此，文件選擇的質(zhì)量某種程度上取決于可用文件以及形成搜索串的語音輸入的質(zhì)量。
根據(jù)本發(fā)明，如果在步驟410的選擇嘗試不能在步驟412找到很好的匹配，那么在步驟414利用生成的語音向用戶建議可選的搜索和/或選擇，并返回到步驟404。不過，如果在步驟412尋找到好的匹配，那么在步驟416可以根據(jù)流行性、作者姓名、軌道號來重新排序最佳匹配，或者也可以根據(jù)用戶根據(jù)喜好而指定的其它標(biāo)準(zhǔn)來重新排序最佳匹配，其中可能根據(jù)屬于輸入語音的關(guān)鍵字來指定標(biāo)準(zhǔn)。那么，在步驟418，將多個選中的歌曲增加到臨時播放列表。在這一步驟中，可以根據(jù)用戶的喜好判定增加的選中歌曲數(shù)目，其中用戶可以設(shè)定要選擇的文件的最大數(shù)目。選擇也可以由最小置信分?jǐn)?shù)來確定，其中最小置信分?jǐn)?shù)也可以由用戶根據(jù)喜好改變。而且，用戶可以根據(jù)屬于輸入語音的關(guān)鍵字來指定個人喜好，例如，通過聲明“播放U2除了專輯血腥星期天最流行的5首音樂”來指定。已識別的關(guān)鍵字“最流行”和“5首音樂”由此可能導(dǎo)致在步驟410選擇一些歌曲，接著在步驟416基于流行性重新排序選中的歌曲，并在步驟418中在臨時播放列表中添加最前面的5首歌曲。一旦構(gòu)建了臨時播放列表，通過退出選擇模式并基于在步驟404接收到的語音輸入中的關(guān)鍵字“播放”自動進(jìn)入播放模式，從而結(jié)束該方法。
本發(fā)明也方便了用戶使用嵌入式設(shè)備建立和/或編輯媒體文件播放列表。圖5示出了為根據(jù)本發(fā)明利用本發(fā)明選擇媒體文件的方法產(chǎn)生存儲的、可編輯播放列表的方法。當(dāng)進(jìn)入與播放列表生成模式相對應(yīng)的選擇模式時，在500開始該方法。其中，執(zhí)行到步驟502，其中初始建立空的播放列表，并根據(jù)用戶的語音輸入給其命名。從某種意義來說，播放列表的名字構(gòu)成語音綁定，用戶通過語音綁定可以檢索多個媒體文件。因此，當(dāng)用戶給播放列表命名為“我最喜歡的憂愁歌曲”時，那么便給列表當(dāng)中的所有歌曲都創(chuàng)建了語音綁定，通過該語音綁定，可以隨意檢索并播放整個列表。
隨著空的列表準(zhǔn)備好接收媒體文件，該方法在步驟504進(jìn)入插入模式，然后接著執(zhí)行到步驟506來接收輸入語音。利用語音識別器在步驟508生成語音識別假設(shè)，在步驟509基于輸入語音中識別的關(guān)鍵字生成搜索串。在步驟510，取決于當(dāng)前模式，如果如本例所示處于插入模式中，該方法執(zhí)行到步驟512。因此，語音輸入“黃色潛水艇”將產(chǎn)生幾個語音識別假設(shè)，并且這些語音識別假設(shè)在步驟512中與不在播放列表中的文件的語法索引相比較。
如果在步驟514中找到好的匹配，那么在步驟515將最匹配的媒體文件重新排序，并在步驟516自動將最匹配的媒體文件加入到播放列表。如果在步驟514沒有找到好的匹配，那么可以在步驟518提示給用戶可選的搜索和/或選擇建議?？蛇x地，如果有多個文件，那么可以讓用戶通過手動或者語音輸入從顯示或者讀出的文件中選擇一個文件。
利用在步驟516至少部分獲得的播放列表，該方法執(zhí)行到步驟520，在此用戶指定新的模式。例如，用戶可以通過選擇保存播放列表和/或播放該播放列表來指定非選擇模式，在這種情況下該方法在522結(jié)束。而且，如果用戶希望加入更多的歌曲到播放列表中，那么用戶可以指定插入模式并且執(zhí)行到步驟504。另外，如果用戶希望從播放列表中刪除一個或者多個媒體文件，那么用戶可以指定刪除模式，并執(zhí)行到步驟524。然后，在步驟526，在步驟506中接收并在步驟508中識別的輸入語音與播放列表中文件的語法索引相比較。如果在步驟528找到好的匹配，匹配的媒體文件在步驟530從列表中刪除。如果沒有發(fā)現(xiàn)好的匹配，那么提示給用戶可選的搜索和/或選擇的建議。根據(jù)在530所編輯的播放列表，用戶可以指定新的模式，可以繼續(xù)擴(kuò)展播放列表或者進(jìn)入非選擇模式。
根據(jù)本發(fā)明，可以在不同的情況下進(jìn)入不同種類的編輯模式。例如，假設(shè)用戶已經(jīng)創(chuàng)建了標(biāo)題為“我的最愛”的播放列表，并且正在收聽臨時播放列表的情況，用戶可以聲明“增加當(dāng)前選擇到我最喜歡的憂愁歌曲中”。這樣，可以根據(jù)選擇當(dāng)前正在播放的歌曲來編輯相應(yīng)的播放列表。如果用戶正在聽僅為隨機(jī)選中的歌曲，而不是之前選定的歌曲，同樣可以執(zhí)行上述過程。另外，正在建立或者編輯播放列表的用戶可以自然地選擇增加一首或者多首選中的歌曲到別的已經(jīng)存在的播放列表。因此，本發(fā)明提供了其它的和附加的選擇模式。
除了產(chǎn)生播放列表，根據(jù)本發(fā)明選擇媒體文件的方法還有其它進(jìn)一步的應(yīng)用。例如用戶可以瀏覽計算機(jī)網(wǎng)絡(luò)中的可用流媒體，并根據(jù)多個不同附有定價的選項，從提供相同歌曲的不同提供者中進(jìn)行選擇。而且，可以用手動輸入來執(zhí)行最終的選擇，這樣可以使用混合模式的操作。還有，對于混合模式，可以使用手動輸入來瀏覽播放列表和/或可選歌曲的一個或多個索引，并使用語音來執(zhí)行最終選擇。最后，應(yīng)該意識到，本發(fā)明的描述在實質(zhì)上只是示范性的，因此不脫離本發(fā)明主旨的各種變化應(yīng)該包含在本發(fā)明的范圍之內(nèi)。
權(quán)利要求
1.一種播放媒體文件并基于用戶的輸入語音生成媒體文件播放列表的嵌入式設(shè)備，包括索引器，用于生成多個語音識別語法，包括至少下列中的一個(a)第一索引器，基于媒體文件的媒體文件頭的內(nèi)容生成第一語音識別語法；和(b)第二索引器，基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法；語音識別器，用于在選擇模式中時從用戶接收輸入語音；和媒體文件選擇器，用于將從選擇模式接收到的輸入語音與多個語音識別語法進(jìn)行比較，從而選擇媒體文件。
2.根據(jù)權(quán)利要求1所述的設(shè)備，其中所述用于生成多個語音識別語法的索引器包括基于媒體文件的媒體文件頭的內(nèi)容生成第一語音識別語法的第一索引器。
3.根據(jù)權(quán)利要求2所述的設(shè)備，其中所述用于生成多個語音識別語法的索引器包括基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法的第二索引器。
4.根據(jù)權(quán)利要求1所述的設(shè)備，其中所述用于生成多個語音識別語法的索引器包括基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法的第二索引器。
5.根據(jù)權(quán)利要求1所述的設(shè)備，其中媒體文件包含語音，并且所述生成多個語音識別語法的索引器包括第三索引器，所述第三索引器識別媒體文件中的語音，并基于在媒體文件中所識別的語音生成第三語音識別語法。
6.根據(jù)權(quán)利要求1所述的設(shè)備，其中所述語音識別器在非選擇模式中從用戶接收輸入語音，其中所述索引器基于在非選擇模式中接收到的輸入語音生成分類，并且其中所述索引器包括第四索引器，所述第四索引器基于生成的分類生成第四語音識別語法。
7.根據(jù)權(quán)利要求1所述的設(shè)備，其中所述的索引器包括第五索引器，所述第五索引器基于與媒體文件相關(guān)聯(lián)的補(bǔ)充描述文本生成第五語音識別語法，所述補(bǔ)充描述文本由計算機(jī)網(wǎng)絡(luò)的數(shù)據(jù)存儲器提供。
8.根據(jù)權(quán)利要求1所述的設(shè)備，包括數(shù)據(jù)鏈接，用于接收計算機(jī)網(wǎng)絡(luò)上的媒體文件；和數(shù)據(jù)存儲器，用于存儲接收到的與多個語音識別語法相關(guān)聯(lián)的媒體文件。
9.根據(jù)權(quán)利要求1所述的設(shè)備，包括播放列表生成器，用于在插入模式中選擇媒體文件時，將選中的媒體文件添加到播放列表。
10.根據(jù)權(quán)利要求1所述的設(shè)備，包括播放列表生成器，用于在刪除模式中選擇媒體文件時，將選中的媒體文件從播放列表中刪除。
11.一種使用輸入語音選擇媒體文件的方法，包括生成多個語音識別語法，包括至少下列中的一個(a)基于媒體文件的媒體文件頭的內(nèi)容生成第一語音識別語法；(b)基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法；在選擇模式中時從用戶接收輸入語音；和將從選擇模式接收到的輸入語音和多個語音識別語法進(jìn)行比較，從而選擇媒體文件。
12.根據(jù)權(quán)利要求11所述的方法，其中所述生成多個語音識別語法包括基于媒體文件的媒體文件頭的內(nèi)容生成第一語音識別語法。
13.根據(jù)權(quán)利要求12所述的方法，其中所述生成多個語音識別語法包括基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法。
14.根據(jù)權(quán)利要求11所述的方法，其中所述生成多個語音識別語法包括基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成第二語音識別語法。
15.根據(jù)權(quán)利要求11所述的方法，其中媒體文件包含語音，該方法包括在語音文件中識別語音，其中所述生成多個語音識別語法包括基于在媒體文件中所識別的語音生成第三語音識別語法。
16.根據(jù)權(quán)利要求11所述的方法，包括在非選擇模式中時從用戶接收輸入語音；基于在非選擇模式中時接收到的輸入語音生成分類；和將生成的分類與媒體文件相關(guān)聯(lián)；其中所述生成多個語音識別語法包括基于與媒體文件相關(guān)聯(lián)的分類生成第四語音識別語法。
17.根據(jù)權(quán)利要求11所述的方法，包括基于與媒體文件相關(guān)聯(lián)的補(bǔ)充描述文本生成第五語音識別語法，所述補(bǔ)充描述文本由計算機(jī)網(wǎng)絡(luò)的數(shù)據(jù)存儲器提供。
18.根據(jù)權(quán)利要求11所述的方法，包括接收計算機(jī)網(wǎng)絡(luò)上的媒體文件；和存儲接收到的與多個語音識別語法相關(guān)聯(lián)的媒體文件到數(shù)據(jù)存儲器中。
19.根據(jù)權(quán)利要求11所述的方法，包括進(jìn)入插入模式；和在插入模式中選擇媒體文件時，將選中的媒體文件添加到播放列表。
20.根據(jù)權(quán)利要求11所述的方法，包括進(jìn)入刪除模式；和在刪除模式中選擇媒體文件時，將選中的媒體文件從播放列表中刪除。
全文摘要
一種用于播放媒體文件的嵌入式設(shè)備，可以基于用戶的輸入語音生成媒體文件播放列表。該嵌入式設(shè)備包括生成多個語音識別語法的索引器。根據(jù)本發(fā)明的一方面，索引器基于媒體文件的媒體文件頭的內(nèi)容生成語音識別語法。根據(jù)本發(fā)明的另一方面，索引器基于用于從用戶位置檢索媒體文件的文件路徑中的種類生成語音識別語法。當(dāng)語音識別器在選擇模式中從用戶接收輸入語音(404)時，媒體文件選擇器將在選擇模式中接收到的輸入語音與多個語音識別語法進(jìn)行比較(410)，從而選擇媒體文件(418)。
文檔編號G10L15/06GK1682279SQ03821303
公開日2005年10月12日申請日期2003年9月12日優(yōu)先權(quán)日2002年9月16日
發(fā)明者大衛(wèi)·克瑞茲, 盧卡·里加茲, 帕特里克·恩伽元, 讓-克勞德·容科申請人:松下電器產(chǎn)業(yè)株式會社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：大衛(wèi).克瑞茲;盧卡.里加茲;帕特里克.恩伽元;讓-克勞德.容科
技術(shù)所有人：松下電器產(chǎn)業(yè)株式會社
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

多媒體檢索相關(guān)技術(shù)

跨媒體檢索相關(guān)技術(shù)

多媒體信息檢索相關(guān)技術(shù)

多媒體檢索技術(shù)包括相關(guān)技術(shù)

多媒體檢索技術(shù)相關(guān)技術(shù)

基于內(nèi)容的多媒體檢索相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

利用語音識別訪問和檢索媒體文件的系統(tǒng)和方法