多媒體播放方法及裝置制造方法

文檔序號(hào)：7805604閱讀：120來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

多媒體播放方法及裝置制造方法
【專利摘要】本發(fā)明是關(guān)于一種多媒體播放方法及裝置。所述方法包括：獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。本發(fā)明用于使得在暫停后繼續(xù)播放時(shí)用戶可以捕捉并理解到完整的語句。
【專利說明】多媒體播放方法及裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及多媒體處理【技術(shù)領(lǐng)域】，尤其涉及一種多媒體播放方法及裝置。
【背景技術(shù)】
[0002]相關(guān)技術(shù)中，在播放視頻的時(shí)候，經(jīng)常會(huì)出現(xiàn)暫停，包括因?yàn)橛脩糁饔^原因的主動(dòng)暫停，也包括由于網(wǎng)絡(luò)的原因，出現(xiàn)短暫的卡頓暫停。由于暫定的時(shí)刻機(jī)動(dòng)性比較大，在繼續(xù)播放的時(shí)候，視頻里面出現(xiàn)的聲音往往是從一個(gè)句子的中間開始，甚至從一個(gè)字或者詞的一半開始，這樣不便于人們連續(xù)地理解情節(jié)。
[0003]相關(guān)技術(shù)中，一些多媒體播放軟件或網(wǎng)頁，在播放過程中關(guān)閉軟件或網(wǎng)頁后，當(dāng)再次開啟軟件播放同一視頻或重新打開上次關(guān)閉的視頻網(wǎng)頁時(shí)，也會(huì)采取在暫停位置返回固定時(shí)間量的回退播放方式。例如，返回的時(shí)間值固定設(shè)置為5秒，則當(dāng)中斷后重新開啟軟件或網(wǎng)頁，繼續(xù)播放原視頻時(shí)，從中斷點(diǎn)之前的5秒開始播放，以便用戶接續(xù)到上次觀看的記憶。
[0004]這種回退播放方式，后退的時(shí)間值是預(yù)先設(shè)定的固定值，雖然給予用戶一定回想的時(shí)間，但是切入的時(shí)間點(diǎn)比較生硬，不夠人性化。因?yàn)榧词购笸?秒，也會(huì)出現(xiàn)從一個(gè)句子的中間開始繼續(xù)播放的情況，不利于用戶理解完整的語句。

【發(fā)明內(nèi)容】

[0005]為克服相關(guān)技術(shù)中存在的問題，本公開實(shí)施例提供一種多媒體播放方法及裝置。
[0006]根據(jù)本公開實(shí)施例的第一方面，提供一種多媒體播放方法，包括:
[0007]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0008]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；
[0009]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
[0010]本實(shí)施例中，通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定一句完整語句的語句起始位置，根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻，使得在暫停后繼續(xù)播放時(shí)用戶可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0011]可選的，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0012]檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；
[0013]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
[0014]可選的，所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0015]獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0016]根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0017]可選的，所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0018]檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間；
[0019]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0020]根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0021]在可選方案中，通過根據(jù)相鄰音頻信號(hào)之間的時(shí)間間隔或相鄰字幕之間的時(shí)間間隔確定語句起始位置，使得后續(xù)可以根據(jù)語句起始位置繼續(xù)播放音頻或視頻，用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。另外，同時(shí)對(duì)音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行分析，確定兩個(gè)完整語句之間的間隔位置，從而更精確地獲得完整語句的起始點(diǎn)，不僅不會(huì)影響到用戶對(duì)語句的理解，也不會(huì)影響到用戶觀看到字幕。
[0022]可選的，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0023]根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；
[0024]檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；
[0025]當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
[0026]在可選方案中，按照人聲通常的頻率先對(duì)音頻數(shù)據(jù)過濾，從而單純對(duì)人聲音頻信號(hào)進(jìn)行分析，根據(jù)人聲音頻信號(hào)之間的時(shí)間間隔確定語句起始位置，使得對(duì)語句起始位置的確定更加準(zhǔn)確。
[0027]可選的，當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí)，所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體，包括:
[0028]從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者
[0029]當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
[0030]在可選方案中，當(dāng)確定多個(gè)語句起始位置時(shí)，可以靈活選擇其中一個(gè)作為暫停后繼續(xù)播放音視頻的起點(diǎn)，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0031]可選的，當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，所述方法還包括:
[0032]按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；
[0033]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；
[0034]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。[0035]可選的，所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，包括:
[0036]獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；
[0037]獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0038]所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0039]根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
[0040]在可選方案中，可以先選取到暫停位置前一段時(shí)間的時(shí)間位置，以該時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn)，使得用戶可以獲得提供更充裕的進(jìn)入視頻情節(jié)的時(shí)間。
[0041]根據(jù)本公開實(shí)施例的第二方面，提供一種多媒體播放裝置，包括:
[0042]獲取模塊，用于獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0043]分析模塊，用于根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；
[0044]播放模塊，用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
[0045]所述分析模塊包括:
[0046]檢測(cè)單元，用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；
[0047]分析確定單元，用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
[0048]所述分析模塊包括:
[0049]獲取單元，用于從所述獲取模塊獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0050]分析確定單元，用于根據(jù)所述獲取單元獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。所述分析模塊包括:
[0051 ] 檢測(cè)單元，用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間；
[0052]獲取單元，用于當(dāng)所述檢測(cè)單元檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；分析確定單元，用于根據(jù)所述獲取單元獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0053]所述分析模塊還包括:
[0054]所述分析模塊還包括:
[0055]過濾單元，用于根據(jù)人聲頻率對(duì)所述獲取模塊獲取的所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；[0056]所述檢測(cè)單元，用于檢測(cè)所述過濾單元過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；
[0057]所述分析確定單元，用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
[0058]所述播放模塊，用于當(dāng)所述分析模塊確定出至少兩個(gè)完整語句的語句起始位置時(shí)，從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
[0059]所述獲取模塊，用于當(dāng)所述分析模塊根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；
[0060]所述分析模塊，用于從所述獲取模塊本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
[0061]所述獲取模塊，用于獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0062]所述分析模塊，用于根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
[0063]根據(jù)本公開實(shí)施例的第三方面，提供一種多媒體播放裝置，包括:
[0064]處理器；
[0065]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器；
[0066]其中，所述處理器被配置為:
[0067]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0068]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；
[0069]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
[0070]應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本公開。
【專利附圖】

【附圖說明】
[0071]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分，示出了符合本發(fā)明的實(shí)施例，并與說明書一起用于解釋本發(fā)明的原理。
[0072]圖1是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；[0073]圖2是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖；
[0074]圖3是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0075]圖4是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0076]圖5是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0077]圖6是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0078]圖7是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖；
[0079]圖8是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖；
[0080]圖9是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0081]圖10是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖；
[0082]圖11是根據(jù)一示例性實(shí)施例示出的一種多媒體播放裝置的框圖；
[0083]圖12a是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖；
[0084]圖12b是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖；
[0085]圖12c是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖；
[0086]圖12d是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖；
[0087]圖13是根據(jù)一示例性實(shí)施例示出的一種用于多媒體播放的裝置1300的框圖。
【具體實(shí)施方式】
[0088]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明，其示例表示在附圖中。下面的描述涉及附圖時(shí)，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0089]本公開實(shí)施例中的多媒體包括視頻、音頻等等。多媒體播放過程中發(fā)生暫停，暫?？梢允怯脩糁鲃?dòng)觸發(fā)的，也可能是由于網(wǎng)絡(luò)原因引起的。用戶主動(dòng)的暫停多媒體播放，可以通過操作指令獲知。由于網(wǎng)絡(luò)原因的暫停多媒體播放，則可以通過檢測(cè)視頻緩存區(qū)中剩余未播放的數(shù)據(jù)量獲知，當(dāng)后續(xù)沒有可供播放的視頻緩存數(shù)據(jù)時(shí)，視頻播放便會(huì)中止。
[0090]本公開實(shí)施例中，在多媒體播放暫停后，通過分析多媒體中音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中完整語句的語句起始點(diǎn)，使得對(duì)多媒體的繼續(xù)播放可以從一個(gè)完整語句開始，解決固定時(shí)間回退播放所導(dǎo)致的影響用戶理解語句的問題。
[0091]圖1是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖1所示，多媒體播放方法用于終端中，包括以下步驟。
[0092]在步驟Sll中，獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字眷數(shù)據(jù)。
[0093]在步驟S12中，根據(jù)音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置。
[0094]在步驟S13中，當(dāng)檢測(cè)到繼續(xù)播放多媒體的指令或滿足繼續(xù)播放多媒體的條件時(shí)，根據(jù)語句起始位置繼續(xù)播放多媒體。
[0095]本實(shí)施例中，通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定一句完整語句的語句起始位置，根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。[0096]按照經(jīng)驗(yàn)，完整的一句話通常不超過16秒，實(shí)際應(yīng)用時(shí)，在步驟Sll中，可以設(shè)置第一預(yù)設(shè)時(shí)長為16秒。例如，圖2是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖，如圖2所示，用戶播放視頻時(shí)，暫停位置為3分20秒處，可以獲取暫停位置之前16秒，即3分04秒至3分20秒的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，用以在這些數(shù)據(jù)中確定完整語句的語句起始位置。
[0097]圖3是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖3所示，可選的，在步驟S12中，根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括以下步驟。
[0098]在步驟S31中，檢測(cè)音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔。
[0099]在步驟S32中，當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為語句起始位置。
[0100]圖4是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖4所示，可選的，在步驟S12中，根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置，包括以下步驟。
[0101]在步驟S41中，獲取字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0102]在步驟S42中，根據(jù)字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定語句起始位置。由于兩句話之間應(yīng)該有一定的時(shí)間間隔，如0.1秒，因此，可以根據(jù)音頻信號(hào)之間的間隔時(shí)長確定完整句子。同理，當(dāng)用戶觀播放的音視頻文件有字幕時(shí)，還可以根據(jù)相鄰字幕之間的時(shí)間間隔確定完整句子。例如，獲取到前一條字幕的終止顯示時(shí)間為3分04秒160毫秒，后一條字幕的起始顯示時(shí)間為3分04秒290毫秒，兩條字幕之間的間隔為130毫秒，即0.13秒，超過了 0.1秒，可以判斷這兩條字幕之間存在語句起始位置。
[0103]或者，在有些音視頻文件中，一條字幕本身就對(duì)應(yīng)一句完整的語句，這樣可以根據(jù)本條字幕的起始顯示時(shí)間或上一條字幕的終止顯示時(shí)間確定語句起始位置。
[0104]在可選方案中，通過根據(jù)相鄰音頻信號(hào)之間的時(shí)間間隔或相鄰字幕之間的時(shí)間間隔確定語句起始位置，使得后續(xù)可以根據(jù)語句起始位置繼續(xù)播放音頻或視頻，用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0105]圖5是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖5所示，可選的，在步驟S12中，根據(jù)音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0106]在步驟S51中，檢測(cè)音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間。
[0107]在步驟S52中，當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
[0108]在步驟S52中，根據(jù)相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定語句起始位置。
[0109]例如，通過對(duì)音頻數(shù)據(jù)分析，獲得相鄰兩個(gè)音頻信號(hào)的播放時(shí)間3分09秒和3分12秒，這兩個(gè)相鄰音頻信號(hào)的時(shí)間間隔未3秒，大于預(yù)先設(shè)定的0.1秒；而這兩個(gè)相鄰音頻信號(hào)對(duì)應(yīng)的相鄰兩條字幕的顯示時(shí)間為3分08秒和3分11秒，也大于預(yù)先設(shè)定的0.1秒。因此，可以確定至少在3分10秒處同時(shí)出現(xiàn)音頻信號(hào)和字幕的空白，可以將3分10秒作為繼續(xù)播放多媒體的起點(diǎn)。
[0110]在可選方案中，同時(shí)對(duì)音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行分析，確定兩個(gè)完整語句之間的間隔位置，從而更精確地獲得完整語句的起始點(diǎn)，不僅不會(huì)影響到用戶對(duì)語句的理解，也不會(huì)影響到用戶觀看到字幕。
[0111]圖6是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖6所示，可選的，在步驟S12中，根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括以下步驟。
[0112]在步驟S61中，根據(jù)人聲頻率對(duì)音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)。
[0113]在步驟S62中，檢測(cè)人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔。
[0114]在步驟S63中，當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為語句起始位置。
[0115]在可選方案中，當(dāng)音頻數(shù)據(jù)中除了人聲外，還存在背景聲音(音樂、環(huán)境音等)的干擾，因此，無法根據(jù)音頻信號(hào)之間的時(shí)間間隔確定語句起始位置。那么，可以按照人聲通常的頻率先對(duì)音頻數(shù)據(jù)過濾，從而單純對(duì)人聲音頻信號(hào)進(jìn)行分析，根據(jù)人聲音頻信號(hào)之間的時(shí)間間隔確定語句起始位置，使得對(duì)語句起始位置的確定更加準(zhǔn)確。
[0116]可選的，當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí)，在步驟S13中，包括:從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
[0117]例如，如圖2所示，分析音頻數(shù)據(jù)后，得到兩個(gè)語句起始位置:3分10秒和3分18秒，暫停位置為3分20秒。可以選擇距離暫停位置最近的3分18秒繼續(xù)播放視頻，或者，如果預(yù)先設(shè)定回退語句數(shù)量為2，即回退2句話繼續(xù)播放視頻，則可以選擇從3分10秒繼續(xù)播放視頻。
[0118]在可選方案中，當(dāng)確定多個(gè)語句起始位置時(shí)，可以靈活選擇其中一個(gè)作為暫停后繼續(xù)播放音視頻的起點(diǎn)，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0119]可選的，在步驟Sll和步驟S12中，當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，該方法還包括:
[0120]按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；
[0121]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；
[0122]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
[0123]例如，圖7是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖，如圖7所示，用戶播放視頻時(shí)，暫停位置為3分20秒處，根據(jù)獲取到的暫停位置之前16秒，即3分04秒至3分20秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，沒有得到一個(gè)完整語句的語句起始位置，可以在3分04秒之前再獲取16秒，即2分48秒至3分04秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)進(jìn)行語句起始位置的分析，直到確定出至少一個(gè)完整語句的語句起始位置。[0124]在可選方案中，在暫停位置之前按照時(shí)間順序獲取一段時(shí)間的數(shù)據(jù)進(jìn)行語句起始位置的分析，如果沒有得到一個(gè)完整語句的語句起始位置，則在此之前再獲取一段時(shí)間的數(shù)據(jù)進(jìn)行分析，直到確定出一個(gè)語句起始位置，作為暫停后繼續(xù)播放音視頻的起點(diǎn)，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0125]可選的，在步驟Sll中，還可以獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或
字.數(shù)據(jù)。
[0126]在步驟S12中，根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
[0127]例如，圖8是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖，如圖8所示，暫停位置為3分20秒處，第一預(yù)設(shè)時(shí)長為16秒，第二預(yù)設(shè)時(shí)長為5秒，獲取3分15秒之前16秒，即2分59秒至3分15秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。經(jīng)分析后得到語句起始位置為3分18秒。
[0128]在可選方案中，可以先選取到暫停位置之前一段時(shí)間例如5秒前的時(shí)間位置，以該時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn)，使得用戶可以獲得提供更充裕的進(jìn)入視頻情節(jié)的時(shí)間。
[0129]例如，如圖8所示，經(jīng)分析后得到兩個(gè)語句起始位置，3分10秒和3分18秒，分別在上述時(shí)間位置(3分15秒)之前和在上述時(shí)間位置和暫停位置(3分20秒)之間，這兩個(gè)語句起始位置均可以用于作為暫停后繼續(xù)播放音視頻的起點(diǎn)。
[0130]在可選方案中，可以按照時(shí)間從后往前的順序依序獲取上述時(shí)間位置(3分15秒)之前至少一個(gè)16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，并在每獲得一個(gè)16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)時(shí)，從獲得的該16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
[0131]在可選方案中，當(dāng)以暫停位置之前一段時(shí)間的時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn)時(shí)，確定的語句起始位置可以在該時(shí)間位置之前，也可以在該時(shí)間位置與暫停位置之間，對(duì)于暫停后繼續(xù)播放音視頻的起點(diǎn)的選擇更加靈活，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0132]下面分別以兩個(gè)具體示例對(duì)本公開的多媒體播放方法進(jìn)行具體說明。
[0133]示例一
[0134]圖9是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖9所示，該方法包括以下步驟。
[0135]在步驟S91中，在視頻播放過程中發(fā)生暫停，暫停位置為5分36秒。
[0136]在步驟S92中，讀取暫停位置之前16秒的音頻數(shù)據(jù)，即5分20秒至5分36秒的
音頻數(shù)據(jù)。
[0137]在步驟S93中，根據(jù)人聲頻率對(duì)讀取到的音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)。
[0138]在步驟S94中，檢測(cè)人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔。
[0139]在步驟S95中，判斷相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔是否大于0.1秒,如果是，則執(zhí)行步驟S96 ;如果否，則該相鄰人聲音頻信號(hào)之間不是語句起始位置。
[0140]在步驟S96中，確定相鄰人聲音頻信號(hào)之間的任一時(shí)間位置為語句起始位置，得到的語句起始位置有2個(gè)，5分29秒和5分33秒。
[0141]在步驟S97中，選擇距離暫停位置最近的5分33秒繼續(xù)播放視頻。
[0142]示例二
[0143]圖10是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖，如圖10所示，該方法包括以下步驟。
[0144]在步驟SlOl中，在視頻播放過程中發(fā)生暫停，暫停位置為5分36秒。
[0145]在步驟S102中，按照時(shí)間從后往前的順序依序讀取暫停位置之前5秒，即5分31秒的時(shí)間位置之前16秒的字幕數(shù)據(jù)。
[0146]在步驟S103中，根據(jù)每次讀取到的16秒的字幕數(shù)據(jù)中判斷是否存在語句起始位置，如果是，執(zhí)行步驟S94，如果否，返回步驟S102，讀取5分15秒之前16秒的字幕數(shù)據(jù)；
[0147]在步驟S104中，得到語句起始位置有3個(gè):5分02秒，5分09秒和5分13秒。
[0148]在步驟S105中，預(yù)先設(shè)定回退語句數(shù)量為2，則回退到5分31秒之前的2句，即5分09秒的位置繼續(xù)播放視頻。
[0149]在上述兩個(gè)具體示例中，通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，可以靈活地根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻，使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句，視頻或音頻里的對(duì)話更自然，情節(jié)更連續(xù)，提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
[0150]圖11是根據(jù)一示例性實(shí)施例示出的一種多媒體播放裝置的框圖。參照?qǐng)D11，該裝置包括獲取模塊111、分析模塊112和播放模塊113。
[0151]獲取模塊111被配置為獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。
[0152]分析模塊112被配置為根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置。
[0153]播放模塊113被配置為用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
[0154]圖12a是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12a所示，可選的，所述分析模塊112包括:檢測(cè)單元1121和分析確定單元1122。
[0155]檢測(cè)單元1121被配置為檢測(cè)所述獲取模塊111獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；
[0156]分析確定單元1122被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置；
[0157]圖12b是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12b所示，可選的，分析模塊112包括:獲取單元1123和分析確定單元1122。
[0158]獲取單元1123被配置為從所述獲取模塊111獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
[0159]分析確定單元1122被配置為根據(jù)所述獲取單元1123獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。[0160]圖12c是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12c所示，可選的，分析模塊112包括:檢測(cè)單元1121、獲取單元1123和分析確定單元1122。
[0161]檢測(cè)單元1121被配置為檢測(cè)所述獲取模塊111獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間。
[0162]獲取單元1123被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
[0163]分析確定單元1122被配置為根據(jù)所述獲取單元1123獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0164]圖12d是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12d所示，可選的，所述分析模塊112還包括:過濾單元1124。
[0165]過濾單元1124被配置為根據(jù)人聲頻率對(duì)所述獲取模塊111獲取的所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；
[0166]所述檢測(cè)單元1121被配置為檢測(cè)所述過濾單元1124過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；
[0167]所述分析確定單元1122被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
[0168]可選的，所述播放模塊113被配置為當(dāng)所述分析模塊112確定出至少兩個(gè)完整語句的語句起始位置時(shí)，從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
[0169]可選的，所述獲取模塊111被配置為當(dāng)所述分析模塊112根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前。
[0170]所述分析模塊112被配置為從所述獲取模塊111本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
[0171]可選的，所述獲取模塊111被配置為獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。
[0172]可選的，所述分析模塊112被配置為根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
[0173]關(guān)于上述實(shí)施例中的裝置，其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述，此處將不做詳細(xì)闡述說明。
[0174]圖13是根據(jù)一示例性實(shí)施例示出的一種用于多媒體播放的裝置1300的框圖。例如，裝置1300可以是移動(dòng)電話，計(jì)算機(jī)，數(shù)字廣播終端，消息收發(fā)設(shè)備，游戲控制臺(tái)，平板設(shè)備，醫(yī)療設(shè)備，健身設(shè)備，個(gè)人數(shù)字助理等。
[0175]參照?qǐng)D13，裝置1300可以包括以下一個(gè)或多個(gè)組件:處理組件1302，存儲(chǔ)器1304，電源組件1306，多媒體組件1308，音頻組件1310，輸入/輸出(I/O)的接口 1312，傳感器組件1314，以及通信組件1316。
[0176]處理組件1302通?？刂蒲b置1300的整體操作，諸如與顯示，電話呼叫，數(shù)據(jù)通信，相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件1302可以包括一個(gè)或多個(gè)處理器1320來執(zhí)行指令，以完成上述的方法的全部或部分步驟。此外，處理組件1302可以包括一個(gè)或多個(gè)模塊，便于處理組件1302和其他組件之間的交互。例如，處理部件1302可以包括多媒體模塊，以方便多媒體組件1308和處理組件1302之間的交互。
[0177]存儲(chǔ)器1304被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備1300的操作。這些數(shù)據(jù)的示例包括用于在裝置1300上操作的任何應(yīng)用程序或方法的指令，聯(lián)系人數(shù)據(jù)，電話簿數(shù)據(jù)，消息，圖片，視頻等。存儲(chǔ)器1304可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn)，如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)，電可擦除可編程只讀存儲(chǔ)器(EEPROM)，可擦除可編程只讀存儲(chǔ)器(EPROM)，可編程只讀存儲(chǔ)器(PROM)，只讀存儲(chǔ)器(R0M)，磁存儲(chǔ)器，快閃存儲(chǔ)器，磁盤或光盤。
[0178]電力組件1306為裝置1300的各種組件提供電力。電力組件1306可以包括電源管理系統(tǒng)，一個(gè)或多個(gè)電源，及其他與為裝置1300生成、管理和分配電力相關(guān)聯(lián)的組件。
[0179]多媒體組件1308包括在所述裝置1300和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中，屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板，屏幕可以被實(shí)現(xiàn)為觸摸屏，以接收來自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界，而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中，多媒體組件1308包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備1300處于操作模式，如拍攝模式或視頻模式時(shí)，前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
[0180]音頻組件1310被配置為輸出和/或輸入音頻信號(hào)。例如，音頻組件1310包括一個(gè)麥克風(fēng)(MIC)，當(dāng)裝置1300處于操作模式，如呼叫模式、記錄模式和語音識(shí)別模式時(shí)，麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1304或經(jīng)由通信組件1316發(fā)送。在一些實(shí)施例中，音頻組件1310還包括一個(gè)揚(yáng)聲器，用于輸出音頻信號(hào)。
[0181]I/O接口 1312為處理組件1302和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點(diǎn)擊輪，按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
[0182]傳感器組件1314包括一個(gè)或多個(gè)傳感器，用于為裝置1300提供各個(gè)方面的狀態(tài)評(píng)估。例如，傳感器組件1314可以檢測(cè)到設(shè)備1300的打開/關(guān)閉狀態(tài)，組件的相對(duì)定位，例如所述組件為裝置1300的顯示器和小鍵盤，傳感器組件1314還可以檢測(cè)裝置1300或裝置1300 —個(gè)組件的位置改變，用戶與裝置1300接觸的存在或不存在，裝置1300方位或加速/減速和裝置1300的溫度變化。傳感器組件1314可以包括接近傳感器，被配置用來在沒有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1314還可以包括光傳感器，如CMOS或CXD圖像傳感器，用于在成像應(yīng)用中使用。在一些實(shí)施例中，該傳感器組件1314還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。
[0183]通信組件1316被配置為便于裝置1300和其他設(shè)備之間有線或無線方式的通信。裝置1300可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò)，如WiFi，2G或3G，或它們的組合。在一個(gè)示例性實(shí)施例中，通信部件1316經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中，所述通信部件1316還包括近場(chǎng)通信(NFC)模塊，以促進(jìn)短程通信。例如，在NFC模塊可基于射頻識(shí)別(RFID)技術(shù)，紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù)，超寬帶(UWB)技術(shù)，藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
[0184]在示例性實(shí)施例中，裝置1300可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn)，用于執(zhí)行上述方法。
[0185]在示例性實(shí)施例中，還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，例如包括指令的存儲(chǔ)器1304，上述指令可由裝置1300的處理器1320執(zhí)行以完成上述方法。例如，所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
[0186]一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)，當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí)，使得移動(dòng)終端能夠執(zhí)行一種多媒體播放方法，包括:
[0187]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0188]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；
[0189]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
[0190]可選的，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0191]檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；
[0192]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
[0193]可選的，所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0194]獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0195]根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0196]可選的，所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0197]檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間；
[0198]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；
[0199]根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
[0200]可選的，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括:[0201]根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；
[0202]檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；
[0203]當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
[0204]可選的，當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí)，所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體，包括:
[0205]從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者
[0206]當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
[0207]可選的，當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，所述方法還包括:
[0208]按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；
[0209]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；
[0210]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
[0211]可選的，所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，包括:
[0212]獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；
[0213]獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；
[0214]所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置，包括:
[0215]根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
[0216]本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后，將容易想到本發(fā)明的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化，這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本【技術(shù)領(lǐng)域】中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的，本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
[0217]應(yīng)當(dāng)理解的是，本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu)，并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。
【權(quán)利要求】
1.一種多媒體播放方法，其特征在于，包括: 獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括: 檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置，包括: 獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
4.根據(jù)權(quán)利要求 1所述的方法，其特征在于，所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置，包括: 檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間；當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
5.根據(jù)權(quán)利要求2-4任一項(xiàng)中所述的方法，其特征在于，所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置，包括: 根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
6.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法，其特征在于，當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí)，所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體，包括: 從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
7.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法，其特征在于，當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，所述方法還包括: 按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
8.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法，其特征在于，所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，包括: 獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置，包括: 根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
9.一種多媒體播放裝置，其特征在于，包括: 獲取模塊，用于獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；分析模塊，用于根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；播放模塊，用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述分析模塊包括: 檢測(cè)單元，用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔；分析確定單元，用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
11.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述分析模塊包括: 獲取單元，用于從所述獲取模塊獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；分析確定單元，用于根據(jù)所述獲取單元獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
12.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述分析模塊包括:檢測(cè)單元，用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間；獲取單元，用于當(dāng)所述檢測(cè)單元檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí)，獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間；分析確定單元，用于根據(jù)所述獲取單元獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
13.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置，其特征在于，所述分析模塊還包括: 過濾單元，用于根據(jù)人聲頻率對(duì)所述獲取模塊獲取的所述音頻數(shù)據(jù)進(jìn)行過濾，得到人聲音頻數(shù)據(jù)；所述檢測(cè)單元，用于檢測(cè)所述過濾單元過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔；所述分析確定單元，用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí)，確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
14.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置，其特征在于，所述播放模塊，用于當(dāng)所述分析模塊確定出至少兩個(gè)完整語句的語句起始位置時(shí)，從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體；或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí)，從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體，所述N為大于或等于2的整數(shù)。
15.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置，其特征在于，所述獲取模塊，用于當(dāng)所述分析模塊根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí)，按照時(shí)間從后往前的順序，獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，其中，本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前；所述分析模塊，用于從所述獲取模塊本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置；若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置，則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置，直到確定出至少一個(gè)完整語句的語句起始位置。
16.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置，其特征在于，所述獲取模塊，用于獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置；獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；所述分析模塊，用于根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)，確定完整語句的語句起始位置。
17.一種多媒體播放裝置，其特征在于，包括: 處理器；用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器；其中，所述處理器被配置為: 獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)；根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置；當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí)，根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
【文檔編號(hào)】H04N21/472GK104038827SQ201410250800
【公開日】2014年9月10日申請(qǐng)日期:2014年6月6日優(yōu)先權(quán)日:2014年6月6日
【發(fā)明者】王斌, 鄭志光, 紀(jì)東方申請(qǐng)人:小米科技有限責(zé)任公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：王斌;鄭志光;紀(jì)東方
技術(shù)所有人：小米科技有限責(zé)任公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

多媒體演示系統(tǒng)相關(guān)技術(shù)

多媒體裝置藝術(shù)相關(guān)技術(shù)

多媒體互動(dòng)裝置相關(guān)技術(shù)

多媒體裝置相關(guān)技術(shù)

檢查裝置氣密性的方法相關(guān)技術(shù)

裝置氣密性檢查方法相關(guān)技術(shù)

檢驗(yàn)裝置氣密性的方法相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

多媒體播放方法及裝置制造方法