国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      多媒體播放方法及裝置制造方法

      文檔序號(hào):7805604閱讀:120來源:國知局
      多媒體播放方法及裝置制造方法
      【專利摘要】本發(fā)明是關(guān)于一種多媒體播放方法及裝置。所述方法包括:獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置;當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。本發(fā)明用于使得在暫停后繼續(xù)播放時(shí)用戶可以捕捉并理解到完整的語句。
      【專利說明】多媒體播放方法及裝置
      【技術(shù)領(lǐng)域】
      [0001]本公開涉及多媒體處理【技術(shù)領(lǐng)域】,尤其涉及一種多媒體播放方法及裝置。
      【背景技術(shù)】
      [0002]相關(guān)技術(shù)中,在播放視頻的時(shí)候,經(jīng)常會(huì)出現(xiàn)暫停,包括因?yàn)橛脩糁饔^原因的主動(dòng)暫停,也包括由于網(wǎng)絡(luò)的原因,出現(xiàn)短暫的卡頓暫停。由于暫定的時(shí)刻機(jī)動(dòng)性比較大,在繼續(xù)播放的時(shí)候,視頻里面出現(xiàn)的聲音往往是從一個(gè)句子的中間開始,甚至從一個(gè)字或者詞的一半開始,這樣不便于人們連續(xù)地理解情節(jié)。
      [0003]相關(guān)技術(shù)中,一些多媒體播放軟件或網(wǎng)頁,在播放過程中關(guān)閉軟件或網(wǎng)頁后,當(dāng)再次開啟軟件播放同一視頻或重新打開上次關(guān)閉的視頻網(wǎng)頁時(shí),也會(huì)采取在暫停位置返回固定時(shí)間量的回退播放方式。例如,返回的時(shí)間值固定設(shè)置為5秒,則當(dāng)中斷后重新開啟軟件或網(wǎng)頁,繼續(xù)播放原視頻時(shí),從中斷點(diǎn)之前的5秒開始播放,以便用戶接續(xù)到上次觀看的記憶。
      [0004]這種回退播放方式,后退的時(shí)間值是預(yù)先設(shè)定的固定值,雖然給予用戶一定回想的時(shí)間,但是切入的時(shí)間點(diǎn)比較生硬,不夠人性化。因?yàn)榧词购笸?秒,也會(huì)出現(xiàn)從一個(gè)句子的中間開始繼續(xù)播放的情況,不利于用戶理解完整的語句。

      【發(fā)明內(nèi)容】

      [0005]為克服相關(guān)技術(shù)中存在的問題,本公開實(shí)施例提供一種多媒體播放方法及裝置。
      [0006]根據(jù)本公開實(shí)施例的第一方面,提供一種多媒體播放方法,包括:
      [0007]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0008]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置;
      [0009]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
      [0010]本實(shí)施例中,通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定一句完整語句的語句起始位置,根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻,使得在暫停后繼續(xù)播放時(shí)用戶可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0011]可選的,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0012]檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔;
      [0013]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
      [0014]可選的,所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0015]獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0016]根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0017]可選的,所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0018]檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間;
      [0019]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0020]根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0021]在可選方案中,通過根據(jù)相鄰音頻信號(hào)之間的時(shí)間間隔或相鄰字幕之間的時(shí)間間隔確定語句起始位置,使得后續(xù)可以根據(jù)語句起始位置繼續(xù)播放音頻或視頻,用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。另外,同時(shí)對(duì)音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行分析,確定兩個(gè)完整語句之間的間隔位置,從而更精確地獲得完整語句的起始點(diǎn),不僅不會(huì)影響到用戶對(duì)語句的理解,也不會(huì)影響到用戶觀看到字幕。
      [0022]可選的,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0023]根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù);
      [0024]檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔;
      [0025]當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      [0026]在可選方案中,按照人聲通常的頻率先對(duì)音頻數(shù)據(jù)過濾,從而單純對(duì)人聲音頻信號(hào)進(jìn)行分析,根據(jù)人聲音頻信號(hào)之間的時(shí)間間隔確定語句起始位置,使得對(duì)語句起始位置的確定更加準(zhǔn)確。
      [0027]可選的,當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí),所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體,包括:
      [0028]從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者
      [0029]當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      [0030]在可選方案中,當(dāng)確定多個(gè)語句起始位置時(shí),可以靈活選擇其中一個(gè)作為暫停后繼續(xù)播放音視頻的起點(diǎn),使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0031]可選的,當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),所述方法還包括:
      [0032]按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前;
      [0033]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;
      [0034]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。[0035]可選的,所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),包括:
      [0036]獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;
      [0037]獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0038]所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0039]根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      [0040]在可選方案中,可以先選取到暫停位置前一段時(shí)間的時(shí)間位置,以該時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn),使得用戶可以獲得提供更充裕的進(jìn)入視頻情節(jié)的時(shí)間。
      [0041]根據(jù)本公開實(shí)施例的第二方面,提供一種多媒體播放裝置,包括:
      [0042]獲取模塊,用于獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0043]分析模塊,用于根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置;
      [0044]播放模塊,用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
      [0045]所述分析模塊包括:
      [0046]檢測(cè)單元,用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔;
      [0047]分析確定單元,用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
      [0048]所述分析模塊包括:
      [0049]獲取單元,用于從所述獲取模塊獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0050]分析確定單元,用于根據(jù)所述獲取單元獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。所述分析模塊包括:
      [0051 ] 檢測(cè)單元,用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間;
      [0052]獲取單元,用于當(dāng)所述檢測(cè)單元檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;分析確定單元,用于根據(jù)所述獲取單元獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0053]所述分析模塊還包括:
      [0054]所述分析模塊還包括:
      [0055]過濾單元,用于根據(jù)人聲頻率對(duì)所述獲取模塊獲取的所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù);[0056]所述檢測(cè)單元,用于檢測(cè)所述過濾單元過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔;
      [0057]所述分析確定單元,用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      [0058]所述播放模塊,用于當(dāng)所述分析模塊確定出至少兩個(gè)完整語句的語句起始位置時(shí),從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      [0059]所述獲取模塊,用于當(dāng)所述分析模塊根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前;
      [0060]所述分析模塊,用于從所述獲取模塊本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      [0061]所述獲取模塊,用于獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0062]所述分析模塊,用于根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      [0063]根據(jù)本公開實(shí)施例的第三方面,提供一種多媒體播放裝置,包括:
      [0064]處理器;
      [0065]用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器;
      [0066]其中,所述處理器被配置為:
      [0067]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0068]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置;
      [0069]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
      [0070]應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
      【專利附圖】

      【附圖說明】
      [0071]此處的附圖被并入說明書中并構(gòu)成本說明書的一部分,示出了符合本發(fā)明的實(shí)施例,并與說明書一起用于解釋本發(fā)明的原理。
      [0072]圖1是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;[0073]圖2是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖;
      [0074]圖3是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0075]圖4是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0076]圖5是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0077]圖6是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0078]圖7是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖;
      [0079]圖8是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖;
      [0080]圖9是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0081]圖10是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖;
      [0082]圖11是根據(jù)一示例性實(shí)施例示出的一種多媒體播放裝置的框圖;
      [0083]圖12a是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖;
      [0084]圖12b是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖;
      [0085]圖12c是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖;
      [0086]圖12d是根據(jù)另一示例性實(shí)施例示出的分析模塊的框圖;
      [0087]圖13是根據(jù)一示例性實(shí)施例示出的一種用于多媒體播放的裝置1300的框圖。
      【具體實(shí)施方式】
      [0088]這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本發(fā)明相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
      [0089]本公開實(shí)施例中的多媒體包括視頻、音頻等等。多媒體播放過程中發(fā)生暫停,暫??梢允怯脩糁鲃?dòng)觸發(fā)的,也可能是由于網(wǎng)絡(luò)原因引起的。用戶主動(dòng)的暫停多媒體播放,可以通過操作指令獲知。由于網(wǎng)絡(luò)原因的暫停多媒體播放,則可以通過檢測(cè)視頻緩存區(qū)中剩余未播放的數(shù)據(jù)量獲知,當(dāng)后續(xù)沒有可供播放的視頻緩存數(shù)據(jù)時(shí),視頻播放便會(huì)中止。
      [0090]本公開實(shí)施例中,在多媒體播放暫停后,通過分析多媒體中音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中完整語句的語句起始點(diǎn),使得對(duì)多媒體的繼續(xù)播放可以從一個(gè)完整語句開始,解決固定時(shí)間回退播放所導(dǎo)致的影響用戶理解語句的問題。
      [0091]圖1是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖1所示,多媒體播放方法用于終端中,包括以下步驟。
      [0092]在步驟Sll中,獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字眷數(shù)據(jù)。
      [0093]在步驟S12中,根據(jù)音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置。
      [0094]在步驟S13中,當(dāng)檢測(cè)到繼續(xù)播放多媒體的指令或滿足繼續(xù)播放多媒體的條件時(shí),根據(jù)語句起始位置繼續(xù)播放多媒體。
      [0095]本實(shí)施例中,通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定一句完整語句的語句起始位置,根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻,使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。[0096]按照經(jīng)驗(yàn),完整的一句話通常不超過16秒,實(shí)際應(yīng)用時(shí),在步驟Sll中,可以設(shè)置第一預(yù)設(shè)時(shí)長為16秒。例如,圖2是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖,如圖2所示,用戶播放視頻時(shí),暫停位置為3分20秒處,可以獲取暫停位置之前16秒,即3分04秒至3分20秒的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),用以在這些數(shù)據(jù)中確定完整語句的語句起始位置。
      [0097]圖3是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖3所示,可選的,在步驟S12中,根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括以下步驟。
      [0098]在步驟S31中,檢測(cè)音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔。
      [0099]在步驟S32中,當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為語句起始位置。
      [0100]圖4是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖4所示,可選的,在步驟S12中,根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置,包括以下步驟。
      [0101]在步驟S41中,獲取字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0102]在步驟S42中,根據(jù)字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定語句起始位置。由于兩句話之間應(yīng)該有一定的時(shí)間間隔,如0.1秒,因此,可以根據(jù)音頻信號(hào)之間的間隔時(shí)長確定完整句子。同理,當(dāng)用戶觀播放的音視頻文件有字幕時(shí),還可以根據(jù)相鄰字幕之間的時(shí)間間隔確定完整句子。例如,獲取到前一條字幕的終止顯示時(shí)間為3分04秒160毫秒,后一條字幕的起始顯示時(shí)間為3分04秒290毫秒,兩條字幕之間的間隔為130毫秒,即0.13秒,超過了 0.1秒,可以判斷這兩條字幕之間存在語句起始位置。
      [0103]或者,在有些音視頻文件中,一條字幕本身就對(duì)應(yīng)一句完整的語句,這樣可以根據(jù)本條字幕的起始顯示時(shí)間或上一條字幕的終止顯示時(shí)間確定語句起始位置。
      [0104]在可選方案中,通過根據(jù)相鄰音頻信號(hào)之間的時(shí)間間隔或相鄰字幕之間的時(shí)間間隔確定語句起始位置,使得后續(xù)可以根據(jù)語句起始位置繼續(xù)播放音頻或視頻,用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0105]圖5是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖5所示,可選的,在步驟S12中,根據(jù)音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0106]在步驟S51中,檢測(cè)音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間。
      [0107]在步驟S52中,當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
      [0108]在步驟S52中,根據(jù)相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定語句起始位置。
      [0109]例如,通過對(duì)音頻數(shù)據(jù)分析,獲得相鄰兩個(gè)音頻信號(hào)的播放時(shí)間3分09秒和3分12秒,這兩個(gè)相鄰音頻信號(hào)的時(shí)間間隔未3秒,大于預(yù)先設(shè)定的0.1秒;而這兩個(gè)相鄰音頻信號(hào)對(duì)應(yīng)的相鄰兩條字幕的顯示時(shí)間為3分08秒和3分11秒,也大于預(yù)先設(shè)定的0.1秒。因此,可以確定至少在3分10秒處同時(shí)出現(xiàn)音頻信號(hào)和字幕的空白,可以將3分10秒作為繼續(xù)播放多媒體的起點(diǎn)。
      [0110]在可選方案中,同時(shí)對(duì)音頻數(shù)據(jù)和字幕數(shù)據(jù)進(jìn)行分析,確定兩個(gè)完整語句之間的間隔位置,從而更精確地獲得完整語句的起始點(diǎn),不僅不會(huì)影響到用戶對(duì)語句的理解,也不會(huì)影響到用戶觀看到字幕。
      [0111]圖6是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖6所示,可選的,在步驟S12中,根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括以下步驟。
      [0112]在步驟S61中,根據(jù)人聲頻率對(duì)音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù)。
      [0113]在步驟S62中,檢測(cè)人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔。
      [0114]在步驟S63中,當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為語句起始位置。
      [0115]在可選方案中,當(dāng)音頻數(shù)據(jù)中除了人聲外,還存在背景聲音(音樂、環(huán)境音等)的干擾,因此,無法根據(jù)音頻信號(hào)之間的時(shí)間間隔確定語句起始位置。那么,可以按照人聲通常的頻率先對(duì)音頻數(shù)據(jù)過濾,從而單純對(duì)人聲音頻信號(hào)進(jìn)行分析,根據(jù)人聲音頻信號(hào)之間的時(shí)間間隔確定語句起始位置,使得對(duì)語句起始位置的確定更加準(zhǔn)確。
      [0116]可選的,當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí),在步驟S13中,包括:從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      [0117]例如,如圖2所示,分析音頻數(shù)據(jù)后,得到兩個(gè)語句起始位置:3分10秒和3分18秒,暫停位置為3分20秒。可以選擇距離暫停位置最近的3分18秒繼續(xù)播放視頻,或者,如果預(yù)先設(shè)定回退語句數(shù)量為2,即回退2句話繼續(xù)播放視頻,則可以選擇從3分10秒繼續(xù)播放視頻。
      [0118]在可選方案中,當(dāng)確定多個(gè)語句起始位置時(shí),可以靈活選擇其中一個(gè)作為暫停后繼續(xù)播放音視頻的起點(diǎn),使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0119]可選的,在步驟Sll和步驟S12中,當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),該方法還包括:
      [0120]按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前;
      [0121]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;
      [0122]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      [0123]例如,圖7是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖,如圖7所示,用戶播放視頻時(shí),暫停位置為3分20秒處,根據(jù)獲取到的暫停位置之前16秒,即3分04秒至3分20秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),沒有得到一個(gè)完整語句的語句起始位置,可以在3分04秒之前再獲取16秒,即2分48秒至3分04秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)進(jìn)行語句起始位置的分析,直到確定出至少一個(gè)完整語句的語句起始位置。[0124]在可選方案中,在暫停位置之前按照時(shí)間順序獲取一段時(shí)間的數(shù)據(jù)進(jìn)行語句起始位置的分析,如果沒有得到一個(gè)完整語句的語句起始位置,則在此之前再獲取一段時(shí)間的數(shù)據(jù)進(jìn)行分析,直到確定出一個(gè)語句起始位置,作為暫停后繼續(xù)播放音視頻的起點(diǎn),使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0125]可選的,在步驟Sll中,還可以獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或
      字.數(shù)據(jù)。
      [0126]在步驟S12中,根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      [0127]例如,圖8是根據(jù)一示例性實(shí)施例示出的暫停位置與語句起始位置的時(shí)間軸示意圖,如圖8所示,暫停位置為3分20秒處,第一預(yù)設(shè)時(shí)長為16秒,第二預(yù)設(shè)時(shí)長為5秒,獲取3分15秒之前16秒,即2分59秒至3分15秒之間的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。經(jīng)分析后得到語句起始位置為3分18秒。
      [0128]在可選方案中,可以先選取到暫停位置之前一段時(shí)間例如5秒前的時(shí)間位置,以該時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn),使得用戶可以獲得提供更充裕的進(jìn)入視頻情節(jié)的時(shí)間。
      [0129]例如,如圖8所示,經(jīng)分析后得到兩個(gè)語句起始位置,3分10秒和3分18秒,分別在上述時(shí)間位置(3分15秒)之前和在上述時(shí)間位置和暫停位置(3分20秒)之間,這兩個(gè)語句起始位置均可以用于作為暫停后繼續(xù)播放音視頻的起點(diǎn)。
      [0130]在可選方案中,可以按照時(shí)間從后往前的順序依序獲取上述時(shí)間位置(3分15秒)之前至少一個(gè)16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),并在每獲得一個(gè)16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)時(shí),從獲得的該16秒內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      [0131]在可選方案中,當(dāng)以暫停位置之前一段時(shí)間的時(shí)間位置作為往回尋找完整語句的語句起始位置的起點(diǎn)時(shí),確定的語句起始位置可以在該時(shí)間位置之前,也可以在該時(shí)間位置與暫停位置之間,對(duì)于暫停后繼續(xù)播放音視頻的起點(diǎn)的選擇更加靈活,使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0132]下面分別以兩個(gè)具體示例對(duì)本公開的多媒體播放方法進(jìn)行具體說明。
      [0133]示例一
      [0134]圖9是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖9所示,該方法包括以下步驟。
      [0135]在步驟S91中,在視頻播放過程中發(fā)生暫停,暫停位置為5分36秒。
      [0136]在步驟S92中,讀取暫停位置之前16秒的音頻數(shù)據(jù),即5分20秒至5分36秒的
      音頻數(shù)據(jù)。
      [0137]在步驟S93中,根據(jù)人聲頻率對(duì)讀取到的音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù)。
      [0138]在步驟S94中,檢測(cè)人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔。
      [0139]在步驟S95中,判斷相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔是否大于0.1秒,如果是,則執(zhí)行步驟S96 ;如果否,則該相鄰人聲音頻信號(hào)之間不是語句起始位置。
      [0140]在步驟S96中,確定相鄰人聲音頻信號(hào)之間的任一時(shí)間位置為語句起始位置,得到的語句起始位置有2個(gè),5分29秒和5分33秒。
      [0141]在步驟S97中,選擇距離暫停位置最近的5分33秒繼續(xù)播放視頻。
      [0142]示例二
      [0143]圖10是根據(jù)一示例性實(shí)施例示出的一種多媒體播放方法的流程圖,如圖10所示,該方法包括以下步驟。
      [0144]在步驟SlOl中,在視頻播放過程中發(fā)生暫停,暫停位置為5分36秒。
      [0145]在步驟S102中,按照時(shí)間從后往前的順序依序讀取暫停位置之前5秒,即5分31秒的時(shí)間位置之前16秒的字幕數(shù)據(jù)。
      [0146]在步驟S103中,根據(jù)每次讀取到的16秒的字幕數(shù)據(jù)中判斷是否存在語句起始位置,如果是,執(zhí)行步驟S94,如果否,返回步驟S102,讀取5分15秒之前16秒的字幕數(shù)據(jù);
      [0147]在步驟S104中,得到語句起始位置有3個(gè):5分02秒,5分09秒和5分13秒。
      [0148]在步驟S105中,預(yù)先設(shè)定回退語句數(shù)量為2,則回退到5分31秒之前的2句,即5分09秒的位置繼續(xù)播放視頻。
      [0149]在上述兩個(gè)具體示例中,通過分析音頻數(shù)據(jù)和/或字幕數(shù)據(jù),可以靈活地根據(jù)確定的語句起始位置繼續(xù)播放視頻或音頻,使得用戶繼續(xù)播放時(shí)可以捕捉并理解到完整的語句,視頻或音頻里的對(duì)話更自然,情節(jié)更連續(xù),提高用戶對(duì)視頻或音頻播放的體驗(yàn)度。
      [0150]圖11是根據(jù)一示例性實(shí)施例示出的一種多媒體播放裝置的框圖。參照?qǐng)D11,該裝置包括獲取模塊111、分析模塊112和播放模塊113。
      [0151]獲取模塊111被配置為獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。
      [0152]分析模塊112被配置為根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置。
      [0153]播放模塊113被配置為用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
      [0154]圖12a是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12a所示,可選的,所述分析模塊112包括:檢測(cè)單元1121和分析確定單元1122。
      [0155]檢測(cè)單元1121被配置為檢測(cè)所述獲取模塊111獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔;
      [0156]分析確定單元1122被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置;
      [0157]圖12b是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12b所示,可選的,分析模塊112包括:獲取單元1123和分析確定單元1122。
      [0158]獲取單元1123被配置為從所述獲取模塊111獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
      [0159]分析確定單元1122被配置為根據(jù)所述獲取單元1123獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。[0160]圖12c是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12c所示,可選的,分析模塊112包括:檢測(cè)單元1121、獲取單元1123和分析確定單元1122。
      [0161]檢測(cè)單元1121被配置為檢測(cè)所述獲取模塊111獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間。
      [0162]獲取單元1123被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間。
      [0163]分析確定單元1122被配置為根據(jù)所述獲取單元1123獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0164]圖12d是根據(jù)一示例性實(shí)施例示出的分析模塊的框圖。如圖12d所示,可選的,所述分析模塊112還包括:過濾單元1124。
      [0165]過濾單元1124被配置為根據(jù)人聲頻率對(duì)所述獲取模塊111獲取的所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù);
      [0166]所述檢測(cè)單元1121被配置為檢測(cè)所述過濾單元1124過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔;
      [0167]所述分析確定單元1122被配置為當(dāng)所述檢測(cè)單元1121檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      [0168]可選的,所述播放模塊113被配置為當(dāng)所述分析模塊112確定出至少兩個(gè)完整語句的語句起始位置時(shí),從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      [0169]可選的,所述獲取模塊111被配置為當(dāng)所述分析模塊112根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前。
      [0170]所述分析模塊112被配置為從所述獲取模塊111本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      [0171]可選的,所述獲取模塊111被配置為獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)。
      [0172]可選的,所述分析模塊112被配置為根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      [0173]關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
      [0174]圖13是根據(jù)一示例性實(shí)施例示出的一種用于多媒體播放的裝置1300的框圖。例如,裝置1300可以是移動(dòng)電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺(tái),平板設(shè)備,醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
      [0175]參照?qǐng)D13,裝置1300可以包括以下一個(gè)或多個(gè)組件:處理組件1302,存儲(chǔ)器1304,電源組件1306,多媒體組件1308,音頻組件1310,輸入/輸出(I/O)的接口 1312,傳感器組件1314,以及通信組件1316。
      [0176]處理組件1302通??刂蒲b置1300的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信,相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理組件1302可以包括一個(gè)或多個(gè)處理器1320來執(zhí)行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1302可以包括一個(gè)或多個(gè)模塊,便于處理組件1302和其他組件之間的交互。例如,處理部件1302可以包括多媒體模塊,以方便多媒體組件1308和處理組件1302之間的交互。
      [0177]存儲(chǔ)器1304被配置為存儲(chǔ)各種類型的數(shù)據(jù)以支持在設(shè)備1300的操作。這些數(shù)據(jù)的示例包括用于在裝置1300上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù)據(jù),消息,圖片,視頻等。存儲(chǔ)器1304可以由任何類型的易失性或非易失性存儲(chǔ)設(shè)備或者它們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM),電可擦除可編程只讀存儲(chǔ)器(EEPROM),可擦除可編程只讀存儲(chǔ)器(EPROM),可編程只讀存儲(chǔ)器(PROM),只讀存儲(chǔ)器(R0M),磁存儲(chǔ)器,快閃存儲(chǔ)器,磁盤或光盤。
      [0178]電力組件1306為裝置1300的各種組件提供電力。電力組件1306可以包括電源管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置1300生成、管理和分配電力相關(guān)聯(lián)的組件。
      [0179]多媒體組件1308包括在所述裝置1300和用戶之間的提供一個(gè)輸出接口的屏幕。在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號(hào)。觸摸面板包括一個(gè)或多個(gè)觸摸傳感器以感測(cè)觸摸、滑動(dòng)和觸摸面板上的手勢(shì)。所述觸摸傳感器可以不僅感測(cè)觸摸或滑動(dòng)動(dòng)作的邊界,而且還檢測(cè)與所述觸摸或滑動(dòng)操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中,多媒體組件1308包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備1300處于操作模式,如拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè)前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
      [0180]音頻組件1310被配置為輸出和/或輸入音頻信號(hào)。例如,音頻組件1310包括一個(gè)麥克風(fēng)(MIC),當(dāng)裝置1300處于操作模式,如呼叫模式、記錄模式和語音識(shí)別模式時(shí),麥克風(fēng)被配置為接收外部音頻信號(hào)。所接收的音頻信號(hào)可以被進(jìn)一步存儲(chǔ)在存儲(chǔ)器1304或經(jīng)由通信組件1316發(fā)送。在一些實(shí)施例中,音頻組件1310還包括一個(gè)揚(yáng)聲器,用于輸出音頻信號(hào)。
      [0181]I/O接口 1312為處理組件1302和外圍接口模塊之間提供接口,上述外圍接口模塊可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動(dòng)按鈕和鎖定按鈕。
      [0182]傳感器組件1314包括一個(gè)或多個(gè)傳感器,用于為裝置1300提供各個(gè)方面的狀態(tài)評(píng)估。例如,傳感器組件1314可以檢測(cè)到設(shè)備1300的打開/關(guān)閉狀態(tài),組件的相對(duì)定位,例如所述組件為裝置1300的顯示器和小鍵盤,傳感器組件1314還可以檢測(cè)裝置1300或裝置1300 —個(gè)組件的位置改變,用戶與裝置1300接觸的存在或不存在,裝置1300方位或加速/減速和裝置1300的溫度變化。傳感器組件1314可以包括接近傳感器,被配置用來在沒有任何的物理接觸時(shí)檢測(cè)附近物體的存在。傳感器組件1314還可以包括光傳感器,如CMOS或CXD圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件1314還可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
      [0183]通信組件1316被配置為便于裝置1300和其他設(shè)備之間有線或無線方式的通信。裝置1300可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示例性實(shí)施例中,通信部件1316經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號(hào)或廣播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件1316還包括近場(chǎng)通信(NFC)模塊,以促進(jìn)短程通信。例如,在NFC模塊可基于射頻識(shí)別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(huì)(IrDA)技術(shù),超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
      [0184]在示例性實(shí)施例中,裝置1300可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字信號(hào)處理器(DSP)、數(shù)字信號(hào)處理設(shè)備(DSro)、可編程邏輯器件(PLD)、現(xiàn)場(chǎng)可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
      [0185]在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),例如包括指令的存儲(chǔ)器1304,上述指令可由裝置1300的處理器1320執(zhí)行以完成上述方法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是ROM、隨機(jī)存取存儲(chǔ)器(RAM)、CD-ROM、磁帶、軟盤和光數(shù)據(jù)存儲(chǔ)設(shè)備等。
      [0186]一種非臨時(shí)性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)所述存儲(chǔ)介質(zhì)中的指令由移動(dòng)終端的處理器執(zhí)行時(shí),使得移動(dòng)終端能夠執(zhí)行一種多媒體播放方法,包括:
      [0187]獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0188]根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置;
      [0189]當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
      [0190]可選的,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0191]檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔;
      [0192]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
      [0193]可選的,所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0194]獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0195]根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0196]可選的,所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0197]檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間;
      [0198]當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;
      [0199]根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      [0200]可選的,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括:[0201]根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù);
      [0202]檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔;
      [0203]當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      [0204]可選的,當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí),所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體,包括:
      [0205]從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者
      [0206]當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      [0207]可選的,當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),所述方法還包括:
      [0208]按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前;
      [0209]從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;
      [0210]若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      [0211]可選的,所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),包括:
      [0212]獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;
      [0213]獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù);
      [0214]所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置,包括:
      [0215]根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      [0216]本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本公開未公開的本【技術(shù)領(lǐng)域】中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。
      [0217]應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。
      【權(quán)利要求】
      1.一種多媒體播放方法,其特征在于,包括: 獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù); 根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置; 當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括: 檢測(cè)所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔; 當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述字幕數(shù)據(jù)確定完整語句的語句起始位置,包括: 獲取所述字幕數(shù)據(jù)中每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間; 根據(jù)所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      4.根據(jù)權(quán)利要求 1所述的方法,其特征在于,所述根據(jù)所述音頻數(shù)據(jù)和字幕數(shù)據(jù)確定完整語句的語句起始位置,包括: 檢測(cè)所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間; 當(dāng)相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間; 根據(jù)所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      5.根據(jù)權(quán)利要求2-4任一項(xiàng)中所述的方法,其特征在于,所述根據(jù)所述音頻數(shù)據(jù)確定完整語句的語句起始位置,包括: 根據(jù)人聲頻率對(duì)所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù); 檢測(cè)所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔; 當(dāng)相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      6.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法,其特征在于, 當(dāng)根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定出至少兩個(gè)完整語句的語句起始位置時(shí),所述根據(jù)所述語句起始位置繼續(xù)播放所述多媒體,包括: 從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      7.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法,其特征在于,當(dāng)根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),所述方法還包括: 按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前;從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置; 若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      8.根據(jù)權(quán)利要求1-4任一項(xiàng)中所述的方法,其特征在于,所述獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),包括: 獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置; 獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù); 所述根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置,包括: 根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      9.一種多媒體播放裝置,其特征在于,包括: 獲取模塊,用于獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù); 分析模塊,用于根據(jù)所述獲取模塊獲取的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置; 播放模塊,用于當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述分析模塊確定的語句起始位置繼續(xù)播放所述多媒體。
      10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述分析模塊包括: 檢測(cè)單元,用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔; 分析確定單元,用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)音頻信號(hào)之間的任一時(shí)間位置為所述語句起始位置。
      11.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述分析模塊包括: 獲取單元,用于從所述獲取模塊獲取的所述字幕數(shù)據(jù)中獲取每條字幕的起始顯示時(shí)間和/或終止顯示時(shí)間; 分析確定單元,用于根據(jù)所述獲取單元獲取的所述字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述分析模塊包括:檢測(cè)單元,用于檢測(cè)所述獲取模塊獲取的所述音頻數(shù)據(jù)中每個(gè)音頻信號(hào)的播放時(shí)間;獲取單元,用于當(dāng)所述檢測(cè)單元檢測(cè)的相鄰兩個(gè)音頻信號(hào)之間的時(shí)間間隔大于第一預(yù)設(shè)間隔時(shí)長時(shí),獲取所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間;分析確定單元,用于根據(jù)所述獲取單元獲取的所述相鄰兩個(gè)音頻信號(hào)的播放時(shí)間及所述相鄰音頻信號(hào)對(duì)應(yīng)的字幕的起始顯示時(shí)間和/或終止顯示時(shí)間確定所述語句起始位置。
      13.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置,其特征在于,所述分析模塊還包括: 過濾單元,用于根據(jù)人聲頻率對(duì)所述獲取模塊獲取的所述音頻數(shù)據(jù)進(jìn)行過濾,得到人聲音頻數(shù)據(jù); 所述檢測(cè)單元,用于檢測(cè)所述過濾單元過濾后的所述人聲音頻數(shù)據(jù)中相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔; 所述分析確定單元,用于當(dāng)所述檢測(cè)單元檢測(cè)到的相鄰兩個(gè)人聲音頻信號(hào)之間的時(shí)間間隔大于所述第一預(yù)設(shè)間隔時(shí)長時(shí),確定所述相鄰兩個(gè)人聲音頻信號(hào)間之間的任一時(shí)間位置為所述語句起始位置。
      14.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置,其特征在于,所述播放模塊,用于當(dāng)所述分析模塊確定出至少兩個(gè)完整語句的語句起始位置時(shí),從距離所述暫停位置最近的語句起始位置繼續(xù)播放所述多媒體;或者當(dāng)預(yù)設(shè)的回退語句數(shù)量為N時(shí),從所述暫停位置之前的第N個(gè)語句起始位置繼續(xù)播放所述多媒體,所述N為大于或等于2的整數(shù)。
      15.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置,其特征在于, 所述獲取模塊,用于當(dāng)所述分析模塊根據(jù)所述多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)無法確定完整語句的語句起始位置時(shí),按照時(shí)間從后往前的順序,獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),其中,本次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間在上一次獲取的第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)的播放時(shí)間之前; 所述分析模塊,用于從所述獲取模塊本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中確定完整語句的語句起始位置;若從本次獲得的該第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)中無法確定完整語句的語句起始位置,則按照時(shí)間從后往前的順序繼續(xù)向前獲取第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù)并確定完整語句的語句起始位置,直到確定出至少一個(gè)完整語句的語句起始位置。
      16.根據(jù)權(quán)利要求9-12任一項(xiàng)中所述的裝置,其特征在于, 所述獲取模塊,用于獲取多媒體的暫停位置之前的、且與所述暫停位置間隔第二預(yù)設(shè)時(shí)長的時(shí)間位置;獲取所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù); 所述分析模塊,用于根據(jù)所述時(shí)間位置之前第一預(yù)設(shè)時(shí)長內(nèi)的音頻數(shù)據(jù)和/或字幕數(shù)據(jù),確定完整語句的語句起始位置。
      17.一種多媒體播放裝置,其特征在于,包括: 處理器; 用于存儲(chǔ)處理器可執(zhí)行指令的存儲(chǔ)器; 其中,所述處理器被配置為: 獲取多媒體的暫停位置之前第一預(yù)設(shè)時(shí)長的音頻數(shù)據(jù)和/或字幕數(shù)據(jù); 根據(jù)所述音頻數(shù)據(jù)和/或字幕數(shù)據(jù)確定完整語句的語句起始位置; 當(dāng)檢測(cè)到繼續(xù)播放所述多媒體的指令或滿足繼續(xù)播放所述多媒體的條件時(shí),根據(jù)所述語句起始位置繼續(xù)播放所述多媒體。
      【文檔編號(hào)】H04N21/472GK104038827SQ201410250800
      【公開日】2014年9月10日 申請(qǐng)日期:2014年6月6日 優(yōu)先權(quán)日:2014年6月6日
      【發(fā)明者】王斌, 鄭志光, 紀(jì)東方 申請(qǐng)人:小米科技有限責(zé)任公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1