識別媒體內(nèi)容中的報(bào)道的制作方法
【專利說明】
【背景技術(shù)】
[0001]在今日總是互聯(lián)的社會中,形式為現(xiàn)場直播、預(yù)錄制或點(diǎn)播節(jié)目的媒體內(nèi)容幾乎是普遍存在的。例如,24 X 7新聞節(jié)目全天提供了連續(xù)的現(xiàn)場直播信息流,并且無數(shù)預(yù)錄制媒體源在任何給定時(shí)刻例如經(jīng)由互聯(lián)網(wǎng)是可訪問的。
[0002]可以使用大量不同技術(shù)、經(jīng)由大量通信頻道中的任意通信頻道來廣播、流傳送、或另外輸送媒體內(nèi)容。例如,在互聯(lián)網(wǎng)上流傳送的視頻媒體的輸送通常包括將視頻內(nèi)容編碼成一個(gè)或多個(gè)流傳送視頻格式,并且高效地向終端用戶輸送已編碼的視頻內(nèi)容。
【附圖說明】
[0003]圖1是根據(jù)在此描述的實(shí)施方式的示例性報(bào)道識別環(huán)境的概念圖。
[0004]圖2是根據(jù)在此描述的實(shí)施方式的從媒體內(nèi)容中識別報(bào)道的示例性方法的概念圖。
[0005]圖3是根據(jù)在此描述的實(shí)施方式的從媒體內(nèi)容中識別報(bào)道的示例性方法的流程圖。
[0006]圖4是根據(jù)在此描述的實(shí)施方式的用于從媒體內(nèi)容中識別報(bào)道的示例性計(jì)算機(jī)系統(tǒng)的框圖。
【具體實(shí)施方式】
[0007]海量可應(yīng)用媒體內(nèi)容可容易地導(dǎo)致信息超負(fù)荷,尤其是如果媒體內(nèi)容并未以允許用戶容易地識別感興趣的具體內(nèi)容的方式而良好編組或另外結(jié)構(gòu)化。作為結(jié)果,某些內(nèi)容提供者、內(nèi)容搜集者、或終端用戶可以人工地加標(biāo)簽或者另外對媒體內(nèi)容分類,例如通過將元數(shù)據(jù)與內(nèi)容相關(guān)聯(lián)。這種人工分類盡管相當(dāng)精確,但可能是相對低效、昂貴和/或耗時(shí)的。
[0008]在此描述了用于識別媒體內(nèi)容中的報(bào)道的技術(shù),即便之前尚未如此分類報(bào)道。如在此所使用的,術(shù)語“報(bào)道”通常指媒體內(nèi)容中與特定主題或一致性概念集相關(guān)的一部分。例如,在晚間新聞節(jié)目播出期間,一個(gè)報(bào)道可能描述最近犯罪審判的結(jié)果,而另一個(gè)報(bào)道可能討論本地商務(wù)的成功,以及又一個(gè)報(bào)道可能涉及天氣。根據(jù)在此描述的技術(shù),媒體內(nèi)容(例如新聞節(jié)目)被分離成概念性報(bào)道(例如包括法律報(bào)道、商務(wù)報(bào)道和天氣報(bào)道的三種概念上不同的報(bào)道)。一旦已經(jīng)使用所描述的技術(shù)識別了報(bào)道,可以執(zhí)行額外的有用處理一例如以概括或分類報(bào)道,或者以使報(bào)道與媒體內(nèi)容隔離(例如剪輯),以為了更方便的訪問或傳輸。可以在已經(jīng)識別了報(bào)道之后,對報(bào)道應(yīng)用這些或其它合適的處理技術(shù),以通常使得報(bào)道對于終端用戶是更加可訪問和/或可消費(fèi)的。
[0009]圖1是根據(jù)在此描述的實(shí)施方式的示例性報(bào)道識別環(huán)境100的概念圖。如所示,環(huán)境100包括被配置為執(zhí)行報(bào)道識別引擎112的計(jì)算系統(tǒng)110。報(bào)道識別引擎112可以通常操作為分析輸入的媒體內(nèi)容102,以及用于識別在媒體內(nèi)容102中所包括的各個(gè)報(bào)道114a、114b和114c。如以下進(jìn)一步詳細(xì)描述的,報(bào)道識別引擎112可以通常通過將媒體內(nèi)容102劃分為片段,分析片段以確定與各個(gè)片段相關(guān)聯(lián)的概念,比較不同片段之間的概念以確定不同片段的概念相似性,以及將概念上類似的片段合并為報(bào)道,來識別報(bào)道。
[0010]環(huán)境100的示例性拓?fù)浣Y(jié)構(gòu)可以代表各個(gè)報(bào)道識別環(huán)境。然而,應(yīng)該理解的是,僅為了示意說明而示出了環(huán)境100的示例性拓?fù)浣Y(jié)構(gòu),可以對配置作出各種修改。例如,環(huán)境100可以包括不同的或額外的部件,或者可以以不同于所示的方式而實(shí)施部件。同樣地,盡管計(jì)算系統(tǒng)110通常被示為獨(dú)立服務(wù)器,但應(yīng)該理解的是,計(jì)算系統(tǒng)110實(shí)際上可以是任何合適類型的計(jì)算裝置,諸如服務(wù)器、大型主機(jī)、膝上型計(jì)算機(jī)、臺式計(jì)算機(jī)、工作站、或其它裝置。計(jì)算系統(tǒng)110也可以代表計(jì)算裝置的群組,諸如服務(wù)器農(nóng)場、服務(wù)器集群、或者單獨(dú)地或一起操作以執(zhí)行在此描述的功能的計(jì)算裝置的其它群組。
[0011]媒體內(nèi)容102可以采用任何合適媒體類型的形式,并且可以從任何合適的媒體源提供??梢匀缭诖怂枋龅倪M(jìn)行處理的媒體類型的示例包括但不限于,音頻信息(例如無線電廣播、電話通話、音頻流等),視頻信息(例如電視廣播、網(wǎng)絡(luò)廣播、視頻流等),和/或多媒體信息(例如音頻、視頻、圖形、和/或其它合適內(nèi)容的組合)。媒體源的示例包括但不限于廣播媒體源、流媒體源、在線媒體儲存庫、獨(dú)立物理媒體(例如藍(lán)光盤、DVD、小型盤等)等等。
[0012]計(jì)算系統(tǒng)110可以包括處理器122、存儲器124、接口126、分段模塊128、內(nèi)容分析模塊130以及片段合并模塊132。應(yīng)該理解的是,僅為了示意說明目的而示出所示部件,在一些情形中,參照計(jì)算系統(tǒng)110的特定模塊或部件所描述的功能可以由例如計(jì)算系統(tǒng)110或其它合適的計(jì)算系統(tǒng)的一個(gè)或多個(gè)不同的或額外的模塊或部件來執(zhí)行。類似的,應(yīng)該理解的是,功能的一部分或全部可以組合成比所示更少的模塊或部件。
[0013]處理器122可以被配置為處理由計(jì)算系統(tǒng)110執(zhí)行的指令。指令可以存儲在非臨時(shí)、有形的計(jì)算機(jī)可讀存儲介質(zhì)上,諸如在存儲器124中或者在分立的存儲裝置(未示出)上,或者在用于存儲使可編程處理器執(zhí)行在此描述的技術(shù)的指令的任何其它類型易失性或非易失性存儲器上??商娲鼗蝾~外地,計(jì)算系統(tǒng)110可以包括專用硬件,諸如一個(gè)或多個(gè)集成電路、專用集成電路(ASIC)、專用處理器(ASSP)、現(xiàn)場可編程門陣列(FPGA)、或用于執(zhí)行在此描述的技術(shù)的專用硬件的前述示例的任意組合。在一些實(shí)施方式中,如合適地,可以將多個(gè)處理器與多個(gè)存儲器和/或多個(gè)類型的存儲器一起使用。
[0014]接口126可以實(shí)施在硬件和/或軟件中,并且可以例如被配置為從合適的媒體源(未示出)接收媒體內(nèi)容102。在一些實(shí)施方式中,接口 126可以配置為從一個(gè)或多個(gè)媒體源定位和/或請求媒體內(nèi)容102。例如,接口 126可以配置為循環(huán)地、定期地和/或隨時(shí)地從不同的新聞?lì)l道或電臺捕捉新聞提要,以及提供媒體內(nèi)容102以供報(bào)道識別引擎112處理。接口126也可以被配置為輸出供終端用戶或其它合適的計(jì)算系統(tǒng)(諸如搜索引擎或其它合適的系統(tǒng))所消費(fèi)的已處理報(bào)道,例如報(bào)道114a、114b和/或114c。
[0015]在一些實(shí)施方式中,接口126也可以包括允許用戶(例如系統(tǒng)管理員)直接地與計(jì)算系統(tǒng)110交互、例如人工地限定或修改與報(bào)道識別引擎112相關(guān)聯(lián)的設(shè)置或選項(xiàng)的一個(gè)或多個(gè)用戶接口。這些設(shè)置或選項(xiàng)可以存儲在數(shù)據(jù)庫(未示出)中,并且可以由報(bào)道識別引擎112使用,以調(diào)整與如在此描述的報(bào)道識別功能相關(guān)聯(lián)的一個(gè)或多個(gè)處理參數(shù)。示例性的用戶接口可以包括觸摸屏裝置、指示裝置、鍵盤、語音輸入接口、視覺輸入接口等等。
[0016]分段模塊128可以執(zhí)行在一個(gè)或多個(gè)處理器(例如處理器122)上,并且可以基于媒體內(nèi)容102中所包括的聽覺指示器而將接收到的媒體內(nèi)容102分段為多個(gè)媒體片段。例如,分段模塊128可以分析媒體內(nèi)容102的音頻部分,來識別某些聽覺標(biāo)志(例如給定長度的靜默,或特定類型的聽覺信號,諸如音樂或特定音調(diào)),以識別媒體內(nèi)容102中的邏輯斷裂。在新聞節(jié)目的示例中,基于媒體內(nèi)容102的音頻部分中的靜默或暫停的分段可以導(dǎo)致與句子和/或段落對齊的片段,因?yàn)榘l(fā)言者可能通常在句子和/或段落之間暫停簡短片刻。類似的,新聞節(jié)目可以包括音樂叮當(dāng)聲、一系列音調(diào)、或者指示了在節(jié)目部分之間邏輯斷裂的其它聽覺信號。這些和/或其它合適的聽覺指示器可以用于允許分段模塊128對媒體內(nèi)容102進(jìn)行分段。
[0017]在一些實(shí)施方式中,分段模塊128也可以或者可替代地使用視覺指示器來對接收到的媒體內(nèi)容102進(jìn)行分段。例如,分段模塊128可以分析媒體內(nèi)容128的視頻部分,以識別也可以或者可替代地用于識別媒體內(nèi)容102中的邏輯斷裂的某些視覺標(biāo)志(例如指示了連續(xù)視頻幀之間顯著差異的關(guān)鍵幀,黑色幀,或其它合適的視覺指示器)。當(dāng)一起采用時(shí),諸如靜默的聽覺指示器與諸如關(guān)鍵幀的視頻指示器組合可以用于精確地且一致性地將媒體內(nèi)容102分段為合適的媒體片段。
[0018]分段模塊128也可以使用其它合適的指示器,以使得或者精細(xì)調(diào)整媒體內(nèi)容102的片段為多個(gè)媒體片段。例如,媒體內(nèi)容102的音頻部分的語音至文本處理可以提供抄本,其可以例如與如上描述的聽覺和/或視覺指示器結(jié)合一起用于確定對于片段合適的斷裂(例如基于句號或抄本中其它標(biāo)點(diǎn)符號)。類