本發(fā)明涉及自動(dòng)文本摘要技術(shù)領(lǐng)域,尤其涉及一種用于提取文本摘要的技術(shù)。
背景技術(shù):
文摘以簡(jiǎn)明扼要且語(yǔ)義連貫的語(yǔ)言,確切、準(zhǔn)確地記述原始文獻(xiàn)的中心內(nèi)容,極大地節(jié)省了人們的閱讀時(shí)間。現(xiàn)有技術(shù)中常常利用計(jì)算機(jī),通過(guò)諸如將文本作為句子的線性序列、將句子視為詞的線性序列等方法,自動(dòng)地從原始文獻(xiàn)中提取文摘,而該等方法對(duì)于文本語(yǔ)法、語(yǔ)義及句法的分析及自動(dòng)摘要常常是基于全文內(nèi)容或章節(jié)相關(guān)的段落內(nèi)容而進(jìn)行的,并不能很好地突出原始文獻(xiàn)的重點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的一個(gè)目的是提供一種用于提取文本摘要的方法與設(shè)備。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種用于提取文本摘要的方法,其中,該方法包括:
獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息;
根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本;
根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。
根據(jù)本發(fā)明的另一方面,還提供了一種用于提取文本摘要的摘要提取設(shè)備,其中,該摘要提取設(shè)備包括:
用于獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的裝置;
用于根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文 本的關(guān)注文本的裝置;
用于根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要的裝置。
與現(xiàn)有技術(shù)相比,本發(fā)明的一個(gè)實(shí)施例通過(guò)根據(jù)用戶關(guān)于目標(biāo)原始文本的關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要,從而使得本發(fā)明提取的文本摘要更能突出原始文獻(xiàn)的重點(diǎn),提高了文本摘要的準(zhǔn)確度和有效性,相應(yīng)地,也提升了用戶的閱讀瀏覽體驗(yàn)。
附圖說(shuō)明
通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:
圖1示出根據(jù)本發(fā)明一個(gè)方面的一種用于提取文本摘要的摘要提取設(shè)備的設(shè)備示意圖;
圖2示出根據(jù)本發(fā)明另一個(gè)方面的一種用于提取文本摘要的方法流程圖。
附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步詳細(xì)描述。
圖1示出根據(jù)本發(fā)明一個(gè)方面的一種用于提取文本摘要的摘要提取設(shè)備1的設(shè)備示意圖,其中,摘要提取設(shè)備1包括用于獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的裝置(以下簡(jiǎn)稱“操作獲取裝置11”);用于根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本的裝置(以下簡(jiǎn)稱“關(guān)注文本確定裝置12”);用于根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要的裝置(以下簡(jiǎn)稱“摘要提取裝置13”)。
具體地,操作獲取裝置11獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息;關(guān)注文本確定裝置12根據(jù)所述閱讀操作信息,確定所述用 戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本;摘要提取裝置13根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。
在此,摘要提取設(shè)備1包括但不限于網(wǎng)絡(luò)設(shè)備、用戶設(shè)備或網(wǎng)絡(luò)設(shè)備與用戶設(shè)備通過(guò)網(wǎng)絡(luò)相集成所構(gòu)成的設(shè)備。在此,所述網(wǎng)絡(luò)設(shè)備包括但不限于如網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或基于云計(jì)算的計(jì)算機(jī)集合等實(shí)現(xiàn);或者由用戶設(shè)備實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的大量主機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。在此,所述用戶設(shè)備可以是任何一種可與用戶通過(guò)鍵盤、鼠標(biāo)、觸摸板、觸摸屏、或手寫設(shè)備等方式進(jìn)行人機(jī)交互的電子產(chǎn)品,例如計(jì)算機(jī)、手機(jī)、智能手機(jī)、PDA、可穿戴設(shè)備、掌上電腦PPC或平板電腦等。所述網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述摘要提取設(shè)備1僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備或用戶設(shè)備如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,網(wǎng)絡(luò)設(shè)備及用戶設(shè)備均包括一種能夠按照事先設(shè)定或存儲(chǔ)的指令,自動(dòng)進(jìn)行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。
具體地,操作獲取裝置11通過(guò)調(diào)用用戶設(shè)備自身提供的應(yīng)用程序接口(API),或者,通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息。
在此,所述目標(biāo)原始文本可以是文章、文獻(xiàn)、新聞、小說(shuō)等任何體裁的以文字為主要描述手段而獨(dú)立成篇的內(nèi)容。
在此,所述閱讀操作信息是指用戶在閱讀所述目標(biāo)原始文本過(guò)程中表現(xiàn)或執(zhí)行的閱讀相關(guān)操作信息,諸如設(shè)置閱讀模式、更改閱讀模式、停留頁(yè)面、段落內(nèi)容收藏等。優(yōu)選地,所述閱讀操作信息包括但 不限于以下至少任一項(xiàng):
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的停留操作;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的收藏相關(guān)操作;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀模式信息;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀速度。
在此,所述收藏相關(guān)操作包括但不限于如復(fù)制、收藏、分享等操作。在具體實(shí)施例中,若用戶在閱讀文檔過(guò)程中執(zhí)行了收藏相關(guān)操作,說(shuō)明用戶對(duì)收藏的內(nèi)容部分關(guān)注度較高,在一定程度上也說(shuō)明了用戶收藏的內(nèi)容部分是文檔的重要內(nèi)容。
在此,所述閱讀模式信息包括但不限于:1)瀏覽模式,即以快于正常閱讀速度的、每次翻多頁(yè);2)閱讀模式,即以正常閱讀速度的、每次翻一頁(yè);3)關(guān)鍵詞搜索模式,該模式下用戶可通過(guò)套索(Lasso)觸摸操作以對(duì)應(yīng)選中內(nèi)容為關(guān)鍵詞進(jìn)行搜索,該搜索可以是轉(zhuǎn)至搜索引擎進(jìn)行搜索,也可以是在用戶正在閱讀的文章中進(jìn)行搜索。在此,所述套索觸摸操作的“套索”的功能,是指用戶通過(guò)與觸摸輸入裝置接觸的手指在網(wǎng)頁(yè)上的任何一個(gè)或多個(gè)單詞的周圍畫一個(gè)圈,或者任何預(yù)定義的其它圈中操作,即可對(duì)選定內(nèi)容進(jìn)行搜索;其中,所述套索觸摸操作包括但不限于畫圈操作、括弧操作,本領(lǐng)域技術(shù)人員應(yīng)能理解上述套索觸摸操作僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的套索觸摸操作如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。例如,用戶正在閱讀《人間詞話》中在詞的境界部分有關(guān)“可堪孤館閉春寒,杜鵑聲里斜陽(yáng)暮”的評(píng)述,其可搜索秦觀《踏沙行》的詞句解析。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述目標(biāo)原始文本和閱讀操作信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的目標(biāo)原始文本或閱讀操作信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
例如,假設(shè)用戶A通過(guò)其ipad2在文庫(kù)APP中正閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》,且閱讀至其中關(guān)于“搜索空間”部分的 描述時(shí),用戶A通過(guò)滑動(dòng)顯示出“搜索空間”部分相應(yīng)段落的內(nèi)容后,停留的時(shí)間超過(guò)預(yù)定時(shí)間閾值后才進(jìn)行滑動(dòng)以繼續(xù)閱讀,則操作獲取裝置11可通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取到用戶A在閱讀目標(biāo)原始文本《LTE物理下行控制信道盲檢過(guò)程研究》過(guò)程中執(zhí)行的停留操作。
再如,假設(shè)用戶A在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),將當(dāng)前閱讀模式由瀏覽模式修改為關(guān)鍵詞搜索模式,并執(zhí)行了在其ipad2的觸摸屏上執(zhí)行了用一個(gè)手指在詞語(yǔ)“CCE”周圍畫一個(gè)圈的觸摸操作,則操作獲取裝置11可通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取到用戶A在閱讀目標(biāo)原始文本《LTE物理下行控制信道盲檢過(guò)程研究》過(guò)程中執(zhí)行的閱讀模式更改操作以及搜索操作。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
接著,關(guān)注文本確定裝置12根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本。
在此,所述關(guān)注文本是指用戶對(duì)所述目標(biāo)原始文本中關(guān)注、感興趣的段落、詞語(yǔ),其也體現(xiàn)了所述目標(biāo)原始文本中的重要內(nèi)容。在具體實(shí)施例中,用戶在閱讀文檔中的其關(guān)注的內(nèi)容部分時(shí),通常具有與閱讀其他內(nèi)容部分不一樣的表現(xiàn),如停留時(shí)間較長(zhǎng)、閱讀速度放慢、進(jìn)行收藏等操作。
在此,關(guān)注文本確定裝置12確定所述關(guān)注文本的方式包括但不限于以下至少任一項(xiàng):
1)若所述用戶閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的停留操作,則關(guān)注文本確定裝置12可根據(jù)所述用戶執(zhí)行所述停留操作所對(duì)應(yīng)的段落的停留時(shí)間,將停留時(shí)間大于預(yù)定時(shí)間閾值的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),在“搜索空間”部分相應(yīng)段落如該文章的第[5-7]段停留的時(shí)間大于預(yù)定時(shí)間閾值,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-7]段作為所述關(guān)注文本。
2)若所述用戶閱讀所述目標(biāo)原始文本過(guò)程中由所述瀏覽模式變換為所述關(guān)鍵詞搜索模式,則關(guān)注文本確定裝置12可將所述目標(biāo)原始文本中在所述關(guān)鍵詞搜索模式下被瀏覽的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),將當(dāng)前閱讀模式由瀏覽模式修改為關(guān)鍵詞搜索模式,在關(guān)鍵詞搜索模式下閱讀的“搜索空間”部分對(duì)應(yīng)的段落為該文章的第[5-10]段,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-10]段作為所述關(guān)注文本。
3)若所述閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的收藏相關(guān)操作,則關(guān)注文本確定裝置12可將所述用戶執(zhí)行所述收藏相關(guān)操作所對(duì)應(yīng)的段落,作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),在“搜索空間”部分相應(yīng)段落如該文章的第[5-7]段中的每一段均執(zhí)行了收藏操作,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-7]段作為所述關(guān)注文本。
4)若所述閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀速度,則關(guān)注文本確定裝置12可將所述目標(biāo)原始文本中所述用戶以低于預(yù)定閱讀速度閾值的閱讀速度瀏覽的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),用戶A通過(guò)滑動(dòng)操作顯示出“搜索空間”部分相應(yīng)段落的內(nèi)容如該文章的第[5]段后,停留了20min, 才進(jìn)行滑動(dòng)以繼續(xù)閱讀該文章的第[6]段,假設(shè)該文章第[5]段共有文字400字,則說(shuō)明用A閱讀第[5]段的閱讀速度為20字/min,其低于預(yù)定閱讀速度閾值如500字/min,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5]段作為所述關(guān)注文本。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述確定所述關(guān)注文本的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定所述關(guān)注文本的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明在根據(jù)所述閱讀操作信息確定所述關(guān)注文本時(shí),可根據(jù)前述所述閱讀操作信息中的任意一項(xiàng)或多項(xiàng)的組合來(lái)確定所述關(guān)注文本。例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),假設(shè)“搜索空間”部分的全部?jī)?nèi)容為該文章的第[5-12]段,用戶A閱讀第[5]段的閱讀速度低于預(yù)定閱讀速度閾值如500字/min,其在閱讀該文章的第[7]段時(shí)執(zhí)行了收藏操作,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5]段和第[7]段均作為所述關(guān)注文本;再如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),其在閱讀該文章的第[7]段時(shí)執(zhí)行了收藏操作,而其在關(guān)鍵詞搜索模式下閱讀的“搜索空間”部分對(duì)應(yīng)的段落為該文章的第[5-10]段,則關(guān)注文本確定裝置12可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-10]段作為所述關(guān)注文本。
在此,需要說(shuō)明的是,本發(fā)明還可獲取多個(gè)用戶關(guān)于目標(biāo)原始文本的閱讀操作信息,進(jìn)而可得到每一用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本,從而本發(fā)明可根據(jù)每一用戶的所述關(guān)注文本,確定所述多個(gè)用戶關(guān)于所述目標(biāo)原始文本的公共關(guān)注文本,以作為最終的關(guān)注文本,可進(jìn)一步提高文本摘要的準(zhǔn)確度和有效性,也進(jìn)一步提升了用戶的閱讀瀏覽體驗(yàn)。
接著,摘要提取裝置13根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,通過(guò)諸如將文本作為句子的線性序列、將句子視為 詞的線性序列等方法,提取所述目標(biāo)原始文本的文本摘要。
例如,假設(shè)文章《LTE物理下行控制信道盲檢過(guò)程研究》通過(guò)現(xiàn)有技術(shù)中的自動(dòng)文本摘要方法,也即基于全文內(nèi)容或章節(jié)相關(guān)的段落內(nèi)容而得到的文本摘要為“LTE物理下行控制信道為整個(gè)系統(tǒng)上下行闡述分配各種資源,對(duì)系統(tǒng)起著非常關(guān)鍵的調(diào)度作用。基于PDCCH信道發(fā)送與接收流程,根據(jù)PDCCH信道結(jié)構(gòu),詳細(xì)分析了信道的調(diào)度過(guò)程,為終端PDCCH信道接收制定了一種詳細(xì)的盲檢方法,為L(zhǎng)TE系統(tǒng)的實(shí)際實(shí)現(xiàn)提供了理論依據(jù)”,而摘要提取裝置13根據(jù)關(guān)注文本確定裝置12確定的所述關(guān)注文本,如“搜索空間”部分對(duì)應(yīng)的第[5-10]段,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,通過(guò)諸如將文本作為句子的線性序列、將句子視為詞的線性序列等方法,提取得到文章《LTE物理下行控制信道盲檢過(guò)程研究》的文本摘要為“LTE物理下行控制信道為整個(gè)系統(tǒng)上下行闡述分配各種資源,對(duì)系統(tǒng)起著非常關(guān)鍵的調(diào)度作用。基于PDCCH信道發(fā)送與接收流程,根據(jù)PDCCH信道結(jié)構(gòu),詳細(xì)分析了信道的調(diào)度過(guò)程、專用搜索空間和公共搜索空間,為終端PDCCH信道接收制定了一種詳細(xì)的盲檢方法,為L(zhǎng)TE系統(tǒng)的實(shí)際實(shí)現(xiàn)提供了理論依據(jù)”。
在此,本發(fā)明提取的文本摘要不同于現(xiàn)有技術(shù)中得到文本摘要,相對(duì)于現(xiàn)有技術(shù),本發(fā)明提取的文本摘要更能突出原始文獻(xiàn)的重點(diǎn),提高了文本摘要的準(zhǔn)確度和有效性,相應(yīng)地,也提升了用戶的閱讀瀏覽體驗(yàn)。
摘要提取設(shè)備1的各裝置之間是持續(xù)不斷工作的。具體地,操作獲取裝置11持續(xù)獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息;關(guān)注文本確定裝置12持續(xù)根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本;摘要提取裝置13持續(xù)根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解所述“持續(xù)”是指摘要提取設(shè)備1的各個(gè)裝置之間分別不斷地進(jìn)行閱讀操作信息的獲取、關(guān)注文本的確定與文本摘要提取,直至摘要提取設(shè)備1在較長(zhǎng)時(shí)間內(nèi)停止獲 取閱讀操作信息。
優(yōu)選地,若所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的停留時(shí)間大于預(yù)定閾值的段落為多個(gè),或者,若所述目標(biāo)原始文本中在所述關(guān)鍵詞搜索模式下被瀏覽的段落為多個(gè),其中,摘要提取設(shè)備1還包括:用于根據(jù)多個(gè)所述段落之間的內(nèi)容關(guān)聯(lián)度,從所述多個(gè)段落中確定優(yōu)選關(guān)注文本的裝置(以下簡(jiǎn)稱“優(yōu)選確定裝置”,未示出),其中,摘要提取裝置13根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。
例如,對(duì)于文章《LTE物理下行控制信道盲檢過(guò)程研究》,用戶A在閱讀該文章過(guò)程中停留時(shí)間大于預(yù)定閾值的段落為該文章的第[5-7]段,假設(shè)第[5-6]段的內(nèi)容分別為專用搜索空間和公共搜索空間,而第[7]段的內(nèi)容為盲檢過(guò)程,則第[7]段的內(nèi)容與第[5-6]段的內(nèi)容之間的關(guān)聯(lián)度比較小,則優(yōu)選確定裝置可確定第[5-6]段作為優(yōu)選關(guān)注文本。
接著,摘要提取裝置13根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。在此,摘要提取裝置13根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述文本摘要的方式與前述摘要提取裝置13根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述文本摘要的方式相同或基本相同,為簡(jiǎn)明起見(jiàn),故在此不再贅述,并以引用的方式包含與此。
在此,本發(fā)明通過(guò)根據(jù)優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,來(lái)提取文本摘要,使得本發(fā)明提取的文本摘要更一步突出原始文獻(xiàn)的重點(diǎn),提高文本摘要的準(zhǔn)確度和有效性,提升用戶的閱讀瀏覽體驗(yàn)。
優(yōu)選地,所述閱讀操作信息還包括所述用戶關(guān)于所述目標(biāo)原始文本的歷史閱讀記錄,其中,關(guān)注文本確定裝置12根據(jù)所述歷史閱讀記錄,確定所述關(guān)注文本。
優(yōu)選地,所述歷史閱讀記錄包括以下至少任一項(xiàng):
-所述用戶關(guān)于所述目標(biāo)原始文本中段落的歷史閱讀頻率信息;
-所述用戶關(guān)于所述目標(biāo)原始文本中段落的歷史閱讀平均時(shí)長(zhǎng)。
例如,對(duì)于文章《LTE物理下行控制信道盲檢過(guò)程研究》,假設(shè)用戶A關(guān)于該文章的歷史閱讀記錄中,經(jīng)常閱讀該文章中的第[5-6]段的內(nèi)容,則關(guān)注文本確定裝置12根據(jù)該歷史閱讀記錄,確定所述關(guān)注文本為該文章的第[5-6]段。
再如,對(duì)于用戶A,假設(shè)其關(guān)于文章《LTE物理下行控制信道盲檢過(guò)程研究》的歷史閱讀記錄中,對(duì)第[6]段的歷史閱讀平均時(shí)長(zhǎng)超過(guò)預(yù)定閾值,則關(guān)注文本確定裝置12根據(jù)該歷史閱讀記錄,確定所述關(guān)注文本為該文章的第[6]段。
圖2示出根據(jù)本發(fā)明另一個(gè)方面的一種用于提取文本摘要的方法流程圖。
其中,該方法包括步驟S1、步驟S2和步驟S3。具體地,在步驟S1中,摘要提取設(shè)備1獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息;在步驟S2中,摘要提取設(shè)備1根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本;在步驟S3中,摘要提取設(shè)備1根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。
在此,摘要提取設(shè)備1包括但不限于網(wǎng)絡(luò)設(shè)備、用戶設(shè)備或網(wǎng)絡(luò)設(shè)備與用戶設(shè)備通過(guò)網(wǎng)絡(luò)相集成所構(gòu)成的設(shè)備。在此,所述網(wǎng)絡(luò)設(shè)備包括但不限于如網(wǎng)絡(luò)主機(jī)、單個(gè)網(wǎng)絡(luò)服務(wù)器、多個(gè)網(wǎng)絡(luò)服務(wù)器集或基于云計(jì)算的計(jì)算機(jī)集合等實(shí)現(xiàn);或者由用戶設(shè)備實(shí)現(xiàn)。在此,云由基于云計(jì)算(Cloud Computing)的大量主機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計(jì)算是分布式計(jì)算的一種,由一群松散耦合的計(jì)算機(jī)集組成的一個(gè)超級(jí)虛擬計(jì)算機(jī)。在此,所述用戶設(shè)備可以是任何一種可與用戶通過(guò)鍵盤、鼠標(biāo)、觸摸板、觸摸屏、或手寫設(shè)備等方式進(jìn)行人機(jī)交互的電子產(chǎn)品,例如計(jì)算機(jī)、手機(jī)、智能手機(jī)、PDA、可穿戴設(shè)備、掌上電腦PPC或平板電腦等。所述網(wǎng)絡(luò)包括但不限于互聯(lián)網(wǎng)、廣域網(wǎng)、城域網(wǎng)、局域網(wǎng)、VPN網(wǎng)絡(luò)、無(wú)線自組織網(wǎng)絡(luò)(Ad Hoc網(wǎng)絡(luò))等。本領(lǐng)域技術(shù)人員應(yīng)能理解上述摘要提取設(shè)備1僅為舉例,其他現(xiàn)有的或今后 可能出現(xiàn)的網(wǎng)絡(luò)設(shè)備或用戶設(shè)備如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。在此,網(wǎng)絡(luò)設(shè)備及用戶設(shè)備均包括一種能夠按照事先設(shè)定或存儲(chǔ)的指令,自動(dòng)進(jìn)行數(shù)值計(jì)算和信息處理的電子設(shè)備,其硬件包括但不限于微處理器、專用集成電路(ASIC)、可編程門陣列(FPGA)、數(shù)字處理器(DSP)、嵌入式設(shè)備等。
具體地,在步驟S1中,摘要提取設(shè)備1通過(guò)調(diào)用用戶設(shè)備自身提供的應(yīng)用程序接口(API),或者,通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息。
在此,所述目標(biāo)原始文本可以是文章、文獻(xiàn)、新聞、小說(shuō)等任何體裁的以文字為主要描述手段而獨(dú)立成篇的內(nèi)容。
在此,所述閱讀操作信息是指用戶在閱讀所述目標(biāo)原始文本過(guò)程中表現(xiàn)或執(zhí)行的閱讀相關(guān)操作信息,諸如設(shè)置閱讀模式、更改閱讀模式、停留頁(yè)面、段落內(nèi)容收藏等。優(yōu)選地,所述閱讀操作信息包括但不限于以下至少任一項(xiàng):
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的停留操作;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的收藏相關(guān)操作;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀模式信息;
-所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀速度。
在此,所述收藏相關(guān)操作包括但不限于如復(fù)制、收藏、分享等操作。在具體實(shí)施例中,若用戶在閱讀文檔過(guò)程中執(zhí)行了收藏相關(guān)操作,說(shuō)明用戶對(duì)收藏的內(nèi)容部分關(guān)注度較高,在一定程度上也說(shuō)明了用戶收藏的內(nèi)容部分是文檔的重要內(nèi)容。
在此,所述閱讀模式信息包括但不限于:1)瀏覽模式,即以快于正常閱讀速度的、每次翻多頁(yè);2)閱讀模式,即以正常閱讀速度的、每次翻一頁(yè);3)關(guān)鍵詞搜索模式,該模式下用戶可通過(guò)套索(Lasso)觸摸操作以對(duì)應(yīng)選中內(nèi)容為關(guān)鍵詞進(jìn)行搜索,該搜索可以是轉(zhuǎn)至搜索引擎進(jìn)行搜索,也可以是在用戶正在閱讀的文章中進(jìn)行搜索。在此,所述套索觸摸操作的“套索”的功能,是指用戶通過(guò)與觸 摸輸入裝置接觸的手指在網(wǎng)頁(yè)上的任何一個(gè)或多個(gè)單詞的周圍畫一個(gè)圈,或者任何預(yù)定義的其它圈中操作,即可對(duì)選定內(nèi)容進(jìn)行搜索;其中,所述套索觸摸操作包括但不限于畫圈操作、括弧操作,本領(lǐng)域技術(shù)人員應(yīng)能理解上述套索觸摸操作僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的套索觸摸操作如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并以引用方式包含于此。例如,用戶正在閱讀《人間詞話》中在詞的境界部分有關(guān)“可堪孤館閉春寒,杜鵑聲里斜陽(yáng)暮”的評(píng)述,其可搜索秦觀《踏沙行》的詞句解析。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述目標(biāo)原始文本和閱讀操作信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的目標(biāo)原始文本或閱讀操作信息如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
例如,假設(shè)用戶A通過(guò)其ipad2在文庫(kù)APP中正閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》,且閱讀至其中關(guān)于“搜索空間”部分的描述時(shí),用戶A通過(guò)滑動(dòng)顯示出“搜索空間”部分相應(yīng)段落的內(nèi)容后,停留的時(shí)間超過(guò)預(yù)定時(shí)間閾值后才進(jìn)行滑動(dòng)以繼續(xù)閱讀,則在步驟S1中,摘要提取設(shè)備1可通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取到用戶A在閱讀目標(biāo)原始文本《LTE物理下行控制信道盲檢過(guò)程研究》過(guò)程中執(zhí)行的停留操作。
再如,假設(shè)用戶A在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),將當(dāng)前閱讀模式由瀏覽模式修改為關(guān)鍵詞搜索模式,并執(zhí)行了在其ipad2的觸摸屏上執(zhí)行了用一個(gè)手指在詞語(yǔ)“CCE”周圍畫一個(gè)圈的觸摸操作,則在步驟S1中,摘要提取設(shè)備1可通過(guò)文庫(kù)等閱讀APP提供的應(yīng)用程序接口(API),獲取到用戶A在閱讀目標(biāo)原始文本《LTE物理下行控制信道盲檢過(guò)程研究》過(guò)程中執(zhí)行的閱讀模式更改操作以及搜索操作。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息的方式如可適用于本發(fā)明,也應(yīng)包含 在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
接著,在步驟S2中,摘要提取設(shè)備1根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本。
在此,所述關(guān)注文本是指用戶對(duì)所述目標(biāo)原始文本中關(guān)注、感興趣的段落、詞語(yǔ),其也體現(xiàn)了所述目標(biāo)原始文本中的重要內(nèi)容。在具體實(shí)施例中,用戶在閱讀文檔中的其關(guān)注的內(nèi)容部分時(shí),通常具有與閱讀其他內(nèi)容部分不一樣的表現(xiàn),如停留時(shí)間較長(zhǎng)、閱讀速度放慢、進(jìn)行收藏等操作。
在此,在步驟S2中,摘要提取設(shè)備1確定所述關(guān)注文本的方式包括但不限于以下至少任一項(xiàng):
1)若所述用戶閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的停留操作,則在步驟S2中,摘要提取設(shè)備1可根據(jù)所述用戶執(zhí)行所述停留操作所對(duì)應(yīng)的段落的停留時(shí)間,將停留時(shí)間大于預(yù)定時(shí)間閾值的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),在“搜索空間”部分相應(yīng)段落如該文章的第[5-7]段停留的時(shí)間大于預(yù)定時(shí)間閾值,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-7]段作為所述關(guān)注文本。
2)若所述用戶閱讀所述目標(biāo)原始文本過(guò)程中由所述瀏覽模式變換為所述關(guān)鍵詞搜索模式,則在步驟S2中,摘要提取設(shè)備1可將所述目標(biāo)原始文本中在所述關(guān)鍵詞搜索模式下被瀏覽的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀至文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),將當(dāng)前閱讀模式由瀏覽模式修改為關(guān)鍵詞搜索模式,在關(guān)鍵詞搜索模式下閱讀的“搜索空間”部分對(duì)應(yīng)的段落為該文章的第[5-10]段,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-10]段作為所述關(guān)注文本。
3)若所述閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中執(zhí)行的收藏相關(guān)操作,則在步驟S2中,摘要提取設(shè)備1可將所述用戶執(zhí)行所述收藏相關(guān)操作所對(duì)應(yīng)的段落,作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),在“搜索空間”部分相應(yīng)段落如該文章的第[5-7]段中的每一段均執(zhí)行了收藏操作,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-7]段作為所述關(guān)注文本。
4)若所述閱讀操作信息包括所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的閱讀速度,則在步驟S2中,摘要提取設(shè)備1可將所述目標(biāo)原始文本中所述用戶以低于預(yù)定閱讀速度閾值的閱讀速度瀏覽的段落作為所述關(guān)注文本。
例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),用戶A通過(guò)滑動(dòng)操作顯示出“搜索空間”部分相應(yīng)段落的內(nèi)容如該文章的第[5]段后,停留了20min,才進(jìn)行滑動(dòng)以繼續(xù)閱讀該文章的第[6]段,假設(shè)該文章第[5]段共有文字400字,則說(shuō)明用A閱讀第[5]段的閱讀速度為20字/min,其低于預(yù)定閱讀速度閾值如500字/min,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5]段作為所述關(guān)注文本。
本領(lǐng)域技術(shù)人員應(yīng)能理解上述確定所述關(guān)注文本的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定所述關(guān)注文本的方式如可適用于本發(fā)明,也應(yīng)包含在本發(fā)明保護(hù)范圍以內(nèi),并在此以引用方式包含于此。
在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本發(fā)明在根據(jù)所述閱讀操作信息確定所述關(guān)注文本時(shí),可根據(jù)前述所述閱讀操作信息中的任意一項(xiàng)或多項(xiàng)的組合來(lái)確定所述關(guān)注文本。例如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),假設(shè)“搜索空間”部分的全部?jī)?nèi)容為該文章的第[5-12]段,用戶A閱讀第[5]段的閱讀速度低于預(yù)定閱讀速度閾值如500字/min,其在閱讀該 文章的第[7]段時(shí)執(zhí)行了收藏操作,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5]段和第[7]段均作為所述關(guān)注文本;再如,對(duì)于用戶A,其在閱讀文章《LTE物理下行控制信道盲檢過(guò)程研究》中關(guān)于“搜索空間”部分的描述時(shí),其在閱讀該文章的第[7]段時(shí)執(zhí)行了收藏操作,而其在關(guān)鍵詞搜索模式下閱讀的“搜索空間”部分對(duì)應(yīng)的段落為該文章的第[5-10]段,則在步驟S2中,摘要提取設(shè)備1可將文章《LTE物理下行控制信道盲檢過(guò)程研究》中的第[5-10]段作為所述關(guān)注文本。
在此,需要說(shuō)明的是,本發(fā)明還可獲取多個(gè)用戶關(guān)于目標(biāo)原始文本的閱讀操作信息,進(jìn)而可得到每一用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本,從而本發(fā)明可根據(jù)每一用戶的所述關(guān)注文本,確定所述多個(gè)用戶關(guān)于所述目標(biāo)原始文本的公共關(guān)注文本,以作為最終的關(guān)注文本,可進(jìn)一步提高文本摘要的準(zhǔn)確度和有效性,也進(jìn)一步提升了用戶的閱讀瀏覽體驗(yàn)。
接著,在步驟S3中,摘要提取設(shè)備1根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,通過(guò)諸如將文本作為句子的線性序列、將句子視為詞的線性序列等方法,提取所述目標(biāo)原始文本的文本摘要。
例如,假設(shè)文章《LTE物理下行控制信道盲檢過(guò)程研究》通過(guò)現(xiàn)有技術(shù)中的自動(dòng)文本摘要方法,也即基于全文內(nèi)容或章節(jié)相關(guān)的段落內(nèi)容而得到的文本摘要為“LTE物理下行控制信道為整個(gè)系統(tǒng)上下行闡述分配各種資源,對(duì)系統(tǒng)起著非常關(guān)鍵的調(diào)度作用?;赑DCCH信道發(fā)送與接收流程,根據(jù)PDCCH信道結(jié)構(gòu),詳細(xì)分析了信道的調(diào)度過(guò)程,為終端PDCCH信道接收制定了一種詳細(xì)的盲檢方法,為L(zhǎng)TE系統(tǒng)的實(shí)際實(shí)現(xiàn)提供了理論依據(jù)”,而在步驟S3中,摘要提取設(shè)備1根據(jù)在步驟S2中,摘要提取設(shè)備1確定的所述關(guān)注文本,如“搜索空間”部分對(duì)應(yīng)的第[5-10]段,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,通過(guò)諸如將文本作為句子的線性序列、將句子視為詞的線性序列等方法,提取得到文章《LTE物理下行控制信道盲檢過(guò)程研究》的文本摘要 為“LTE物理下行控制信道為整個(gè)系統(tǒng)上下行闡述分配各種資源,對(duì)系統(tǒng)起著非常關(guān)鍵的調(diào)度作用。基于PDCCH信道發(fā)送與接收流程,根據(jù)PDCCH信道結(jié)構(gòu),詳細(xì)分析了信道的調(diào)度過(guò)程、專用搜索空間和公共搜索空間,為終端PDCCH信道接收制定了一種詳細(xì)的盲檢方法,為L(zhǎng)TE系統(tǒng)的實(shí)際實(shí)現(xiàn)提供了理論依據(jù)”。
在此,本發(fā)明提取的文本摘要不同于現(xiàn)有技術(shù)中得到文本摘要,相對(duì)于現(xiàn)有技術(shù),本發(fā)明提取的文本摘要更能突出原始文獻(xiàn)的重點(diǎn),提高了文本摘要的準(zhǔn)確度和有效性,相應(yīng)地,也提升了用戶的閱讀瀏覽體驗(yàn)。
摘要提取設(shè)備1的各步驟之間是持續(xù)不斷工作的。具體地,在步驟S1中,摘要提取設(shè)備1持續(xù)獲取用戶關(guān)于目標(biāo)原始文本的閱讀操作信息;在步驟S2中,摘要提取設(shè)備1持續(xù)根據(jù)所述閱讀操作信息,確定所述用戶關(guān)于所述目標(biāo)原始文本的關(guān)注文本;在步驟S3中,摘要提取設(shè)備1持續(xù)根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。在此,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解所述“持續(xù)”是指摘要提取設(shè)備1的各個(gè)步驟之間分別不斷地進(jìn)行閱讀操作信息的獲取、關(guān)注文本的確定與文本摘要提取,直至摘要提取設(shè)備1在較長(zhǎng)時(shí)間內(nèi)停止獲取閱讀操作信息。
優(yōu)選地,若所述用戶閱讀所述目標(biāo)原始文本過(guò)程中的停留時(shí)間大于預(yù)定閾值的段落為多個(gè),或者,若所述目標(biāo)原始文本中在所述關(guān)鍵詞搜索模式下被瀏覽的段落為多個(gè),其中,摘要提取設(shè)備1還包括步驟S4(未示出)。具體地,在步驟S4中,摘要提取設(shè)備1根據(jù)多個(gè)所述段落之間的內(nèi)容關(guān)聯(lián)度,從所述多個(gè)段落中確定優(yōu)選關(guān)注文本,其中,在步驟S3中,摘要提取設(shè)備1根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。
例如,對(duì)于文章《LTE物理下行控制信道盲檢過(guò)程研究》,用戶A在閱讀該文章過(guò)程中停留時(shí)間大于預(yù)定閾值的段落為該文章的第[5-7]段,假設(shè)第[5-6]段的內(nèi)容分別為專用搜索空間和公共搜索空間,而第[7]段的內(nèi)容為盲檢過(guò)程,則第[7]段的內(nèi)容與第[5-6]段的內(nèi)容之間的關(guān)聯(lián) 度比較小,則優(yōu)選確定裝置可確定第[5-6]段作為優(yōu)選關(guān)注文本。
接著,在步驟S3中,摘要提取設(shè)備1根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述目標(biāo)原始文本的文本摘要。在此,在步驟S3中,摘要提取設(shè)備1根據(jù)所述優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述文本摘要的方式與前述在步驟S3中,摘要提取設(shè)備1根據(jù)所述關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,提取所述文本摘要的方式相同或基本相同,為簡(jiǎn)明起見(jiàn),故在此不再贅述,并以引用的方式包含與此。
在此,本發(fā)明通過(guò)根據(jù)優(yōu)選關(guān)注文本,結(jié)合所述目標(biāo)原始文本的內(nèi)容信息,來(lái)提取文本摘要,使得本發(fā)明提取的文本摘要更一步突出原始文獻(xiàn)的重點(diǎn),提高文本摘要的準(zhǔn)確度和有效性,提升用戶的閱讀瀏覽體驗(yàn)。
優(yōu)選地,所述閱讀操作信息還包括所述用戶關(guān)于所述目標(biāo)原始文本的歷史閱讀記錄,其中,在步驟S2中,摘要提取設(shè)備1根據(jù)所述歷史閱讀記錄,確定所述關(guān)注文本。
優(yōu)選地,所述歷史閱讀記錄包括以下至少任一項(xiàng):
-所述用戶關(guān)于所述目標(biāo)原始文本中段落的歷史閱讀頻率信息;
-所述用戶關(guān)于所述目標(biāo)原始文本中段落的歷史閱讀平均時(shí)長(zhǎng)。
例如,對(duì)于文章《LTE物理下行控制信道盲檢過(guò)程研究》,假設(shè)用戶A關(guān)于該文章的歷史閱讀記錄中,經(jīng)常閱讀該文章中的第[5-6]段的內(nèi)容,則在步驟S2中,摘要提取設(shè)備1根據(jù)該歷史閱讀記錄,確定所述關(guān)注文本為該文章的第[5-6]段。
再如,對(duì)于用戶A,假設(shè)其關(guān)于文章《LTE物理下行控制信道盲檢過(guò)程研究》的歷史閱讀記錄中,對(duì)第[6]段的歷史閱讀平均時(shí)長(zhǎng)超過(guò)預(yù)定閾值,則在步驟S2中,摘要提取設(shè)備1根據(jù)該歷史閱讀記錄,確定所述關(guān)注文本為該文章的第[6]段。
需要注意的是,本發(fā)明可在軟件和/或軟件與硬件的組合體中被實(shí)施,例如,可采用專用集成電路(ASIC)、通用目的計(jì)算機(jī)或任何其他類似硬件設(shè)備來(lái)實(shí)現(xiàn)。在一個(gè)實(shí)施例中,本發(fā)明的軟件程序可以通過(guò)處 理器執(zhí)行以實(shí)現(xiàn)上文所述步驟或功能。同樣地,本發(fā)明的軟件程序(包括相關(guān)的數(shù)據(jù)結(jié)構(gòu))可以被存儲(chǔ)到計(jì)算機(jī)可讀記錄介質(zhì)中,例如,RAM存儲(chǔ)器,磁或光驅(qū)動(dòng)器或軟磁盤及類似設(shè)備。另外,本發(fā)明的一些步驟或功能可采用硬件來(lái)實(shí)現(xiàn),例如,作為與處理器配合從而執(zhí)行各個(gè)步驟或功能的電路。
另外,本發(fā)明的一部分可被應(yīng)用為計(jì)算機(jī)程序產(chǎn)品,例如計(jì)算機(jī)程序指令,當(dāng)其被計(jì)算機(jī)執(zhí)行時(shí),通過(guò)該計(jì)算機(jī)的操作,可以調(diào)用或提供根據(jù)本發(fā)明的方法和/或技術(shù)方案。而調(diào)用本發(fā)明的方法的程序指令,可能被存儲(chǔ)在固定的或可移動(dòng)的記錄介質(zhì)中,和/或通過(guò)廣播或其他信號(hào)承載媒體中的數(shù)據(jù)流而被傳輸,和/或被存儲(chǔ)在根據(jù)所述程序指令運(yùn)行的計(jì)算機(jī)設(shè)備的工作存儲(chǔ)器中。在此,根據(jù)本發(fā)明的一個(gè)實(shí)施例包括一個(gè)裝置,該裝置包括用于存儲(chǔ)計(jì)算機(jī)程序指令的存儲(chǔ)器和用于執(zhí)行程序指令的處理器,其中,當(dāng)該計(jì)算機(jī)程序指令被該處理器執(zhí)行時(shí),觸發(fā)該裝置運(yùn)行基于前述根據(jù)本發(fā)明的多個(gè)實(shí)施例的方法和/或技術(shù)方案。
對(duì)于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無(wú)論從哪一點(diǎn)來(lái)看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說(shuō)明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此外,顯然“包括”一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。裝置權(quán)利要求中陳述的多個(gè)單元或裝置也可以由一個(gè)單元或裝置通過(guò)軟件或者硬件來(lái)實(shí)現(xiàn)。第一,第二等詞語(yǔ)用來(lái)表示名稱,而并不表示任何特定的順序。