一種海量數(shù)據(jù)的信息處理方法及裝置的制造方法
【專利摘要】本發(fā)明公開(kāi)了一種海量數(shù)據(jù)的信息處理方法及裝置,解決目前在對(duì)數(shù)據(jù)相關(guān)性獲取的過(guò)程中,存在無(wú)法獲取數(shù)據(jù)序列變量和事件變量之間相關(guān)性的問(wèn)題。本發(fā)明實(shí)施例中,分別從每一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列以及事件信息集合;將獲取的數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集合輸入預(yù)設(shè)的海量數(shù)據(jù)信息處理模型,從而輸出數(shù)據(jù)序列與事件信息集合中任意時(shí)間信息之間的相關(guān)性結(jié)果。采用本發(fā)明技術(shù)方案,基于多個(gè)數(shù)據(jù)源的事件信息,采用預(yù)設(shè)的海量數(shù)據(jù)信息處理模型即可獲取每一種事件信息與數(shù)據(jù)序列的關(guān)聯(lián)性,無(wú)須人工判定,有效節(jié)約了人力資源,并保證了獲取的結(jié)果的準(zhǔn)確性。
【專利說(shuō)明】
-種海量數(shù)據(jù)的信息處理方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及數(shù)據(jù)處理領(lǐng)域,尤其設(shè)及一種海量數(shù)據(jù)的信息處理方法及裝置。
【背景技術(shù)】
[0002] 目前,對(duì)獲取到的數(shù)據(jù)進(jìn)行處理,W確定不同類(lèi)型數(shù)據(jù)之間的相關(guān)性,對(duì)于行業(yè)發(fā) 展有著至關(guān)重要的作用。例如,在醫(yī)學(xué)領(lǐng)域,探究人體疾病的誘發(fā)原因時(shí),常常需要關(guān)聯(lián)分 析患者的疾病和生活習(xí)慣之間的相關(guān)性,如分析吸煙習(xí)慣和患肺癌的相關(guān)性;又如,在金融 領(lǐng)域,也常常需要關(guān)聯(lián)分析不同股票的價(jià)格波動(dòng)的相關(guān)性。
[0003] 在現(xiàn)有技術(shù)中,數(shù)據(jù)之間的相關(guān)性分析僅局限于同類(lèi)型數(shù)據(jù)之間,如是否吸煙和 是否患肺癌,都屬于事件類(lèi)型,兩支股票價(jià)格均為隨時(shí)間變化的數(shù)據(jù)序列,該數(shù)據(jù)序列中包 含取值為整數(shù)、小數(shù)或者空的數(shù)據(jù)。然而,隨著科技的迅猛發(fā)展,不同業(yè)務(wù)之間的相互交叉 也越來(lái)越頻繁,使得挖掘數(shù)據(jù)序列變量和事件變量之間的相關(guān)性也變成越來(lái)越重要。
[0004] 目前,針對(duì)兩個(gè)事件類(lèi)型變量之間相關(guān)性,主要采用卡方檢驗(yàn)(chi-squared test)方法獲取;而針對(duì)兩個(gè)數(shù)據(jù)序列之間的相關(guān)性,主要通過(guò)皮爾遜相關(guān)系數(shù) 任earson' S correlation coefficient)方法獲取,上述兩種方式均不能相互使用,因此, 目前僅能獲取不同數(shù)據(jù)序列之間的相關(guān)性,或者不同事件信息集合之間的相關(guān)性,而針對(duì) 數(shù)據(jù)序列和事件信息集合之間的相關(guān)性的獲取,需要通過(guò)人工實(shí)現(xiàn),缺乏定性定量的分析 技術(shù)方法。
[0005] 由此可見(jiàn),目前在對(duì)數(shù)據(jù)相關(guān)性獲取的過(guò)程中,存在無(wú)法獲取數(shù)據(jù)序列變量和事 件變量之間相關(guān)性的問(wèn)題。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明實(shí)施例提供一種海量數(shù)據(jù)的信息處理方法及裝置,用W解決目前在對(duì)數(shù)據(jù) 相關(guān)性獲取的過(guò)程中,存在無(wú)法獲取數(shù)據(jù)序列變量和事件變量之間相關(guān)性的問(wèn)題。
[0007] 本發(fā)明實(shí)施例提供的具體技術(shù)方案如下:
[0008] 第一方面,提供一種海量數(shù)據(jù)的信息處理方法,包括:從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù) 序列和事件信息集合;其中,第一數(shù)據(jù)源的所述數(shù)據(jù)序列中包含所述第一數(shù)據(jù)源在η個(gè)采 集周期內(nèi)所采集的數(shù)據(jù),第一數(shù)據(jù)源為所述至少一個(gè)數(shù)據(jù)源中的任一數(shù)據(jù)源,所述第一數(shù) 據(jù)源的所述事件信息集合中包含所述第一數(shù)據(jù)源在所述η個(gè)采集周期內(nèi)發(fā)生的事件的事 件信息,所述事件信息包括所述事件的事件類(lèi)型,W及所述事件發(fā)生的起始時(shí)間和結(jié)束時(shí) 間;η為大于等于2的整數(shù);通過(guò)海量數(shù)據(jù)信息處理模型將獲取的所述數(shù)據(jù)序列和所述事件 信息集合進(jìn)行處理,得到所述數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間的相關(guān)性 結(jié)果;其中,所述海量數(shù)據(jù)信息處理模型用于根據(jù)所述至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事 件信息集合,確定所述數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間的相關(guān)性結(jié)果。
[0009] 結(jié)合第一方面,在第一種可能的實(shí)現(xiàn)方式中,對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一 個(gè)數(shù)據(jù)源,均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第 一采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事件信息,所述篩選事件信息為所述事件信 息集合中滿足第一預(yù)設(shè)篩選條件的事件信息,將所述篩選事件信息存儲(chǔ)至篩選事件信息集 合中;其中,所述第一采集周期為所述η個(gè)采集周期中的任一采集周期;從所述第一數(shù)據(jù) 源對(duì)應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù)據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序 列中滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù);根據(jù)所述篩選事件信息集合中包含的所述至少一個(gè)數(shù) 據(jù)源的篩選事件信息的事件類(lèi)型,對(duì)所述篩選事件信息集合中包含的篩選事件信息進(jìn)行分 類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息;從所述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第 一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,所述第一 事件類(lèi)型為所述篩選事件信息集合中包含的事件類(lèi)型中的任一事件類(lèi)型;根據(jù)獲取的所述 第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一 事件類(lèi)型的相關(guān)性指標(biāo);根據(jù)所述相關(guān)性指標(biāo)獲取所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間 的相關(guān)性結(jié)果。
[0010] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式中,在所述第 一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息, 執(zhí)行如下操作:根據(jù)所述第一事件信息的第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間,確定所述 第一事件所對(duì)應(yīng)的時(shí)間窗;其中,所述第一事件信息為所述第一數(shù)據(jù)源的事件信息集合中, 所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息;當(dāng)判定在所述第一事件所對(duì)應(yīng)的 時(shí)間窗內(nèi),沒(méi)有除所述第一事件之外的其他事件發(fā)生時(shí),確定所述第一事件信息為所述篩 選事件信息并獲取所述篩選事件信息。
[0011] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式或者第二種可能的實(shí)現(xiàn)方式,在第Ξ種可 能的實(shí)現(xiàn)方式中,從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述第一采集周期內(nèi)的數(shù)據(jù)序列中,選取所述 第一數(shù)據(jù)源的每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù),將選取的所述數(shù)據(jù) 作為第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù);W及從除所述第一采集周期之外的其 他采集周期中,選取在所述每一個(gè)篩選事件信息的所述起始時(shí)間和所述結(jié)束時(shí)間之間的數(shù) 據(jù),并根據(jù)獲取的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù);將所述 第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù),W及所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周 期的篩選數(shù)據(jù),確定為所述第一數(shù)據(jù)源的篩選數(shù)據(jù)。
[0012] 結(jié)合第一方面的第一種可能的實(shí)現(xiàn)方式至第Ξ種可能的實(shí)現(xiàn)方式中的任一種,在 第四種可能的實(shí)現(xiàn)方式中,對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù) 所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包 含的第一空類(lèi)型篩選數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第一特 性值和第二特性值;其中,所述第一特性值用于表征所述第一采集周期內(nèi)的所述第一篩選 事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第二特 性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間, 所述第一非空類(lèi)型篩選數(shù)據(jù)的平均值;所述第一篩選事件信息為事件類(lèi)型為所述第一事件 類(lèi)型的任一篩選事件信息;對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù) 所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包 含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第Ξ特 性值和第四特性值;其中,所述第Ξ特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選 事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第四特 性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間, 所述第二非空類(lèi)型的所述篩選數(shù)據(jù)的平均值;對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩 選事件信息,獲取所述第一篩選事件信息的第一特性值和第Ξ特性值的差值,將所述差值 確定為所述第一篩選事件信息的第一增量值;W及獲取所述第一篩選事件信息的第二特性 值和第四特性值的差值,將所述差值確定為所述第一篩選事件信息的第二增量值;其中,所 述第一增量值用于表征在所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束 時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí) 間和結(jié)束時(shí)間之間所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率的增量,所述第二增量值用于表征 在所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi) 型篩選數(shù)據(jù)的平均值相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間第二非 空類(lèi)型篩選數(shù)據(jù)的平均值的增量;分別獲取事件類(lèi)型為所述第一事件類(lèi)型的每一個(gè)篩選事 件信息的第一增量值和第二增量值;根據(jù)獲取的所述每一個(gè)篩選事件信息的第一增量值和 第二增量值,確定所述第一事件類(lèi)型的相關(guān)性指標(biāo)。
[0013] 結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,從所述第 一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第 一空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí) 間窗,采用指示函數(shù),獲取所述第一篩選事件信息的第一特性值;從所述第一采集周期內(nèi), 所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一非空類(lèi)型篩選 數(shù)據(jù);并根據(jù)所述第一非空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指 示函數(shù),獲取所述篩選事件信息的第二特性值。
[0014] 結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,從所述其 他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第 二空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事件 信息的第Ξ特性值;從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí) 間之間的篩選數(shù)據(jù)中,選取第二非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二非空類(lèi)型篩選數(shù)據(jù),所 述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),所述其他 采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示 函數(shù),獲取所述篩選事件信息的第四特性值。
[0015] 結(jié)合第一方面的第四種可能的實(shí)現(xiàn)方式至第六種可能的實(shí)現(xiàn)方式,在第屯種可能 的實(shí)現(xiàn)方式中,根據(jù)事件類(lèi)型為所述第一事件類(lèi)型的所有篩選事件信息的第一增量值,確 定所述第一事件類(lèi)型的第一相關(guān)性指標(biāo);其中,第一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出 現(xiàn)概率與發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件相關(guān);或者,從事件類(lèi)型為所述第一事件類(lèi) 型的所述篩選事件信息的第二增量值中,選取大于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的 大于預(yù)設(shè)闊值的第二增量值,確定所述第一事件類(lèi)型的第二相關(guān)性指標(biāo);其中,所述第二相 關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值增大的概率;或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于預(yù)設(shè)闊值 的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊值的第二增量值,確定所述第一事件類(lèi)型的第Ξ 相關(guān)性指標(biāo);其中,所述第Ξ相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件 時(shí),數(shù)據(jù)取值減小的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第 二增量值中,選取大于所述預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增 量值,W及事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第 一事件類(lèi)型的第四相關(guān)性指標(biāo);其中,所述第四相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第 一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的增大量;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述 篩選事件信息的第二增量值中,選取小于所述預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的小于 預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增 量值,確定所述第一事件類(lèi)型的第五相關(guān)性指標(biāo);其中,所述第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā) 生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的減小量。
[0016] 結(jié)合第一方面的第屯種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,若所述第 一事件類(lèi)型的第四相關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第二 相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值大于差值闊值,則確定所述相關(guān) 性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā) 生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量為所述第四相關(guān)性指標(biāo);否則,若所述 第一事件類(lèi)型的第五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第 二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值大于所述差值闊值,則確定所 述相關(guān)性結(jié)果為,第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件 發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小量為所述第一事件類(lèi)型的第五相關(guān)性 指標(biāo);若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值闊值,或者所述第 一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值小于所述差 值闊值,則當(dāng)所述第一事件類(lèi)型的第一相關(guān)性指標(biāo)大于預(yù)設(shè)概率闊值時(shí),確定所述相關(guān)性 結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生 將引起數(shù)據(jù)序列中空類(lèi)型數(shù)據(jù)的出現(xiàn)概率增大。
[0017] 第二方面,提供一種海量數(shù)據(jù)的信息處理裝置,包括:數(shù)據(jù)序列和事件信息集合獲 取單元,從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合;其中,第一數(shù)據(jù)源的所述數(shù)據(jù)序 列中包含所述第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的數(shù)據(jù),第一數(shù)據(jù)源為所述至少一個(gè)數(shù) 據(jù)源中的任一數(shù)據(jù)源,所述第一數(shù)據(jù)源的所述事件信息集合中包含所述第一數(shù)據(jù)源在所述 η個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,所述事件信息包括所述事件的事件類(lèi)型,W及所述 事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間;η為大于等于2的整數(shù);相關(guān)性結(jié)果獲取單元,用于通過(guò) 海量數(shù)據(jù)信息處理模型將所述數(shù)據(jù)序列和事件信息集合獲取單元獲取的所述數(shù)據(jù)序列和 所述事件信息集合進(jìn)行處理,得到所述數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間 的相關(guān)性結(jié)果;其中,所述海量數(shù)據(jù)信息處理模型用于根據(jù)所述至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù) 序列和事件信息集合,確定所述數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間的相關(guān) 性結(jié)果。
[0018] 結(jié)合第二方面,在第一種可能的實(shí)現(xiàn)方式,所述相關(guān)性結(jié)果獲取單元,具體用于: 對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源,均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件信息 集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事件信 息,所述篩選事件信息為所述事件信息集合中滿足第一預(yù)設(shè)篩選條件的事件信息,將所述 篩選事件信息存儲(chǔ)至篩選事件信息集合中;其中,所述第一采集周期為所述η個(gè)采集周期 中的任一采集周期;從所述第一數(shù)據(jù)源對(duì)應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù) 據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序列中滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù);根據(jù)所述篩選事 件信息集合中包含的所述至少一個(gè)數(shù)據(jù)源的篩選事件信息的事件類(lèi)型,對(duì)所述篩選事件信 息集合中包含的篩選事件信息進(jìn)行分類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息;從所 述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束 時(shí)間之間的篩選數(shù)據(jù);其中,所述第一事件類(lèi)型為所述篩選事件信息集合中包含的事件類(lèi) 型中的任一事件類(lèi)型;根據(jù)獲取的所述第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié) 束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一事件類(lèi)型的相關(guān)性指標(biāo);根據(jù)所述相關(guān)性指標(biāo)獲取 所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間的相關(guān)性結(jié)果。
[0019] 結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式,在第二種可能的實(shí)現(xiàn)方式,所述相關(guān)性 獲取單元單元,具體用于:在所述第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的 第一采集周期內(nèi)的任一事件信息,執(zhí)行如下操作:根據(jù)所述第一事件信息的第一事件發(fā)生 的起始時(shí)間和結(jié)束時(shí)間,確定所述第一事件所對(duì)應(yīng)的時(shí)間窗;其中,所述第一事件信息為 所述第一數(shù)據(jù)源的事件信息集合中,所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信 息;當(dāng)判定在所述第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除所述第一事件之外的其他事件發(fā)生 時(shí),確定所述第一事件信息為所述篩選事件信息并獲取所述篩選事件信息。
[0020] 結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式或第二種可能的實(shí)現(xiàn)方式,在第Ξ種可能 的實(shí)現(xiàn)方式中,所述相關(guān)性結(jié)果獲取單元,具體用于:從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述第一采 集周期內(nèi)的數(shù)據(jù)序列中,選取所述第一數(shù)據(jù)源的每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí) 間之間的數(shù)據(jù),將選取的所述數(shù)據(jù)作為第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù);W及 從除所述第一采集周期之外的其他采集周期中,選取在所述每一個(gè)篩選事件信息的所述起 始時(shí)間和所述結(jié)束時(shí)間之間的數(shù)據(jù),并根據(jù)獲取的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其 他采集周期的篩選數(shù)據(jù);將所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù),W及所述第 一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù),確定為所述第一數(shù)據(jù)源的篩選數(shù)據(jù)。
[0021] 結(jié)合第二方面的第一種可能的實(shí)現(xiàn)方式至第Ξ種可能的實(shí)現(xiàn)方式中任一種,在第 四種可能的實(shí)現(xiàn)方式中,所述相關(guān)性結(jié)果獲取單元,具體用于:對(duì)于事件類(lèi)型為所述第一事 件類(lèi)型的第一篩選事件信息,根據(jù)所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲 取所述第一篩選事件信息的第一特性值和第二特性值;其中,所述第一特性值用于表征所 述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型 篩選數(shù)據(jù)的出現(xiàn)概率,所述第二特性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件 信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一非空類(lèi)型篩選數(shù)據(jù)的平均值;所述第一篩選事 件信息為事件類(lèi)型為所述第一事件類(lèi)型的任一篩選事件信息;對(duì)于事件類(lèi)型為所述第一事 件類(lèi)型的第一篩選事件信息,根據(jù)所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲 取所述第一篩選事件信息的第Ξ特性值和第四特性值;其中,所述第Ξ特性值用于表征所 述η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二空類(lèi)型 篩選數(shù)據(jù)的出現(xiàn)概率,所述第四特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件 信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二非空類(lèi)型的所述篩選數(shù)據(jù)的平均值;對(duì)于事件 類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,獲取所述第一篩選事件信息的第一特性值 和第Ξ特性值的差值,將所述差值確定為所述第一篩選事件信息的第一增量值;W及獲取 所述第一篩選事件信息的第二特性值和第四特性值的差值,將所述差值確定為所述第一篩 選事件信息的第二增量值;其中,所述第一增量值用于表征在所述第一采集周期內(nèi),所述第 一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于 所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概 率的增量,所述第二增量值用于表征在所述第一采集周期內(nèi),所述第一篩選事件信息的起 始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均值相對(duì)于所述η個(gè)采集周期內(nèi)的所 述起始時(shí)間和結(jié)束時(shí)間之間第二非空類(lèi)型篩選數(shù)據(jù)的平均值的增量;分別獲取事件類(lèi)型為 所述第一事件類(lèi)型的每一個(gè)篩選事件信息的第一增量值和第二增量值;根據(jù)獲取的所述每 一個(gè)篩選事件信息的第一增量值和第二增量值,確定所述第一事件類(lèi)型的相關(guān)性指標(biāo)。
[0022] 結(jié)合第二方面的第四種可能的實(shí)現(xiàn)方式,在第五種可能的實(shí)現(xiàn)方式中,所述相關(guān) 性結(jié)果獲取單元,具體用于:從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一空類(lèi)型篩選數(shù)據(jù), 所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述第一篩選事件信息的第 一特性值;從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的 篩選數(shù)據(jù)中,選取第一非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一非空類(lèi)型篩選數(shù)據(jù),所述第一篩 選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述篩選事件信息的第二特性值。
[0023] 結(jié)合第二方面的第四種可能的實(shí)現(xiàn)方式,在第六種可能的實(shí)現(xiàn)方式中,所述相關(guān) 性結(jié)果獲取單元,具體用于:從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二空類(lèi)型篩選數(shù)據(jù), 所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目, 采用指示函數(shù),獲取所述篩選事件信息的第Ξ特性值;從所述其他采集周期內(nèi),所述第一篩 選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二非空類(lèi)型篩選數(shù)據(jù);并根 據(jù)所述第二非空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié) 束時(shí)間之間的篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間 之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事件信息的第四特性值。
[0024] 結(jié)合第二方面的第四種可能的實(shí)現(xiàn)方式至第六種可能的實(shí)現(xiàn)方式中的任一種,在 第屯種可能的實(shí)現(xiàn)方式中,所述相關(guān)性結(jié)果獲取單元,具體用于:根據(jù)事件類(lèi)型為所述第一 事件類(lèi)型的所有篩選事件信息的第一增量值,確定所述第一事件類(lèi)型的第一相關(guān)性指標(biāo); 其中,第一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的 事件相關(guān);或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選 取大于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增量值,確定所述第一 事件類(lèi)型的第二相關(guān)性指標(biāo);其中,所述第二相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一 事件類(lèi)型的事件時(shí),數(shù)據(jù)取值增大的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩 選事件信息的第二增量值中,選取小于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊 值的第二增量值,確定所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo);其中,所述第Ξ相關(guān)性指標(biāo)用 于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值減小的概率;或者,從事件類(lèi)型 為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大于所述預(yù)設(shè)闊值的第二 增量值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一事件類(lèi)型的 所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第四相關(guān)性指標(biāo);其中,所述第 四相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的增大量; 或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于所 述預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所 述第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第五相關(guān)性 指標(biāo);其中,所述第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù) 平均值的減小量。
[0025] 結(jié)合第二方面的第屯種可能的實(shí)現(xiàn)方式,在第八種可能的實(shí)現(xiàn)方式中,所述相關(guān) 性結(jié)果獲取單元,具體用于:若所述第一事件類(lèi)型的第四相關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平 均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo) 的差值大于差值闊值,則確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān), 且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量 為所述第四相關(guān)性指標(biāo);否則,若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大 平均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指 標(biāo)的差值大于所述差值闊值,則確定所述相關(guān)性結(jié)果為,第一事件類(lèi)型和所述數(shù)據(jù)序列相 關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小 量為所述第一事件類(lèi)型的第五相關(guān)性指標(biāo);若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)大于第 二預(yù)設(shè)增大平均值闊值,或者所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的 第Ξ相關(guān)性指標(biāo)的差值小于所述差值闊值,則當(dāng)所述第一事件類(lèi)型的第一相關(guān)性指標(biāo)大于 預(yù)設(shè)概率闊值時(shí),確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng) 于所述第一事件類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi)型數(shù)據(jù)的出現(xiàn)概率增大。
[00%] 本發(fā)明實(shí)施例中,分別從每一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列W及事件信息集合;將獲取 的數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集合輸入預(yù)設(shè)的海量數(shù)據(jù)信息處理模型,從而輸出數(shù)據(jù)序 列與事件信息集合中任意時(shí)間信息之間的相關(guān)性結(jié)果。采用本發(fā)明技術(shù)方案,基于多個(gè)數(shù) 據(jù)源的事件信息,采用預(yù)設(shè)的海量數(shù)據(jù)信息處理模型即可獲取每一種事件信息與數(shù)據(jù)序列 的關(guān)聯(lián)性,無(wú)須人工判定,有效節(jié)約了人力資源,并保證了獲取的結(jié)果的準(zhǔn)確性。
【附圖說(shuō)明】
[0027] 圖1為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理系統(tǒng)架構(gòu)圖;
[0028] 圖2為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理流程圖;
[0029] 圖3為本發(fā)明實(shí)施例中相關(guān)性結(jié)果獲取流程圖;
[0030] 圖4為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理;
[0031] 圖5為本發(fā)明實(shí)施例中具體應(yīng)用場(chǎng)景下海量數(shù)據(jù)的信息處理流程;
[0032] 圖6為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理裝置結(jié)構(gòu)示意圖;
[0033] 圖7為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理設(shè)備結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0034] 為了解決目前在對(duì)數(shù)據(jù)相關(guān)性獲取的過(guò)程中,存在無(wú)法獲取數(shù)據(jù)序列變量和事件 變量之間相關(guān)性的問(wèn)題。本發(fā)明實(shí)施例中,分別從每一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列W及事件信 息集合;將獲取的數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集合輸入預(yù)設(shè)的海量數(shù)據(jù)信息處理模型, 從而輸出數(shù)據(jù)序列與事件信息集合中任意時(shí)間信息之間的相關(guān)性結(jié)果。采用本發(fā)明技術(shù)方 案,基于多個(gè)數(shù)據(jù)源的事件信息,采用預(yù)設(shè)的海量數(shù)據(jù)信息處理模型即可獲取每一種事件 信息與數(shù)據(jù)序列的關(guān)聯(lián)性,無(wú)須人工判定,有效節(jié)約了人力資源,并保證了獲取的結(jié)果的準(zhǔn) 確性。
[0035] 參閱圖1所示,為本發(fā)明實(shí)施例中海量數(shù)據(jù)的信息處理系統(tǒng)架構(gòu)圖,該海量數(shù)據(jù) 的信息處理系統(tǒng)包括信息處理設(shè)備,該信息處理設(shè)備用于將獲取到的數(shù)據(jù)源的數(shù)據(jù)序列W 及事件信息集合進(jìn)行處理,W確定事件信息集合和數(shù)據(jù)序列之間的相關(guān)性,該信息處理設(shè) 備可W具備用戶交互界面,W便于向用戶呈現(xiàn)相關(guān)性判斷結(jié)果;該信息處理設(shè)備還可W不 具備用戶交互界面,該信息處理設(shè)備與具備用戶交互界面的客戶端相連接,W通過(guò)該客戶 端向用戶呈現(xiàn)相關(guān)性判斷結(jié)果;此外,上述海量數(shù)據(jù)的信息處理系統(tǒng)中還可W包含多個(gè)數(shù) 據(jù)源,用于向信息處理設(shè)備提供待處理的數(shù)據(jù)序列W及事件信息集合;可選的,上述海量數(shù) 據(jù)的信息處理系統(tǒng)中還可W包含采集設(shè)備,用于采集數(shù)據(jù)源提供的待處理的數(shù)據(jù)序列W及 事件信息集合,并將采集到的信息發(fā)送至信息處理設(shè)備。
[0036] 下面結(jié)合說(shuō)明書(shū)附圖,對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳細(xì)描述。
[0037] 參閱圖2所示,本發(fā)明實(shí)施例中,海量數(shù)據(jù)的信息處理過(guò)程,包括:
[0038] 步驟200 :從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合;其中,第一數(shù)據(jù)源的 數(shù)據(jù)序列中包含第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的數(shù)據(jù),第一數(shù)據(jù)源為至少一個(gè)數(shù)據(jù) 源中的任一數(shù)據(jù)源,第一數(shù)據(jù)源的事件信息集合中包含第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)發(fā)生 的事件的事件信息,該事件信息包括事件的事件類(lèi)型,W及該事件發(fā)生的起始時(shí)間和結(jié)束 時(shí)間;η為大于等于2的整數(shù)。
[0039] 步驟210 :通過(guò)海量數(shù)據(jù)信息處理模型將獲取的數(shù)據(jù)序列和事件信息集合進(jìn)行處 理,得到該數(shù)據(jù)序列和該事件信息集合中任一事件信息之間的相關(guān)性結(jié)果;其中,海量數(shù)據(jù) 信息處理模型用于根據(jù)至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合,確定數(shù)據(jù)序列和事 件信息集合中任一事件信息之間的相關(guān)性結(jié)果。
[0040] 在步驟200中,采集設(shè)備分別將從每一個(gè)數(shù)據(jù)源獲取的數(shù)據(jù)序列和事件信息集合 發(fā)送至信息處理設(shè)備,使信息處理設(shè)備直接獲取每一個(gè)數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集 合;或者,采集設(shè)備將所有采集到的數(shù)據(jù)序列和事件信息發(fā)送至信息處理設(shè)備,信息處理設(shè) 備根據(jù)每一個(gè)數(shù)據(jù)序列和事件信息集合所攜帶的數(shù)據(jù)源標(biāo)識(shí),對(duì)所有數(shù)據(jù)序列和事件信息 集合進(jìn)行分類(lèi),W確定哪個(gè)數(shù)據(jù)序列和哪個(gè)事件信息集合對(duì)應(yīng)于同一個(gè)數(shù)據(jù)源。當(dāng)采用后 一種技術(shù)方案時(shí),信息處理設(shè)備對(duì)獲取的事件信息集合和數(shù)據(jù)序列進(jìn)行關(guān)聯(lián)關(guān)系匹配,W 確定對(duì)應(yīng)于同一個(gè)數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集合,建立數(shù)據(jù)序列和事件信息集合在時(shí) 空域中的匹配關(guān)系,從而便于后期獲取單個(gè)數(shù)據(jù)源對(duì)應(yīng)的相關(guān)參數(shù)。基于此,信息處理設(shè)備 可W獲取多個(gè)數(shù)據(jù)序列和多個(gè)事件信息集合,每一個(gè)數(shù)據(jù)序列對(duì)應(yīng)一個(gè)數(shù)據(jù)源,每一個(gè)事 件信息集合也對(duì)應(yīng)一個(gè)數(shù)據(jù)源,此外,信息處理設(shè)備可W獲取一個(gè)數(shù)據(jù)序列和一個(gè)事件信 息集合,該數(shù)據(jù)序列中包含所有數(shù)據(jù)源的數(shù)據(jù),事件信息集合中包含所有數(shù)據(jù)源的事件信 息,且在該篩選信息集合中,篩選事件信息均W其自身對(duì)應(yīng)的數(shù)據(jù)源的不同而分類(lèi),即每一 個(gè)分類(lèi)中僅包含同一個(gè)數(shù)據(jù)源的篩選事件信息。w下w第二種方式為例,詳細(xì)介紹獲取數(shù) 據(jù)序列和事件信息集合之間相關(guān)性的方法。
[0041] 信息處理設(shè)備從每一個(gè)數(shù)據(jù)源獲取到數(shù)據(jù)序列和事件信息集合,如任意一數(shù)據(jù)源 用k表示,1《k《K,K為數(shù)據(jù)源的總數(shù)目,該數(shù)據(jù)源k的數(shù)據(jù)序列用義1"=[名"],=心.表 示,i表示時(shí)間窗的標(biāo)識(shí),表示數(shù)據(jù)源k在第i個(gè)時(shí)間窗中的變量值,該義的值為空 (NULL)類(lèi)型或者為非空類(lèi)型(包含整數(shù)和小數(shù));該數(shù)據(jù)源k的事件信息集合用eW表示, 巧"={ef V··,ef,,ef},ef i表示數(shù)據(jù)源k上發(fā)生的任一事件的事件信息,該事件信息 包括該任一事件的開(kāi)始時(shí)間(由e. start表示),結(jié)束時(shí)間(由e. end表示),W及事件類(lèi) 型(由e. type表示)。
[0042] 其中,上述時(shí)間窗為信息處理設(shè)備在本地預(yù)設(shè)的一個(gè)時(shí)間段,如該時(shí)間窗為30分 鐘,且每一個(gè)時(shí)間窗的時(shí)間長(zhǎng)度相等,此外該時(shí)間窗與數(shù)據(jù)源本地預(yù)設(shè)的時(shí)間窗的時(shí)間段 長(zhǎng)度相等;通過(guò)該時(shí)間窗將一個(gè)采集周期劃分為多個(gè)時(shí)間段。
[0043] 由于時(shí)間窗為數(shù)據(jù)源本地預(yù)設(shè)的參數(shù),因此,當(dāng)數(shù)據(jù)源本地沒(méi)有預(yù)設(shè)時(shí)間窗的情 況下,可選的,信息處理設(shè)備在本地也不設(shè)置時(shí)間窗。
[0044] 在步驟210中,信息處理設(shè)備在本地預(yù)先建立海量數(shù)據(jù)信息處理模型,用于對(duì)輸 入的數(shù)據(jù)源的數(shù)據(jù)序列和事件信息集合進(jìn)行處理,W確定數(shù)據(jù)序列與事件信息集合中包含 的事件信息之間的相關(guān)性結(jié)果。
[0045] 參閱圖3所示,在步驟210中,通過(guò)海量數(shù)據(jù)信息處理模型將獲取的數(shù)據(jù)序列和事 件信息集合進(jìn)行處理的過(guò)程,包括:
[0046] 步驟al :對(duì)于上述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源,均執(zhí)行如下操作:在第一 數(shù)據(jù)源的事件信息集合中,對(duì)第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩選,獲 取篩選事件信息,該篩選事件信息為上述事件信息集合中滿足第一預(yù)設(shè)篩選條件的事件信 息,將該篩選事件信息存儲(chǔ)至篩選事件信息集合中;其中,第一采集周期為η個(gè)采集周期中 的任一采集周期;從第一數(shù)據(jù)源對(duì)應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù)據(jù),其 中,該篩選數(shù)據(jù)為數(shù)據(jù)序列中滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù)。
[0047] 本發(fā)明實(shí)施例中,信息處理設(shè)備在本地預(yù)設(shè)篩選事件信息集合,該篩選事件信息 集合為空;對(duì)每一個(gè)數(shù)據(jù)源的事件信息集合中的事件信息進(jìn)行篩選,獲取滿足預(yù)設(shè)篩選條 件的事件信息,并將獲取的事件信息作為篩選事件信息存儲(chǔ)至上述篩選事件信息集合中。 其中,該預(yù)設(shè)篩選條件為在事件對(duì)應(yīng)的時(shí)間窗內(nèi),不存在其他事件發(fā)生。
[0048] 具體的,W信息處理設(shè)備對(duì)第一數(shù)據(jù)源的事件信息集合中進(jìn)行事件信息篩選為 例,該第一數(shù)據(jù)源為信息處理設(shè)備獲取到的所有數(shù)據(jù)源中的任一數(shù)據(jù)源,則信息處理設(shè)備 獲取第一數(shù)據(jù)源的篩選事件信息的過(guò)程為:對(duì)于第一數(shù)據(jù)源的事件信息集合中的第一事件 信息,該第一事件信息為第一數(shù)據(jù)源的所有事件信息中的任一事件信息,第一事件信息包 含發(fā)生第一事件的起始時(shí)間和結(jié)束時(shí)間;信息處理設(shè)備根據(jù)第一事件發(fā)生的起始時(shí)間和結(jié) 束時(shí)間,確定該第一事件所對(duì)應(yīng)的時(shí)間窗;當(dāng)判定在該第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除 該第一事件之外的其他事件發(fā)生時(shí),確定該第一事件滿足上述預(yù)設(shè)篩選條件;當(dāng)判定在該 第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),除該第一事件之外,還存在其他事件時(shí),確定該第一事件不滿 足預(yù)設(shè)篩選條件,此時(shí),不將該第一事件存儲(chǔ)至篩選事件信息集合中;信息處理設(shè)備將第一 數(shù)據(jù)源的所有事件信息均采用上述方式進(jìn)行篩選處理,w獲取第一數(shù)據(jù)源的所有篩選事件 信息。例如,針對(duì)第一數(shù)據(jù)源的第一事件ei,該第一事件ei對(duì)應(yīng)的時(shí)間窗為曰,若在該時(shí)間 窗a中,第一數(shù)據(jù)源上僅發(fā)生了第一事件ei,此時(shí),將第一事件ei的第一事件信息作為篩選 事件信息存儲(chǔ)至篩選事件信息集合中;若在該時(shí)間窗a中,第一數(shù)據(jù)源上除了發(fā)生第一事 件ei W外,還發(fā)生了第二事件e 2,此時(shí),不將第一事件ei存儲(chǔ)至篩選事件信息集合中。信息 處理設(shè)備對(duì)于獲取的每一個(gè)數(shù)據(jù)源的事件信息,均執(zhí)行上述操作,W獲取所有數(shù)據(jù)源的篩 選事件信息。
[0049] 在上述過(guò)程中,若信息處理設(shè)備在本地設(shè)置時(shí)間窗時(shí),還可W設(shè)置時(shí)間窗的關(guān)聯(lián) 函數(shù)f(t),該關(guān)聯(lián)函數(shù)f(t)用于表示時(shí)間窗的標(biāo)識(shí),即已知任意一事件發(fā)生的起始時(shí)間和 結(jié)束時(shí)間,即可獲取該任意一事件對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí);例如,對(duì)于第一數(shù)據(jù)源上發(fā)生的第一 事件e,Πι= f (e. start),η 2= f (e. end),η 1和η 2均為第一事件e對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí),η 1 和Π 2可W相等,也可W不相等。例如,當(dāng)W-天為一個(gè)周期,一個(gè)小時(shí)為一個(gè)時(shí)間窗時(shí),10 : 00~11 :00為時(shí)間窗10,11 :00~12 :00為時(shí)間窗11,若第一事件e的起始時(shí)間為10 :30, 結(jié)束時(shí)間為11 :30,則第一事件e對(duì)應(yīng)的時(shí)間窗ni為時(shí)間窗10,時(shí)間窗η 2為時(shí)間窗11,此 時(shí)ni和η 2不相等;若第一時(shí)間e的起始時(shí)間為10 :30,結(jié)束時(shí)間為10 :40,則第一事件e對(duì) 應(yīng)的時(shí)間窗ni為時(shí)間窗10,時(shí)間窗η 2為時(shí)間窗10,此時(shí)η 1和η 2相等。采用該技術(shù)方案,獲 取每一個(gè)事件信息對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí),便于后期進(jìn)行篩選事件信息的判斷。
[0050] 進(jìn)一步的,當(dāng)信息處理設(shè)備在本地沒(méi)有預(yù)設(shè)時(shí)間窗時(shí),在獲取每一個(gè)數(shù)據(jù)源的篩 選事件信息時(shí),僅W事件信息的起始時(shí)間和結(jié)束時(shí)間為基準(zhǔn)進(jìn)行篩選即可,如對(duì)于第一數(shù) 據(jù)源的事件信息集合中的第一事件信息,該第一事件信息為第一數(shù)據(jù)源的所有事件信息中 的任一事件信息,第一事件信息包含發(fā)生第一事件的起始時(shí)間和結(jié)束時(shí)間;信息處理設(shè)備 判定在第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間之間,沒(méi)有除該第一事件之外的其他事件發(fā)生 時(shí),確定該第一事件滿足上述預(yù)設(shè)篩選條件;當(dāng)判定在該第一事件發(fā)生的起始時(shí)間和結(jié)束 時(shí)間之間,除該第一事件之外,還存在其他事件時(shí),確定該第一事件不滿足預(yù)設(shè)篩選條件, 此時(shí),不將該第一事件存儲(chǔ)至篩選事件信息集合中;信息處理設(shè)備將第一數(shù)據(jù)源的所有事 件信息均采用上述方式進(jìn)行篩選處理,W獲取第一數(shù)據(jù)源的所有篩選事件信息。
[0051] 采用該技術(shù)方案,將在第一事件的時(shí)間窗內(nèi)僅發(fā)生第一事件的第一事件信息作為 篩選事件信息,避免當(dāng)在第一事件的時(shí)間窗內(nèi)發(fā)生多個(gè)事件時(shí),無(wú)法判定該時(shí)間窗對(duì)應(yīng)的 數(shù)據(jù)是由哪一個(gè)事件的發(fā)生造成的,保證了最終獲取的結(jié)果的準(zhǔn)確性。
[0052] 在上述步驟al中,信息處理設(shè)備在本地預(yù)設(shè)篩選數(shù)據(jù)集合,W第一數(shù)據(jù)源的第一 篩選事件信息為例,該第一篩選事件信息為第一數(shù)據(jù)源的所有篩選事件信息中的任一篩選 事件信息,獲取篩選數(shù)據(jù)集合中篩選數(shù)據(jù)的過(guò)程包括:在第一采集周期內(nèi),確定第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間;根據(jù)該第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間,選取第 一數(shù)據(jù)源的數(shù)據(jù)序列中,該起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù)。例如,第一數(shù)據(jù)源對(duì)應(yīng)的第一 采集周期內(nèi),第一篩選事件信息的起始時(shí)間為周一 10 :〇〇~11 :〇〇,此時(shí),從第一數(shù)據(jù)源的 數(shù)據(jù)序列中,選取周一 10 :〇〇~11 :〇〇之間的數(shù)據(jù),將該數(shù)據(jù)作為第一周期內(nèi)的篩選數(shù)據(jù)。
[0053] 進(jìn)一步的,根據(jù)該第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間,從第一數(shù)據(jù)源的數(shù) 據(jù)序列中,獲取除上述第一采集周期之外的其他采集周期內(nèi),該第一篩選事件信息的起始 時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù);若除上述第一采集周期之外的其他采集周期內(nèi),存在任意一 采集周期,在該任意一采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間沒(méi)有任 何事件發(fā)生,則保留該任意一采集周期的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的 數(shù)據(jù),并將保留的數(shù)據(jù)作為第一數(shù)據(jù)源對(duì)應(yīng)的其他采集周期內(nèi)的篩選數(shù)據(jù),保存至篩選數(shù) 據(jù)集合中;否則,剔除掉該任意一采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間 之間的數(shù)據(jù)。
[0054] 例如,對(duì)于第一數(shù)據(jù)源,一個(gè)采集周期為7天,在第一采集周期內(nèi),第一數(shù)據(jù)源發(fā) 生了事件ei,該事件ei的起始時(shí)間為10 :00,結(jié)束時(shí)間為11 :00,除第一采集周期之外,還包 括第二采集周期、第Ξ采集周期和第四采集周期,在第二采集周期的10 :〇〇~11 :〇〇之間, 發(fā)生了事件62,由于僅需要保留在上述10 :00~11 :00之間沒(méi)有任何事件發(fā)生的該時(shí)間段 的數(shù)據(jù),因此,此時(shí)將剔除第二采集周期的10 :〇〇~11 :〇〇之間的數(shù)據(jù);在第立采集周期的 10 :00~11 :00之間,僅發(fā)生了事件ei,由于僅需要保留在上述10 :00~11 :00之間沒(méi)有 任何事件發(fā)生的該時(shí)間段的數(shù)據(jù),因此,此時(shí)將剔除第Ξ采集周期的10 :00~11 :00之間 的數(shù)據(jù);在第四采集周期的10 :〇〇~11 :〇〇之間,沒(méi)有發(fā)生任何事件,由于僅需要保留在上 述10 :00~11 :00之間沒(méi)有任何事件發(fā)生的該時(shí)間段的數(shù)據(jù),因此,此時(shí)將第四采集周期 的10 :00~11 :00之間的數(shù)據(jù)作為篩選數(shù)據(jù),存儲(chǔ)至篩選事件集合中。
[0055] 進(jìn)一步的,信息處理設(shè)備對(duì)篩選事件信息集合中的每一個(gè)篩選事件信息,均執(zhí)行 上述操作,W獲取所有數(shù)據(jù)源的篩選數(shù)據(jù)。
[0056] 采用上述技術(shù)方案,針對(duì)每一個(gè)數(shù)據(jù)源,信息處理設(shè)備將除上述第一采集周期W 外的其他采集周期內(nèi),在特定時(shí)間段中存在事件發(fā)生的數(shù)據(jù)剔除,僅保留在該特定時(shí)間段 內(nèi)不存在任何事件發(fā)生的該特定時(shí)間段內(nèi)的數(shù)據(jù),便于后期確定該特定時(shí)間段內(nèi)數(shù)據(jù)變化 是否與上述第一采集周期發(fā)生的事件相關(guān),避免其他事件對(duì)判斷結(jié)果造成的干擾,提高了 最終獲取的判斷結(jié)果的準(zhǔn)確性。
[0057] 步驟a2 :根據(jù)篩選事件信息集合中包含的至少一個(gè)數(shù)據(jù)源的篩選事件信息的事 件類(lèi)型,對(duì)篩選事件信息集合中包含的篩選事件信息進(jìn)行分類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng) 的篩選事件信息。
[0058] 本發(fā)明實(shí)施例中,信息處理設(shè)備獲取該篩選事件信息集合中包含的每一個(gè)篩選事 件信息的事件類(lèi)型,根據(jù)事件類(lèi)型對(duì)所有的篩選事件信息進(jìn)行分類(lèi),使每一個(gè)分類(lèi)中包含 對(duì)應(yīng)于同一個(gè)事件類(lèi)型的篩選事件信息。例如,針對(duì)事件ei、02、和04,事件ei的事件類(lèi) 型為小區(qū)不可用告警,事件62的事件類(lèi)型為網(wǎng)絡(luò)中斷告警,事件e 3的事件類(lèi)型為網(wǎng)絡(luò)中斷 告警,事件θ4的事件類(lèi)型為小區(qū)不可用告警,則事件e 1和事件e 2的事件類(lèi)型相同,屬于同 一個(gè)分類(lèi),事件和事件e 4的事件類(lèi)型相同,屬于同一個(gè)分類(lèi)。
[0059] 步驟a3 :從每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,獲取第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息 的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,第一事件類(lèi)型為篩選事件信息集合中包含 的事件類(lèi)型中的任一事件類(lèi)型。
[0060] 步驟a4 :根據(jù)獲取的第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間 之間的篩選數(shù)據(jù),獲取第一事件類(lèi)型的相關(guān)性指標(biāo)。
[0061] 本發(fā)明實(shí)施例中,W事件類(lèi)型為第一事件類(lèi)型的第一篩選事件信息為例,該第一 事件類(lèi)型為分類(lèi)后得到的所有事件類(lèi)型中的任一種事件類(lèi)型,第一篩選事件信息為事件類(lèi) 型為第一事件類(lèi)型的任一篩選時(shí)間信息,詳細(xì)描述相關(guān)性指標(biāo)的獲?。?br>[0062] 對(duì)于事件類(lèi)型為第一事件類(lèi)型的第一篩選事件信息,信息處理設(shè)備根據(jù)上述第一 采集周期內(nèi),每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空 類(lèi)型篩選數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取第一篩選事件信息的第一特性值和第二特性 值;其中,第一特性值用于表征上述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,第二特性值用于表征上述第一采集周 期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均 值;對(duì)于事件類(lèi)型為第一事件類(lèi)型的第一篩選事件信息,根據(jù)其他采集周期內(nèi),第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空 類(lèi)型篩選數(shù)據(jù),獲取第一篩選事件信息的第Ξ特性值和第四特性值;其中,第Ξ特性值用于 表征η個(gè)采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第二空類(lèi)型篩選數(shù) 據(jù)的出現(xiàn)概率,第四特性值用于表征η個(gè)采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié) 束時(shí)間之間,第二非空類(lèi)型篩選數(shù)據(jù)的平均值;對(duì)于事件類(lèi)型為第一事件類(lèi)型的第一篩選 事件信息,獲取第一篩選事件信息的第一特性值和第Ξ特性值的差值,將該差值確定為上 述第一篩選事件信息對(duì)應(yīng)的第一增量值;W及獲取第一篩選事件信息的第二特性值和第四 特性值的差值,將該差值確定為上述第一篩選事件信息對(duì)應(yīng)的第二增量值;其中,第一增量 值用于表征在所述第一采集周期內(nèi),第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述 第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間 之間所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率的增量,所述第二增量值用于表征在所述第一采 集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的 平均值相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間第二非空類(lèi)型篩選數(shù) 據(jù)的平均值的增量。
[0063] 針對(duì)事件類(lèi)型為第一事件類(lèi)型的篩選事件信息,均采用上述方法獲取相應(yīng)的第一 增量值和第二增量值,因此,信息處理設(shè)備獲取事件類(lèi)型為第一事件類(lèi)型的所有篩選事件 信息分別對(duì)應(yīng)的第一增量值和第二增量值;根據(jù)所有數(shù)據(jù)源的篩選事件信息中,事件類(lèi)型 為第一事件類(lèi)型的各個(gè)篩選事件信息分別對(duì)應(yīng)的所有第一增量值和所有第二增量值,確定 該任意一事件類(lèi)型對(duì)應(yīng)的相關(guān)性指標(biāo)。
[0064] 在步驟a4中,第一篩選事件信息的第二特性值獲?。簭牡谝粩?shù)據(jù)源對(duì)應(yīng)的第一采 集周期內(nèi),第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一空類(lèi)型 篩選數(shù)據(jù);并根據(jù)第一空類(lèi)型篩選數(shù)據(jù),第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí),采用指示 函數(shù),獲取該篩選事件信息的第一特性值;例如,針對(duì)第一數(shù)據(jù)源的第一篩選事件信息e, 針對(duì)該第一篩選事件信息e,其對(duì)應(yīng)的選取的數(shù)據(jù)序列為',該第一篩選事件信息e的起 始時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí)為ni,結(jié)束時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí)為n2,ni《η《η 2;則第一篩選 事件信息e的第一特性值可W采用如下公式獲?。?陽(yáng)0化]
[0066]其中,ewLLrati。為第一篩選事件信息e的第一特性值;η 1為第一篩選事件信息e 的起始時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí);Π 2為第一篩選事件信息e的結(jié)束時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí); 1(曲為指示函數(shù)。
[0067] 第一篩選事件信息的第二特性值的獲取:信息處理設(shè)備從第一篩選事件信息的起 始時(shí)間和結(jié)束時(shí)間之間篩選數(shù)據(jù)中,選取第一非空類(lèi)型數(shù)據(jù);并根據(jù)第一非空類(lèi)型數(shù)據(jù),該 第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí),采用指示函數(shù),獲取該第一篩選事件信息的第二 特性值。例如,上述第一篩選事件信息e的第二特性值可W采用如下公式獲?。?br>[0068]
[0069] 其中,e、m。。。為第一篩選事件信息e的第二特性值;η 1為第一篩選事件信息e的起 始時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí);Π 2為第一篩選事件信息e的結(jié)束時(shí)間對(duì)應(yīng)的時(shí)間窗標(biāo)識(shí);1怕) 為指示函數(shù)。
[0070] 第一篩選事件信息的第Ξ特性值的獲?。盒畔⑻幚碓O(shè)備從篩選數(shù)據(jù)集合中,選取 第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的第二空類(lèi)型篩選數(shù)據(jù);并根據(jù)選取的第二 空類(lèi)型篩選數(shù)據(jù),該篩選數(shù)據(jù)集合中包含的其他采集周期內(nèi),第一篩選事件信息的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取第一篩選事件信息的第Ξ特性 值;例如,在上述第一篩選事件信息e的其他采集周期內(nèi),該第一篩選事件信息e的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)記為名產(chǎn),1《η'《N,N為第一篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,則第一篩選事件信息e的第Ξ特性值可W采用如下公式 獲?。?br>[0071]
陽(yáng)0巧其中,ew。^f。tl。b。w為事件信息e的第ミ特性值;N為其他采集周期內(nèi),第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目;1(曲為指示函數(shù)。
[0073] 第一篩選事件信息的第四特性值的獲?。盒畔⑻幚碓O(shè)備從篩選數(shù)據(jù)集合中,選取 第一數(shù)據(jù)源對(duì)應(yīng)的其他采集周期內(nèi)第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的第二 非空類(lèi)型篩選數(shù)據(jù);并根據(jù)選取的第二非空類(lèi)型篩選數(shù)據(jù),其他采集周期內(nèi)的第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),W及篩選數(shù)據(jù)集合中,其他采集周期內(nèi)的 第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取該 第一篩選事件信息的第四特性值。例如,上述第一篩選事件信息e的第四特性值可W采用 如下公式獲取:
[0074]
[007引其中,ex me。。^。^為第一篩選事件信息e的第四特性值;N為其他采集周期內(nèi),第一 篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目;1(曲為指示函數(shù)。
[0076] 信息處理設(shè)備根據(jù)上述第一篩選事件信息e的第一特性值和第一篩選事件信息e 的第Ξ特性值,可W采用如下公式獲取第一篩選事件信息e的第一增量值:
[0077]
陽(yáng)〇7引其中,ewLLrati。meremeM為第一篩選事件信息e的第一增量值;e NULLrati。為第一篩選 事件信息e的第一特性值;為第一篩選事件信息e的第Ξ特性值。
[0079] 基于上述第一事件信息e的第二特性值和第一事件信息e的第四特性值,可W采 用如下公式獲取第一事件信息e的第二增量值:
[0080]
[00川其中,emeatiMrement為第一事件信息e的第二增量值;e x_mea。為第一事件信息e的第 二特性值;e、。。。。>。5。為第一事件信息e的第四特性值。
[0082] 信息處理設(shè)備根據(jù)對(duì)應(yīng)于第一事件類(lèi)型的每一個(gè)篩選事件信息的第一增量值和 第二增量值,確定第一事件類(lèi)型對(duì)應(yīng)的相關(guān)性指標(biāo),其中,該相關(guān)性指標(biāo)包含五個(gè)相關(guān)性指 標(biāo),其中:
[0083] 第一相關(guān)性指標(biāo)的獲?。盒畔⑻幚碓O(shè)備確定事件類(lèi)型為第一事件類(lèi)型的篩選事件 信息;并分別獲取確定的每一個(gè)篩選事件信息對(duì)應(yīng)的第一增量值;W及根據(jù)獲取的每一個(gè) 篩選事件信息對(duì)應(yīng)的第一增量信息,確定該第一事件類(lèi)型對(duì)應(yīng)的第一相關(guān)性指標(biāo);其中,第 一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā)生對(duì)應(yīng)于該第一事件類(lèi)型的事件相關(guān), 該第一相關(guān)性指標(biāo)為大于等于-1且小于等于1的值,該第一相關(guān)性指標(biāo)越大,表明當(dāng)存在 第一(記為C)類(lèi)型事件發(fā)生時(shí),數(shù)據(jù)序列中數(shù)據(jù)類(lèi)型為空的概率越大;例如,上述第一事件 類(lèi)型C對(duì)應(yīng)的第一相關(guān)性指標(biāo)可W采用如下公式獲取:
[0084]
[00財(cái)其中,f。。。1。"_。1^。為第一事件類(lèi)型0對(duì)應(yīng)的第一相關(guān)性指標(biāo);6為篩選事件信 息,且篩選事件信息e的事件類(lèi)型為C ;E*為篩選事件信息集合;e. type為事件類(lèi)型;W。為 篩選事件信息e的權(quán)重值,該值為根據(jù)具體情況預(yù)先設(shè)定的值;fgti。為篩選事件 信息e對(duì)應(yīng)的第一增量值。
[0086] 第二相關(guān)性指標(biāo)的獲?。盒畔⑻幚碓O(shè)備確定事件類(lèi)型為第一事件類(lèi)型的篩選事件 信息;并分別獲取確定的每一個(gè)篩選事件信息對(duì)應(yīng)的第二增量值;選取獲取的所有第二增 量值中大于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的所有大于預(yù)設(shè)闊值的第二增量值,確定 上述第一事件類(lèi)型對(duì)應(yīng)的第二相關(guān)性指標(biāo);其中,第二相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于 上述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值增大的概率;例如,上述第一事件類(lèi)型C對(duì)應(yīng)的第二 相關(guān)性指標(biāo)可W采用如下公式獲?。?br>[0087]
[00蝴其中,心。^。。。。為第一事件類(lèi)型0對(duì)應(yīng)的第二相關(guān)性指標(biāo);6為篩選事件信息,且 篩選事件信息e的事件類(lèi)型為C ;E*為篩選事件信息集合;e. type -事件類(lèi)型;W。為篩選事 件信息e的權(quán)重值,該值為根據(jù)具體情況預(yù)先設(shè)定的值;em。。。。。,。。。。1為篩選事件信息e對(duì)應(yīng) 的第二增量值;1(曲為指示函數(shù)。
[0089] 第Ξ相關(guān)性值指標(biāo)的獲取:信息處理設(shè)備確定事件類(lèi)型為第一事件類(lèi)型的篩選事 件信息;并分別獲取確定的每一個(gè)篩選事件信息對(duì)應(yīng)的第二增量值;選取獲取的所有第二 增量值中小于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的所有小于預(yù)設(shè)闊值的第二增量值,確 定上述第一事件類(lèi)型對(duì)應(yīng)的第Ξ相關(guān)性指標(biāo);其中,第Ξ相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng) 于上述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值減小的概率;例如,上述第一事件類(lèi)型C對(duì)應(yīng)的第 Ξ相關(guān)性指標(biāo)可W采用如下公式獲取:
[0090]
[00川其中,Tdfw f。。。。為第一事件類(lèi)型C對(duì)應(yīng)的第;相關(guān)性指標(biāo);e為篩選事件信息,且 篩選事件信息e的事件類(lèi)型為C ;E*為篩選事件信息集合;e. type為事件類(lèi)型;W。為篩選事 件信息e的權(quán)重值,該值為根據(jù)具體情況預(yù)先設(shè)定的值;em。。。。。,。。。。1為篩選事件信息e對(duì)應(yīng) 的第二增量值;1(曲為指示函數(shù)。
[0092] 第四相關(guān)性指標(biāo)的獲?。盒畔⑻幚碓O(shè)備確定事件類(lèi)型為第一事件類(lèi)型的篩選事件 信息;并分別獲取確定的每一個(gè)篩選事件信息對(duì)應(yīng)的第二增量值;選取獲取的所有第二增 量值中大于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的所有大于預(yù)設(shè)闊值的第二增量值,W及 獲取的每一個(gè)篩選事件信息對(duì)應(yīng)的第二增量值,確定上述第一事件類(lèi)型對(duì)應(yīng)的第四相關(guān)性 指標(biāo);其中,第四相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于上述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均 值的增大量;例如,上述第一事件類(lèi)型C對(duì)應(yīng)的第四相關(guān)性指標(biāo)可W采用如下公式獲?。?br>[0093]
[0094] 其中,Tme。。1。^。。1_。+為第一事件類(lèi)型〇對(duì)應(yīng)的第四相關(guān)性指標(biāo);6為篩選事件信息, 且篩選事件信息e的事件類(lèi)型為C ;E*為篩選事件信息集合;e. type為事件類(lèi)型;W。為篩選 事件信息e的權(quán)重值,該值為根據(jù)具體情況預(yù)先設(shè)定的值;em。。。1。。,。。1。。1為篩選事件信息6對(duì) 應(yīng)的第二增量值;1(曲為指示函數(shù)。
[0095] 第五相關(guān)性指標(biāo)的獲取:信息處理設(shè)備確定事件類(lèi)型為第一事件類(lèi)型的篩選事件 信息;并分別獲取確定的每一個(gè)篩選事件信息對(duì)應(yīng)的第一增量值;取獲取的所有第二增量 值中小于所述預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的所有小于預(yù)設(shè)闊值的第二增量值,W 及獲取的每一個(gè)篩選事件信息對(duì)應(yīng)的第二增量值,確定第一事件類(lèi)型對(duì)應(yīng)的第五相關(guān)性指 標(biāo);其中,第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的減 小量;例如,上述第一事件類(lèi)型C對(duì)應(yīng)的第五相關(guān)性指標(biāo)可W采用如下公式獲取:
[0096]
[0097] 其中,Tmean_mcrement_c為第一事件類(lèi)型G對(duì)應(yīng)的第五相關(guān)性指標(biāo);e為篩選事件信息, 且篩選事件信息e的事件類(lèi)型為C ;E*為篩選事件信息集合;e. type為事件類(lèi)型;W。為篩選 事件信息e的權(quán)重值,該值為根據(jù)具體情況預(yù)先設(shè)定的值;em。。。1。。,。。1。。1為篩選事件信息6對(duì) 應(yīng)的第二增量值;1(曲為指示函數(shù)。
[0098] 采用上述技術(shù)方案,信息處理設(shè)備能夠獲取每一個(gè)事件類(lèi)型對(duì)應(yīng)的各種類(lèi)型相關(guān) 性指標(biāo),并根據(jù)該各種類(lèi)型相關(guān)性指標(biāo)來(lái)確定數(shù)據(jù)序列中的數(shù)據(jù)變化與哪一種事件類(lèi)型相 關(guān),有效保證了最終得到的判斷結(jié)果的準(zhǔn)確性。
[0099] 步驟a5 :根據(jù)上述相關(guān)性指標(biāo)獲取數(shù)據(jù)序列和第一事件類(lèi)型之間的相關(guān)性結(jié)果。
[0100] 本發(fā)明實(shí)施例中,若第一事件類(lèi)型對(duì)應(yīng)的第四相關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平均 值闊值,且該第一事件類(lèi)型對(duì)應(yīng)的第二相關(guān)性指標(biāo)與該第一事件類(lèi)型對(duì)應(yīng)的第Ξ相關(guān)性 指標(biāo)的差值大于差值闊值,則確定該第一事件類(lèi)型和對(duì)應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于上述 第一事件類(lèi)型的事件發(fā)生,將引起該數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量為第四相關(guān)性指 標(biāo); 陽(yáng)101] 否則,若上述第一事件類(lèi)型對(duì)應(yīng)的第五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值闊 值,且該第一事件類(lèi)型對(duì)應(yīng)的第二相關(guān)性指標(biāo)與該第一事件類(lèi)型對(duì)應(yīng)的第Ξ相關(guān)性指標(biāo)的 差值大于上述差值闊值,則確定該第一事件類(lèi)型和相應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于該第一 事件類(lèi)型的事件發(fā)生,將引起上述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小量為第五相關(guān)性指標(biāo); 若上述第一事件類(lèi)型對(duì)應(yīng)的第五相關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值闊值,或者該第一事 件類(lèi)型對(duì)應(yīng)的第二相關(guān)性指標(biāo)與該第一事件類(lèi)型對(duì)應(yīng)的第Ξ相關(guān)性指標(biāo)的差值小于上述 差值闊值,則當(dāng)上述第一事件類(lèi)型對(duì)應(yīng)的第一相關(guān)性指標(biāo)大于預(yù)設(shè)概率闊值時(shí),確定上述 第一事件類(lèi)型和相應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于該第一事件類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序 列中空類(lèi)型數(shù)據(jù)的概率增大。 陽(yáng)102] 進(jìn)一步的,當(dāng)信息處理設(shè)備在本地沒(méi)有預(yù)設(shè)時(shí)間窗時(shí),信息處理設(shè)備能夠根據(jù)每 一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間,采用上述方式獲取上述第一事件類(lèi)型對(duì)應(yīng)的各 個(gè)相關(guān)性指標(biāo),在此不再寶述。 陽(yáng)103] 基于上述技術(shù)方案,參閱圖4所示,針對(duì)任意一數(shù)據(jù)源k的事件信息集合E,該事件 信息集合E對(duì)應(yīng)的數(shù)據(jù)序列為X,采用步驟200進(jìn)行數(shù)據(jù)時(shí)空域關(guān)聯(lián)匹配,采用步驟al至步 驟曰3進(jìn)行數(shù)據(jù)序列X和事件信息集合E之間的特征構(gòu)建與提取,采用步驟曰4至步驟曰5,進(jìn) 行相關(guān)性指標(biāo)和相關(guān)性結(jié)果確定。
[0104] 例如,在通信應(yīng)用領(lǐng)域,當(dāng)某一基站對(duì)應(yīng)的某一特定KPI (Key Per化rmance Indicator ;企業(yè)關(guān)鍵績(jī)效指標(biāo))指標(biāo)較差時(shí),需要查看該基站的話統(tǒng)指標(biāo),W及ΚΡΙ指標(biāo)較 差的時(shí)間段內(nèi)是否存在告警。如果存在告警,則可W定位到硬件問(wèn)題,或者硬件資源不夠等 原因,無(wú)須關(guān)注其他的射頻方面原因;如果ΚΡΙ指標(biāo)較差的時(shí)間段內(nèi)沒(méi)有告警,將從射頻方 面深入分析ΚΡΙ指標(biāo)較差的原因。基于上述過(guò)程,采用本發(fā)明技術(shù)方案時(shí),即為將基站作為 一個(gè)數(shù)據(jù)源,由信息處理設(shè)備收集不同基站對(duì)應(yīng)的話統(tǒng)指標(biāo),并根據(jù)待分析ΚΡΙ的定義公 式,計(jì)算各個(gè)基站的ΚΡΙ數(shù)據(jù)序列X,其中,時(shí)間窗和采集周期均由數(shù)據(jù)源決定,如W 30分鐘 為時(shí)間窗,且采集周期為屯天;將告警作為事件信息集合中的變量,將每一個(gè)告警作為一個(gè) 事件信息e,告警的名稱記為e. type,告警的起始時(shí)間記為e. start,告警的結(jié)束時(shí)間記為 e. end。同時(shí)根據(jù)告警定位的設(shè)備信息,將每個(gè)事件信息e和相應(yīng)的基站關(guān)聯(lián)起來(lái)。采用本 發(fā)明技術(shù)方案,確定事件信息集合E與數(shù)據(jù)序列X之間的相關(guān)程度,從物理上確定各種類(lèi)型 告警與上述KPI是否強(qiáng)相關(guān),W及每一種類(lèi)型的告警均會(huì)引起該KPI指標(biāo)如何變化和變化 幅度。
[0105] 又例如,電商平臺(tái)基于對(duì)用戶的網(wǎng)絡(luò)行為和節(jié)假日之間的相關(guān)性分析,針對(duì)不同 節(jié)假日進(jìn)行不同的營(yíng)銷(xiāo)活動(dòng)策劃,如中秋節(jié)和月餅類(lèi)產(chǎn)品為強(qiáng)相關(guān)關(guān)系,因此,電商平臺(tái)在 中秋節(jié)期間將進(jìn)行月餅類(lèi)產(chǎn)品的促銷(xiāo)?;谏鲜鰡?wèn)題,采用本發(fā)明技術(shù)方案時(shí),即信息處理 設(shè)備將用戶針對(duì)不同關(guān)鍵字在每一個(gè)時(shí)間窗內(nèi)的捜索數(shù)量作為數(shù)據(jù)序列X中的數(shù)據(jù)變量, 將節(jié)假日作為事件信息集合E中的事件,采集周期為一個(gè)月,節(jié)假日的類(lèi)型作為e. type,節(jié) 假日的起始時(shí)間記為e. start,節(jié)假日的結(jié)束時(shí)間記為e. end。采用本發(fā)明技術(shù)方案,確定 事件信息集合E與數(shù)據(jù)序列X之間的相關(guān)程度,物理確定關(guān)鍵字與各類(lèi)節(jié)假日的相關(guān)程度。
[0106] 采用本發(fā)明技術(shù)方案,基于數(shù)據(jù)序列和事件集合中所包含的變量,確定兩者之間 的相關(guān)性,無(wú)須人工確定兩者之間的相關(guān)性,有效節(jié)約了人力資源,提高了相關(guān)性確定的效 率;并且,信息處理設(shè)備能夠定量確定兩者之間相關(guān)性指標(biāo),避免了現(xiàn)有技術(shù)中依靠人為確 定相關(guān)性指標(biāo)所造成的誤差,提高了所確定的相關(guān)性指標(biāo)的準(zhǔn)確性。
[0107] 基于上述技術(shù)方案,參閱圖5所示,信息處理設(shè)備基于上述五種類(lèi)型的相關(guān)性指 標(biāo),確定任意一事件類(lèi)型與數(shù)據(jù)序列的相關(guān)性的過(guò)程,具體包括:
[0108] 步驟500 :信息處理設(shè)備判斷上述任意一事件類(lèi)型對(duì)應(yīng)的相關(guān)性指標(biāo)是否滿足, 第四相關(guān)性能指標(biāo)大于第一預(yù)設(shè)增大平均值闊值,且第二相關(guān)性能指標(biāo)與第Ξ相關(guān)性能指 標(biāo)的差值大于差值闊值(即a且T rauy。。。e-Tdrw r。。。。> b),當(dāng)滿足時(shí),執(zhí) 行步驟510 ;否則,執(zhí)行步驟520。
[0109] 步驟510 :信息處理設(shè)備確定該任意一事件類(lèi)型和對(duì)應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì)應(yīng) 于上述任意一事件類(lèi)型的事件發(fā)生,將引起該數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量為第四 相關(guān)性指標(biāo)。
[0110] 步驟520 :信息處理設(shè)備判斷上述任意一事件類(lèi)型的相關(guān)性能指標(biāo)是否滿足,第 五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值闊值,且該任意一事件類(lèi)型對(duì)應(yīng)的第二相關(guān)性指標(biāo) 與該任意一事件類(lèi)型對(duì)應(yīng)的第Ξ相關(guān)性指標(biāo)的差值大于上述差值闊值(即。< C 且b)諾滿足,執(zhí)行步驟530 ;否則,執(zhí)行步驟540。 陽(yáng)111] 本發(fā)明實(shí)施例中,上述C =-a。
[0112] 步驟530 :信息處理設(shè)備確定該任意一事件類(lèi)型和相應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì)應(yīng) 于該任意一事件類(lèi)型的事件發(fā)生,將引起上述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小量為第五 相關(guān)性指標(biāo)。
[0113] 步驟540 :信息處理設(shè)備判斷上述任意一事件類(lèi)型對(duì)應(yīng)的第一相關(guān)性指標(biāo)是否大 于預(yù)設(shè)概率闊值(即町。^_^。,1。_1。"。1。。。1_。> d),若是,則執(zhí)行步驟550 ;否則,結(jié)束當(dāng)前操作。
[0114] 步驟550 :信息處理設(shè)備確定上述任意一事件類(lèi)型和相應(yīng)的數(shù)據(jù)序列相關(guān),且對(duì) 應(yīng)于該任意一事件類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi)型的數(shù)據(jù)概率增大。
[0115] 基于上述技術(shù)方案,參閱圖6所示,本發(fā)明實(shí)施例中還提供一種信息處理裝置,包 括數(shù)據(jù)序列和事件信息集合獲取單元60,相關(guān)性結(jié)果獲取單元61,其中:
[0116] 數(shù)據(jù)序列和事件信息集合獲取單元60,用于從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事 件信息集合;其中,第一數(shù)據(jù)源的所述數(shù)據(jù)序列中包含所述第一數(shù)據(jù)源在η個(gè)采集周期內(nèi) 所采集的數(shù)據(jù),第一數(shù)據(jù)源為所述至少一個(gè)數(shù)據(jù)源中的任一數(shù)據(jù)源,所述第一數(shù)據(jù)源的所 述事件信息集合中包含所述第一數(shù)據(jù)源在所述η個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,所 述事件信息包括所述事件的事件類(lèi)型,W及所述事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間;η為大 于等于2的整數(shù);
[0117] 相關(guān)性結(jié)果獲取單元61,用于通過(guò)海量數(shù)據(jù)信息處理模型將所述數(shù)據(jù)序列和事件 信息集合獲取單元60獲取的所述數(shù)據(jù)序列和所述事件信息集合進(jìn)行處理,得到所述數(shù)據(jù) 序列和所述事件信息集合中任一事件信息之間的相關(guān)性結(jié)果;其中,所述海量數(shù)據(jù)信息處 理模型用于根據(jù)所述至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合,確定所述數(shù)據(jù)序列和 所述事件信息集合中任一事件信息之間的相關(guān)性結(jié)果。
[0118] 可選的,所述相關(guān)性結(jié)果獲取單元61,用于對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一個(gè) 數(shù)據(jù)源,均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一 采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事件信息,所述篩選事件信息為所述事件信息 集合中滿足第一預(yù)設(shè)篩選條件的事件信息,將所述篩選事件信息存儲(chǔ)至篩選事件信息集合 中;其中,所述第一采集周期為所述η個(gè)采集周期中的任一采集周期;從所述第一數(shù)據(jù)源對(duì) 應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù)據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序列中 滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù);根據(jù)所述篩選事件信息集合中包含的所述至少一個(gè)數(shù)據(jù)源 的篩選事件信息的事件類(lèi)型,對(duì)所述篩選事件信息集合中包含的篩選事件信息進(jìn)行分類(lèi), 獲取每一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息;從所述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一 事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,所述第一事 件類(lèi)型為所述篩選事件信息集合中包含的事件類(lèi)型中的任一事件類(lèi)型;根據(jù)獲取的所述第 一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一事 件類(lèi)型的相關(guān)性指標(biāo);根據(jù)所述相關(guān)性指標(biāo)獲取所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間的 相關(guān)性結(jié)果。
[0119] 可選的,所述相關(guān)性獲取單元單元61,具體用于:在所述第一數(shù)據(jù)源的事件信息 集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息,執(zhí)行如下操作:根據(jù)所 述第一事件信息的第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間,確定所述第一事件所對(duì)應(yīng)的時(shí)間 窗;其中,所述第一事件信息為所述第一數(shù)據(jù)源的事件信息集合中,所述第一數(shù)據(jù)源對(duì)應(yīng)的 第一采集周期內(nèi)的任一事件信息;當(dāng)判定在所述第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除所述 第一事件之外的其他事件發(fā)生時(shí),確定所述第一事件信息為所述篩選事件信息并獲取所述 篩選事件信息。
[0120] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述 第一采集周期內(nèi)的數(shù)據(jù)序列中,選取所述第一數(shù)據(jù)源的每一個(gè)篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的數(shù)據(jù),將選取的所述數(shù)據(jù)作為第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù) 據(jù);W及從除所述第一采集周期之外的其他采集周期中,選取在所述每一個(gè)篩選事件信息 的所述起始時(shí)間和所述結(jié)束時(shí)間之間的數(shù)據(jù),并根據(jù)獲取的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng) 的所述其他采集周期的篩選數(shù)據(jù);將所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù),W 及所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù),確定為所述第一數(shù)據(jù)源的篩選數(shù) 據(jù)。 陽(yáng)121] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:對(duì)于事件類(lèi)型為所述第一事件 類(lèi)型的第一篩選事件信息,根據(jù)所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取 所述第一篩選事件信息的第一特性值和第二特性值;其中,所述第一特性值用于表征所述 第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩 選數(shù)據(jù)的出現(xiàn)概率,所述第二特性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一非空類(lèi)型篩選數(shù)據(jù)的平均值;所述第一篩選事件 信息為事件類(lèi)型為所述第一事件類(lèi)型的任一篩選事件信息;對(duì)于事件類(lèi)型為所述第一事件 類(lèi)型的第一篩選事件信息,根據(jù)所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲取 所述第一篩選事件信息的第Ξ特性值和第四特性值;其中,所述第Ξ特性值用于表征所述 η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二空類(lèi)型篩 選數(shù)據(jù)的出現(xiàn)概率,所述第四特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二非空類(lèi)型的所述篩選數(shù)據(jù)的平均值;對(duì)于事件類(lèi) 型為所述第一事件類(lèi)型的第一篩選事件信息,獲取所述第一篩選事件信息的第一特性值和 第Ξ特性值的差值,將所述差值確定為所述第一篩選事件信息的第一增量值;W及獲取所 述第一篩選事件信息的第二特性值和第四特性值的差值,將所述差值確定為所述第一篩選 事件信息的第二增量值;其中,所述第一增量值用于表征在所述第一采集周期內(nèi),所述第一 篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于所 述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率 的增量,所述第二增量值用于表征在所述第一采集周期內(nèi),所述第一篩選事件信息的起始 時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均值相對(duì)于所述η個(gè)采集周期內(nèi)的所述 起始時(shí)間和結(jié)束時(shí)間之間第二非空類(lèi)型篩選數(shù)據(jù)的平均值的增量;分別獲取事件類(lèi)型為所 述第一事件類(lèi)型的每一個(gè)篩選事件信息的第一增量值和第二增量值;根據(jù)獲取的所述每一 個(gè)篩選事件信息的第一增量值和第二增量值,確定所述第一事件類(lèi)型的相關(guān)性指標(biāo)。
[0122] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:從所述第一采集周期內(nèi),所述第 一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一空類(lèi)型篩選數(shù)據(jù);并 根據(jù)所述第一空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲 取所述第一篩選事件信息的第一特性值;從所述第一采集周期內(nèi),所述第一篩選事件信息 的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一 非空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述篩選 事件信息的第二特性值。
[0123] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:從所述其他采集周期內(nèi),所述第 一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二空類(lèi)型篩選數(shù)據(jù);并 根據(jù)所述第二空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié) 束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事件信息的第Ξ特性值;從所 述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選 取第二非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二非空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第 一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選 事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事 件信息的第四特性值。
[0124] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:根據(jù)事件類(lèi)型為所述第一事件 類(lèi)型的所有篩選事件信息的第一增量值,確定所述第一事件類(lèi)型的第一相關(guān)性指標(biāo);其中, 第一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件 相關(guān);或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大 于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增量值,確定所述第一事件 類(lèi)型的第二相關(guān)性指標(biāo);其中,所述第二相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件 類(lèi)型的事件時(shí),數(shù)據(jù)取值增大的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事 件信息的第二增量值中,選取小于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊值的 第二增量值,確定所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo);其中,所述第Ξ相關(guān)性指標(biāo)用于表 征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值減小的概率;或者,從事件類(lèi)型為所 述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大于所述預(yù)設(shè)闊值的第二增量 值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一事件類(lèi)型的所述 篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第四相關(guān)性指標(biāo);其中,所述第四相 關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的增大量;或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于所述預(yù)設(shè) 闊值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一 事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第五相關(guān)性指標(biāo); 其中,所述第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均 值的減小量。
[0125] 可選的,所述相關(guān)性結(jié)果獲取單元61,具體用于:若所述第一事件類(lèi)型的第四相 關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第 一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值大于差值闊值,則確定所述相關(guān)性結(jié)果為,所述第一 事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù) 序列中的數(shù)據(jù)取值增大,增大量為所述第四相關(guān)性指標(biāo);否則,若所述第一事件類(lèi)型的第五 相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述 第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值大于所述差值闊值,則確定所述相關(guān)性結(jié)果為,第 一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù) 據(jù)序列中的數(shù)據(jù)取值減小,減小量為所述第一事件類(lèi)型的第五相關(guān)性指標(biāo);若所述第一事 件類(lèi)型的第五相關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值闊值,或者所述第一事件類(lèi)型的第二相 關(guān)性指標(biāo)與所述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值小于所述差值闊值,則當(dāng)所述第一 事件類(lèi)型的第一相關(guān)性指標(biāo)大于預(yù)設(shè)概率闊值時(shí),確定所述相關(guān)性結(jié)果為,所述第一事件 類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi) 型數(shù)據(jù)的出現(xiàn)概率增大。
[01%] 基于上述技術(shù)方案,參閱圖7所示,本發(fā)明實(shí)施例中還提供一種海量數(shù)據(jù)的信息 處理設(shè)備,包括收發(fā)器70,存儲(chǔ)器71,W及處理器72,其中:
[0127] 收發(fā)器70,用于接收至少一個(gè)數(shù)據(jù)源發(fā)送的數(shù)據(jù)序列W及事件信息集合;其中, 第一數(shù)據(jù)源的所述數(shù)據(jù)序列中包含所述第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的數(shù)據(jù),第一 數(shù)據(jù)源為所述至少一個(gè)數(shù)據(jù)源中的任一數(shù)據(jù)源,所述第一數(shù)據(jù)源的所述事件信息集合中包 含所述第一數(shù)據(jù)源在所述η個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,所述事件信息包括所述 事件的事件類(lèi)型,W及所述事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間;
[0128] 存儲(chǔ)器71,用于存儲(chǔ)應(yīng)用程序,W及預(yù)設(shè)的篩選事件信息集合和篩選數(shù)據(jù)集合;
[0129] 處理器72,用于運(yùn)行存儲(chǔ)器71中存儲(chǔ)的應(yīng)用程序,執(zhí)行如下操作:
[0130] 通過(guò)海量數(shù)據(jù)信息處理模型將所述數(shù)據(jù)序列和事件信息集合獲取單元獲取的所 述數(shù)據(jù)序列和所述事件信息集合進(jìn)行處理,得到所述數(shù)據(jù)序列和所述事件信息集合中任一 事件信息之間的相關(guān)性結(jié)果;其中,所述海量數(shù)據(jù)信息處理模型用于根據(jù)所述至少一個(gè)數(shù) 據(jù)源獲取數(shù)據(jù)序列和事件信息集合,確定所述數(shù)據(jù)序列和所述事件信息集合中任一事件信 息之間的相關(guān)性結(jié)果。 陽(yáng)131] 可選的,所述處理器72,具體用于:對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源, 均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周 期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事件信息,所述篩選事件信息為所述事件信息集合中 滿足第一預(yù)設(shè)篩選條件的事件信息,將所述篩選事件信息存儲(chǔ)至篩選事件信息集合中;其 中,所述第一采集周期為所述η個(gè)采集周期中的任一采集周期;從所述第一數(shù)據(jù)源對(duì)應(yīng)的η 個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù)據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序列中滿足第 二預(yù)設(shè)篩選條件的數(shù)據(jù);根據(jù)所述篩選事件信息集合中包含的所述至少一個(gè)數(shù)據(jù)源的篩選 事件信息的事件類(lèi)型,對(duì)所述篩選事件信息集合中包含的篩選事件信息進(jìn)行分類(lèi),獲取每 一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息;從所述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一事件類(lèi) 型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,所述第一事件類(lèi)型 為所述篩選事件信息集合中包含的事件類(lèi)型中的任一事件類(lèi)型;根據(jù)獲取的所述第一事件 類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一事件類(lèi)型 的相關(guān)性指標(biāo);根據(jù)所述相關(guān)性指標(biāo)獲取所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間的相關(guān)性 結(jié)果。
[0132] 可選的,所述處理器72,具體用于:在所述第一數(shù)據(jù)源的事件信息集合中,對(duì)所述 第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息,執(zhí)行如下操作:根據(jù)所述第一事件信 息的第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間,確定所述第一事件所對(duì)應(yīng)的時(shí)間窗;其中,所 述第一事件信息為所述第一數(shù)據(jù)源的事件信息集合中,所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周 期內(nèi)的任一事件信息;當(dāng)判定在所述第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除所述第一事件之 外的其他事件發(fā)生時(shí),確定所述第一事件信息為所述篩選事件信息并獲取所述篩選事件信 息。
[0133] 可選的,所述處理器72,具體用于:從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述第一采集周期 內(nèi)的數(shù)據(jù)序列中,選取所述第一數(shù)據(jù)源的每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間 的數(shù)據(jù),將選取的所述數(shù)據(jù)作為第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù);W及從除所 述第一采集周期之外的其他采集周期中,選取在所述每一個(gè)篩選事件信息的所述起始時(shí)間 和所述結(jié)束時(shí)間之間的數(shù)據(jù),并根據(jù)獲取的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集 周期的篩選數(shù)據(jù);將所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù),W及所述第一數(shù)據(jù) 源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù),確定為所述第一數(shù)據(jù)源的篩選數(shù)據(jù)。
[0134] 可選的,所述處理器72,具體用于:對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩 選事件信息,根據(jù)所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之 間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選 事件信息的第一特性值和第二特性值;其中,所述第一特性值用于表征所述第一采集周期 內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn) 概率,所述第二特性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第一非空類(lèi)型篩選數(shù)據(jù)的平均值;所述第一篩選事件信息為事件類(lèi) 型為所述第一事件類(lèi)型的任一篩選事件信息;對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩 選事件信息,根據(jù)所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之 間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選 事件信息的第Ξ特性值和第四特性值;其中,所述第Ξ特性值用于表征所述η個(gè)采集周期 內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn) 概率,所述第四特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第二非空類(lèi)型的所述篩選數(shù)據(jù)的平均值;對(duì)于事件類(lèi)型為所述第一 事件類(lèi)型的第一篩選事件信息,獲取所述第一篩選事件信息的第一特性值和第Ξ特性值的 差值,將所述差值確定為所述第一篩選事件信息的第一增量值;W及獲取所述第一篩選事 件信息的第二特性值和第四特性值的差值,將所述差值確定為所述第一篩選事件信息的第 二增量值;其中,所述第一增量值用于表征在所述第一采集周期內(nèi),所述第一篩選事件信息 的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于所述η個(gè)采集周 期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率的增量,所述第 二增量值用于表征在所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間 之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均值相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束 時(shí)間之間第二非空類(lèi)型篩選數(shù)據(jù)的平均值的增量;分別獲取事件類(lèi)型為所述第一事件類(lèi)型 的每一個(gè)篩選事件信息的第一增量值和第二增量值;根據(jù)獲取的所述每一個(gè)篩選事件信息 的第一增量值和第二增量值,確定所述第一事件類(lèi)型的相關(guān)性指標(biāo)。
[0135] 可選的,所述處理器72,具體用于:從所述第一采集周期內(nèi),所述第一篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一 空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述第一篩 選事件信息的第一特性值;從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一非空類(lèi)型篩選 數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述篩選事件信息的第 二特性值。
[0136] 可選的,所述處理器72,具體用于:從所述其他采集周期內(nèi),所述第一篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二 空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的 篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事件信息的第Ξ特性值;從所述其他采集周 期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二非空類(lèi) 型篩選數(shù)據(jù);并根據(jù)所述第二非空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起 始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述篩選事件信息的第四 特性值。
[0137] 可選的,處理器72,具體用于:根據(jù)事件類(lèi)型為所述第一事件類(lèi)型的所有篩選事 件信息的第一增量值,確定所述第一事件類(lèi)型的第一相關(guān)性指標(biāo);其中,第一相關(guān)性指標(biāo)用 于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件相關(guān);或者,從事件 類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大于預(yù)設(shè)闊值的第二 增量值,并根據(jù)選取的大于預(yù)設(shè)闊值的第二增量值,確定所述第一事件類(lèi)型的第二相關(guān)性 指標(biāo);其中,所述第二相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù) 取值增大的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量 值中,選取小于預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)闊值的第二增量值,確定所 述第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo);其中,所述第Ξ相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所 述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值減小的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的 所述篩選事件信息的第二增量值中,選取大于所述預(yù)設(shè)闊值的第二增量值,并根據(jù)選取的 大于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第 二增量值,確定所述第一事件類(lèi)型的第四相關(guān)性指標(biāo);其中,所述第四相關(guān)性指標(biāo)用于表 征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的增大量;或者,從事件類(lèi)型為所 述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于所述預(yù)設(shè)闊值的第二增量 值,并根據(jù)選取的小于預(yù)設(shè)闊值的第二增量值,W及事件類(lèi)型為所述第一事件類(lèi)型的所述 篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第五相關(guān)性指標(biāo);其中,所述第五相 關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的減小量。
[0138] 可選的,所處理器72,具體用于:若所述第一事件類(lèi)型的第四相關(guān)性指標(biāo)大于第 一預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第 Ξ相關(guān)性指標(biāo)的差值大于差值闊值,則確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述 數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取 值增大,增大量為所述第四相關(guān)性指標(biāo);否則,若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)小于 第二預(yù)設(shè)增大平均值闊值,且所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的 第Ξ相關(guān)性指標(biāo)的差值大于所述差值闊值,則確定所述相關(guān)性結(jié)果為,第一事件類(lèi)型和所 述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù) 取值減小,減小量為所述第一事件類(lèi)型的第五相關(guān)性指標(biāo);若所述第一事件類(lèi)型的第五相 關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值闊值,或者所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述 第一事件類(lèi)型的第Ξ相關(guān)性指標(biāo)的差值小于所述差值闊值,則當(dāng)所述第一事件類(lèi)型的第一 相關(guān)性指標(biāo)大于預(yù)設(shè)概率闊值時(shí),確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù) 序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi)型數(shù)據(jù)的出現(xiàn)概 率增大。
[0139] 綜上所述,本發(fā)明實(shí)施例中,從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合;其 中,第一數(shù)據(jù)源的數(shù)據(jù)序列中包含第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的數(shù)據(jù),第一數(shù)據(jù) 源為至少一個(gè)數(shù)據(jù)源中的任一數(shù)據(jù)源,第一數(shù)據(jù)源的事件信息集合中包含第一數(shù)據(jù)源在η 個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,該事件信息包括事件的事件類(lèi)型,W及該事件發(fā)生 的起始時(shí)間和結(jié)束時(shí)間;對(duì)于上述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源,均執(zhí)行如下操作: 在第一數(shù)據(jù)源的事件信息集合中,對(duì)第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩 選,獲取篩選事件信息,篩選事件信息為事件信息集合中滿足預(yù)設(shè)篩選條件的事件信息,將 該篩選事件信息存儲(chǔ)至篩選事件信息集合中;其中,第一采集周期為η個(gè)采集周期中的任 一采集周期;從第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的數(shù)據(jù)序列中,選取第一數(shù)據(jù)源的篩選 事件信息集合中包含的每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù);W及從除 第一采集周期之外的其他采集周期中,選取在每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間 之間沒(méi)有任何事件發(fā)生的時(shí)間段,并獲取除第一采集周期之外的其他采集周期中每一個(gè)篩 選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù),并從獲取的數(shù)據(jù)中選取在上述時(shí)間段之間 的數(shù)據(jù),將選取的數(shù)據(jù)確定為第一數(shù)據(jù)源的篩選數(shù)據(jù),存儲(chǔ)至篩選數(shù)據(jù)集合中;根據(jù)篩選事 件信息集合中包含的至少一個(gè)數(shù)據(jù)源的篩選事件信息的事件類(lèi)型,對(duì)篩選事件信息集合中 包含的篩選事件信息進(jìn)行分類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息;從每一個(gè)數(shù)據(jù) 源對(duì)應(yīng)的第一采集周期內(nèi)的數(shù)據(jù)中,選取第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的數(shù)據(jù),W及從每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一事件類(lèi)型對(duì)應(yīng)的篩選 事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,第一事件類(lèi)型為篩選事件信息集 合中包含的事件類(lèi)型中的任意一種事件類(lèi)型;根據(jù)獲取的第一事件類(lèi)型對(duì)應(yīng)的篩選事件信 息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù),W及獲取的第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起 始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取第一事件類(lèi)型的相關(guān)性指標(biāo);根據(jù)上述相關(guān)性指 標(biāo),確定第一事件類(lèi)型與數(shù)據(jù)序列的相關(guān)性。采用本發(fā)明技術(shù)方案,基于多個(gè)數(shù)據(jù)源對(duì)應(yīng)的 事件信息,獲取篩選事件信息集合中每一個(gè)篩選事件信息對(duì)應(yīng)的不同周期的相應(yīng)數(shù)據(jù),確 定每一種事件類(lèi)型與數(shù)據(jù)序列的關(guān)聯(lián)性,無(wú)須人工判定,有效節(jié)約了人力資源,并保證了獲 取的結(jié)果的準(zhǔn)確性。
[0140] 本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí) 施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī) 可用存儲(chǔ)介質(zhì)(包括但不限于磁盤(pán)存儲(chǔ)器、CD-ROM、光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn) 品的形式。 陽(yáng)141] 本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程 圖和/或方框圖來(lái)描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一 流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻\(yùn)些計(jì)算 機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理 器W產(chǎn)生一個(gè)機(jī)器,使得通過(guò)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生 用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能 的裝置。
[0142] 運(yùn)些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備W特 定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或 多個(gè)方框中指定的功能。
[0143] 運(yùn)些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì) 算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟W產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或 其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖 一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0144] 盡管已描述了本發(fā)明的優(yōu)選實(shí)施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造 性概念,則可對(duì)運(yùn)些實(shí)施例作出另外的變更和修改。所W,所附權(quán)利要求意欲解釋為包括優(yōu) 選實(shí)施例W及落入本發(fā)明范圍的所有變更和修改。
[0145] 顯然,本領(lǐng)域的技術(shù)人員可W對(duì)本發(fā)明實(shí)施例進(jìn)行各種改動(dòng)和變型而不脫離本發(fā) 明實(shí)施例的精神和范圍。運(yùn)樣,倘若本發(fā)明實(shí)施例的運(yùn)些修改和變型屬于本發(fā)明權(quán)利要求 及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含運(yùn)些改動(dòng)和變型在內(nèi)。
【主權(quán)項(xiàng)】
1. 一種海量數(shù)據(jù)的信息處理方法,其特征在于,包括: 從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合;其中,第一數(shù)據(jù)源的所述數(shù)據(jù)序列 中包含所述第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的數(shù)據(jù),第一數(shù)據(jù)源為所述至少一個(gè)數(shù)據(jù) 源中的任一數(shù)據(jù)源,所述第一數(shù)據(jù)源的所述事件信息集合中包含所述第一數(shù)據(jù)源在所述η 個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,所述事件信息包括所述事件的事件類(lèi)型,以及所述 事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間;η為大于等于2的整數(shù); 通過(guò)海量數(shù)據(jù)信息處理模型將獲取的所述數(shù)據(jù)序列和所述事件信息集合進(jìn)行處理,得 到所述數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間的相關(guān)性結(jié)果;其中,所述海量 數(shù)據(jù)信息處理模型用于根據(jù)所述至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合,確定所述 數(shù)據(jù)序列和所述事件信息集合中任一事件信息之間的相關(guān)性結(jié)果。2. 如權(quán)利要求1所述的方法,其特征在于,所述通過(guò)海量數(shù)據(jù)信息處理模型將獲取的 所述數(shù)據(jù)序列和所述事件信息集合進(jìn)行處理,包括: 對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源,均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件 信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事 件信息,所述篩選事件信息為所述事件信息集合中滿足第一預(yù)設(shè)篩選條件的事件信息,將 所述篩選事件信息存儲(chǔ)至篩選事件信息集合中;其中,所述第一采集周期為所述η個(gè)采集 周期中的任一采集周期;從所述第一數(shù)據(jù)源對(duì)應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩 選數(shù)據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序列中滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù); 根據(jù)所述篩選事件信息集合中包含的所述至少一個(gè)數(shù)據(jù)源的篩選事件信息的事件類(lèi) 型,對(duì)所述篩選事件信息集合中包含的篩選事件信息進(jìn)行分類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng) 的篩選事件信息; 從所述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,所述第一事件類(lèi)型為所述篩選事件信息集合中包含 的事件類(lèi)型中的任一事件類(lèi)型; 根據(jù)獲取的所述第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩 選數(shù)據(jù),獲取所述第一事件類(lèi)型的相關(guān)性指標(biāo); 根據(jù)所述相關(guān)性指標(biāo)獲取所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間的相關(guān)性結(jié)果。3. 如權(quán)利要求2所述的方法,其特征在于,在第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第 一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事件信息,具體包括: 在所述第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任 一事件信息,執(zhí)行如下操作: 根據(jù)所述第一事件信息的第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間,確定所述第一事件所 對(duì)應(yīng)的時(shí)間窗;其中,所述第一事件信息為所述第一數(shù)據(jù)源的事件信息集合中,所述第一數(shù) 據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息; 當(dāng)判定在所述第一事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除所述第一事件之外的其他事件發(fā)生 時(shí),確定所述第一事件信息為所述篩選事件信息并獲取所述篩選事件信息。4. 如權(quán)利要求2或3所述的方法,其特征在于,從所述第一數(shù)據(jù)源對(duì)應(yīng)的η個(gè)采集周期 內(nèi)的數(shù)據(jù)序列中,選取篩選數(shù)據(jù),具體包括: 從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述第一采集周期內(nèi)的數(shù)據(jù)序列中,選取所述第一數(shù)據(jù)源的 每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù),將選取的所述數(shù)據(jù)作為第一數(shù)據(jù) 源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù);以及 從除所述第一采集周期之外的其他采集周期中,選取在所述每一個(gè)篩選事件信息的所 述起始時(shí)間和所述結(jié)束時(shí)間之間的數(shù)據(jù),并根據(jù)獲取的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng)的所 述其他采集周期的篩選數(shù)據(jù); 將所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù),以及所述第一數(shù)據(jù)源對(duì)應(yīng)的所述 其他采集周期的篩選數(shù)據(jù),確定為所述第一數(shù)據(jù)源的篩選數(shù)據(jù)。5. 如權(quán)利要求2至4任一所述的方法,其特征在于,所述根據(jù)獲取的所述第一事件類(lèi)型 對(duì)應(yīng)的篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一事件類(lèi)型的相 關(guān)性指標(biāo),具體包括: 對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù)所述第一采集周期內(nèi), 所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選 數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第一特性值和第二特性值; 其中,所述第一特性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第二特性值用于表征所述第 一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一非空類(lèi)型篩 選數(shù)據(jù)的平均值;所述第一篩選事件信息為事件類(lèi)型為所述第一事件類(lèi)型的任一篩選事件 信息; 對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù)所述其他采集周期內(nèi), 所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選 數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第三特性值和第四特性值; 其中,所述第三特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第四特性值用于表征所述η 個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二非空類(lèi)型的 所述篩選數(shù)據(jù)的平均值; 對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,獲取所述第一篩選事件信息 的第一特性值和第三特性值的差值,將所述差值確定為所述第一篩選事件信息的第一增量 值;以及獲取所述第一篩選事件信息的第二特性值和第四特性值的差值,將所述差值確定 為所述第一篩選事件信息的第二增量值;其中,所述第一增量值用于表征在所述第一采集 周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的 出現(xiàn)概率相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間所述第二空類(lèi)型篩 選數(shù)據(jù)的出現(xiàn)概率的增量,所述第二增量值用于表征在所述第一采集周期內(nèi),所述第一篩 選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均值相對(duì)于所述η個(gè) 采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間第二非空類(lèi)型篩選數(shù)據(jù)的平均值的增量; 分別獲取事件類(lèi)型為所述第一事件類(lèi)型的每一個(gè)篩選事件信息的第一增量值和第二 增量值; 根據(jù)獲取的所述每一個(gè)篩選事件信息的第一增量值和第二增量值,確定所述第一事件 類(lèi)型的相關(guān)性指標(biāo)。6. 如權(quán)利要求5所述的方法,其特征在于,根據(jù)所述第一采集周期內(nèi),所述第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選數(shù)據(jù)和第一非空 類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第一特性值和第二特性值,具體包括: 從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第一空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息 所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述第一篩選事件信息的第一特性值; 從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第一非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一非空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件 信息所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述篩選事件信息的第二特性值。7. 如權(quán)利要求5所述的方法,其特征在于,根據(jù)所述其他采集周期內(nèi),所述第一篩選事 件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選數(shù)據(jù)和第二非空 類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第三特性值和第四特性值,具體包括: 從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第二空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的 第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所 述篩選事件信息的第三特性值; 從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第二非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二非空類(lèi)型篩選數(shù)據(jù),所述其他采集周期 內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù),所述其他采集周期內(nèi)的第 一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所述 篩選事件信息的第四特性值。8. 如權(quán)利要求5-7任一項(xiàng)所述的方法,其特征在于,根據(jù)獲取的所述每一個(gè)篩選事件 信息的第一增量值和第二增量值,確定所述第一事件類(lèi)型的相關(guān)性指標(biāo),具體包括: 根據(jù)事件類(lèi)型為所述第一事件類(lèi)型的所有篩選事件信息的第一增量值,確定所述第一 事件類(lèi)型的第一相關(guān)性指標(biāo);其中,第一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā) 生對(duì)應(yīng)于所述第一事件類(lèi)型的事件相關(guān);或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大于預(yù)設(shè) 閾值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)閾值的第二增量值,確定所述第一事件類(lèi)型的 第二相關(guān)性指標(biāo);其中,所述第二相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的 事件時(shí),數(shù)據(jù)取值增大的概率;或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于預(yù)設(shè) 閾值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)閾值的第二增量值,確定所述第一事件類(lèi)型的 第三相關(guān)性指標(biāo);其中,所述第三相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的 事件時(shí),數(shù)據(jù)取值減小的概率;或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取大于所述 預(yù)設(shè)閾值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)閾值的第二增量值,以及事件類(lèi)型為所述 第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第四相關(guān)性指 標(biāo);其中,所述第四相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平 均值的增大量;或者, 從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于所述 預(yù)設(shè)閾值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)閾值的第二增量值,以及事件類(lèi)型為所述 第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的第五相關(guān)性指 標(biāo);其中,所述第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平 均值的減小量。9. 如權(quán)利要求8所述的方法,其特征在于,根據(jù)所述相關(guān)性指標(biāo)獲取所述數(shù)據(jù)序列和 所述第一事件類(lèi)型之間的相關(guān)性結(jié)果,具體包括: 若所述第一事件類(lèi)型的第四相關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平均值閾值,且所述第一 事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的差值大于差值閾值, 則確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事 件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量為所述第四相關(guān)性指 標(biāo); 否則,若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值閾值,且所述 第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的差值大于所述 差值閾值,則確定所述相關(guān)性結(jié)果為,第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第 一事件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小量為所述第一事件 類(lèi)型的第五相關(guān)性指標(biāo);若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值 閾值,或者所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的 差值小于所述差值閾值,則當(dāng)所述第一事件類(lèi)型的第一相關(guān)性指標(biāo)大于預(yù)設(shè)概率閾值時(shí), 確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件 類(lèi)型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi)型數(shù)據(jù)的出現(xiàn)概率增大。10. -種海量數(shù)據(jù)的信息處理裝置,其特征在于,包括: 數(shù)據(jù)序列和事件信息集合獲取單元,從至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集 合;其中,第一數(shù)據(jù)源的所述數(shù)據(jù)序列中包含所述第一數(shù)據(jù)源在η個(gè)采集周期內(nèi)所采集的 數(shù)據(jù),第一數(shù)據(jù)源為所述至少一個(gè)數(shù)據(jù)源中的任一數(shù)據(jù)源,所述第一數(shù)據(jù)源的所述事件信 息集合中包含所述第一數(shù)據(jù)源在所述η個(gè)采集周期內(nèi)發(fā)生的事件的事件信息,所述事件信 息包括所述事件的事件類(lèi)型,以及所述事件發(fā)生的起始時(shí)間和結(jié)束時(shí)間;η為大于等于2的 整數(shù); 相關(guān)性結(jié)果獲取單元,用于通過(guò)海量數(shù)據(jù)信息處理模型將所述數(shù)據(jù)序列和事件信息集 合獲取單元獲取的所述數(shù)據(jù)序列和所述事件信息集合進(jìn)行處理,得到所述數(shù)據(jù)序列和所述 事件信息集合中任一事件信息之間的相關(guān)性結(jié)果;其中,所述海量數(shù)據(jù)信息處理模型用于 根據(jù)所述至少一個(gè)數(shù)據(jù)源獲取數(shù)據(jù)序列和事件信息集合,確定所述數(shù)據(jù)序列和所述事件信 息集合中任一事件信息之間的相關(guān)性結(jié)果。11. 如權(quán)利要求10所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體用于: 對(duì)于所述至少一個(gè)數(shù)據(jù)源中的每一個(gè)數(shù)據(jù)源,均執(zhí)行如下操作:在第一數(shù)據(jù)源的事件 信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的事件信息進(jìn)行篩選,獲取篩選事 件信息,所述篩選事件信息為所述事件信息集合中滿足第一預(yù)設(shè)篩選條件的事件信息,將 所述篩選事件信息存儲(chǔ)至篩選事件信息集合中;其中,所述第一采集周期為所述η個(gè)采集 周期中的任一采集周期;從所述第一數(shù)據(jù)源對(duì)應(yīng)的η個(gè)采集周期內(nèi)的數(shù)據(jù)序列中,選取篩 選數(shù)據(jù),其中,所述篩選數(shù)據(jù)為所述數(shù)據(jù)序列中滿足第二預(yù)設(shè)篩選條件的數(shù)據(jù);根據(jù)所述篩 選事件信息集合中包含的所述至少一個(gè)數(shù)據(jù)源的篩選事件信息的事件類(lèi)型,對(duì)所述篩選事 件信息集合中包含的篩選事件信息進(jìn)行分類(lèi),獲取每一種事件類(lèi)型對(duì)應(yīng)的篩選事件信息; 從所述每一個(gè)數(shù)據(jù)源的篩選數(shù)據(jù)中,選取第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間和 結(jié)束時(shí)間之間的篩選數(shù)據(jù);其中,所述第一事件類(lèi)型為所述篩選事件信息集合中包含的事 件類(lèi)型中的任一事件類(lèi)型;根據(jù)獲取的所述第一事件類(lèi)型對(duì)應(yīng)的篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間的篩選數(shù)據(jù),獲取所述第一事件類(lèi)型的相關(guān)性指標(biāo);根據(jù)所述相關(guān)性指標(biāo) 獲取所述數(shù)據(jù)序列和所述第一事件類(lèi)型之間的相關(guān)性結(jié)果。12. 如權(quán)利要求11所述的裝置,其特征在于,所述相關(guān)性獲取單元單元,具體用于: 在所述第一數(shù)據(jù)源的事件信息集合中,對(duì)所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任 一事件信息,執(zhí)行如下操作:根據(jù)所述第一事件信息的第一事件發(fā)生的起始時(shí)間和結(jié)束時(shí) 間,確定所述第一事件所對(duì)應(yīng)的時(shí)間窗;其中,所述第一事件信息為所述第一數(shù)據(jù)源的事件 信息集合中,所述第一數(shù)據(jù)源對(duì)應(yīng)的第一采集周期內(nèi)的任一事件信息;當(dāng)判定在所述第一 事件所對(duì)應(yīng)的時(shí)間窗內(nèi),沒(méi)有除所述第一事件之外的其他事件發(fā)生時(shí),確定所述第一事件 信息為所述篩選事件信息并獲取所述篩選事件信息。13. 如權(quán)利要求11或12所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體用 于: 從所述第一數(shù)據(jù)源對(duì)應(yīng)的所述第一采集周期內(nèi)的數(shù)據(jù)序列中,選取所述第一數(shù)據(jù)源的 每一個(gè)篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的數(shù)據(jù),將選取的所述數(shù)據(jù)作為第一數(shù)據(jù) 源對(duì)應(yīng)的第一采集周期的篩選數(shù)據(jù);以及從除所述第一采集周期之外的其他采集周期中, 選取在所述每一個(gè)篩選事件信息的所述起始時(shí)間和所述結(jié)束時(shí)間之間的數(shù)據(jù),并根據(jù)獲取 的數(shù)據(jù)確定所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù);將所述第一數(shù)據(jù)源對(duì)應(yīng) 的第一采集周期的篩選數(shù)據(jù),以及所述第一數(shù)據(jù)源對(duì)應(yīng)的所述其他采集周期的篩選數(shù)據(jù), 確定為所述第一數(shù)據(jù)源的篩選數(shù)據(jù)。14. 如權(quán)利要求11-13任一所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體 用于: 對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù)所述第一采集周期內(nèi), 所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第一空類(lèi)型篩選 數(shù)據(jù)和第一非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第一特性值和第二特性值; 其中,所述第一特性值用于表征所述第一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第一空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第二特性值用于表征所述第 一采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一非空類(lèi)型篩 選數(shù)據(jù)的平均值;所述第一篩選事件信息為事件類(lèi)型為所述第一事件類(lèi)型的任一篩選事件 信息;對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,根據(jù)所述其他采集周期內(nèi), 所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中包含的第二空類(lèi)型篩選 數(shù)據(jù)和第二非空類(lèi)型篩選數(shù)據(jù),獲取所述第一篩選事件信息的第三特性值和第四特性值; 其中,所述第三特性值用于表征所述η個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間 和結(jié)束時(shí)間之間,所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率,所述第四特性值用于表征所述η 個(gè)采集周期內(nèi)的所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第二非空類(lèi)型的 所述篩選數(shù)據(jù)的平均值;對(duì)于事件類(lèi)型為所述第一事件類(lèi)型的第一篩選事件信息,獲取所 述第一篩選事件信息的第一特性值和第三特性值的差值,將所述差值確定為所述第一篩選 事件信息的第一增量值;以及獲取所述第一篩選事件信息的第二特性值和第四特性值的差 值,將所述差值確定為所述第一篩選事件信息的第二增量值;其中,所述第一增量值用于表 征在所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,所述第一 空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間 所述第二空類(lèi)型篩選數(shù)據(jù)的出現(xiàn)概率的增量,所述第二增量值用于表征在所述第一采集周 期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間,第一非空類(lèi)型篩選數(shù)據(jù)的平均 值相對(duì)于所述η個(gè)采集周期內(nèi)的所述起始時(shí)間和結(jié)束時(shí)間之間第二非空類(lèi)型篩選數(shù)據(jù)的 平均值的增量;分別獲取事件類(lèi)型為所述第一事件類(lèi)型的每一個(gè)篩選事件信息的第一增量 值和第二增量值;根據(jù)獲取的所述每一個(gè)篩選事件信息的第一增量值和第二增量值,確定 所述第一事件類(lèi)型的相關(guān)性指標(biāo)。15. 如權(quán)利要求14所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體用于: 從所述第一采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第一空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息 所對(duì)應(yīng)的時(shí)間窗,采用指示函數(shù),獲取所述第一篩選事件信息的第一特性值;從所述第一采 集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第一非 空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第一非空類(lèi)型篩選數(shù)據(jù),所述第一篩選事件信息所對(duì)應(yīng)的時(shí) 間窗,采用指示函數(shù),獲取所述篩選事件信息的第二特性值。16. 如權(quán)利要求14所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體用于: 從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù)中,選取第二空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二空類(lèi)型篩選數(shù)據(jù),所述其他采集周期內(nèi)的 第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù)目,采用指示函數(shù),獲取所 述篩選事件信息的第三特性值;從所述其他采集周期內(nèi),所述第一篩選事件信息的起始時(shí) 間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)中,選取第二非空類(lèi)型篩選數(shù)據(jù);并根據(jù)所述第二非空類(lèi)型 篩選數(shù)據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù) 據(jù),所述其他采集周期內(nèi)的第一篩選事件信息的起始時(shí)間和結(jié)束時(shí)間之間的篩選數(shù)據(jù)的數(shù) 目,采用指示函數(shù),獲取所述篩選事件信息的第四特性值。17. 如權(quán)利要求14-16任一項(xiàng)所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具 體用于: 根據(jù)事件類(lèi)型為所述第一事件類(lèi)型的所有篩選事件信息的第一增量值,確定所述第一 事件類(lèi)型的第一相關(guān)性指標(biāo);其中,第一相關(guān)性指標(biāo)用于表征空類(lèi)型數(shù)據(jù)的出現(xiàn)概率與發(fā) 生對(duì)應(yīng)于所述第一事件類(lèi)型的事件相關(guān);或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩 選事件信息的第二增量值中,選取大于預(yù)設(shè)閾值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)閾 值的第二增量值,確定所述第一事件類(lèi)型的第二相關(guān)性指標(biāo);其中,所述第二相關(guān)性指標(biāo)用 于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值增大的概率;或者,從事件類(lèi)型 為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中,選取小于預(yù)設(shè)閾值的第二增量 值,并根據(jù)選取的小于預(yù)設(shè)閾值的第二增量值,確定所述第一事件類(lèi)型的第三相關(guān)性指標(biāo); 其中,所述第三相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)取值 減小的概率;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值中, 選取大于所述預(yù)設(shè)閾值的第二增量值,并根據(jù)選取的大于預(yù)設(shè)閾值的第二增量值,以及事 件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所述第一事件類(lèi)型的 第四相關(guān)性指標(biāo);其中,所述第四相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所述第一事件類(lèi)型的 事件時(shí),數(shù)據(jù)平均值的增大量;或者,從事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息 的第二增量值中,選取小于所述預(yù)設(shè)閾值的第二增量值,并根據(jù)選取的小于預(yù)設(shè)閾值的第 二增量值,以及事件類(lèi)型為所述第一事件類(lèi)型的所述篩選事件信息的第二增量值,確定所 述第一事件類(lèi)型的第五相關(guān)性指標(biāo);其中,所述第五相關(guān)性指標(biāo)用于表征當(dāng)發(fā)生對(duì)應(yīng)于所 述第一事件類(lèi)型的事件時(shí),數(shù)據(jù)平均值的減小量。18.如權(quán)利要求17所述的裝置,其特征在于,所述相關(guān)性結(jié)果獲取單元,具體用于: 若所述第一事件類(lèi)型的第四相關(guān)性指標(biāo)大于第一預(yù)設(shè)增大平均值閾值,且所述第一事 件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的差值大于差值閾值,則 確定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件 類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值增大,增大量為所述第四相關(guān)性指標(biāo); 否則,若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)小于第二預(yù)設(shè)增大平均值閾值,且所述第一 事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的差值大于所述差值 閾值,則確定所述相關(guān)性結(jié)果為,第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事 件類(lèi)型的事件發(fā)生,將引起所述數(shù)據(jù)序列中的數(shù)據(jù)取值減小,減小量為所述第一事件類(lèi)型 的第五相關(guān)性指標(biāo);若所述第一事件類(lèi)型的第五相關(guān)性指標(biāo)大于第二預(yù)設(shè)增大平均值閾 值,或者所述第一事件類(lèi)型的第二相關(guān)性指標(biāo)與所述第一事件類(lèi)型的第三相關(guān)性指標(biāo)的差 值小于所述差值閾值,則當(dāng)所述第一事件類(lèi)型的第一相關(guān)性指標(biāo)大于預(yù)設(shè)概率閾值時(shí),確 定所述相關(guān)性結(jié)果為,所述第一事件類(lèi)型和所述數(shù)據(jù)序列相關(guān),且對(duì)應(yīng)于所述第一事件類(lèi) 型的事件發(fā)生將引起數(shù)據(jù)序列中空類(lèi)型數(shù)據(jù)的出現(xiàn)概率增大。
【文檔編號(hào)】G06F17/30GK105989032SQ201510054747
【公開(kāi)日】2016年10月5日
【申請(qǐng)日】2015年1月31日
【發(fā)明人】王平輝, 潘璐伽, 范偉
【申請(qǐng)人】華為技術(shù)有限公司