行響應(yīng),包 括:(i)來(lái)自與吉娜和查理的會(huì)議筆記;(ii)弗朗西斯關(guān)于這個(gè)主題的公開(kāi)信息;(iii)吉 娜關(guān)于這個(gè)主題上的公開(kāi)信息(弗朗西斯的網(wǎng)絡(luò)聯(lián)系人中的一個(gè));以及(iv)XYZ大學(xué)的 教授史密斯關(guān)于這個(gè)問(wèn)題的公開(kāi)信息(弗朗西斯的網(wǎng)絡(luò)聯(lián)系人中的另一個(gè)且可能是埃布 爾的聯(lián)系人)。在手頭上具有此信息,弗朗西斯能夠容易地利用如聊天窗口 915中所示的相 關(guān)信息來(lái)回答埃布爾。
[0080] 本發(fā)明的某些實(shí)施例提供了多維社交基因圖譜建模。在社交基因圖譜進(jìn)行建模時(shí) 的挑戰(zhàn)包括:(i)數(shù)據(jù)量;(ii)高維度(非結(jié)構(gòu)化)數(shù)據(jù)分析;以及(iii)處理遞增更新。 圖IOA至IOF是支持將詞頻一逆向文件頻率(tf-idf)應(yīng)用于對(duì)詞語(yǔ)、人以及活動(dòng)重要性進(jìn) 行建模的有用參考。
[0081] 圖IOA是圖示出根據(jù)本發(fā)明的實(shí)施例的與多維社交基因圖譜建模相關(guān)聯(lián)的算法 的社交基因圖譜圖表。社交基因圖譜圖表1OOOa示出了關(guān)系模型的五個(gè)軸:時(shí)間(T) 1005 ; 詞語(yǔ)(W)IOlO ;人(P) 1015 ;設(shè)備(D) 1020 ;以及渠道(D) 1025。下面是對(duì)應(yīng)于用于用戶(hù)組u 和感興趣聯(lián)系A(chǔ)p1的活動(dòng)實(shí)例^的等式,其中,活動(dòng)實(shí)例是活動(dòng)組A的元素:
[0082] Bj (u, P1) e A
[0083] Bj= WXPXCXDXT
[0084] 圖IOB是圖示出根據(jù)本發(fā)明的實(shí)施例的與多維社交基因圖譜建模相關(guān)聯(lián)的算法 的社交基因圖譜圖。社交基因圖譜圖1050a圖示出作為用戶(hù)u 1030和感興趣聯(lián)系人?1 1035的函數(shù)被映射到關(guān)系組中的活動(dòng)組A。在活動(dòng)組A內(nèi)的關(guān)系組內(nèi)的其他聯(lián)系人是查理 1040和丹尼爾1045。
[0085] 圖IOC是圖示出根據(jù)本發(fā)明的實(shí)施例的用于與針對(duì)給定時(shí)間tk的多維社交基因 圖譜建模相關(guān)聯(lián)的算法的圖表。社交基因圖譜圖表1OOOb示出了在給定時(shí)間t k的對(duì)應(yīng)于 活動(dòng)實(shí)例\_的數(shù)據(jù)。該數(shù)據(jù)包括在給定時(shí)間tk與活動(dòng)\有關(guān)的詞語(yǔ)^和人P 1。該數(shù)據(jù)描 述按針對(duì)給定時(shí)間作為用戶(hù)u 1030和感興趣聯(lián)系人P1 1035的函數(shù)被映射到關(guān)系中的相 應(yīng)相對(duì)強(qiáng)度或分?jǐn)?shù)而排序的"什么"和"誰(shuí)"(參見(jiàn)圖10B)。在給定時(shí)間tk對(duì)應(yīng)于活動(dòng)實(shí)例 的等式如下:
[0086] aj (u, P1, tk) e A, aj = < W (a j), P (aj) >
[0087] 圖IOD是圖示出根據(jù)本發(fā)明的實(shí)施例的在給定時(shí)間的用于詞語(yǔ)DARPA的與多維社 交基因圖譜建模相關(guān)聯(lián)的算法的社交基因圖譜圖表。社交基因圖譜圖表1OOOc示出了出現(xiàn) 詞語(yǔ)DARPA的給定時(shí)間t k對(duì)應(yīng)于活動(dòng)實(shí)例^的數(shù)據(jù)。數(shù)據(jù)輸出包括出現(xiàn)詞語(yǔ)DARPA的給 定時(shí)間tk與活動(dòng)a j有關(guān)的人p j。該數(shù)據(jù)描述對(duì)于給定聯(lián)系人Pj針對(duì)給定時(shí)間t k的詞語(yǔ) DARPA出現(xiàn)的頻率。上文相對(duì)于圖IOB敘述了適用的等式,其中,詞語(yǔ)W是DARPA。
[0088] 圖IOE是圖示出根據(jù)本發(fā)明的實(shí)施例的用于聯(lián)系人"丹尼爾"的與多維社交基因 圖譜建模相關(guān)聯(lián)的算法的社交基因圖譜圖表。社交基因圖譜圖表1OOOd示出了在其中出現(xiàn) 聯(lián)系人姓名"丹尼爾"發(fā)的給定時(shí)間t k對(duì)應(yīng)于活動(dòng)實(shí)例的數(shù)據(jù)。該數(shù)據(jù)描述對(duì)于特定詞語(yǔ) 在指定時(shí)間tk的聯(lián)系人丹尼爾出現(xiàn)的頻率。上文相對(duì)于圖IOB敘述了適用等式,其中聯(lián)系 人P是丹尼爾。
[0089] 圖IOF是圖示出根據(jù)本發(fā)明的實(shí)施例的用于聯(lián)系人"丹尼爾"的與多維社交基因 圖譜建模相關(guān)聯(lián)的算法的社交基因圖譜圖。社交基因圖譜圖1050b圖示出作為用戶(hù)u 1030 和感興趣聯(lián)系人函數(shù)被映射到關(guān)系組R中的活動(dòng)組A,其中提到了聯(lián)系人"丹尼爾"。 在活動(dòng)組A內(nèi)的關(guān)系組內(nèi)的其他聯(lián)系人是貝克1035和丹尼爾1045。
[0090] Tf-idf·是反映一個(gè)詞語(yǔ)對(duì)于作為較大集合或文集的一部分的文件而言有多重要 的數(shù)值統(tǒng)計(jì)。其常常被用作信息檢索和文本挖掘中的加權(quán)因數(shù)。Tf-idf值與詞語(yǔ)在文件中 出現(xiàn)的次數(shù)成比例地增加,但是被文集中的詞語(yǔ)頻率所抵消,這幫助控制某些詞語(yǔ)與其他 的相比通常更加常見(jiàn)的事實(shí)。
[0091] 本發(fā)明的某些實(shí)施例對(duì)與兩個(gè)人之間的關(guān)系相關(guān)聯(lián)的活動(dòng)和人施加逆向文件頻 率(idf)的原理,其中,該活動(dòng)是詞語(yǔ)、人、設(shè)備、渠道以及時(shí)間的函數(shù)。逆向活動(dòng)頻率(iaf) 反映詞語(yǔ)對(duì)于與兩個(gè)人之間的關(guān)系相關(guān)聯(lián)的一組活動(dòng)中的活動(dòng)而言有多重要。逆向人頻率 (ipf)反映某些人在與兩個(gè)人之間的關(guān)系相關(guān)聯(lián)的一組人中有多重要。iaf是例如通過(guò)將 與兩個(gè)人之間的關(guān)系相關(guān)聯(lián)的活動(dòng)的總數(shù)除以包含指定詞語(yǔ)的活動(dòng)的數(shù)目且然后取該商 的對(duì)數(shù)而獲得的。用于iaf和ipf的等式如下:
[0092] 參考TF-IDF模型對(duì)詞語(yǔ)重要性進(jìn)行建模:
[0093]
【主權(quán)項(xiàng)】
1. 一種方法,包括: 收集與包括第一人和第二人的一對(duì)人有關(guān)的基礎(chǔ)數(shù)據(jù); 創(chuàng)建包括誰(shuí)屬性部分和什么屬性部分的成對(duì)關(guān)系數(shù)據(jù)集; 通過(guò)存儲(chǔ)以下各項(xiàng)來(lái)對(duì)所述成對(duì)關(guān)系數(shù)據(jù)集的所述誰(shuí)屬性部分進(jìn)行定義:(i)與所述 第一人的身份有關(guān)的第一人數(shù)據(jù),以及(ii)與所述第二人的身份有關(guān)的第二人數(shù)據(jù);以及 通過(guò)存儲(chǔ)話題數(shù)據(jù)來(lái)對(duì)所述成對(duì)關(guān)系數(shù)據(jù)集的所述什么屬性部分進(jìn)行定義,所述話題 數(shù)據(jù):(i)基于收集的所述基礎(chǔ)數(shù)據(jù),以及(ii)與關(guān)于所述第一人和所述第二人之間的關(guān) 系的話題有關(guān)。
2. 根據(jù)權(quán)利要求1所述的方法,還包括: 在所述第一人和所述第二人之間的聊天會(huì)話期間實(shí)時(shí)地向所述第一人和所述第二人 中的至少一人顯示所述話題數(shù)據(jù)的一部分。
3. 根據(jù)權(quán)利要求1所述的方法,其中,所述基礎(chǔ)數(shù)據(jù)包括所述第一人和所述第二人的 交流數(shù)據(jù)。
4. 根據(jù)權(quán)利要求3所述的方法,其中,所述交流數(shù)據(jù)包括在聊天會(huì)話期間的所述第一 人和所述第二人之間的通信。
5. 根據(jù)權(quán)利要求1所述的方法,還包括: 至少部分地基于在所述第一人和所述第二人之間的聊天會(huì)話期間收集的基礎(chǔ)數(shù)據(jù),來(lái) 實(shí)時(shí)地更新所述成對(duì)關(guān)系數(shù)據(jù)集。
6. 根據(jù)權(quán)利要求1所述的方法,其中: 所述什么屬性部分包括具有與所述第一人和所述第二人之間的所述關(guān)系有關(guān)的、除固 有名稱(chēng)之外的詞語(yǔ)的詞語(yǔ)維度;以及 所述什么屬性部分包括具有與所述第一人和所述第二人之間的所述關(guān)系有關(guān)的人的 身份的人維度。
7. 根據(jù)權(quán)利要求1所述的方法,其中,通過(guò)存儲(chǔ)所述什么屬性進(jìn)行定義包括: 對(duì)所述基礎(chǔ)數(shù)據(jù)的至少一部分執(zhí)行文本分析,以便確定所述話題數(shù)據(jù)。
8. 根據(jù)權(quán)利要求1所述的方法,其中,通過(guò)存儲(chǔ)所述什么屬性進(jìn)行定義包括: 對(duì)所述基礎(chǔ)數(shù)據(jù)的至少一部分執(zhí)行逆向頻率處理,以便確定所述話題數(shù)據(jù)。
9. 一種系統(tǒng),包括: 存儲(chǔ)器,具有計(jì)算機(jī)可讀計(jì)算機(jī)指令;以及 處理器,用于執(zhí)行所述計(jì)算機(jī)可讀指令,所述指令包括: 收集與包括第一人和第二人的一對(duì)人有關(guān)的基礎(chǔ)數(shù)據(jù); 創(chuàng)建包括誰(shuí)屬性部分和什么屬性部分的成對(duì)關(guān)系數(shù)據(jù)集; 通過(guò)存儲(chǔ)以下各項(xiàng)來(lái)對(duì)所述成對(duì)關(guān)系數(shù)據(jù)集的所述誰(shuí)屬性部分進(jìn)行定義:(i)與所述 第一人的身份有關(guān)的第一人數(shù)據(jù),以及(ii)與所述第二人的身份有關(guān)的第二人數(shù)據(jù);以及 通過(guò)存儲(chǔ)話題數(shù)據(jù)來(lái)對(duì)所述成對(duì)關(guān)系數(shù)據(jù)集的所述什么屬性部分進(jìn)行定義,所述話題 數(shù)據(jù):(i)基于收集的所述基礎(chǔ)數(shù)據(jù),以及(ii)與關(guān)于所述第一人和所述第二人之間的關(guān) 系的話題有關(guān)。
10. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中: 所述什么屬性部分包括具有與所述第一人和所述第二人之間的所述關(guān)系有關(guān)的、除固 有名稱(chēng)之外的詞語(yǔ)的詞語(yǔ)維度;以及 所述什么屬性部分包括具有與所述第一人和所述第二人之間的所述關(guān)系有關(guān)的人的 身份的人維度。
11. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,通過(guò)存儲(chǔ)所述什么屬性部分進(jìn)行定義包括: 對(duì)所述基礎(chǔ)數(shù)據(jù)的至少一部分執(zhí)行文本分析,以便確定所述話題數(shù)據(jù)。
12. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,通過(guò)存儲(chǔ)所述什么屬性部分進(jìn)行定義包括: 對(duì)所述基礎(chǔ)數(shù)據(jù)的至少一部分執(zhí)行逆向頻率處理,以便確定所述話題數(shù)據(jù)。
13. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述基礎(chǔ)數(shù)據(jù)包括所述第一人和所述第二人的 交流數(shù)據(jù)。
14. 根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述指令還包括: 在所述第一人和所述第二人之間的聊天會(huì)話期間實(shí)時(shí)地向所述第一人和所述第二人 中的至少一人顯示所述話題數(shù)據(jù)的一部分。
【專(zhuān)利摘要】公開(kāi)涉及用于使用電子通信數(shù)據(jù)來(lái)映射關(guān)系的方法和系統(tǒng)。成對(duì)關(guān)系數(shù)據(jù)集具有多個(gè)屬性(諸如誰(shuí)、什么、何時(shí)、何處、如何)且具有什么屬性(也稱(chēng)為話題屬性),該什么屬性具有詞語(yǔ)維度和人維度。所述什么屬性中的所述話題維度中的數(shù)據(jù)涉及關(guān)于成對(duì)對(duì)的所述第一人和所述第二人之間的特定的人類(lèi)個(gè)人關(guān)系的話題(包括其他人)。所述什么屬性數(shù)據(jù)是通過(guò)處理基礎(chǔ)數(shù)據(jù)而導(dǎo)出的,該基礎(chǔ)數(shù)據(jù)包括交流數(shù)據(jù)(即,所述第一人和所述第二人參與的交流的主旨,包括即時(shí)通訊和電子郵件交換)。在聊天會(huì)話期間實(shí)時(shí)地向用戶(hù)顯示成對(duì)關(guān)系數(shù)據(jù)。
【IPC分類(lèi)】H04L29-06, G06F17-30, H04L12-58
【公開(kāi)號(hào)】CN104731842
【申請(qǐng)?zhí)枴緾N201410677474
【發(fā)明人】B·A·史密斯, 王飛, 張維, 周雪
【申請(qǐng)人】國(guó)際商業(yè)機(jī)器公司
【公開(kāi)日】2015年6月24日
【申請(qǐng)日】2014年11月21日
【公告號(hào)】US20150178373