用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法
【專利說明】用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者的系統(tǒng)和方法 相關(guān)申請的交叉引用
[0001] 本申請案請求2013年10月25日提交的標(biāo)題為用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者 的系統(tǒng)和方法"的美國臨時(shí)專利申請案第61/895,539號、2013年11月22日提交的題為"用于 識別社交數(shù)據(jù)網(wǎng)絡(luò)中的影響者及其社群的系統(tǒng)和方法"的美國臨時(shí)專利申請案第61/907, 878號W及2014年7月3日提交的題為使用加權(quán)分析來動態(tài)確定社交數(shù)據(jù)網(wǎng)絡(luò)中的影響 者的系統(tǒng)和方法"的美國臨時(shí)專利申請案第62/020,833號的優(yōu)先權(quán),所述申請案的全部內(nèi) 容W引用的方式并入本文中。
技術(shù)領(lǐng)域
[0002] W下總體上設(shè)及分析社交網(wǎng)絡(luò)數(shù)據(jù)。
【背景技術(shù)】
[0001] 近年來,社交媒體已經(jīng)成為個(gè)人和消費(fèi)者在線(例如,在互聯(lián)網(wǎng)上)交互的大眾化 方式。社交媒體還影響企業(yè)目的在于和其客戶、粉絲、和潛在客戶在線交互的方式。
[0002] 在特定主題上具有廣大關(guān)注的一些部落客被識別并用于支持或贊助特定的產(chǎn)品。 例如,大眾化部落客的網(wǎng)站上的廣告空間用于為相關(guān)產(chǎn)品及服務(wù)打廣告。
[0003] 社交網(wǎng)絡(luò)平臺也用于影響成群的人。社交網(wǎng)絡(luò)平臺的實(shí)例包括那些通過商標(biāo)名稱 所熟知的臉譜網(wǎng)、推特、領(lǐng)英化inkedin)、湯博樂及拼趣。社交網(wǎng)絡(luò)平臺中的大眾化或?qū)<?個(gè)人可用于向其他人營銷。當(dāng)社交網(wǎng)絡(luò)中的用戶數(shù)量增長時(shí),快速識別大眾化或有影響力 的個(gè)人變得越來越難。此外,難W準(zhǔn)確識別特定主題中有影響力的個(gè)人。在社交網(wǎng)絡(luò)中的專 家或那些大眾化用戶在本文中可交換地稱為"影響者"。 附圖簡要說明
[0004] 現(xiàn)在參考附圖僅通過舉例方式來描述實(shí)施例,在附圖中:
[0005] 圖1是展示在社交數(shù)據(jù)網(wǎng)絡(luò)中相互聯(lián)系的用戶的圖式。
[0006] 圖2是與計(jì)算裝置通信的服務(wù)器的示意圖。
[0007] 圖3是用于確定與主題有關(guān)的影響者的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例的流程圖。
[0008] 圖4是用于確定與主題有關(guān)的影響者的計(jì)算機(jī)可執(zhí)行指令的另一實(shí)施例的流程 圖。
[0009] 圖5是用于獲取和儲存社交網(wǎng)絡(luò)數(shù)據(jù)的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例的流程圖。
[0010] 圖6是索引存儲中的示例數(shù)據(jù)組件的框圖。
[0011] 圖7是簡檔存儲的示例數(shù)據(jù)組件的框圖。
[0012] 圖8是示例用戶列表及用戶列入不同用戶列表中的次數(shù)的統(tǒng)計(jì)的示意圖。
[0013] 圖9是用于確定其中給定用戶被視作專家的主題的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例的 流程圖。
[0014] 圖10是用于確定給定用戶感興趣的主題的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例的流程圖。
[0015] 圖11是用于捜索索引存儲中被視作主題的專家的用戶的計(jì)算機(jī)可執(zhí)行指令的實(shí) 施例的流程圖。
[0016] 圖12是用于識別對主題感興趣的用戶的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例的流程圖。
[0017] 圖13是用于主題"Mc化fe"(麥咖啡)的示例主題網(wǎng)絡(luò)圖的圖解。
[0018] 圖14是圖13中的主題網(wǎng)絡(luò)圖的圖解,展示主集群和異常值集群的分解。
[0019] 圖15是用于基于社群分解在主題網(wǎng)絡(luò)中識別和過濾異常值的計(jì)算機(jī)可執(zhí)行指令 的實(shí)施例的流程圖。
[0020] 圖16是用于自每一主題網(wǎng)絡(luò)識別和提供社群集群的計(jì)算機(jī)可執(zhí)行指令的實(shí)施例 的流程圖。
[0021] 圖17A至圖17D展示用于與主題網(wǎng)絡(luò)中顯示影響者社群的GUI互動的示例性截屏。
[0022] 圖18圖示示例性社群網(wǎng)絡(luò)圖。
[0023] 圖19A至圖19C展示特定主題的示例性社群及特征。
[0024] 圖20A至圖20B展示第二選擇主題的示例性社群及特征。 附圖詳細(xì)說明
[0025] 應(yīng)當(dāng)認(rèn)識的是,為了說明的簡化和清晰,在認(rèn)為適當(dāng)時(shí),參考數(shù)字可在圖中被重復(fù) W指示相應(yīng)或相似的元件。此外,陳述了許多特定細(xì)節(jié),W提供對本文中所描述的實(shí)施例的 透徹理解。然而,本領(lǐng)域的普通技術(shù)人員將理解的是,沒有運(yùn)些特定細(xì)節(jié)也可W實(shí)踐本文中 所描述的實(shí)施例。在其他情形下,沒有詳細(xì)描述公知方法、程序和部件,W不使本文中所描 述的實(shí)施例難理解。并且,本說明不被認(rèn)為是限制本文中所描述的實(shí)施例的范圍。
[0026] 社交網(wǎng)絡(luò)平臺包括(例如通過藉由與社交網(wǎng)絡(luò)平臺有關(guān)的網(wǎng)站通信的計(jì)算裝置的 網(wǎng)絡(luò))產(chǎn)生并發(fā)布內(nèi)容給其他人看、聽等的用戶。社交網(wǎng)絡(luò)平臺的非限制性實(shí)例為 Facebook、Twitte;r、LinkedIn、Pinterest、Tumbl;r、博客圈、網(wǎng)站、協(xié)作維基百科、在線新聞 組、在線論壇、電子郵件W及即時(shí)消息業(yè)務(wù)。目前已知及未來可知的社交網(wǎng)絡(luò)平臺適用于本 文中所描述的原理。社交網(wǎng)絡(luò)平臺可用于向平臺的用戶推廣及發(fā)布廣告。應(yīng)認(rèn)識到難W識 別給定主題的相關(guān)用戶。運(yùn)包括識別給定主題上有影響力的用戶。
[0027] 如本文所用,術(shù)語"影響者"是指首先產(chǎn)生并分享與主題有關(guān)的內(nèi)容并被視為對社 交數(shù)據(jù)網(wǎng)絡(luò)中的其他用戶有影響力的用戶賬戶。如本文所用,術(shù)語"關(guān)注者",是指關(guān)注第二 用戶賬戶(例如與第一用戶賬戶的至少一個(gè)社交網(wǎng)絡(luò)平臺有關(guān)并通過計(jì)算裝置存取的第二 用戶賬戶),W使得公開第二用戶賬戶發(fā)布的內(nèi)容供第一用戶賬戶閱讀、消耗等的第一用戶 賬戶(例如與一個(gè)或多個(gè)社交網(wǎng)絡(luò)平臺有關(guān)并通過計(jì)算裝置存取的第一用戶賬戶)。例如, 當(dāng)?shù)谝挥脩絷P(guān)注第二用戶,第一用戶(即關(guān)注者)將接收第二用戶發(fā)布的內(nèi)容。本文中對特 定主題"感興趣"的用戶是指關(guān)注特定主題中的(例如與社交網(wǎng)絡(luò)平臺有關(guān)的)若干專家的 用戶賬戶。在某些情況下,關(guān)注者(例如通過分析或轉(zhuǎn)發(fā)內(nèi)容)參與其他用戶發(fā)布的內(nèi)容。
[0028] 公司需要識別關(guān)鍵影響者W(例如)將可潛在傳播及支持品牌消息的個(gè)人作為目 標(biāo)。使所述個(gè)人參與可允許控制品牌的在線消息及可降低可能發(fā)生的潛在負(fù)面情緒。仔細(xì) 管理該過程可(例如)在病毒式營銷活動的情況下引起在線注意力份額的指數(shù)增長。
[0029] 過去用于確定影響者的大多數(shù)方式的關(guān)注點(diǎn)在于易計(jì)算的度量,例如關(guān)注者或朋 友的數(shù)量、或發(fā)帖的數(shù)量。在合計(jì)的關(guān)注者或朋友計(jì)數(shù)可接近于整體社交網(wǎng)絡(luò)時(shí),其通過計(jì) 算度量的方式提供小數(shù)據(jù),所述度量表明相對于公司或品牌的用戶或個(gè)人的影響力。此帶 來增雜影響者結(jié)果W及篩選大量潛在用戶所浪費(fèi)的時(shí)間。
[0030] -些社交媒體分析公司宣稱提供社交網(wǎng)絡(luò)的影響者分?jǐn)?shù)。然而,本文中認(rèn)識到許 多公司使用并非真實(shí)影響者度量的度量,而非關(guān)注者數(shù)量及提及的次數(shù)(例如Twitter的推 文、帖子、消息等)的代數(shù)式。例如,一些已知方式使用所述數(shù)字的對數(shù)歸一,其將約80%的 權(quán)重分配至關(guān)注者計(jì)數(shù)W及提及的次數(shù)的余數(shù)。
[0031] 使用代數(shù)式的原因在于關(guān)注者和提及的計(jì)數(shù)或計(jì)算在社交網(wǎng)絡(luò)的用戶簡檔中是 實(shí)時(shí)更新的。因此,計(jì)算迅速并且易于報(bào)告。運(yùn)通常被稱為權(quán)威度量或權(quán)威分?jǐn)?shù)W將其與真 實(shí)影響者分析區(qū)分開。然而,權(quán)威分?jǐn)?shù)方式具有若干嚴(yán)重的缺點(diǎn)。
[0032] 本文中認(rèn)識到所述權(quán)威分?jǐn)?shù)為上下文非相關(guān)。其為與主題或查詢無關(guān)的靜態(tài)度 量。例如,且不論主題,由于具有數(shù)百萬關(guān)注者,如紐約時(shí)報(bào)(New York Times)或CP^N的大眾 媒體可得到最高的排名。因此,其不是上下文相關(guān)的。
[0033] 本文中還認(rèn)識到所述權(quán)威度量具有高關(guān)注者計(jì)數(shù)偏差。如果某一領(lǐng)域中存在擁有 有限數(shù)量關(guān)注者的明確定義的專業(yè)人員,但他們不都是專家,由于其低關(guān)注者計(jì)數(shù),他們絕 不會出現(xiàn)在前20至100個(gè)結(jié)果中。實(shí)際上,所有的關(guān)注者均被當(dāng)做具有相同的權(quán)重,運(yùn)已被 視為網(wǎng)絡(luò)分析研究中錯(cuò)誤的假定。
[0034] 本文中提出的系統(tǒng)和方法可動態(tài)計(jì)算關(guān)于查詢主題的影響者,并且可對其關(guān)注者 的影響力作出解釋。
[0035] 本文中還認(rèn)識到影響者關(guān)系的遞歸性是大規(guī)模執(zhí)行影響者識別時(shí)的一種挑戰(zhàn)。通 過舉例,假設(shè)存在個(gè)人A、B和C的情況下,其中A關(guān)注B和C;B關(guān)注C和A; W及C僅關(guān)注A。隨后A 的影響力取決于C,C的影響力又取決于A和B,等等。運(yùn)樣,運(yùn)樣,影響者關(guān)系具有遞歸性。
[0036] 更一般而言,提出的系統(tǒng)及方法提供一種確定社交數(shù)據(jù)網(wǎng)絡(luò)中影響者的方式。
[0037] 作為實(shí)例,考慮圖1中的特定主題的簡化的關(guān)注者網(wǎng)絡(luò)。展示與其他用戶有關(guān)的每 一用戶(實(shí)際上為用戶賬戶或與用戶賬戶或用戶數(shù)據(jù)地址有關(guān)的用戶名)。所述用戶之間的 線,也被稱為邊界,代表用戶之間的關(guān)系。例如,從用戶賬戶"Dave"指向用戶賬戶"Carol"的 箭頭表示化ve讀取Carol發(fā)布的消息。換言之,化ve關(guān)注化roLAmy和Brian之間的雙向箭頭 表示,例如,Amy關(guān)注Dave,并且Dave關(guān)注Amy。除去圖1中的每一用戶賬戶,提供頁面排名分 數(shù)。頁面排名算法為谷歌(Google)所用的已知算法用W衡量網(wǎng)絡(luò)中的網(wǎng)站的重要性,并且 還可應(yīng)用于衡量社交數(shù)據(jù)網(wǎng)絡(luò)中的用戶的重要性。
[003引繼續(xù)圖1 ,Amy擁有大量關(guān)注者(即DaveXarol和Eddie),并且為所述網(wǎng)絡(luò)中最具有 影響力的用戶(即頁面排名分?jǐn)?shù)為46.1%)。然而,僅擁有一個(gè)關(guān)注者(即Amy)的化ian比擁 有兩個(gè)關(guān)注者(即Eddie和化ve)的化rol更具影響力,主要是因?yàn)榛痠an具有很大一部分Amy 的注意力份額。換言之,使用本文提出的系統(tǒng)及方法,雖然Carol比Brain具有更多的關(guān)注 者,但是她不一定比Brian更具有影響力。因此,使用本文所提出的系統(tǒng)及方法,用戶的關(guān)注 者數(shù)量并非影響力的唯一決定因素。在實(shí)施例中,識別用戶的關(guān)注者是誰也可作為影響力 計(jì)算的因素。
[0039]表1表示圖1中的示例性網(wǎng)絡(luò),并且其說明頁面排名可如何顯著地與關(guān)注者數(shù)量區(qū)
巧i :圖i所不Wlwitter天巧苦訂甄巧本FJ絕W貝舊排巧分甄。
[0040] Amy擁有最大數(shù)量的關(guān)注者W及最高的頁面排名分?jǐn)?shù),因而明顯為最具影響力者。 雖然Carol擁有兩個(gè)關(guān)注者,但是與擁有1個(gè)關(guān)注者的Brian相比,她具有較低的頁面排名度 量。然而,Brian的一個(gè)關(guān)注者是最具影響力的Amy(擁有四個(gè)關(guān)注者),而化rol的兩個(gè)關(guān)注 者為低影響者(每人擁有0個(gè)關(guān)注者)。其直觀表明,如果某人被少數(shù)專家認(rèn)定為專家,則她/ 他也是專家。然而,與僅計(jì)數(shù)關(guān)注者數(shù)量相比,頁面排名算法可更好的衡量影響力。如下所 述,頁面排名算法及其他類似排名算法可與本文中所提出的系統(tǒng)及方法一起使用。
[0041] 提出的系統(tǒng)及方法可用于確定社交數(shù)據(jù)網(wǎng)絡(luò)中給定主題的關(guān)鍵影響者。
[0042] 在實(shí)施例中,提出的系統(tǒng)及方法可用于確定主題A中的影響者也是一個(gè)或多個(gè)其 他主題(例如主題B、主題C等)中的影響者。
[0043] 轉(zhuǎn)至圖2,展示所提出的系統(tǒng)的示意圖。服務(wù)器100通過網(wǎng)絡(luò)102與計(jì)算裝置101通 信。服務(wù)器100獲取并分析社交網(wǎng)絡(luò)數(shù)據(jù)并且通過網(wǎng)絡(luò)將結(jié)果提供至計(jì)算裝置101。計(jì)算裝 置101可通過GUI接收用戶輸入W控制分析參數(shù)。