將實(shí)體與類(lèi)別相關(guān)聯(lián)的制作方法
【專(zhuān)利摘要】本發(fā)明涉及將實(shí)體與類(lèi)別相關(guān)聯(lián)。除其它所公開(kāi)的主題外,一種用于將實(shí)體與類(lèi)別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括為多個(gè)類(lèi)別中的至少子集中的每一個(gè)確定概率值,所述概率值表示識(shí)別的實(shí)體屬于相應(yīng)類(lèi)別的可能性并且使用關(guān)于實(shí)體的信息來(lái)確定。該方法包括使用概率值和基于訓(xùn)練數(shù)據(jù)的用于多個(gè)類(lèi)別的規(guī)則集來(lái)為實(shí)體識(shí)別多個(gè)類(lèi)別中的一個(gè)。
【專(zhuān)利說(shuō)明】將實(shí)體與類(lèi)別相關(guān)聯(lián)
[0001]分案說(shuō)明
[0002]本申請(qǐng)屬于申請(qǐng)日為2009年9月14日并且申請(qǐng)?zhí)枮镹0.200980145280.2的中國(guó)專(zhuān)利申請(qǐng)的分案申請(qǐng)。
[0003]相關(guān)申請(qǐng)
[0004]本申請(qǐng)要求于2009年2月26日提交的、題為ASSOCIATING AN ENTITY WITH ACATEGORY (將實(shí)體與類(lèi)別相關(guān)聯(lián))的美國(guó)申請(qǐng)序列號(hào)N0.12/393,361,以及于2008年9月15日提交的美國(guó)臨時(shí)專(zhuān)利申請(qǐng)序列號(hào)N0.61/097,026的優(yōu)先權(quán),特此通過(guò)引用合并所述美國(guó)申請(qǐng)的全部?jī)?nèi)容。
【技術(shù)領(lǐng)域】
[0005]本文檔涉及信息處理。
【背景技術(shù)】
[0006]廣告主可以在多個(gè)不同平臺(tái)中的任何平臺(tái)上運(yùn)行廣告活動(dòng),所述多個(gè)不同平臺(tái)包括因特網(wǎng)、電視、無(wú)線(xiàn)電廣播以及廣告牌。在廣告活動(dòng)中所使用的廣告可以覆蓋產(chǎn)品和服務(wù)的范圍,并且可以定向特定受眾或更一般地定向更大人群。例如,運(yùn)行網(wǎng)站的發(fā)布者可以向廣告主提供空間用于呈現(xiàn)廣告。呈現(xiàn)在網(wǎng)站上的廣告有時(shí)基于網(wǎng)站的內(nèi)容來(lái)選擇。
【發(fā)明內(nèi)容】
[0007]本發(fā)明涉及將實(shí)體與類(lèi)別相關(guān)聯(lián)。
[0008]在第一方面中,一種用于將實(shí)體與類(lèi)別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括為多個(gè)類(lèi)別中的至少子集中的每一個(gè)確定概率值,所述概率值表示識(shí)別的實(shí)體屬于相應(yīng)類(lèi)別的可能性并且使用關(guān)于實(shí)體的信息來(lái)確定。該方法包括為實(shí)體記錄多個(gè)類(lèi)別中的一個(gè)類(lèi)別,類(lèi)別使用概率值和用于多個(gè)類(lèi)別的規(guī)則集來(lái)識(shí)別。
[0009]實(shí)施方式可以包括以下特征中的任何、全部特征或不包括以下特征。實(shí)體可以是被識(shí)別為加入在程序中的內(nèi)容提供者,在所述程序中內(nèi)容提供者提供待由至少一個(gè)發(fā)布者發(fā)布的內(nèi)容,以及概率值可以使用與內(nèi)容提供者相關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞以及與內(nèi)容提供者相關(guān)聯(lián)的至少一個(gè)財(cái)務(wù)值來(lái)確定。確定概率值可以包括將至少一個(gè)關(guān)鍵詞至少映射到多個(gè)類(lèi)別的子集;用至少一個(gè)財(cái)務(wù)值對(duì)至少子集賦予權(quán)重,其中財(cái)務(wù)值已被分配給對(duì)應(yīng)關(guān)鍵詞;以及選擇預(yù)定數(shù)量的類(lèi)別作為子集。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。規(guī)則集可以包括決策樹(shù),其被配置用于通過(guò)處理包括在決策樹(shù)中的多個(gè)決策中的至少部分來(lái)選擇多個(gè)類(lèi)別中的一個(gè)。該方法可以進(jìn)一步包括使用訓(xùn)練數(shù)據(jù)來(lái)生成決策樹(shù),其中訓(xùn)練數(shù)據(jù)包括實(shí)體到多個(gè)類(lèi)別中的一個(gè)或多個(gè)的映射。生成決策樹(shù)可以進(jìn)一步包括使用有關(guān)實(shí)體的財(cái)務(wù)數(shù)據(jù)對(duì)映射賦予權(quán)重。對(duì)映射賦予權(quán)重可以進(jìn)一步包括基于與映射的至少子集相對(duì)應(yīng)的財(cái)務(wù)數(shù)據(jù)來(lái)過(guò)采樣(oversample)映射的所述子集。生成決策樹(shù)可以包括選擇用于決策樹(shù)的結(jié)構(gòu);確定決策樹(shù)的延伸區(qū)(extent),包括在選擇多個(gè)類(lèi)別中的一個(gè)之前待進(jìn)行的多個(gè)決策中的決策數(shù)量;以及確定待在多個(gè)決策中使用的閾值??梢缘蓻Q策樹(shù)。內(nèi)容提供者可以從事于廣告,以及多個(gè)類(lèi)別可以包括內(nèi)容提供者待與之匹配的垂直元(vertical)。生成決策樹(shù)可以進(jìn)一步包括識(shí)別垂直元中的至少一個(gè),對(duì)于其概率值的確定具有將垂直元不恰當(dāng)?shù)胤峙浣o內(nèi)容提供者的傾向;以及選擇閾值中的至少一個(gè),使得降低所述傾向。該方法可以進(jìn)一步包括基于已為實(shí)體識(shí)別的類(lèi)別向用戶(hù)呈現(xiàn)信息。信息可以指示與類(lèi)別相關(guān)聯(lián)的季節(jié)性。
[0010]在第二方面中,一種計(jì)算機(jī)系統(tǒng)包括第一分類(lèi)器,其為多個(gè)類(lèi)別中的至少子集中的每一個(gè)類(lèi)別確定概率值,所述概率值表示識(shí)別的實(shí)體屬于相應(yīng)類(lèi)別的可能性并且使用關(guān)于實(shí)體的信息來(lái)確定。該系統(tǒng)包括第二分類(lèi)器,其使用概率值和用于多個(gè)類(lèi)別的規(guī)則集來(lái)為實(shí)體識(shí)別多個(gè)類(lèi)別中的一個(gè)類(lèi)別。
[0011]實(shí)施方式可以包括以下特征中的任何、全部特征或不包括以下特征。規(guī)則集可以基于訓(xùn)練數(shù)據(jù)。第一分類(lèi)器在確定概率值時(shí)可以考慮與實(shí)體有關(guān)的財(cái)務(wù)值。規(guī)則集可以包括決策樹(shù),其被配置用于通過(guò)處理包括在決策樹(shù)中的多個(gè)決策中的至少部分來(lái)選擇多個(gè)類(lèi)別中的一個(gè),以及該計(jì)算機(jī)系統(tǒng)可以進(jìn)一步包括使用訓(xùn)練數(shù)據(jù)來(lái)生成決策樹(shù)的規(guī)則組件,其中訓(xùn)練數(shù)據(jù)包括實(shí)體到多個(gè)類(lèi)別中的一個(gè)或多個(gè)的映射。規(guī)則組件可以使用有關(guān)實(shí)體的財(cái)務(wù)數(shù)據(jù)對(duì)映射賦予權(quán)重,包括基于與映射的至少子集相對(duì)應(yīng)的財(cái)務(wù)數(shù)據(jù)來(lái)過(guò)采樣映射的所述子集。該系統(tǒng)可以進(jìn)一步包括前端組件,其基于第二分類(lèi)器已為實(shí)體識(shí)別了類(lèi)別向用戶(hù)呈現(xiàn)信息。
[0012]在第三方面中,一種用于將內(nèi)容提供者與類(lèi)別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法包括將內(nèi)容提供者識(shí)別為加入在程序中,在所述程序中內(nèi)容提供者提供待由至少一個(gè)發(fā)布者發(fā)布的內(nèi)容。該方法進(jìn)一步包括接收有關(guān)內(nèi)容提供者的至少一個(gè)關(guān)鍵詞和有關(guān)關(guān)鍵詞的至少一個(gè)財(cái)務(wù)值。該方法進(jìn)一步包括接收多個(gè)類(lèi)別,其中內(nèi)容提供者待與類(lèi)別中的至少一個(gè)相關(guān)聯(lián)。該方法進(jìn)一步包括基于類(lèi)別的名稱(chēng)將至少一個(gè)關(guān)鍵詞映射到類(lèi)別的子集。該方法進(jìn)一步包括將類(lèi)別的至少子集中的每一個(gè)與概率值相關(guān)聯(lián),所述概率值表示內(nèi)容提供者應(yīng)當(dāng)與相應(yīng)類(lèi)別相關(guān)聯(lián)的可能性,所述概率值使用財(cái)務(wù)值被賦予權(quán)重。該方法進(jìn)一步包括接收所生成的有關(guān)多個(gè)類(lèi)別的規(guī)則集,所述規(guī)則集被配置用于在識(shí)別類(lèi)別中的一個(gè)時(shí)使用。該方法進(jìn)一步包括使用規(guī)則集來(lái)處理有關(guān)內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括:(i)類(lèi)別的至少子集中的每一個(gè)的概率值;(ii)有關(guān)內(nèi)容提供者的財(cái)務(wù)數(shù)據(jù)內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域。該方法進(jìn)一步包括基于對(duì)數(shù)據(jù)的處理為內(nèi)容提供者選擇多個(gè)類(lèi)別中的一個(gè)。該方法進(jìn)一步包括將內(nèi)容提供者與所選擇的類(lèi)別相關(guān)聯(lián)。
[0013]實(shí)施方式可以提供以下優(yōu)勢(shì)中的任何、全部?jī)?yōu)勢(shì)或不提供以下優(yōu)勢(shì)。可以提供分成類(lèi)別的改進(jìn)的分類(lèi)?;诟怕实姆诸?lèi)可以被賦予收益權(quán)重,以及可以由先前使用訓(xùn)練數(shù)據(jù)來(lái)訓(xùn)練的基于規(guī)則的分類(lèi)進(jìn)行進(jìn)一步特定化。可以增加分類(lèi)的靈活性。
[0014]在附圖和下面的描述中闡述了一個(gè)或多個(gè)實(shí)施例的細(xì)節(jié)。其它特征和優(yōu)勢(shì)從描述和附圖、以及從權(quán)利要求將是顯而易見(jiàn)的。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0015]圖1示出了可以為實(shí)體識(shí)別類(lèi)別的示例系統(tǒng)。
[0016]圖2示出了可以為實(shí)體識(shí)別類(lèi)別的另一個(gè)示例系統(tǒng)。
[0017]圖3示出了可以基于已為實(shí)體識(shí)別的類(lèi)別來(lái)呈現(xiàn)信息的示例用戶(hù)界面。[0018]圖4示出了可以執(zhí)行來(lái)為實(shí)體識(shí)別類(lèi)別的示例方法。
[0019]圖5是可以結(jié)合在本文檔中描述的計(jì)算機(jī)實(shí)現(xiàn)的方法使用的計(jì)算系統(tǒng)的框圖。
[0020]各附圖中相同的參考標(biāo)記指示相同的元素。
【具體實(shí)施方式】
[0021]圖1示出了可以為實(shí)體識(shí)別類(lèi)別的示例系統(tǒng)100。多個(gè)實(shí)體可以在系統(tǒng)100中操作,例如實(shí)體可以是以下形式的:諸如廣告主的內(nèi)容提供者和諸如網(wǎng)頁(yè)或其它內(nèi)容的所有者的內(nèi)容發(fā)布者。在一些實(shí)施方式中,內(nèi)容提供者可以操作一個(gè)或多個(gè)內(nèi)容提供者系統(tǒng)102,以及內(nèi)容發(fā)布者可以操作一個(gè)或多個(gè)內(nèi)容發(fā)布者系統(tǒng)104??梢詫⑷魏畏N類(lèi)的計(jì)算機(jī)設(shè)備、電子設(shè)備或系統(tǒng)包括在系統(tǒng)102和104中,諸如服務(wù)器計(jì)算機(jī)或個(gè)人計(jì)算機(jī)。系統(tǒng)100中的組件可以使用諸如本地計(jì)算機(jī)網(wǎng)絡(luò)或因特網(wǎng)的任何種類(lèi)的網(wǎng)絡(luò)106來(lái)相互通信。
[0022]在一些實(shí)施方式中,系統(tǒng)100中的一個(gè)或多個(gè)實(shí)體可以參與事務(wù),在所述事務(wù)中內(nèi)容提供者提供待由至少一個(gè)發(fā)布者發(fā)布的內(nèi)容。例如,諸如廣告的內(nèi)容可以通過(guò)網(wǎng)絡(luò)106從內(nèi)容提供者系統(tǒng)102分發(fā)用于以?xún)?nèi)容發(fā)布者系統(tǒng)104中的一個(gè)或多個(gè)的名義發(fā)布。在一些實(shí)施方式中,內(nèi)容可以由諸如內(nèi)容分發(fā)者系統(tǒng)108 (例如,廣告服務(wù)器)的第三方暫時(shí)或永久保持,并且可以從系統(tǒng)108分發(fā)用于發(fā)布。例如,當(dāng)用戶(hù)系統(tǒng)110向發(fā)布者系統(tǒng)104請(qǐng)求媒體內(nèi)容(例如,網(wǎng)頁(yè))時(shí),內(nèi)容分發(fā)者系統(tǒng)108可以將相關(guān)聯(lián)的內(nèi)容(例如,廣告)提供給用戶(hù)系統(tǒng)110用于連同所請(qǐng)求的內(nèi)容一起呈現(xiàn)。在下面將描述其中諸如系統(tǒng)100中的內(nèi)容提供者和/或內(nèi)容發(fā)布者的一個(gè)或多個(gè)實(shí)體可以使用類(lèi)別目錄來(lái)進(jìn)行分類(lèi)的示例。這樣的分類(lèi)對(duì)涉及分類(lèi)實(shí)體的任何人,例如管理在實(shí)體間分發(fā)內(nèi)容的個(gè)人,可以是有用的。
[0023]系統(tǒng)100可以包括一個(gè)或多個(gè)分類(lèi)器。在一些實(shí)施方式中,系統(tǒng)100包括概率分類(lèi)器112和基于規(guī)則的分類(lèi)器114。這些和其它組件的名稱(chēng)在此被寬泛使用,而不是狹窄使用;例如,概率分類(lèi)器112在其操作中可以使用一個(gè)或多個(gè)規(guī)則,以及基于規(guī)則的分類(lèi)器114在分類(lèi)過(guò)程中可以確定或使用一個(gè)或多個(gè)概率。分類(lèi)器112和114可以以任何形式,諸如使用軟件、硬件、固件或以上組合,來(lái)實(shí)現(xiàn)。
[0024]在一些實(shí)施方式中,可以使用分類(lèi)器112和114,以使諸如操作系統(tǒng)102的內(nèi)容提供者的所選擇的實(shí)體與諸如來(lái)自垂直元目錄116的垂直元的一個(gè)或多個(gè)類(lèi)別相匹配。垂直元可以是指一個(gè)或多個(gè)業(yè)務(wù)分類(lèi),諸如有時(shí)在市場(chǎng)分析中使用來(lái)表示在共同領(lǐng)域中交易的企業(yè)和客戶(hù)的歸類(lèi)詞語(yǔ)(例如,消費(fèi)電子垂直元或化妝品垂直元)??梢允褂闷渌诸?lèi)。
[0025]概率分類(lèi)器112可以為諸如內(nèi)容提供者的實(shí)體確定針對(duì)目錄116中的垂直元中的至少一個(gè)的概率值。概率可以表示內(nèi)容提供者屬于對(duì)應(yīng)垂直元的可能性。例如,概率分類(lèi)器可以確定實(shí)體“Example Company, Inc.(示例公司)”應(yīng)當(dāng)被分類(lèi)為屬于“抵押”垂直元的概率。概率可以使用有關(guān)實(shí)體的信息來(lái)確定。在一些實(shí)施方式中,概率分類(lèi)器112可以確定多個(gè)概率值,諸如與目錄116中的垂直元的至少子集中的每一個(gè)相對(duì)應(yīng)的值。
[0026]基于規(guī)則的分類(lèi)器114可以為實(shí)體識(shí)別類(lèi)別,諸如目錄116中的垂直元中的一個(gè)。在一些實(shí)施方式中,基于規(guī)則的分類(lèi)器114可以使用由概率分類(lèi)器112確定的一個(gè)或多個(gè)概率和諸如決策樹(shù)118的規(guī)則集。例如,決策樹(shù)118可以包括多個(gè)決策,以及可以被配置用于通過(guò)處理決策中的至少部分來(lái)選擇目錄116中的多個(gè)垂直元中的一個(gè)。在一些實(shí)施方式中,系統(tǒng)100可以包括基于訓(xùn)練數(shù)據(jù)122來(lái)生成決策樹(shù)118或其它規(guī)則的規(guī)則組件120。在一些實(shí)施方式中,訓(xùn)練數(shù)據(jù)122可以包括實(shí)體到類(lèi)別中的相應(yīng)類(lèi)別一諸如目錄116中的垂直元一的映射。
[0027]可以以多種方式中的任何方式生成諸如決策樹(shù)118的規(guī)則集。在一些實(shí)施方式中,可以定義樹(shù)模型,并且然后可以基于訓(xùn)練數(shù)據(jù)122來(lái)生成樹(shù)。例如,可以選擇樹(shù)結(jié)構(gòu),諸如以定義樹(shù)應(yīng)當(dāng)包括多級(jí)二元決策。作為另一個(gè)示例,可以定義樹(shù)的延伸區(qū)(例如,決策樹(shù)何時(shí)應(yīng)當(dāng)結(jié)束),諸如在選擇多個(gè)類(lèi)別中的一個(gè)之前待進(jìn)行的多個(gè)決策中的決策數(shù)量。在一些實(shí)施方式中,樹(shù)118中的一個(gè)或多個(gè)決策可以使用閾值。例如,可以將概率(例如,由概率分類(lèi)器112確定的概率)與閾值進(jìn)行比較??梢允褂萌魏畏N類(lèi)的迭代過(guò)程來(lái)生成決策樹(shù)118的一個(gè)或多個(gè)方面。例如,樹(shù)118的結(jié)構(gòu)可以在初始迭代中選擇,并且針對(duì)諸如訓(xùn)練數(shù)據(jù)122的代表性數(shù)據(jù)測(cè)試,以及這樣的測(cè)試的結(jié)果可以用于在另一個(gè)迭代中生成樹(shù)118的另一個(gè)結(jié)構(gòu)。作為另一個(gè)示例,可以在初始迭代中確定閾值的第一集合,以及可以在一個(gè)或多個(gè)額外迭代中通過(guò)反饋過(guò)程對(duì)值中的至少一個(gè)進(jìn)行精化。
[0028]基于規(guī)則的分類(lèi)器114在系統(tǒng)100中可以用于一個(gè)或多個(gè)用途。在一些實(shí)施方式中,概率分類(lèi)器112可能具有在一個(gè)或多個(gè)方面將實(shí)體錯(cuò)誤分類(lèi)的傾向。例如,分類(lèi)器114可能頻繁為實(shí)際上未參與娛樂(lè)業(yè)或僅僅參與較小程度的實(shí)體選擇“娛樂(lè)”垂直元。在概率確定中這樣的特性可以是概率分類(lèi)器112如何被配置的人為結(jié)果,以及可以取決于多個(gè)因素,其可以使解決該問(wèn)題困難或不現(xiàn)實(shí)。在一些實(shí)施方式中,可以將基于規(guī)則的分類(lèi)器114與概率分類(lèi)器112結(jié)合使用。例如,可以選擇由基于規(guī)則的分類(lèi)器114使用的規(guī)則集(例如,決策樹(shù)118)中的閾值中的至少一個(gè),以降低或消除所討論的關(guān)于類(lèi)別的傾向。
[0029]可以為給定實(shí)體,諸如為運(yùn)行系統(tǒng)102的內(nèi)容提供者,選擇至少一個(gè)類(lèi)別(例如,目錄116中的垂直元中的一個(gè))。這樣的選擇可以用于一個(gè)或多個(gè)用途,諸如用來(lái)向用戶(hù)輸出相關(guān)信息。在一些實(shí)施方式中,系統(tǒng)100可以包括可以使用一個(gè)或多個(gè)類(lèi)別選擇的前端組件124。例如,前端組件124可以呈現(xiàn)與所選擇的類(lèi)別有關(guān)的信息作為表征實(shí)體的方式。
[0030]圖2示出了可以為實(shí)體識(shí)別類(lèi)別的另一個(gè)示例系統(tǒng)200。在系統(tǒng)200中,可以識(shí)別關(guān)于實(shí)體的一個(gè)或多個(gè)信息部分,諸如與內(nèi)容提供者相關(guān)聯(lián)的關(guān)鍵詞202。在一些實(shí)施方式中,作為參加內(nèi)容分發(fā)程序的一部分,內(nèi)容提供者可以自識(shí)別關(guān)鍵詞。例如,廣告主可以向內(nèi)容分發(fā)者系統(tǒng)108 (圖1)登記對(duì)一個(gè)或多個(gè)關(guān)鍵詞的出價(jià),使得廣告主的廣告可以被考慮用于在與關(guān)鍵詞有關(guān)的語(yǔ)境下發(fā)布。可以識(shí)別有關(guān)實(shí)體的財(cái)務(wù)信息204。例如,這可以包括收益數(shù)據(jù),諸如有關(guān)廣告主花費(fèi)在特定關(guān)鍵詞上的金額的信息。
[0031]系統(tǒng)200可以包括基礎(chǔ)分類(lèi)器206。在一些實(shí)施方式中,基礎(chǔ)分類(lèi)器可以被配置為使用諸如垂直元目錄116 (圖1)的類(lèi)別集來(lái)對(duì)諸如內(nèi)容提供者或內(nèi)容分發(fā)活動(dòng)的實(shí)體進(jìn)行分類(lèi)。在一些實(shí)施方式中,基礎(chǔ)分類(lèi)器206可以將關(guān)鍵詞202映射到部分或全部垂直元,并且選擇預(yù)定數(shù)量的垂直元。例如,諸如通過(guò)選擇具有最大權(quán)重的那些垂直元,垂直元中的三個(gè)可以被選擇為最能代表實(shí)體。
[0032]基礎(chǔ)分類(lèi)器206可以將用于特定實(shí)體的多個(gè)關(guān)鍵詞映射到相應(yīng)垂直元。可以合并為關(guān)鍵詞選擇的相應(yīng)垂直元(例如,可以求其相應(yīng)概率的平均值)以形成實(shí)體的單一歸類(lèi)。在一些實(shí)施方式中,可以基于財(cái)務(wù)數(shù)據(jù)204,諸如基于花費(fèi)在各個(gè)關(guān)鍵詞上的金額,來(lái)對(duì)為實(shí)體選擇的垂直元賦予權(quán)重。例如,在計(jì)算分類(lèi)時(shí),可以給予關(guān)于對(duì)內(nèi)容提供者的或分發(fā)活動(dòng)的花費(fèi)的相對(duì)較大部分負(fù)責(zé)的關(guān)鍵詞的垂直元相對(duì)較大的權(quán)重。在一些實(shí)施方式中,基礎(chǔ)分類(lèi)器206可以包括概率分類(lèi)器112 (圖1)。在一些實(shí)施方式中,基礎(chǔ)分類(lèi)器206的輸出可以包括一個(gè)或多個(gè)賦予權(quán)重的垂直元208,諸如與權(quán)重(例如在O和I之間的數(shù)字)相關(guān)聯(lián)的至少一個(gè)分類(lèi)器詞語(yǔ)(例如,垂直元名稱(chēng))。
[0033]系統(tǒng)200可以包括賦予花費(fèi)權(quán)重規(guī)則組件210。在一些實(shí)施方式中,組件210可以提供用于定義若干類(lèi)別之間,諸如在三個(gè)賦予收益權(quán)重的垂直元之間,的主類(lèi)別的策略。例如,關(guān)于系統(tǒng)200中的其它組件,組件210可以作為離線(xiàn)程序運(yùn)行,諸如以由Mathworks公司開(kāi)發(fā)的MATLAB環(huán)境中的程序的形式。
[0034]賦予花費(fèi)權(quán)重規(guī)則組件210可以被配置用于多維特征空間上的多類(lèi)分類(lèi)。在一些實(shí)施方式中,η維特征可以用于映射到任何m維。例如,垂直元目錄116可以包括30個(gè)垂直元。作為另一個(gè)示例,可以識(shí)別額外特征,包括但不限于實(shí)體的季度花費(fèi)、實(shí)體的總花費(fèi)、用于實(shí)體的關(guān)鍵詞的數(shù)量以及實(shí)體的促銷(xiāo)國(guó)家。因此,34維特征空間(S卩,n=34)可以用于成為任何30維(S卩,m=30)的分類(lèi)。在一些實(shí)施方式中,特征維中的一個(gè)或多個(gè),諸如實(shí)體國(guó)家,可以是分類(lèi)的。例如,可以給預(yù)定數(shù)量的最高位國(guó)家(例如,九個(gè)國(guó)家)每一個(gè)分配一個(gè)類(lèi),以及可以將剩余國(guó)家聚組在公有類(lèi)中。在一些實(shí)施方式中,特征維中的一個(gè)或多個(gè)可以是離散或連續(xù)變量。例如,關(guān)鍵詞計(jì)數(shù)可以是離散變量和/或總花費(fèi)可以是連續(xù)變量。
[0035]在一些實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以包括基于規(guī)則的分類(lèi)器(圖1)。例如,組件210可以使用部分或全部訓(xùn)練數(shù)據(jù)122來(lái)定義適當(dāng)策略。在一些實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以在新的或經(jīng)修改的訓(xùn)練數(shù)據(jù)集變得可用時(shí),諸如在人類(lèi)分類(lèi)者將一個(gè)或多個(gè)實(shí)體映射到了垂直元目錄116時(shí),被觸發(fā)。
[0036]賦予花費(fèi)權(quán)重規(guī)則組件210可以輸出可以在為實(shí)體選擇類(lèi)別時(shí)使用的規(guī)則集212。在一些實(shí)施方式中,該規(guī)則集可以包括決策樹(shù)。例如,組件210可以使決策樹(shù)分裂并且生長(zhǎng)以?xún)?yōu)化給定實(shí)體是特定類(lèi)別的成員的已確定概率。作為另一個(gè)示例,訓(xùn)練數(shù)據(jù)122(圖1)可以用于修剪決策樹(shù),諸如以避免過(guò)擬合。
[0037]在一些實(shí)施方式中,可以使用諸如“分類(lèi)回歸樹(shù)”(CART)的特征。在這樣的實(shí)施方式中,賦予花費(fèi)權(quán)重規(guī)則組件210可以包括或基于CART分類(lèi)器。例如,可以用定制的修剪程序(例如,停止規(guī)則)構(gòu)建CART模型。作為另一個(gè)示例,可以使用十折交叉驗(yàn)證(10-foldcross validation)來(lái)計(jì)算CART模型的誤差估計(jì)。
[0038]在一些實(shí)施方式中,規(guī)則集212包括一維規(guī)則的分類(lèi)決策樹(shù),其用于將賦予收益權(quán)重的垂直元(例如,三個(gè))集映射到用于實(shí)體的一個(gè)垂直元中。例如,這可以在系統(tǒng)200中提供更大歸納能力的益處,諸如以允許從基礎(chǔ)分類(lèi)器206修剪“壞的垂直元”和/或其它系
統(tǒng)誤差。
[0039]在生成規(guī)則集212時(shí),可以考慮財(cái)務(wù)數(shù)據(jù)。在一些實(shí)施方式中,可以在構(gòu)建CART模型時(shí)復(fù)制數(shù)據(jù),諸如以使復(fù)制量與花費(fèi)金額成比例。例如,可能過(guò)采樣與相對(duì)較高的總花費(fèi)和/或季度花費(fèi)水平相對(duì)應(yīng)的數(shù)據(jù)。作為另一個(gè)示例,可能對(duì)與相對(duì)較低的總花費(fèi)和/或季度花費(fèi)水平相對(duì)應(yīng)的數(shù)據(jù)采樣不足。在一些實(shí)施方式中,基于收益的額外訓(xùn)練數(shù)據(jù)點(diǎn)可能易于使最終輸出(例如,對(duì)一個(gè)或多個(gè)類(lèi)別的選擇)偏向于較高花費(fèi)實(shí)體(例如,內(nèi)容提供者),并且提高有關(guān)這些實(shí)體的精確性。
[0040]下面在附錄I中展現(xiàn)了規(guī)則集212—在此為決策樹(shù)一的示例。
[0041]系統(tǒng)100可以包括主垂直元分類(lèi)器214。在一些實(shí)施方式中,分類(lèi)器可以將賦予收益權(quán)重的類(lèi)別集(例如,賦予權(quán)重的垂直元208)靜態(tài)地映射到用于實(shí)體的單個(gè)主垂直元中。例如,分類(lèi)器214可以使用規(guī)則集212 (諸如通過(guò)加載由組件210生成的CART分類(lèi)樹(shù))來(lái)從基礎(chǔ)分類(lèi)器206選擇賦予權(quán)重的類(lèi)別中的一個(gè)。
[0042]圖3示出了可以基于已為實(shí)體識(shí)別的類(lèi)別來(lái)呈現(xiàn)信息的示例用戶(hù)界面300。在一些實(shí)施方式中,前端組件124(圖1)可以諸如向系統(tǒng)100中的動(dòng)作者生成用戶(hù)界面300。在一些實(shí)施方式中,用戶(hù)界面300可以用于管理客戶(hù)關(guān)系,諸如用于監(jiān)視和/或跟蹤諸如廣告活動(dòng)的內(nèi)容分發(fā)程序中的參與者。用戶(hù)界面300可以包括“名稱(chēng)”區(qū)域302,其中可以呈現(xiàn)一個(gè)或多個(gè)實(shí)體的標(biāo)識(shí)符,諸如廣告主和/或另一個(gè)內(nèi)容提供者的名稱(chēng)。用戶(hù)界面300可以包括“垂直元”區(qū)域304,其中可以指示為實(shí)體識(shí)別的類(lèi)別,諸如來(lái)自目錄116的垂直元。用戶(hù)界面300可以包括呈現(xiàn)與分配給實(shí)體的類(lèi)別有關(guān)的信息的一個(gè)或多個(gè)區(qū)域,諸如“季節(jié)性”區(qū)域306。例如,從事特定垂直元的公司(例如,稅務(wù)籌劃顧問(wèn)或鮮花零售商)在其業(yè)務(wù)和/或其它活動(dòng)中可能具有季節(jié)性發(fā)生波動(dòng)。在一些實(shí)施方式中,可以向用戶(hù)輸出這樣的季節(jié)性(例如,“該實(shí)體的業(yè)務(wù)在情人節(jié)附近可能達(dá)到最高峰”的信息)。在一些實(shí)施方式中,可以在沒(méi)有明確指示所選擇的垂直元的情況下輸出相關(guān)信息(例如,季節(jié)性區(qū)域306)。用戶(hù)界面300可以包括“搜索”控件308,通過(guò)其用戶(hù)可以使用一個(gè)或多個(gè)標(biāo)準(zhǔn)來(lái)搜索實(shí)體,以及可以通過(guò)將信息填充在區(qū)域302-306中的一個(gè)或多個(gè)中來(lái)呈現(xiàn)這樣的搜索的結(jié)果。用戶(hù)界面300可以包括“聯(lián)系”控件310,通過(guò)其用戶(hù)可以發(fā)起與一個(gè)或多個(gè)實(shí)體的聯(lián)系,諸如經(jīng)由電子郵件或電話(huà)。例如,當(dāng)看見(jiàn)了季節(jié)性區(qū)域306中的信息時(shí),諸如銷(xiāo)售代表的用戶(hù)可以聯(lián)系實(shí)體以確保其有關(guān)旺季的需求得到滿(mǎn)足。
[0043]圖4示出了可以執(zhí)行來(lái)為實(shí)體識(shí)別類(lèi)別的示例方法400。方法400可以由例如系統(tǒng)100和/或200中、執(zhí)行存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令的處理器來(lái)執(zhí)行。在一些實(shí)施方式中,可以以另一種順序執(zhí)行步驟中的一個(gè)或多個(gè);作為另一個(gè)示例,可以執(zhí)行更多或更少步驟。步驟410包括為多個(gè)類(lèi)別中的至少子集中的每一個(gè)確定概率值。概率值可以表示識(shí)別的實(shí)體屬于相應(yīng)類(lèi)別的可能性并且可以使用關(guān)于實(shí)體的信息來(lái)確定。例如,概率分類(lèi)器112和/或基礎(chǔ)分類(lèi)器可以為諸如內(nèi)容提供者或內(nèi)容發(fā)布者的特定實(shí)體生成賦予權(quán)重的垂直元208。子集可以包括一個(gè)或多個(gè)類(lèi)別。
[0044]步驟420包括為實(shí)體記錄多個(gè)類(lèi)別中的一個(gè),類(lèi)別使用概率值和基于例如訓(xùn)練數(shù)據(jù)的用于多個(gè)類(lèi)別的規(guī)則集來(lái)識(shí)別。例如,基于規(guī)則的分類(lèi)器114和/或主垂直元分類(lèi)器214可以從目錄116選擇一個(gè)垂直元來(lái)與特定實(shí)體相關(guān)聯(lián)。
[0045]步驟430包括基于為實(shí)體對(duì)類(lèi)別的識(shí)別來(lái)呈現(xiàn)信息。例如,前端組件124可以生成可以呈現(xiàn)季節(jié)性區(qū)域306的用戶(hù)界面300。
[0046]圖5是通用計(jì)算機(jī)系統(tǒng)500的不意圖。根據(jù)一個(gè)實(shí)施方式,系統(tǒng)500可以用于結(jié)合先前描述的任何計(jì)算機(jī)實(shí)現(xiàn)的方法描述的操作。系統(tǒng)500包括處理器510、存儲(chǔ)器520、存儲(chǔ)設(shè)備530和輸入/輸出設(shè)備540。組件510、520、530和540中的每一個(gè)使用系統(tǒng)總線(xiàn)550互連。處理器510能夠處理用于在系統(tǒng)500內(nèi)執(zhí)行的指令。在一個(gè)實(shí)施方式中,處理器510是單線(xiàn)程處理器。在另一個(gè)實(shí)施方式中,處理器510是多線(xiàn)程處理器。處理器510能夠處理存儲(chǔ)在存儲(chǔ)器520中或存儲(chǔ)設(shè)備530上的指令以在輸入/輸出設(shè)備540上顯示用于用戶(hù)界面的圖形信息。
[0047]存儲(chǔ)器520存儲(chǔ)系統(tǒng)500內(nèi)的信息。在一個(gè)實(shí)施方式中,存儲(chǔ)器520是計(jì)算機(jī)可讀介質(zhì)。在一個(gè)實(shí)施方式中,存儲(chǔ)器520是易失性存儲(chǔ)器單元。在另一個(gè)實(shí)施方式中,存儲(chǔ)器520是非易失性存儲(chǔ)器單元。
[0048]存儲(chǔ)設(shè)備530能夠?yàn)橄到y(tǒng)500提供海量存儲(chǔ)。在一個(gè)實(shí)施方式中,存儲(chǔ)設(shè)備530是計(jì)算機(jī)可讀介質(zhì)。在各種不同的實(shí)施方式中,存儲(chǔ)設(shè)備530可以是軟盤(pán)設(shè)備、硬盤(pán)設(shè)備、光盤(pán)設(shè)備或帶設(shè)備。
[0049]輸入/輸出設(shè)備540為系統(tǒng)500提供輸入/輸出操作。在一個(gè)實(shí)施方式中,輸入/輸出設(shè)備540包括鍵盤(pán)和/或指不設(shè)備。在另一個(gè)實(shí)施方式中,輸入/輸出設(shè)備540包括用于顯示圖形用戶(hù)界面的顯示單元。
[0050]可以在數(shù)字電子電路中,或者在計(jì)算機(jī)硬件、固件、軟件或者在它們的組合中實(shí)現(xiàn)所描述的特征??梢栽谟行蔚匕ㄔ谛畔⑤d體中一例如,在機(jī)器可讀存儲(chǔ)設(shè)備或傳播信號(hào)中一的、用于可編程處理器執(zhí)行的計(jì)算機(jī)程序產(chǎn)品中實(shí)現(xiàn)裝置;以及可以由執(zhí)行指令程序來(lái)執(zhí)行所描述的實(shí)施方式的功能的可編程處理器通過(guò)操作輸入數(shù)據(jù)并且生成輸出來(lái)執(zhí)行方法步驟??梢栽诎ㄖ辽僖粋€(gè)可編程處理器的可編程系統(tǒng)上可執(zhí)行的一個(gè)或多個(gè)計(jì)算機(jī)程序中有利地實(shí)現(xiàn)所描述的特征,所述至少一個(gè)可編程處理器被耦接以從數(shù)據(jù)存儲(chǔ)系統(tǒng)、至少一個(gè)輸入設(shè)備和至少一個(gè)輸出設(shè)備接收數(shù)據(jù)和指令以及將數(shù)據(jù)和指令傳送到數(shù)據(jù)存儲(chǔ)系統(tǒng)、至少一個(gè)輸入設(shè)備和至少一個(gè)輸出設(shè)備。計(jì)算機(jī)程序是可以在計(jì)算機(jī)中直接或間接使用來(lái)執(zhí)行某一動(dòng)作或引起某一結(jié)果的指令集。計(jì)算機(jī)程序可以以任何形式的編程語(yǔ)言編寫(xiě),所述編程語(yǔ)言包括編譯或解釋語(yǔ)言,并且其可以以任何形式部署,包括作為獨(dú)立程序或作為模塊、組件、子程序或適于在計(jì)算環(huán)境中使用的其它單元。
[0051]用于執(zhí)行指令程序的適當(dāng)處理器包括例如通用和專(zhuān)用微處理器兩者,以及任何種類(lèi)的計(jì)算機(jī)的唯一處理器或多個(gè)處理器中的一個(gè)。通常,處理器將從只讀存儲(chǔ)器或隨機(jī)存取存儲(chǔ)器或兩者接收指令和數(shù)據(jù)。計(jì)算機(jī)的主要元件是用于執(zhí)行指令的處理器和用于存儲(chǔ)指令和數(shù)據(jù)的一個(gè)或多個(gè)存儲(chǔ)器。通常,計(jì)算機(jī)還包括用于存儲(chǔ)數(shù)據(jù)文件的一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備,或可操作地耦接以與所述一個(gè)或多個(gè)海量存儲(chǔ)設(shè)備通信;這樣的設(shè)備包括磁盤(pán),諸如內(nèi)部硬盤(pán)和可移動(dòng)盤(pán);磁光盤(pán);以及光盤(pán)。適于有形地包括計(jì)算機(jī)程序指令和數(shù)據(jù)的存儲(chǔ)設(shè)備包括所有形式的非易失性存儲(chǔ)器,包括例如:半導(dǎo)體存儲(chǔ)器設(shè)備,例如EPR0M、EEPROM和閃存設(shè)備;磁盤(pán),諸如內(nèi)部硬盤(pán)和可移動(dòng)盤(pán);磁光盤(pán);以及CD-ROM和DVD-ROM盤(pán)。處理器和存儲(chǔ)器可以由ASIC (專(zhuān)用集成電路)補(bǔ)充,或合并入ASIC。
[0052]為了提供與用戶(hù)的交互,可以在具有下述的計(jì)算機(jī)上實(shí)現(xiàn)特征:用于向用戶(hù)顯示信息的顯示設(shè)備,例如CRT (陰極射線(xiàn)管)或LCD (液晶顯示)監(jiān)視器,以及用戶(hù)通過(guò)其可以向計(jì)算機(jī)提供輸入的鍵盤(pán)和指示設(shè)備,例如鼠標(biāo)或跟蹤球。
[0053]可以在包括諸如數(shù)據(jù)服務(wù)器的后端組件、或者包括諸如應(yīng)用服務(wù)器或因特網(wǎng)服務(wù)器的中間件組件、或者包括諸如具有圖形用戶(hù)界面或因特網(wǎng)瀏覽器的客戶(hù)端計(jì)算機(jī)的前端組件、或者它們的任何組合的計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)特征。系統(tǒng)的組件可以通過(guò)諸如通信網(wǎng)絡(luò)的任何形式或介質(zhì)的數(shù)字?jǐn)?shù)據(jù)通信連接。通信網(wǎng)絡(luò)的示例例如包括LAN、WAN以及形成因特網(wǎng)的計(jì)算機(jī)和網(wǎng)絡(luò)。
[0054]計(jì)算機(jī)系統(tǒng)可以包括客戶(hù)端和服務(wù)器??蛻?hù)端和服務(wù)器通常彼此遠(yuǎn)離并且典型地通過(guò)諸如所描述的網(wǎng)絡(luò)之一的網(wǎng)絡(luò)交互??蛻?hù)端和服務(wù)器的關(guān)系依靠在各個(gè)計(jì)算機(jī)上運(yùn)行并且彼此具有客戶(hù)端-服務(wù)器關(guān)系的計(jì)算機(jī)程序產(chǎn)生。[0055]已經(jīng)描述了多個(gè)實(shí)施例。然而,將理解的是,在不背離本公開(kāi)的精神和范圍的情況下,可以進(jìn)行各種修改。因此,其它實(shí)施例在權(quán)利要求的范圍內(nèi)。
[0056]附錄I
[0057]CART模型描述和輸出
[0058]自變量
[0059]xl:國(guó)家(例如,根據(jù)國(guó)家代碼)
[0060]x2:關(guān)鍵詞計(jì)數(shù)
[0061]x3:總花費(fèi)(USD)
[0062]x4:季度花費(fèi)(USD)
[0063]x5?x34:從最小到最大排序的用于垂直元的收益權(quán)重(例如,分類(lèi)器112或206的輸出)
[0064]Id x5 x6 x7 x8 x9 xlO xll xl2 xl3 xl4
[0065]垂直2 3 4 5 7 8 11 12 13 14
[0066]元
[0067]Id xl5 xl6 xl7 xl8 xl9 x20 x21 x22 x23 x24
[0068]垂直15 16 18 19 20 29 44 45 47 52
[0069]元
[0070]Id x25 x26 x27 x28 x29 x30 x31 x32 x33 x34
[0071]垂直66 67 71 174 285 299 397 439 533 570
[0072]元
[0073]CART 輸出
[0074]用于分類(lèi)的決策樹(shù)
[0075]Iif x26<0.156561then node2else node3
[0076]2if x9〈0.370092then node4else node5
[0077]3if x26<0.657022then node6else node7
[0078]4if xl7<0.495845then node8else node9
[0079]5if x9<0.823663then nodelOelse nodell
[0080]6if xl5<0.0685697then nodel2else nodel3
[0081]7if x21<0.0848807then nodel4else nodel5
[0082]8if x8〈0.521697then nodel6else nodel7
[0083]9if xl7<0.736217then nodel8else nodel9
[0084]IOif x23<0.498586then node20else node21
[0085]llclass=7
[0086]12if x20<0.257736then node22else node23
[0087]13if x20<0.0258419then node24else node25
[0088]14class=67
[0089]15if x2<7168.5then node26else node27
[0090]16if x24<0.354713then node28else node29
[0091]17if x8<0.716763then node30else node31[0092]18if x2<80663then node32else node33
[0093]19if xl7<0.925121then node34else node35
[0094]20if xl8<0.213272then node36else node37
[0095]21class=47
[0096]22if xl2<0.335248then node38else node39
[0097]23if xlin{1346}then node40else node41
[0098]24if x29<0.230442then node42else node43
[0099]25class=29
[0100]26class=44
[0101]27class=52
[0102]28if xll<0.331887then node44else node45
[0103]29class=52
[0104]30if x2<7057.5then node46else node47
[0105]31class=5
[0106]32if x7<0.0829784then node48else node49
[0107]33if xl=lthen node50else node51
[0108]34if x2<77348then node52else node53
[0109]35class=18
[0110]36if x20<0.371657then node54else node55
[0111]37if x3<3.85033e+06then node56else node57
[0112]38if xl9<0.330368then node58else node59
[0113]39class=12
[0114]40class=29
[0115]41class=67
[0116]42class=67
[0117]43class=285
[0118]44if x23<0.57222then node60else node61
[0119]45if x7<0.114347then node62else node63
[0120]46if xl3<0.330393then node64else node65
[0121]47if x7<0.255785then node66else node67
[0122]48if xlin{1237810}then node68else node69
[0123]49class=4
[0124]50class=ll
[0125]51class=285
[0126]52class=18
[0127]53class=20
[0128]54class=7
[0129]55class=29
[0130]56class=7[0131]57class=19
[0132]58if x21<0.203319then node70else node71
[0133]59class=20
[0134]60if x3<4.08266e+07then node72else node73
[0135]61if x23<0.730036then node74else node75
[0136]62if xll<0.537014then node76else node77
[0137]63if xlin{12810}then node78else node79
[0138]64if x24<0.10869then node80else node81
[0139]65if x2〈1310then node82else node83
[0140]66if xlin{1257}then node84else node85
[0141]67class=4
[0142]68class=18
[0143]69if x2<39894then node86else node87
[0144]70if xl3<0.193039then node88else node89
[0145]71class=44
[0146]72if x22<0.442255then node90else node91
[0147]73class=5
[0148]74if xl2<0.179846then node92else node93
[0149]75class=47
[0150]76if x27<0.189842then node94else node95
[0151]77class=ll
[0152]78class=4
[0153]79class=ll
[0154]80class=5
[0155]81if xlin{136810}then node96else node97
[0156]82class=13
[0157]83class=5
[0158]84if x32<0.117921then node98else node99
[0159]85class=5
[0160]86if x21<0.268462then nodelOOelse nodelOl
[0161]87class=52
[0162]88if xl7<0.209712then nodel02else nodel03
[0163]89class=13
[0164]90if x7<0.35475then nodel04else nodel05
[0165]91if x22<0.711517then nodel06else nodel07
[0166]92if x2<10.5then nodel08else nodel09
[0167]93class=12
[0168]94if x4〈368742then nodellOelse nodelll
[0169]95class=71[0170]96class=5
[0171]97class=52
[0172]98class=19
[0173]99class=18
[0174]100class=18
[0175]101class=44
[0176]102if x23<0.262412then nodell2else nodell3
[0177]103class=18
[0178]104if xl8<0.513483then nodell4else nodell5
[0179]105class=4
[0180]106if x21<0.210351then nodell6else nodell7
[0181]107class=45
[0182]108class=18
[0183]109class=47
[0184]IlOif xl2〈0.433287then nodell8else nodell9
[0185]Illclass=Il
[0186]112if x7〈0.569093then nodel20else nodel21
[0187]113class=47
[0188]114if x20<0.473106then nodel22else nodel23
[0189]115if x22<0.158422then nodel24else nodel25
[0190]116if x6〈0.0777122then nodel26else nodel27
[0191]117if x21〈0.470751then nodel28else nodel29
[0192]118if x3〈l.47723e+06then nodel30else nodel31
[0193]119if x3<5.20398e+06then nodel32else nodel33
[0194]120if xl4<0.396659then nodel34else nodel35
[0195]121class=4
[0196]122if xl2<0.470398then nodel36else nodel37
[0197]123if xl7<0.306859then nodel38else nodel39
[0198]124if xl8<0.824979then nodel40else nodel41
[0199]125class=19
[0200]126class=45
[0201]127if x3<l.93593e+06then nodel42else nodel43
[0202]128if x3<l.44848e+06then nodel44else nodel45
[0203]129class=45
[0204]130class=ll
[0205]131class=8
[0206]132if xlin{14568}then nodel46else nodel47
[0207]133class=ll
[0208]134if xll<0.09162then nodel48else nodel49
【權(quán)利要求】
1.一種用于將實(shí)體與類(lèi)別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括: 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器執(zhí)行指令,所述指令使得所述一個(gè)或多個(gè)計(jì)算機(jī)處理器生成內(nèi)容分發(fā)系統(tǒng),所述內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個(gè)內(nèi)容提供者接收一個(gè)或多個(gè)內(nèi)容部分,(ii)至少部分地基于所述至少一個(gè)內(nèi)容提供者屬于多個(gè)類(lèi)別中的哪一個(gè)來(lái)選擇所述一個(gè)或多個(gè)內(nèi)容部分中的至少一個(gè)用于發(fā)布,以及(iii)提供所選擇的所述至少一個(gè)內(nèi)容部分以代表所述至少一個(gè)內(nèi)容提供者用于發(fā)布; 接收關(guān)于第一內(nèi)容提供者的第一信息; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,相對(duì)于所述第一內(nèi)容提供者確定所述多個(gè)類(lèi)別的至少子集中的每一個(gè)類(lèi)別的概率值,每一個(gè)所述概率值表示所述第一內(nèi)容提供者屬于相應(yīng)類(lèi)別的可能性并且使用關(guān)于所述第一內(nèi)容提供者的所述第一信息來(lái)確定;以及 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,識(shí)別所述多個(gè)類(lèi)別的所述子集中的一個(gè)類(lèi)別,并且將所識(shí)別的所述一個(gè)類(lèi)別分配給所述內(nèi)容分發(fā)系統(tǒng)中的所述第一內(nèi)容提供者,所述一個(gè)類(lèi)別使用所述概率值和用于所述多個(gè)類(lèi)別的規(guī)則集來(lái)識(shí)別。
2.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述概率值使用與所述第一內(nèi)容提供者相關(guān)聯(lián)的至少一個(gè)關(guān)鍵詞以及與所述第一內(nèi)容提供者相關(guān)聯(lián)的至少一個(gè)財(cái)務(wù)值來(lái)確定。
3.根據(jù)權(quán)利要求2所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中確定所述概率值包括: 將所述至少一個(gè)關(guān)鍵詞 至少映射到所述多個(gè)類(lèi)別的所述子集; 用所述至少一個(gè)財(cái)務(wù)值對(duì)至少所述子集賦予權(quán)重,其中所述財(cái)務(wù)值已被分配給對(duì)應(yīng)關(guān)鍵詞;以及 選擇預(yù)定數(shù)量的所述多個(gè)類(lèi)別作為所述子集。
4.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
5.根據(jù)權(quán)利要求4所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述規(guī)則集包括決策樹(shù),所述決策樹(shù)被配置用于通過(guò)處理包括在所述決策樹(shù)中的多個(gè)決策中的至少部分來(lái)選擇所述多個(gè)類(lèi)別中的一個(gè)。
6.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: 使用所述訓(xùn)練數(shù)據(jù)來(lái)生成所述決策樹(shù),其中所述訓(xùn)練數(shù)據(jù)包括實(shí)體到所述多個(gè)類(lèi)別中的一個(gè)或多個(gè)的映射。
7.根據(jù)權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹(shù)進(jìn)一步包括: 使用有關(guān)所述實(shí)體的財(cái)務(wù)數(shù)據(jù)對(duì)所述映射賦予權(quán)重。
8.根據(jù)權(quán)利要求7所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中對(duì)所述映射賦予權(quán)重進(jìn)一步包括: 基于與所述映射的至少子集相對(duì)應(yīng)的所述財(cái)務(wù)數(shù)據(jù)來(lái)過(guò)采樣所述映射的所述子集。
9.根據(jù)權(quán)利要求5所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹(shù)包括: 選擇用于所述決策樹(shù)的結(jié)構(gòu); 確定所述決策樹(shù)的延伸區(qū),包括在選擇所述多個(gè)類(lèi)別中的所述一個(gè)之前待進(jìn)行的所述多個(gè)決策中的決策數(shù)量;以及 確定待在所述多個(gè)決策中使用的閾值。
10.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述決策樹(shù)被迭代生成。
11.根據(jù)權(quán)利要求6所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第一內(nèi)容提供者從事于廣告,以及其中所述多個(gè)類(lèi)別包括所述第一內(nèi)容提供者待與之匹配的垂直元。
12.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中生成所述決策樹(shù)進(jìn)一步包括: 識(shí)別所述垂直元中的至少一個(gè),對(duì)于所述至少一個(gè)垂直元所述概率值的所述確定具有將所述垂直元不恰當(dāng)?shù)胤峙浣o所述第一內(nèi)容提供者的傾向;以及選擇所述閾值中的至少一個(gè),使得降低所述傾向。
13.根據(jù)權(quán)利要求1所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,進(jìn)一步包括: 基于已為所述第一內(nèi)容提供者識(shí)別的所述類(lèi)別向用戶(hù)呈現(xiàn)第二信息。
14.根據(jù)權(quán)利要求13所述的計(jì)算機(jī)實(shí)現(xiàn)的方法,其中所述第二信息指示與所述類(lèi)別相關(guān)聯(lián)的季節(jié)性。
15.一種計(jì)算機(jī)系統(tǒng),包括: 一個(gè)或多個(gè)計(jì)算機(jī)處理器;以及 存儲(chǔ)有指令的非易失性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述指令在被執(zhí)行時(shí)使得所述一個(gè)或多個(gè)計(jì)算機(jī)處理器生成: 內(nèi)容分發(fā)系統(tǒng),所述內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個(gè)內(nèi)容提供者接收一個(gè)或多個(gè)內(nèi)容部分,(ii)至少部分地基于所述至少一個(gè)內(nèi)容提供者屬于多個(gè)類(lèi)別中的哪一個(gè)來(lái)選擇所述一個(gè)或多個(gè)內(nèi)容部 分中的至少一個(gè)用于發(fā)布,以及(iii)提供所選擇的所述至少一個(gè)內(nèi)容部分以代表所述至少一個(gè)內(nèi)容提供者用于發(fā)布; 第一分類(lèi)器,所述第一分類(lèi)器相對(duì)于所述第一內(nèi)容提供者確定所述多個(gè)類(lèi)別的至少子集中的每一個(gè)類(lèi)別的概率值,每一個(gè)所述概率值表示所述第一內(nèi)容提供者屬于相應(yīng)類(lèi)別的可能性并且使用所接收的關(guān)于所述第一內(nèi)容提供者的第一信息來(lái)確定;以及 第二分類(lèi)器,所述第二分類(lèi)器使用所述概率值和用于所述多個(gè)類(lèi)別的規(guī)則集來(lái)為所述內(nèi)容分發(fā)系統(tǒng)中的所述第一內(nèi)容提供者識(shí)別所述多個(gè)類(lèi)別的所述子集中的一個(gè)類(lèi)別; 其中所述計(jì)算機(jī)系統(tǒng)將所識(shí)別的類(lèi)別分配給所述第一內(nèi)容提供者。
16.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則集基于訓(xùn)練數(shù)據(jù)。
17.根據(jù)權(quán)利要求16所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則集包括決策樹(shù),所述決策樹(shù)被配置用于通過(guò)處理包括在所述決策樹(shù)中的多個(gè)決策中的至少部分來(lái)選擇所述多個(gè)類(lèi)別中的一個(gè),所述計(jì)算機(jī)系統(tǒng)進(jìn)一步包括: 規(guī)則組件,所述規(guī)則組件使用所述訓(xùn)練數(shù)據(jù)來(lái)生成所述決策樹(shù),其中所述訓(xùn)練數(shù)據(jù)包括實(shí)體到所述多個(gè)類(lèi)別中的一個(gè)或多個(gè)的映射。
18.根據(jù)權(quán)利要求17所述的計(jì)算機(jī)系統(tǒng),其中所述規(guī)則組件使用有關(guān)所述實(shí)體的財(cái)務(wù)數(shù)據(jù)對(duì)所述映射賦予權(quán)重,包括基于與所述映射的至少子集相對(duì)應(yīng)的所述財(cái)務(wù)數(shù)據(jù)來(lái)過(guò)采樣所述映射的所述子集。
19.根據(jù)權(quán)利要求15所述的計(jì)算機(jī)系統(tǒng),進(jìn)一步包括: 前端組件,所述前端組件基于所述第二分類(lèi)器已為所述第一內(nèi)容提供者識(shí)別了所述類(lèi)別而向用戶(hù)呈現(xiàn)信息。
20.一種用于將內(nèi)容提供者與類(lèi)別相關(guān)聯(lián)的計(jì)算機(jī)實(shí)現(xiàn)的方法,所述方法包括: 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,將第一內(nèi)容提供者識(shí)別為加入在程序中,在所述程序中所述第一內(nèi)容提供者提供待由至少一個(gè)發(fā)布者發(fā)布的內(nèi)容,其中內(nèi)容分發(fā)系統(tǒng)被配置成:(i)從至少一個(gè)內(nèi)容提供者接收一個(gè)或多個(gè)內(nèi)容部分,(?)至少部分地基于所述至少一個(gè)內(nèi)容提供者屬于多個(gè)類(lèi)別中的哪一個(gè)來(lái)選擇所述一個(gè)或多個(gè)內(nèi)容部分中的至少一個(gè)用于發(fā)布,以及(iii)提供所選擇的所述至少一個(gè)內(nèi)容部分以代表所述至少一個(gè)內(nèi)容提供者用于發(fā)布; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,接收有關(guān)所述第一內(nèi)容提供者的至少一個(gè)關(guān)鍵詞和有關(guān)所述關(guān)鍵詞的至少一個(gè)財(cái)務(wù)值; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,接收多個(gè)類(lèi)別,其中所述第一內(nèi)容提供者待與所述類(lèi)別中的至少一個(gè)相關(guān)聯(lián); 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,基于所述類(lèi)別的名稱(chēng)將所述至少一個(gè)關(guān)鍵詞映射到所述類(lèi)別的子集; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,將所述類(lèi)別的至少所述子集中的每一個(gè)與概率值相關(guān)聯(lián),所述概率值表示所述第一內(nèi)容提供者應(yīng)當(dāng)與相應(yīng)類(lèi)別相關(guān)聯(lián)的可能性,所述概率值使用所述財(cái)務(wù)值被賦予權(quán)重; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,接收所生成的有關(guān)所述多個(gè)類(lèi)別的規(guī)則集,所述規(guī)則集被配置用于在識(shí)別所述類(lèi)別中的一個(gè)時(shí)使用; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,使用所述規(guī)則集來(lái)處理有關(guān)所述第一內(nèi)容提供者的數(shù)據(jù),所述數(shù)據(jù)至少包括:(i )所述類(lèi)別的至少所述子集中的每一個(gè)的所述概率值;(ii )有關(guān)所述第一內(nèi)容提供者的財(cái)務(wù)數(shù)據(jù);(iii)所述第一內(nèi)容提供者與之相關(guān)聯(lián)的地理區(qū)域; 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,基于對(duì)所述數(shù)據(jù)的所述處理為所述第一內(nèi)容提供者選擇所述多個(gè)類(lèi)別中的一個(gè);以及 使用一個(gè)或多個(gè)計(jì)算機(jī)處理器,將所述第一內(nèi)容提供者與所選擇的類(lèi)別相關(guān)聯(lián)。
【文檔編號(hào)】G06Q10/06GK103927615SQ201410119954
【公開(kāi)日】2014年7月16日 申請(qǐng)日期:2009年9月14日 優(yōu)先權(quán)日:2008年9月15日
【發(fā)明者】裴忠順, 伍慶, 崔賢影, 維維克·拉古納坦 申請(qǐng)人:谷歌公司