一種廣告投放方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)領(lǐng)域,尤其設(shè)及一種廣告投放方法及裝置。
【背景技術(shù)】
[0002] 品牌廣告主在進(jìn)行廣告投放時,首要關(guān)注的往往是廣告是否達(dá)到一定的展現(xiàn)量, 希望廣告能夠吸引更多的觀看的用戶點(diǎn)擊廣告來進(jìn)一步了解他們的產(chǎn)品,也就是說,在一 定展現(xiàn)量的前提下需要提升廣告的點(diǎn)擊率。一只廣告的點(diǎn)擊率與很多因素有關(guān),除了與廣 告素材本身做得引人入勝等原因外,最重要的因素是運(yùn)支廣告是否正好切中觀看用戶的喜 好與需求。然而,目前視頻網(wǎng)站并不具備捜索引擎那樣能夠獲取用戶直接的需求信息的能 力,造成視頻網(wǎng)站的品牌廣告的點(diǎn)擊率較低,廣告點(diǎn)擊率優(yōu)化工作難W取得長足的進(jìn)步,可 見一種優(yōu)化廣告點(diǎn)擊率的方案有待被提出。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明提供例一種廣告點(diǎn)擊率優(yōu)化方法及裝置,用于解決現(xiàn)有技術(shù)中視頻網(wǎng)站無 法根據(jù)用戶需求投放廣告導(dǎo)致廣告點(diǎn)擊率較低的問題。
[0004] 根據(jù)本發(fā)明的一個方面,提供了一種廣告投放方法,包括:根據(jù)廣告的歷史訪問數(shù) 據(jù)確定用戶對廣告的偏好信息;對偏好信息進(jìn)行特征提??;W提取到的特征數(shù)據(jù)為訓(xùn)練數(shù) 據(jù),按照預(yù)設(shè)的算法模型進(jìn)行訓(xùn)練得到訓(xùn)練模型;使用訓(xùn)練模型對廣告測試數(shù)據(jù)進(jìn)行預(yù)測, 得到廣告的預(yù)測點(diǎn)擊率;根據(jù)預(yù)測點(diǎn)擊率投放廣告。
[0005] 其中,對偏好信息進(jìn)行特征提取包括:提取偏好信息中的發(fā)生點(diǎn)擊或展示廣告時 的上下文環(huán)境信息、廣告的描述信息、點(diǎn)擊或展示廣告的用戶屬性信息W及用戶對廣告的 偏好信息。
[0006] 其中,W提取到的特征數(shù)據(jù)為訓(xùn)練數(shù)據(jù),按照預(yù)設(shè)的算法模型進(jìn)行訓(xùn)練得到訓(xùn)練 模型包括:使用邏輯回歸模型和/或樹模型算法對訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,得到訓(xùn)練模型。
[0007] 其中,使用邏輯回歸模型和/或樹模型算法對訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,得到訓(xùn)練模型包 括:在僅使用邏輯回歸模型的情況下,使用邏輯回歸模型在訓(xùn)練數(shù)據(jù)的向量空間中計算每 一個特征維度的權(quán)重值,針對廣告的點(diǎn)擊日志或展示日志中的每一條記錄計算權(quán)重值與對 應(yīng)特征值的加權(quán)和,再將加權(quán)和代入邏輯回歸函數(shù);在僅適用樹模型的情況下,使用一個樹 對訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練,逐漸加入新的樹對上一次訓(xùn)練得到的模型進(jìn)行增強(qiáng),得到訓(xùn)練模型; 在同時使用邏輯回歸模型W及樹模型的情況下,使用樹模型對廣告的點(diǎn)擊日志或展示日志 中的每條記錄進(jìn)行分區(qū),得到新的特征集合,使用邏輯回歸模型對新的特征集合進(jìn)行訓(xùn)練。
[0008] 其中,根據(jù)廣告的歷史訪問數(shù)據(jù)確定用戶對廣告的偏好信息包括:對廣告的點(diǎn)擊 日志或展示日志對儲存在用戶本地終端上的數(shù)據(jù)、會話標(biāo)識ID、廣告ID進(jìn)行整合;通過廣告 的點(diǎn)擊日志或展示日志中的廣告素材ID與廣告素材信息庫進(jìn)行整合得到廣告素材的行業(yè) 描述信息;通過廣告的點(diǎn)擊日志或展示日志里的儲存在用戶本地終端上的數(shù)據(jù)與用戶信息 進(jìn)行連接整合得到該用戶的屬性信息與對廣告的偏好信息;對經(jīng)過整合的數(shù)據(jù)進(jìn)行清洗去 掉不合法的儲存在用戶本地終端上的數(shù)據(jù)。
[0009] 進(jìn)一步的,上述方法還包括:在對偏好信息進(jìn)行特征提取之后,如果偏好信息中的 特征為具有有限類別的離散型特征,對離散型特征進(jìn)行離散化編碼;如果偏好數(shù)據(jù)中的特 征為連續(xù)型特征,則根據(jù)預(yù)設(shè)模型算法的類型確定是否對連續(xù)型特征進(jìn)行離散化編碼。
[0010] 其中,根據(jù)預(yù)測點(diǎn)擊率投放廣告包括:在得到廣告的預(yù)測點(diǎn)擊率之后,使用廣告的 驗(yàn)證數(shù)據(jù)確定廣告的最佳點(diǎn)擊率闊值;如果廣告的預(yù)測點(diǎn)擊率大于最佳點(diǎn)擊率闊值,則投 放該廣告,否則放棄投放該廣告。
[0011] 根據(jù)本發(fā)明的另一個方面,提供了一種廣告投放裝置,包括:第一確定模塊,用于 根據(jù)廣告的歷史訪問數(shù)據(jù)確定用戶對廣告的偏好信息;提取模塊,用于對偏好信息進(jìn)行特 征提取;訓(xùn)練模塊,用于W提取到的特征數(shù)據(jù)為訓(xùn)練數(shù)據(jù),按照預(yù)設(shè)的算法模型進(jìn)行訓(xùn)練得 到訓(xùn)練模型;預(yù)測模塊,使用訓(xùn)練模型對廣告測試數(shù)據(jù)進(jìn)行預(yù)測,得到廣告的預(yù)測點(diǎn)擊率; 投放模塊,用于根據(jù)預(yù)測點(diǎn)擊率投放廣告。
[0012] 其中,上述提取模塊具體用于:提取偏好信息中的發(fā)生點(diǎn)擊或展示廣告時的上下 文環(huán)境信息、廣告的描述信息、點(diǎn)擊或展示廣告的用戶屬性信息W及用戶對廣告的偏好信 息。
[0013] 其中,上述訓(xùn)練模塊具體用于:使用邏輯回歸模型和/或樹模型算法對訓(xùn)練數(shù)據(jù)進(jìn) 行訓(xùn)練,得到訓(xùn)練模型。
[0014] 其中,上述訓(xùn)練模塊包括:第一訓(xùn)練單元,用于在僅使用邏輯回歸模型的情況下, 使用邏輯回歸模型在訓(xùn)練數(shù)據(jù)的向量空間中計算每一個特征維度的權(quán)重值,針對廣告的點(diǎn) 擊日志或展示日志中的每一條記錄計算權(quán)重值與對應(yīng)特征值的加權(quán)和,再將加權(quán)和代入邏 輯回歸函數(shù);第二訓(xùn)練單元,用于在僅適用樹模型的情況下,使用一個樹對訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn) 練,逐漸加入新的樹對上一次訓(xùn)練得到的模型進(jìn)行增強(qiáng),得到訓(xùn)練模型;第Ξ訓(xùn)練單元,用 于在同時使用邏輯回歸模型W及樹模型的情況下,使用樹模型對廣告的點(diǎn)擊日志或展示日 志中的每條記錄進(jìn)行分區(qū),得到新的特征集合,使用邏輯回歸模型對新的特征集合進(jìn)行訓(xùn) 練。
[0015] 其中,上述第一確定模塊包括:第一整合單元,用于對廣告的點(diǎn)擊日志或展示日志 對儲存在用戶本地終端上的數(shù)據(jù)、會話標(biāo)識ID、廣告ID進(jìn)行整合;第二整合單元,用于通過 廣告的點(diǎn)擊日志或展示日志中的廣告素材ID與廣告素材信息庫進(jìn)行整合得到廣告素材的 行業(yè)描述信息;第Ξ整合單元,用于通過日志里的儲存在用戶本地終端上的數(shù)據(jù)與用戶信 息進(jìn)行連接整合得到該用戶的屬性信息與對廣告的偏好信息;清洗單元,用于對經(jīng)過整合 的數(shù)據(jù)進(jìn)行清洗去掉不合法的儲存在用戶本地終端上的數(shù)據(jù)。
[0016] 進(jìn)一步的,上述裝置還包括:離散模塊,用于在對偏好信息進(jìn)行特征提取之后,如 果偏好信息中的特征為具有有限類別的離散型特征,對離散型特征進(jìn)行離散化編碼;如果 偏好數(shù)據(jù)中的特征為連續(xù)型特征,則根據(jù)預(yù)設(shè)模型算法的類型確定是否對連續(xù)型特征進(jìn)行 離散化編碼。
[0017] 其中,上述投放模塊包括:確定單元,用于在得到廣告的預(yù)測點(diǎn)擊率之后,使用廣 告的驗(yàn)證數(shù)據(jù)確定廣告的最佳點(diǎn)擊率闊值;投放單元,用于如果廣告的預(yù)測點(diǎn)擊率大于最 佳點(diǎn)擊率闊值,則投放該廣告,否則放棄投放該廣告。
[001引本發(fā)明有益效果如下:
[0019] 本發(fā)明實(shí)施例提供的方案,能夠充分利用視頻網(wǎng)站中被挖掘出的大量用戶信息, 包括用戶屬性信息和用戶對廣告的偏好信息,結(jié)合廣告素材本身的行業(yè)描述來進(jìn)行點(diǎn)擊率 的預(yù)測,預(yù)測出的點(diǎn)擊率可W很好的指導(dǎo)廣告的投放,使得廣告的投放更有針對性,優(yōu)化了 網(wǎng)頁上廣告的點(diǎn)擊率。
【附圖說明】
[0020] 此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本申請的一部分,本發(fā) 明的示意性實(shí)施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中: [0021 ]圖1是本發(fā)明實(shí)施例1提供的廣告投放方法的流程圖;
[0022] 圖2是本發(fā)明實(shí)施例2提供的廣告投放方法的流程圖;
[0023] 圖3是本發(fā)明實(shí)施2中提取到的特征值向量示意圖;
[0024] 圖4是本發(fā)明實(shí)施例3提供的廣告投放裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0025] 為了解決現(xiàn)有技術(shù)中網(wǎng)頁