本公開涉及計(jì)算機(jī),尤其涉及一種內(nèi)容推薦方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、對(duì)內(nèi)容進(jìn)行推薦時(shí)可以通過點(diǎn)擊率、觀看時(shí)長(zhǎng)進(jìn)行推薦。相關(guān)技術(shù)中,對(duì)樣本數(shù)據(jù)中的噪音數(shù)據(jù)可以通過人工確定的固定閾值進(jìn)行截?cái)嗷虿捎闷骄^看時(shí)長(zhǎng)進(jìn)行替換的修改方式進(jìn)行處理,但是這種方式?jīng)]有顧及內(nèi)容自身以及不同用戶自身導(dǎo)致的差異,導(dǎo)致訓(xùn)練的針對(duì)觀看時(shí)長(zhǎng)的內(nèi)容推薦模型的準(zhǔn)確性較低,進(jìn)而導(dǎo)致內(nèi)容推薦的準(zhǔn)確性較低。
技術(shù)實(shí)現(xiàn)思路
1、為了解決上述技術(shù)問題,本公開提供了一種內(nèi)容推薦方法、裝置、設(shè)備及介質(zhì)。
2、本公開實(shí)施例提供了一種內(nèi)容推薦方法,所述方法包括:
3、獲取樣本數(shù)據(jù)集,其中,所述樣本數(shù)據(jù)集包括多個(gè)樣本數(shù)據(jù),每個(gè)所述樣本數(shù)據(jù)包括一個(gè)內(nèi)容及其對(duì)應(yīng)的觀看時(shí)長(zhǎng)標(biāo)簽;
4、確定所述樣本數(shù)據(jù)集中各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng);
5、基于各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)、觀看時(shí)長(zhǎng)標(biāo)簽以及置信區(qū)間參數(shù),對(duì)所述樣本數(shù)據(jù)集中的噪音數(shù)據(jù)進(jìn)行糾正處理,得到目標(biāo)數(shù)據(jù)集;
6、基于所述目標(biāo)數(shù)據(jù)集訓(xùn)練得到觀看時(shí)長(zhǎng)模型,并基于所述觀看時(shí)長(zhǎng)模型在多個(gè)內(nèi)容中確定推薦內(nèi)容。
7、本公開實(shí)施例還提供了一種內(nèi)容推薦裝置,所述裝置包括:
8、獲取模塊,用于獲取樣本數(shù)據(jù)集,其中,所述樣本數(shù)據(jù)集包括多個(gè)樣本數(shù)據(jù),每個(gè)所述樣本數(shù)據(jù)包括一個(gè)內(nèi)容及其對(duì)應(yīng)的觀看時(shí)長(zhǎng)標(biāo)簽;
9、標(biāo)準(zhǔn)模塊,用于確定所述樣本數(shù)據(jù)集中各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng);
10、樣本糾正模塊,用于基于各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)、觀看時(shí)長(zhǎng)標(biāo)簽以及置信區(qū)間參數(shù),對(duì)所述樣本數(shù)據(jù)集中的噪音數(shù)據(jù)進(jìn)行糾正處理,得到目標(biāo)數(shù)據(jù)集;
11、模型模塊,用于基于所述目標(biāo)數(shù)據(jù)集訓(xùn)練得到觀看時(shí)長(zhǎng)模型,并基于所述觀看時(shí)長(zhǎng)模型在多個(gè)內(nèi)容中確定推薦內(nèi)容。
12、本公開實(shí)施例還提供了一種電子設(shè)備,所述電子設(shè)備包括:處理器;用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;所述處理器,用于從所述存儲(chǔ)器中讀取所述可執(zhí)行指令,并執(zhí)行所述指令以實(shí)現(xiàn)如本公開實(shí)施例提供的內(nèi)容推薦方法。
13、本公開實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行如本公開實(shí)施例提供的內(nèi)容推薦方法。
14、本公開實(shí)施例提供的技術(shù)方案與現(xiàn)有技術(shù)相比具有如下優(yōu)點(diǎn):本公開實(shí)施例提供的內(nèi)容推薦方案,獲取樣本數(shù)據(jù)集,其中,樣本數(shù)據(jù)集包括多個(gè)樣本數(shù)據(jù),每個(gè)樣本數(shù)據(jù)包括一個(gè)內(nèi)容及其對(duì)應(yīng)的觀看時(shí)長(zhǎng)標(biāo)簽;確定樣本數(shù)據(jù)集中各樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng);基于各樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)、觀看時(shí)長(zhǎng)標(biāo)簽以及置信區(qū)間參數(shù),對(duì)樣本數(shù)據(jù)集中的噪音數(shù)據(jù)進(jìn)行糾正處理,得到目標(biāo)數(shù)據(jù)集;基于目標(biāo)數(shù)據(jù)集訓(xùn)練得到觀看時(shí)長(zhǎng)模型,并基于觀看時(shí)長(zhǎng)模型在多個(gè)內(nèi)容中確定推薦內(nèi)容。采用上述技術(shù)方案,對(duì)樣本數(shù)據(jù)中的各樣本數(shù)據(jù)可以先確定標(biāo)準(zhǔn)觀看時(shí)長(zhǎng),之后可以根據(jù)各樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)、觀看時(shí)長(zhǎng)標(biāo)簽以及預(yù)設(shè)的置信區(qū)間參數(shù),利用統(tǒng)計(jì)方式對(duì)其中的噪音數(shù)據(jù)進(jìn)行糾正處理,利用糾正處理后的目標(biāo)數(shù)據(jù)集進(jìn)行模型訓(xùn)練得到觀看時(shí)長(zhǎng)模型,基于觀看時(shí)長(zhǎng)模型進(jìn)行推薦內(nèi)容的確定,實(shí)現(xiàn)了基于定義的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)和正態(tài)分布的置信區(qū)間參數(shù)統(tǒng)計(jì)方式對(duì)噪音數(shù)據(jù)進(jìn)行糾正,這種糾正噪音數(shù)據(jù)的方式顧及了內(nèi)容自身的差異以及不同用戶群體的差異,能夠更加有效表達(dá)噪音數(shù)據(jù)的觀看時(shí)長(zhǎng),進(jìn)而利用糾正后的樣本數(shù)據(jù)訓(xùn)練模型能夠更好地優(yōu)化噪音帶來的模型預(yù)估偏差問題,提升模型的準(zhǔn)確性,進(jìn)而有效提升基于該模型的內(nèi)容推薦的準(zhǔn)確性。
1.一種內(nèi)容推薦方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,確定所述樣本數(shù)據(jù)集中各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng),包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述第二樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)與所述文本長(zhǎng)度、所述圖像數(shù)量正相關(guān)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,基于各所述樣本數(shù)據(jù)的標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)、觀看時(shí)長(zhǎng)標(biāo)簽以及置信區(qū)間參數(shù),對(duì)所述樣本數(shù)據(jù)集中的噪音數(shù)據(jù)進(jìn)行糾正處理,得到目標(biāo)數(shù)據(jù)集,包括:
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,根據(jù)多個(gè)所述標(biāo)準(zhǔn)觀看時(shí)長(zhǎng)將所述樣本數(shù)據(jù)集劃分為多個(gè)樣本集合,包括:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,確定各所述樣本集合的觀看時(shí)長(zhǎng)標(biāo)簽的預(yù)設(shè)統(tǒng)計(jì)參數(shù),包括:
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,針對(duì)每個(gè)所述樣本集合,基于該樣本集合的預(yù)設(shè)統(tǒng)計(jì)參數(shù)和置信區(qū)間參數(shù)提取并糾正噪音數(shù)據(jù),得到糾正后的樣本集合,包括:
8.根據(jù)權(quán)利要求1-7中任一所述的方法,其特征在于,所述置信區(qū)間參數(shù)表征所述樣本數(shù)據(jù)集的觀看時(shí)長(zhǎng)標(biāo)簽的正態(tài)分布的置信區(qū)間,所述置信區(qū)間參數(shù)越大,所述置信區(qū)間越大。
9.一種內(nèi)容推薦裝置,其特征在于,包括:
10.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
11.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行上述權(quán)利要求1-8中任一所述的內(nèi)容推薦方法。