本公開總體涉及計算機領域,并且更具體地,涉及用于內容處理的方法、裝置、電子設備和介質。
背景技術:
1、在數(shù)字化時代,信息分發(fā)已經(jīng)變得越來越重要,然而由于信息非常龐雜,其中充斥非常多同質化的低質量內容,需要在將信息分發(fā)到用戶之前篩選出其中的同質化的低質量內容。內容處理是進行同質化的低質量內容篩選的重要方式,在信息被分發(fā)之前,內容處理根據(jù)信息的內容對于信息進行篩選,以保證大部分同質化的低質量內容能夠被篩選出來。
2、同時,根據(jù)相關統(tǒng)計數(shù)據(jù)及用戶習慣,信息分發(fā)易出現(xiàn)集中性的分布變化,該現(xiàn)象在節(jié)假日時期或相關熱點出現(xiàn)時會更為明顯,導致出現(xiàn)大量同質化的低質量內容,極大影響用戶體驗。如何批量快速地對同質化的低質量內容進行處理,為用戶維護高質量多樣化的空間成為了迫切的需求。
技術實現(xiàn)思路
1、本公開的實施例提供了一種用于內容處理的方法、裝置、電子設備和介質,通過獲取與待發(fā)布內容相關聯(lián)的多個相關內容的發(fā)布狀態(tài),來確定待發(fā)布內容的發(fā)布狀態(tài),能夠提升鑒別低質量內容的效果,降低低質量內容的漏放和正向有益內容的誤判斷,篩選出同質化的低質量內容,從而提升用戶使用體驗。
2、在本公開的第一方面中,提供了一種用于內容處理的方法。該方法包括獲取待發(fā)布內容,待發(fā)布內容包括文本、圖像、或視頻中的至少一項。該方法還包括基于待發(fā)布內容的內容特征,獲取與待發(fā)布內容相關聯(lián)的多個相關內容。此外,該方法還包括基于多個相關內容的發(fā)布狀態(tài),確定待發(fā)布內容的發(fā)布狀態(tài)。
3、在本公開的第二方面中,提供了一種用于內容處理的裝置。該裝置包括發(fā)布內容獲取模塊,被配置為獲取待發(fā)布內容,待發(fā)布內容包括文本、圖像、或視頻中的至少一項。該裝置還包括相關內容獲取模塊,被配置為基于待發(fā)布內容的內容特征,獲取與待發(fā)布內容相關聯(lián)的多個相關內容。此外,該裝置還包括發(fā)布狀態(tài)確定模塊,被配置為基于多個相關內容的發(fā)布狀態(tài),確定待發(fā)布內容的發(fā)布狀態(tài)。
4、在本公開的第三方面中,提供了一種電子設備。該電子設備包括一個或多個處理器;以及存儲裝置,用于存儲一個或多個程序,當一個或多個程序被一個或多個處理器執(zhí)行,使得一個或多個處理器實現(xiàn)一種用于內容處理的方法。該方法包括獲取待發(fā)布內容,待發(fā)布內容包括文本、圖像、或視頻中的至少一項。該方法還包括基于待發(fā)布內容的內容特征,獲取與待發(fā)布內容相關聯(lián)的多個相關內容。此外,該方法還包括基于多個相關內容的發(fā)布狀態(tài),確定待發(fā)布內容的發(fā)布狀態(tài)。
5、在本公開的第四方面中,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執(zhí)行時實現(xiàn)一種用于內容處理的方法。該方法包括獲取用戶歷史交互的對象序列,該對象序列按交互時間排序。該方法包括獲取待發(fā)布內容,待發(fā)布內容包括文本、圖像、或視頻中的至少一項。該方法還包括基于待發(fā)布內容的內容特征,獲取與待發(fā)布內容相關聯(lián)的多個相關內容。此外,該方法還包括基于多個相關內容的發(fā)布狀態(tài),確定待發(fā)布內容的發(fā)布狀態(tài)。
6、提供
技術實現(xiàn)要素:
部分是為了以簡化的形式來介紹對概念的選擇,它們在下文的具體實施方式中將被進一步描述。發(fā)明內容部分無意標識要求保護的主題的關鍵特征或主要特征,也無意限制要求保護的主題的范圍。
1.一種用于內容處理的方法,包括:
2.根據(jù)權利要求1所述的方法,其中獲取與所述待發(fā)布內容相關聯(lián)的所述多個相關內容包括:
3.根據(jù)權利要求1所述的方法,其中確定所述待發(fā)布內容的所述發(fā)布狀態(tài)包括:
4.根據(jù)權利要求3所述的方法,其中確定所述待發(fā)布內容的所述發(fā)布狀態(tài)還包括:
5.根據(jù)權利要求4所述的方法,其中確定所述待發(fā)布內容的所述發(fā)布狀態(tài)還包括:
6.根據(jù)權利要求4所述的方法,其中確定所述待發(fā)布內容的所述統(tǒng)計特征包括:
7.根據(jù)權利要求6所述的方法,其中確定所述待發(fā)布內容的所述發(fā)布狀態(tài)包括:
8.根據(jù)權利要求7所述的方法,其中確定所述待發(fā)布內容的所述聚類特征包括:
9.根據(jù)權利要求8所述的方法,其中基于所述待發(fā)布內容的所述聚類特征確定所述待發(fā)布內容的所述發(fā)布狀態(tài)包括:
10.根據(jù)權利要求9所述的方法,其中確定所述待發(fā)布內容的所述發(fā)布狀態(tài)包括:
11.根據(jù)權利要求7所述的方法,還包括:
12.根據(jù)權利要求11所述的方法,其中訓練所述機器學習模型包括:
13.根據(jù)權利要求8所述的方法,還包括:
14.根據(jù)權利要求13所述的方法,其中更新所述聚類查詢表包括:
15.一種用于內容處理的裝置,包括:
16.一種電子設備,包括:
17.一種計算機可讀存儲介質,其上存儲有計算機可執(zhí)行指令,其中所述計算機可執(zhí)行指令被處理器執(zhí)行以實現(xiàn)根據(jù)權利要求1至14中任一項所述的方法。