技術(shù)編號(hào):6635701
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒(méi)有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明公開(kāi)了一種,包括以下步驟利用短文本訓(xùn)練數(shù)據(jù)集進(jìn)行主題建模,抽取主題詞分布;對(duì)主題詞分布進(jìn)行重排序;構(gòu)建候選關(guān)鍵詞詞典和主題-關(guān)鍵詞語(yǔ)義圖譜;基于鏈接分析的方法計(jì)算候選關(guān)鍵詞和種子關(guān)鍵詞的綜合相似度評(píng)價(jià),選擇最相似的候選關(guān)鍵詞完成對(duì)短文本的擴(kuò)展。本發(fā)明方法較基于語(yǔ)言模型的短文本特征表示方法操作簡(jiǎn)單,執(zhí)行效率高,而且充分利用關(guān)鍵詞之間的語(yǔ)義關(guān)聯(lián)信息,較傳統(tǒng)的基于詞袋模型的短文本特征表示方法,有效緩解了數(shù)據(jù)稀疏性問(wèn)題和語(yǔ)義敏感性問(wèn)題,不依賴于外部大規(guī)模輔助...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒(méi)有源代碼,用于學(xué)習(xí)研究技術(shù)思路。