技術(shù)總結(jié)
一種基于機(jī)器學(xué)習(xí)的專利數(shù)據(jù)處理方法及其處理系統(tǒng),該方法包括:在第一步驟(S1)中,確定用于機(jī)器學(xué)習(xí)的原始專利數(shù)據(jù),其中,原始專利數(shù)據(jù)排除人工干預(yù)的內(nèi)容;在第二步驟(S2)中,機(jī)器學(xué)習(xí)每一篇原始專利數(shù)據(jù)并生成基于機(jī)器理解的特征文件;在第三步驟(S3)中,每一篇原始專利數(shù)據(jù)對(duì)應(yīng)唯一的特征文件,基于特征文件對(duì)原始專利數(shù)據(jù)歸類;在第四步驟(S4)中,建立與原始專利數(shù)據(jù)對(duì)應(yīng)的專利數(shù)據(jù)庫,其中,根據(jù)數(shù)據(jù)處理需求、數(shù)據(jù)處理頻率和/或數(shù)據(jù)處理時(shí)間對(duì)特征文件歸納存儲(chǔ),當(dāng)提出數(shù)據(jù)處理需求時(shí),基于對(duì)專利數(shù)據(jù)庫中的特征文件數(shù)據(jù)處理以映射對(duì)應(yīng)的原始專利數(shù)據(jù)。
技術(shù)研發(fā)人員:楊珊珊
受保護(hù)的技術(shù)使用者:高域(北京)智能科技研究院有限公司
文檔號(hào)碼:201710043497
技術(shù)研發(fā)日:2017.01.19
技術(shù)公布日:2017.05.17