技術(shù)特征:
技術(shù)總結(jié)
本發(fā)明提供一種基于Mahout的機(jī)器學(xué)習(xí)服務(wù)組裝方法,其特征在于,包括以下步驟:步驟S1:將不同格式的數(shù)據(jù)進(jìn)行預(yù)處理;步驟S2:進(jìn)行模型訓(xùn)練;步驟S3:對(duì)模型進(jìn)行評(píng)估;步驟S4:將算子進(jìn)行統(tǒng)一的封裝;步驟S5:根據(jù)用戶描述的所要使用的機(jī)器學(xué)習(xí)方法以及要進(jìn)行處理的數(shù)據(jù)的格式,組裝機(jī)器學(xué)習(xí)工作流路徑;步驟S6:當(dāng)這些機(jī)器學(xué)習(xí)工作流在通過(guò)Oozie在Hadoop平臺(tái)上運(yùn)行結(jié)束之后,每一條工作流的模型評(píng)估算子將會(huì)給出工作流的評(píng)估結(jié)果;用戶根據(jù)此評(píng)估結(jié)果,選擇機(jī)器學(xué)習(xí)工作流。與現(xiàn)有技術(shù)相比,本發(fā)明能夠快速有效地定制和調(diào)優(yōu)可復(fù)用的機(jī)器學(xué)習(xí)流程,從而能夠高效的在Hadoop平臺(tái)上進(jìn)行數(shù)據(jù)挖掘工作。
技術(shù)研發(fā)人員:郭文忠;黃益成;陳星
受保護(hù)的技術(shù)使用者:福州大學(xué)
技術(shù)研發(fā)日:2016.12.23
技術(shù)公布日:2017.09.15