1.一種用于非結(jié)構(gòu)化文檔搜索的方法,其特征在于,包括:
獲取非結(jié)構(gòu)化文檔;
解析所述非結(jié)構(gòu)化文檔,以提取所述非結(jié)構(gòu)化文檔的元數(shù)據(jù)和內(nèi)容;以及
將所述元數(shù)據(jù)和所述內(nèi)容遠(yuǎn)程上傳至索引服務(wù)器。
2.如權(quán)利要求1所述的方法,其特征在于,解析所述非結(jié)構(gòu)化文檔,包括:
確定所述非結(jié)構(gòu)化文檔待索引的域,以及所述域的權(quán)重;
生成自適應(yīng)的索引結(jié)構(gòu);以及
根據(jù)Mapping結(jié)構(gòu)解析所述非結(jié)構(gòu)化文檔。
3.如權(quán)利要求2所述的方法,其特征在于,生成自適應(yīng)的索引結(jié)構(gòu),包括:
根據(jù)所述非結(jié)構(gòu)化文檔的規(guī)模,生成自適應(yīng)的所述索引結(jié)構(gòu)。
4.如權(quán)利要求2所述的方法,其特征在于,還包括:
確定所述非結(jié)構(gòu)化文檔的所述Mapping結(jié)構(gòu)。
5.如權(quán)利要求1所述的方法,其特征在于,還包括:
發(fā)送搜索請求,所述搜索請求包括:確定域搜索請求、不確定域搜索請求。
6.一種用于非結(jié)構(gòu)化文檔搜索的方法,其特征在于,包括:
初始化服務(wù)器;
獲取非結(jié)構(gòu)化文檔的元數(shù)據(jù)和內(nèi)容;以及
儲存和/或索引所述非結(jié)構(gòu)化文檔的所述元數(shù)據(jù)和所述內(nèi)容。
7.如權(quán)利要求6所述的方法,其特征在于,初始化服務(wù)器,包括:
部署數(shù)據(jù)庫集群和索引集群;
初始化數(shù)據(jù)庫表結(jié)構(gòu);以及
初始化索引結(jié)構(gòu)。
8.如權(quán)利要求6所述的方法,其特征在于,初始化服務(wù)器,還包括:
部署分布式文件系統(tǒng)。
9.如權(quán)利要求7所述的方法,其特征在于,所述索引集群,包括:
Elasticsearch索引服務(wù)器。
10.如權(quán)利要求7所述的方法,其特征在于,所述索引結(jié)構(gòu),包括:
Mapping結(jié)構(gòu)。
11.如權(quán)利要求6所述的方法,其特征在于,所述服務(wù)器,包括:
文件服務(wù)器、數(shù)據(jù)庫服務(wù)器以及索引服務(wù)器。
12.如權(quán)利要求11所述的方法,其特征在于,包括:
所述文件服務(wù)器與所述數(shù)據(jù)庫服務(wù)器、所述索引服務(wù)器通信,存儲和/或索引所述非結(jié)構(gòu)化文檔。
13.如權(quán)利要求6所述的方法,其特征在于,還包括:
接收搜索請求,并提供搜索結(jié)果,所述搜索請求包括:確定域搜索請求、不確定域搜索請求。
14.一種用于非結(jié)構(gòu)化文檔搜索的裝置,其特征在于,包括:
第一接收模塊,用于獲取非結(jié)構(gòu)化文檔;
解析模塊,用于解析所述非結(jié)構(gòu)化文檔,以提取所述非結(jié)構(gòu)化文檔的元數(shù)據(jù)和內(nèi)容;以及
上傳模塊,用于將所述元數(shù)據(jù)和所述內(nèi)容遠(yuǎn)程上傳至索引服務(wù)器。
15.如權(quán)利要求14所述的裝置,其特征在于,所述解析模塊,包括:
確定域子模塊,用于確定所述非結(jié)構(gòu)化文檔待索引的域,以及所述域的權(quán)重;
結(jié)構(gòu)子模塊,用于生成自適應(yīng)的索引結(jié)構(gòu);以及
解析子模塊,用于根據(jù)Mapping結(jié)構(gòu)解析所述非結(jié)構(gòu)化文檔。
16.一種用于非結(jié)構(gòu)化文檔搜索的裝置,其特征在于,包括:
初始化模塊,用于初始化服務(wù)器;
第二接收模塊,用于獲取非結(jié)構(gòu)化文檔的元數(shù)據(jù)和內(nèi)容;以及
索引模塊,用于儲存和/或索引所述非結(jié)構(gòu)化文檔的所述元數(shù)據(jù)和所述內(nèi)容。