專利名稱:一種垂直搜索的查詢方法、系統(tǒng)和裝置的制作方法
技術(shù)領(lǐng)域:
本申請涉及網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是涉及一種垂直搜索的查詢方法、系統(tǒng)和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的日益發(fā)展,互聯(lián)網(wǎng)上存儲的信息量日趨龐大。當(dāng)人們需要獲取某方 面的專用信息時,通過搜索引擎進(jìn)行搜索。但由于互聯(lián)網(wǎng)上的信息量過大,采用通用搜索方 式獲取的搜索結(jié)果缺乏準(zhǔn)確性,于是垂直搜索方式得到了快速的發(fā)展。垂直搜索是針對某 一個行業(yè)的專業(yè)搜索引擎,是搜索引擎的細(xì)分和延伸,是對網(wǎng)頁庫中的某類專門的信息進(jìn) 行一次整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后再以某種形式返回給用戶。相對通 用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等提出來的新的搜索引擎服務(wù)模式,通過針 對某一特定領(lǐng)域、某一特定人群或某一特定需求提供的有一定價值的信息和相關(guān)服務(wù)。其 特點就是“專、精、深”,且具有行業(yè)色彩,相比較通用搜索引擎的海量信息無序化,垂直搜索 弓I擎則顯得更加專注、具體和深入。垂直搜索引擎的應(yīng)用方向很多,比如企業(yè)庫搜索、供求信息搜索引擎、購物搜索、 房產(chǎn)搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索等,幾乎各行各業(yè)各類信息都可以進(jìn)一 步細(xì)化成各類的垂直搜索引擎。當(dāng)垂直搜索用于購物搜索時,用戶在B2C (Business to Customer,企業(yè)對消費者 購物模式)或C2C(C0nsumer to Customer,消費者對消費者購物模式)購物網(wǎng)站輸入查詢 詞購物,通常會返回兩部分的結(jié)果1.商品分類的導(dǎo)航信息,2.與查詢相關(guān)的搜索結(jié)果。導(dǎo) 航的商品分類名稱依據(jù)樹的結(jié)構(gòu)組織起來,方便用戶沿樹結(jié)構(gòu)的路徑自上而下通過商品分 類的信息的定位到更準(zhǔn)確的搜索結(jié)果。商品類目樹結(jié)構(gòu)保存在數(shù)據(jù)庫相對應(yīng)的數(shù)據(jù)表,數(shù)據(jù)的輸入與維護(hù)需要人工進(jìn) 行,在B2C或C2C網(wǎng)站中每一個商品的展示都必須屬于該商品類目樹的某一個節(jié)點或多個 節(jié)點。當(dāng)前的電子商務(wù)網(wǎng)站往往商品數(shù)量過于龐大,導(dǎo)致商品分類過多。在上億規(guī)模的 商品數(shù)量上,商品類目樹通常會接近一萬個節(jié)點,每一層級的類目節(jié)點數(shù)量往往會多達(dá)幾 十個。在用戶查詢時,顯示給用戶的商品分類信息過多,并且無法告訴用戶這些商品類目哪 些對用戶的查詢更重要。對該問題,目前主流的解決方式是當(dāng)用戶查詢時,逐個統(tǒng)計每個類 目下的返回結(jié)果數(shù)量。然后把這些商品類目依據(jù)商品數(shù)量按照從大到小進(jìn)行排序,并且設(shè) 置一定的閥值。把商品數(shù)低于這個閥值的類目隱藏起來。達(dá)到減少分類數(shù)量的目的。在實現(xiàn)本申請的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在如下問題(1)顯示的類目與用戶的查詢相關(guān)性很低。(2)商品分類之間沒有機制決定哪個商品類目更重要。(3)對于商品的類目顯示的數(shù)量僅僅用閥值控制會把相關(guān)性高的類目隱藏起來。
發(fā)明內(nèi)容
本申請實施例提供一種垂直搜索的查詢方法、系統(tǒng)和裝置,用于提高查詢結(jié)果與 用戶查詢的相關(guān)性。本申請實施例提供一種垂直搜索的查詢方法,應(yīng)用于包括查詢服務(wù)器、分析服務(wù) 器和日志服務(wù)器的系統(tǒng)中,其特征在于,包括查詢服務(wù)器獲取用戶的查詢信息;所述查詢服務(wù)器根據(jù)所述查詢信息在所述商品類目服務(wù)器的查詢字典中獲取查詢 結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及其對應(yīng)的權(quán)重;所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并 將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用戶查看的 商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng) 計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查 詢。其中,在所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行 排序之前,還包括設(shè)定一權(quán)重閾值,將所述查詢結(jié)果中的權(quán)重大于所述權(quán)重閾值的子商品 類目按照其對應(yīng)的權(quán)重進(jìn)行排序。其中,所述查詢服務(wù)器獲取用戶的查詢信息之前,還包括前端服務(wù)器獲取用戶的查詢信息,所述查詢信息包括所述用戶的查詢詞和商品類 目;所述前端服務(wù)器對所述查詢詞進(jìn)行歸一化處理和獲取商品類目對應(yīng)的商品ID ;所述前端服務(wù)器將經(jīng)歸一化處理的所述查詢詞和所述商品類目ID轉(zhuǎn)發(fā)給所述商 品類目服務(wù)器。其中,其特征在于,所述日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志之前,還 包括獲取前端服務(wù)器轉(zhuǎn)發(fā)的所述用戶的查詢信息;分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商 品類目服務(wù)器的查詢字典,用于后續(xù)的查詢具體包括接收所述日志服務(wù)器定時發(fā)送的預(yù)設(shè)時間內(nèi)的日志;根據(jù)預(yù)設(shè)時間內(nèi)的所述日志進(jìn)行統(tǒng)計分析,獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié) 果為所述用戶查看的商品類目以及對應(yīng)的權(quán)重;所述權(quán)重包括所述用戶查看的商品類目對 應(yīng)的點擊次數(shù)以及在同級商品類目中對應(yīng)的點擊概率;根據(jù)商品類目樹,將所述統(tǒng)計分析結(jié)果生成查詢文件;將所述查詢文件發(fā)送給所述查詢服務(wù)器,以使所述查詢服務(wù)器根據(jù)所述查詢文件 更新所述商品類目服務(wù)器的查詢字典,用戶后續(xù)的查詢。其中,所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排 序,并將排序結(jié)果發(fā)送給所述用戶之前,還包括所述查詢服務(wù)器對所述查詢結(jié)果進(jìn)行拼接,所述拼接包括獲取所述查詢結(jié)果中所 述商品類目ID對應(yīng)的商品類目。6
本申請實施例提供一種垂直搜索的查詢系統(tǒng),其特征在于,包括查詢服務(wù)器,用于獲取用戶的查詢信息;根據(jù)所述查詢信息在所述商品類目服務(wù) 器的查詢字典獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商 品類目及其對應(yīng)的權(quán)重;將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并 將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看;獲取分析服務(wù)器發(fā)送的統(tǒng)計分析結(jié)果, 根據(jù)所述統(tǒng)計分析結(jié)果更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢;日志服務(wù)器,用于根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將 所述日志發(fā)送給所述分析服務(wù)器。分析服務(wù)器,用于接收所述日志服務(wù)器發(fā)送的所述日志;對所述日志進(jìn)行統(tǒng)計分 析獲取所述統(tǒng)計分析結(jié)果;將所述統(tǒng)計分析結(jié)發(fā)送給所述查詢服務(wù)器。其中,所述查詢信息包括查詢詞和商品類目,所述日志服務(wù)器包括獲取模塊,用于獲取前端服務(wù)器轉(zhuǎn)發(fā)的用戶的查詢信息;生成模塊,用于根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志;發(fā)送模塊,用于將所述生成模塊生成的所述日志發(fā)送給所述分析服務(wù)器進(jìn)行統(tǒng)計 分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用 于后續(xù)的查詢。其中,所述分析服務(wù)器包括接收模塊,用于接收所述日志服務(wù)器發(fā)送的日志;統(tǒng)計分析模塊,用于對所述接收模塊接收的所述日志進(jìn)行統(tǒng)計分析,獲取統(tǒng)計分 析結(jié)果;發(fā)送模塊,用于將所述統(tǒng)計分析模塊獲取的所述統(tǒng)計分析結(jié)果發(fā)送給查詢服務(wù) 器,使所述查詢服務(wù)器更新所述查詢服務(wù)器的查詢字典,用于后續(xù)的查詢。其中,所述統(tǒng)計分析模塊包括統(tǒng)計分析子模塊,用于根據(jù)預(yù)設(shè)時間內(nèi)的所述獲取模塊獲取的所述日志進(jìn)行統(tǒng)計 分析,獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果為所述用戶查看的商品類目以及對應(yīng)的權(quán)重; 所述權(quán)重包括所述用戶查看的商品類目對應(yīng)的點擊次數(shù)以及在同級商品類目中對應(yīng)的點 擊概率;生成子模塊用于根據(jù)商品類目樹,將所述統(tǒng)計分析子模塊獲取的所述統(tǒng)計分析 結(jié)果生成查詢文件。本申請實施例提供一種服務(wù)器,作為查詢服務(wù)器,應(yīng)用于包括查詢服務(wù)器、分析服 務(wù)器和日志服務(wù)器的系統(tǒng)中,其特征在于,包括獲取模塊,用于獲取用戶的查詢信息;查詢模塊,用于根據(jù)所述獲取模塊獲取的所述查詢信息在所述商品類目服務(wù)器的 查詢字典獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類 目及其對應(yīng)的權(quán)重;發(fā)送模塊,用于將所述查詢模塊獲取的所述查詢結(jié)果中的子商品類目按照其對應(yīng) 的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根 據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn) 行統(tǒng)計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢;更新模塊,用于根據(jù)所述獲取模塊獲取的統(tǒng)計分析結(jié)果更新所述商品類目服務(wù)器 的查詢字典,并將所述更新后的查詢字典發(fā)送到所述查詢模塊,用于后續(xù)的查詢。其中,所述發(fā)送模塊還用于設(shè)定一權(quán)重閾值,將所述查詢結(jié)果中的權(quán)重大于所述 權(quán)重閾值的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序。其中,所述查詢信息包括經(jīng)歸一化處理的所述查詢詞和所述商品類目對應(yīng)的商品 類目ID;還包括拼接模塊,用于對所述查詢結(jié)果進(jìn)行拼接,所述拼接包括獲取所述查詢結(jié) 果中所述商品類目ID對應(yīng)的商品類目。本申請通過根據(jù)用戶點擊記錄返回用戶的查詢結(jié)果,提高了查詢結(jié)果與用戶查詢 的相關(guān)性。當(dāng)然,實施本申請的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所有優(yōu)點。
為了更清楚地說明本申請或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對本申請或現(xiàn)有技術(shù) 描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本申請的 一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這 些附圖獲得其他的附圖。圖1為本申請實施例中一種垂直搜索的查詢方法的流程圖;圖2為本申請實施例中一種垂直搜索的查詢方法的交互圖;圖3為本申請實施例中一種垂直搜索的查詢方法的交互圖;圖4為本申請實施例中一種垂直搜索的查詢方法的流程圖;圖5為本申請實施例中根據(jù)點擊查看的商品類目生成的點擊類目樹;圖6為本申請實施例中根據(jù)點擊查看的商品類目以及次數(shù)生成的點擊類目樹;圖7為本申請實施例中一種垂直搜索的查詢方法的流程圖;圖8為本申請實施例中一種垂直搜索的查詢方法的流程圖;圖9為本申請實施例中一種日志服務(wù)器的結(jié)構(gòu)示意圖;圖10為本申請實施例中一種分析服務(wù)器的結(jié)構(gòu)示意圖;圖11為本申請實施例中一種分析服務(wù)器的結(jié)構(gòu)示意圖;圖12為本申請實施例中一種查詢服務(wù)器的結(jié)構(gòu)示意圖;圖13為本申請實施例中一種查詢服務(wù)器的結(jié)構(gòu)示意圖。
具體實施例方式本申請實施例提出查詢服務(wù)器獲取用戶的查詢信息;所述查詢服務(wù)器根據(jù)所述 查詢信息在所述商品類目服務(wù)器的查詢字典中獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢 信息相匹配的商品類目下的子商品類目及其對應(yīng)的權(quán)重;所述查詢服務(wù)器將所述查詢結(jié)果 中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶 進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將 所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新 所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢。
下面將結(jié)合本申請中的附圖,對本申請中的技術(shù)方案進(jìn)行清楚、完整的描述,顯 然,所描述的實施例是本申請的一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤?例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬 于本申請保護(hù)的范圍。如背景技術(shù)所述,垂直搜索引擎的應(yīng)用方向很多,比如企業(yè)庫搜索、供求信息搜索 引擎、購物搜索、房產(chǎn)搜索、人才搜索、地圖搜索、mp3搜索、圖片搜索。舉個例子來說明會更 容易理解,比如購物搜索引擎,整體流程大致如下根據(jù)用戶的搜索要求,抓取網(wǎng)頁后,對網(wǎng)頁商品信息進(jìn)行抽取,抽取出商品名稱、價格、簡介......甚至可以進(jìn)一步將筆記本簡介細(xì)分成“品牌、型號、CPU、內(nèi)存、硬盤、顯示屏.......”,并將搜索結(jié)果返回給用戶。為了根據(jù)用戶的搜索要求,提高返回信息與用于所要搜索的信息的相關(guān)性,本申請?zhí)岢隽艘环N垂 直搜索的查詢方法。本申請實施例提供一種垂直搜索的查詢方法,如圖1所示,包括以下步驟步驟101、查詢服務(wù)器獲取用戶的查詢信息。其中,所述查詢信息可以包括所述用戶輸入的查詢詞和用戶輸入或選擇的商品類目。步驟102、所述查詢服務(wù)器根據(jù)所述查詢信息在所述商品類目服務(wù)器的查詢字典 中獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及其 對應(yīng)的權(quán)重。步驟103、所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn) 行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用 戶查看的商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計分 析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于 后續(xù)的查詢。其中,在所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行 排序之前,還可以設(shè)定一權(quán)重閾值,將所述查詢結(jié)果中的權(quán)重大于所述權(quán)重閾值的子商品 類目按照其對應(yīng)的權(quán)重進(jìn)行排序。通過查詢信息在查詢詞典中查詢獲得相匹配的商品類 目,可以對該商品類目下的所有子商品類目按照權(quán)重進(jìn)行排序,也可只對部分子商品類目 按照權(quán)重進(jìn)行排序。當(dāng)對部分子商品類目按照權(quán)重進(jìn)行排序時,可以預(yù)先設(shè)定一權(quán)重閾值, 僅選取查詢結(jié)果中的權(quán)重大于該權(quán)重閾值的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序。通過 對部分子商品類目進(jìn)行排序,并把排序結(jié)果發(fā)送給用戶可以減少排序的計算量,提高排序 的計算速度。本申請實施例中提供的一種垂直搜索的查詢方法,如圖2所示,其中,查詢服務(wù)器 具體為商品類目查詢服務(wù)器,分析服務(wù)器具體為分布式文件存儲及并行運算平臺,如圖3 所示,具體包括以下步驟(1)前端服務(wù)器接收用戶輸入的查詢信息,查詢信息中包括查詢詞和商品類目, 前端服務(wù)器將該查詢詞轉(zhuǎn)發(fā)給日志查詢服務(wù)器,用于后續(xù)根據(jù)該次查詢生成日志;將該查 詢信息轉(zhuǎn)發(fā)給商品類目查詢服務(wù)器,用于在商品類目查詢服務(wù)器中根據(jù)該查詢信息進(jìn)行查 詢,并將查詢結(jié)果返回給用戶,以供用戶點擊查看。(2)用戶在前端服務(wù)器根據(jù)自己的需要對商品類目以及商品進(jìn)行點擊查看,此時,每一個點擊查看動作均會由日志服務(wù)器生成對應(yīng)的一條日志記錄,該日志有用戶點擊查看 的商品以及該商品所屬的商品類目。一段時間后,日志服務(wù)器將該段時間內(nèi)所有的日志導(dǎo) 入到分布式文件存儲及并行運算平臺,用于對日志的存儲以及統(tǒng)計分析。
(3)分布式文件存儲及并行運算平臺中的點擊分析統(tǒng)計程序?qū)σ欢螘r間內(nèi)的日志 進(jìn)行統(tǒng)計分析,該分析包括獲取每個商品類目點擊的權(quán)重,權(quán)重體現(xiàn)了商品類目與用戶查 詢信息的相關(guān)度,優(yōu)選地,可以為查詢信息對應(yīng)的點擊次數(shù)或點擊概率。當(dāng)用戶點擊查看商 品時,由于每一個日志都記錄有該次點擊查看對應(yīng)的用戶查詢詞,以及該點擊查看的商品 所屬商品類目,從而根據(jù)大量的日志便可以獲取針對同一查詢詞,用戶所查看的商品所在 的商品類目以及權(quán)重。從中可以獲知,當(dāng)用戶輸入該查詢詞時,各個商品類目與該查詢詞的 相關(guān)度,即用戶關(guān)心的程度。點擊分析統(tǒng)計程序?qū)⒔y(tǒng)計分析結(jié)果作為輸出,傳送到商品類目 查詢服務(wù)器。(4)商品類目查詢服務(wù)器根據(jù)統(tǒng)計分析結(jié)果通過hash算法以Key-Value的形式編 譯查詢字典,從而提高查詢的速度。其中Key為用戶輸入的查詢詞,Value為該查詢詞對應(yīng) 的多個商品類目以及相應(yīng)的權(quán)重,該查詢字典體現(xiàn)了查詢詞與各個商品類目的相關(guān)度。當(dāng) 獲知用戶的查詢詞和商品類目時,即可以在查詢字典中進(jìn)行查詢,將與該查詢詞相關(guān)的商 品類目返回給用戶,并按照相關(guān)度的高低,即商品類目的權(quán)重進(jìn)行排列,以供用戶選擇。需要說明的時,根據(jù)本次的統(tǒng)計分析結(jié)果更新查詢字典可以是僅僅根據(jù)該次統(tǒng)計 分析的查詢結(jié)果生成的查詢字典,也可以將該次統(tǒng)計分析結(jié)果添加到原查詢字典中,生成 新的查詢字典,也可以根據(jù)需要刪除指定時段內(nèi)或指定時段之前的統(tǒng)計分析結(jié)果在查詢字 典中對應(yīng)的數(shù)據(jù)。例如對于服裝類的商品,當(dāng)?shù)綋Q季的季節(jié)時,之前的統(tǒng)計分析結(jié)果將不 適用于隨后的查詢,所以將不用于隨后查詢的統(tǒng)計分析結(jié)果對應(yīng)的數(shù)據(jù)刪除,以保證查詢 的準(zhǔn)確性。通過上述的說明可知,該查詢方法是一個循環(huán)的過程。用戶進(jìn)行查詢時,返回的查 詢結(jié)果是商品類目查詢服務(wù)器在上一時間段的點擊查看行為生成的查詢字典中查詢而獲 得的查詢結(jié)果;而根據(jù)用戶在本次查詢中進(jìn)行點擊查看的行為生成的日志將在下一個時間 段進(jìn)行統(tǒng)計分析,并發(fā)送給商品類目查詢服務(wù)器,用于后續(xù)的商品類目查詢。本申請實施例提供一種垂直搜索的查詢方法,如圖4所示,包括以下步驟步驟401、用戶輸入查詢信息。此處,我們定義用于進(jìn)行一次查詢所需的查詢信息為查詢詞,也可以包括商品類目。前端服務(wù)器通過查詢頁面,提供與用戶進(jìn)行交互的窗口。用戶通過瀏覽器,訪問該 查詢頁面,在該查詢頁面中輸入想要查詢的查詢信息進(jìn)行查詢。例如,當(dāng)用戶需要買一件T恤時,用戶登錄在線交易網(wǎng)站,通過該網(wǎng)站的查詢頁 面,輸入用戶想要查詢的查詢信息“T恤”。此時,若用戶只想查看有關(guān)男裝T恤的信息時, 可以通過輸入“T恤”時系統(tǒng)彈出的下拉框選擇商品類目,從而在輸入查詢詞的同時,輸入商 品類目,對查詢范圍進(jìn)行限定,例如用戶選擇下拉框中的“T恤男裝”,其中“男裝”即為商 品類目,查詢信息為“T恤男裝”。用戶還可以僅輸入查詢詞“T恤”,當(dāng)系統(tǒng)根據(jù)“T恤”返回的頁面上提供有“男裝”、 “女裝”和“休閑裝”時,用戶選擇“男裝”,其中“男裝”為商品類目,查詢信息為“T恤男裝”。
步驟402、前端服務(wù)器獲取用戶輸入的查詢信息。前端服務(wù)器通過查詢頁面,獲取到用戶輸入的查詢信息,具體包括以下步驟(1)前端服務(wù)器通過查詢頁面獲取用戶輸入的查詢信息。(2)前端服務(wù)器獲取該查詢信息中的商品類目所對應(yīng)的商品類目ID。為了便于后端的商品類目查詢服務(wù)器的查詢,前端服務(wù)器并非直接將所獲取的查 詢信息中的商品類目發(fā)送給商品類目查詢服務(wù)器,而是將該商品類目對應(yīng)的商品類目ID 發(fā)送給商品類目查詢服務(wù)器,所以前端服務(wù)器需要獲取該商品類目對應(yīng)的商品類目ID。此時,若查詢信息僅為查詢詞,沒有商品類目,則無需獲取商品類目ID。當(dāng)然,也可以由前端服務(wù)器將商品類目轉(zhuǎn)發(fā)給后端的商品類目查詢服務(wù)器,由后 端的商品類目查詢服務(wù)器獲取該商品類目對應(yīng)的商品類目ID,再通過該商品類目ID進(jìn)行 查詢。步驟403、前端服務(wù)器將查詢信息中查詢詞和商品類目ID轉(zhuǎn)發(fā)給后端的商品類目 服務(wù)器。前端服務(wù)器和后端的商品類目查詢服務(wù)器通過接口進(jìn)行數(shù)據(jù)的傳輸。前端接口的 輸入輸出采用http的方式進(jìn)行訪問及返回結(jié)果。輸入?yún)?shù)采用http協(xié)議,通過Get方式 提交參數(shù)給“商品類目查詢服務(wù)器”。傳入的參數(shù)主要有兩個查詢詞和商品類目ID。輸入連接的格式如下http://host ? query =查詢詞 &catid =商品類目 id返回結(jié)果采用XML的格式,具體格式如下< xml version=" 1.0" encoding="GBK" > <conf>〈module name="catsort" v=""><p name="result">510001:200,510021:100,10221:30</p></module></conf^步驟404、后端的商品類目查詢服務(wù)器根據(jù)接收的查詢信息,進(jìn)行查詢,并將查詢 結(jié)果發(fā)送給前端服務(wù)器。步驟405、前端服務(wù)器將由后端的商品類目查詢服務(wù)器發(fā)送的查詢結(jié)果顯示給用 戶。其中,當(dāng)查詢信息僅為查詢詞時,查詢結(jié)果為與該查詢詞匹配的所有商品類目及 其對應(yīng)的權(quán)重(即商品類目的點擊次數(shù)或點擊概率),并按照權(quán)重由高到低的順序排列;當(dāng) 查詢信息為查詢詞和商品類目時,查詢結(jié)果為與該查詢信息匹配的商品類目下的所有子商 品類目及其對應(yīng)的權(quán)重(即商品類目的點擊次數(shù)或點擊概率),并按照權(quán)重由高到低的順 序排列。優(yōu)選地,顯示給用戶的查詢結(jié)果頁面中,既包括與查詢信息相匹配的商品類目下 的所有子商品類目,也包括該等子商品類目下的每一款商品信息的詳單,以便用戶在該查 詢結(jié)果中直接選擇具體商品進(jìn)行查看。11
步驟406、用戶根據(jù)查詢結(jié)果,從中選擇查看的商品類目進(jìn)行點擊查看,日志服務(wù) 器根據(jù)點擊生成日志。前端服務(wù)器通過查詢結(jié)果顯示頁面,將后端的商品類目查詢服務(wù)器返回的查詢結(jié) 果顯示給用戶。用戶從顯示的查詢結(jié)果中選擇所要查看的商品類目進(jìn)行點擊查看,再在所 查看的商品類目的子類目中進(jìn)行點擊,再由商品類目查詢服務(wù)器按照上述查詢方法返回給 用戶以供查看。如此往復(fù),通過逐級地查看商品類目查找到所要查看的商品,進(jìn)行點擊查看。上述所顯示的每一個商品中都添加了保存到“日志服務(wù)器”的連接。在點擊查看 的過程中,每當(dāng)對商品進(jìn)行點擊后,都將根據(jù)該次點擊行為生成相應(yīng)的日志,保存在日志服 務(wù)器中。其中,每一次點擊行為為一條點擊日志,日志的格式如表1所示表1日志格式查詢詞查詢類目商品ID商品類目商品屬性其中,查詢詞為用戶輸入的查詢信息中的查詢詞,查詢類目為用戶在頁面返回的 商品類目中所選擇點擊查看的商品類目并從點擊該商品類目返回的頁面中選擇商品進(jìn)行 點擊查看,此時該商品類目為查詢類目,所以查詢類目可能有多個,而日志中的查詢類目僅 存儲的查詢類目為用戶點擊查看商品之前最近一次點擊的商品類目。點擊該查詢類目后, 返回給用戶的查詢結(jié)果既包括該查詢類目下的所有子商品類目也包括該等子商品類目下 的每一款商品信息的詳單。商品ID為每一個商品所對應(yīng)的ID號,用于唯一標(biāo)識每一款商 品。商品類目為用戶點擊查看的商品直接所屬的商品類目。該商品類目可能是查詢類目的 子商品類目。商品屬性為該商品所對應(yīng)的附屬信息,例如品牌。例如,當(dāng)用戶輸入的查詢詞為“T恤”時,在根據(jù)用戶點選的商品類目為“長袖T恤” 返回的查詢結(jié)果中,在商品詳單中選擇了一款品牌為POLO的T恤,該件商品對應(yīng)的商品ID 為12200021,其直接所屬商品類目為男裝T恤,其中“男裝T恤”為“長袖T恤”的子類目, 根據(jù)上述信息生成如表2所示的一條日志記錄。表2日志記錄查詢詞查詢類目商品ID商品類目商品屬性T恤長袖T恤12200021男裝T恤品牌P0L0
步驟407、日志服務(wù)器定時將生成的日志導(dǎo)入到分布式文件存儲及并行運算平臺。分布式文件存儲及并行運算平臺用于存儲生成的日志,以及對所有日志進(jìn)行分析 時的計算。每一條日志記錄的產(chǎn)生是隨著用戶的點擊查看而同時產(chǎn)生的,日志服務(wù)器定時將 該時間段內(nèi)的所有日志導(dǎo)入到分布式文件存儲及并行運算平臺。其中,日志服務(wù)器的定期 操作可以為每天,或每12小時等等。步驟408、點擊分析統(tǒng)計程序定時對存儲的日志進(jìn)行統(tǒng)計分析,得出統(tǒng)計分析結(jié)果 ο日志服務(wù)器定時將生成的日志導(dǎo)入到分布式文件存儲及并行運算平臺后,點擊分 析統(tǒng)計程序?qū)⒍〞r對存儲的日志進(jìn)行統(tǒng)計分析,得出統(tǒng)計分析結(jié)果。該統(tǒng)計分析的對象可 以為最近十天的日志,或最近兩周的日志,具體的時間可以按照經(jīng)驗值或統(tǒng)計需求進(jìn)行調(diào) 離iF. ο具體的,點擊分析統(tǒng)計程序定時對存儲的日志進(jìn)行統(tǒng)計分析,得出統(tǒng)計分析結(jié)果, 具體包括以下步驟(1)獲取進(jìn)行統(tǒng)計分析的日志。日志服務(wù)器會定時更新分布式文件存儲及并行運算平臺中的日志,點擊分析統(tǒng)計 程序定時對存儲的日志進(jìn)行統(tǒng)計分析時,需要獲取更新的日志,以獲取最新的日志,提高統(tǒng) 計的準(zhǔn)確性。(2)對查詢詞進(jìn)行歸一化處理。由于每個用戶輸入的查詢詞不一定符合點擊分析統(tǒng)計程序的統(tǒng)計標(biāo)準(zhǔn),為了便于 根據(jù)查詢詞進(jìn)行統(tǒng)計,需要對查詢詞進(jìn)行歸一化處理。歸一化處理包括去除查詢詞中不必 要的詞,多余的空格,進(jìn)行字母大小寫之間的轉(zhuǎn)換,全角半角之間的轉(zhuǎn)換,簡體繁體之間的 轉(zhuǎn)換,標(biāo)點的轉(zhuǎn)換以及中文數(shù)字之間的轉(zhuǎn)換等。經(jīng)歸一化處理的查詢詞可以直接用于點擊 分析統(tǒng)計程序的統(tǒng)計。(3)對日志進(jìn)行數(shù)據(jù)匯總,生成點擊分布數(shù)據(jù)。成千上萬的用戶進(jìn)行查詢時,會輸入相同的查詢詞以及點擊相同的查詢類目,根 據(jù)一段時間內(nèi)的日志,對用戶查詢的查詢詞以及查詢類目進(jìn)行匯總,獲取根據(jù)每個查詢詞 所點擊的商品類目的次數(shù)。例如,通過查詢詞“T恤”點擊查看的商品共有400個,其中有200個商品屬于男 裝商品類目,有100個商品屬于女裝商品類目,有100個商品屬于運動休閑商品類目。在屬 于男裝商品類目的200個商品中,有200個商品屬于短袖T恤商品類目,有0個商品屬于長 袖T恤商品類目。在屬于女裝商品類目的100個商品中,有100個商品屬于短袖T恤商品 類目,有0個商品屬于長袖T恤商品類目。在屬于運動休閑商品類目的100個商品中,有60 個商品屬于情侶裝商品類目,有40個商品屬于運動T恤商品類目。上述每一個點擊查看過程都會生成對應(yīng)的日志,根據(jù)對日志的匯總,得出如表3 的點擊分布數(shù)據(jù)表3點擊分布數(shù)據(jù)
權(quán)利要求
1.一種垂直搜索的查詢方法,應(yīng)用于包括查詢服務(wù)器、分析服務(wù)器和日志服務(wù)器的系 統(tǒng)中,其特征在于,包括查詢服務(wù)器獲取用戶的查詢信息;所述查詢服務(wù)器根據(jù)所述查詢信息在所述商品類目服務(wù)器的查詢字典中獲取查詢結(jié) 果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及其對應(yīng)的權(quán)重;所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并將排 序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用戶查看的商品 類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng)計分 析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢。
2.如權(quán)利要求1所述的方法,其特征在于,在所述查詢服務(wù)器將所述查詢結(jié)果中的子 商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序之前,還包括設(shè)定一權(quán)重閾值,將所述查詢結(jié)果中的 權(quán)重大于所述權(quán)重閾值的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序。
3.如權(quán)利要求1所述的方法,其特征在于,所述查詢服務(wù)器獲取用戶的查詢信息之前, 還包括前端服務(wù)器獲取用戶的查詢信息,所述查詢信息包括所述用戶的查詢詞和商品類目;所述前端服務(wù)器對所述查詢詞進(jìn)行歸一化處理和獲取商品類目對應(yīng)的商品ID ;所述前端服務(wù)器將經(jīng)歸一化處理的所述查詢詞和所述商品類目ID轉(zhuǎn)發(fā)給所述商品類 目服務(wù)器。
4.如權(quán)利要求1所述的方法,其特征在于,所述日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志之前,還包括獲取前端服務(wù)器轉(zhuǎn)發(fā)的所述用戶的查詢信息;分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類 目服務(wù)器的查詢字典,用于后續(xù)的查詢具體包括接收所述日志服務(wù)器定時發(fā)送的預(yù)設(shè)時間內(nèi)的日志;根據(jù)預(yù)設(shè)時間內(nèi)的所述日志進(jìn)行統(tǒng)計分析,獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果為 所述用戶查看的商品類目以及對應(yīng)的權(quán)重;所述權(quán)重包括所述用戶查看的商品類目對應(yīng)的 點擊次數(shù)以及在同級商品類目中對應(yīng)的點擊概率;根據(jù)商品類目樹,將所述統(tǒng)計分析結(jié)果生成查詢文件;將所述查詢文件發(fā)送給所述查詢服務(wù)器,以使所述查詢服務(wù)器根據(jù)所述查詢文件更新 所述商品類目服務(wù)器的查詢字典,用戶后續(xù)的查詢。
5.如權(quán)利要求1所述的方法,其特征在于,所述查詢服務(wù)器將所述查詢結(jié)果中的子商 品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶之前,還包括所述查詢服務(wù)器對所述查詢結(jié)果進(jìn)行拼接,所述拼接包括獲取所述查詢結(jié)果中所述商 品類目ID對應(yīng)的商品類目。
6.一種垂直搜索的查詢系統(tǒng),其特征在于,包括查詢服務(wù)器,用于獲取用戶的查詢信息;根據(jù)所述查詢信息在所述商品類目服務(wù)器的 查詢字典獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類 目及其對應(yīng)的權(quán)重;將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看;獲取分析服務(wù)器發(fā)送的統(tǒng)計分析結(jié)果,根據(jù) 所述統(tǒng)計分析結(jié)果更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢;日志服務(wù)器,用于根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將所述 日志發(fā)送給所述分析服務(wù)器。分析服務(wù)器,用于接收所述日志服務(wù)器發(fā)送的所述日志;對所述日志進(jìn)行統(tǒng)計分析獲 取所述統(tǒng)計分析結(jié)果;將所述統(tǒng)計分析結(jié)發(fā)送給所述查詢服務(wù)器。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述查詢信息包括查詢詞和商品類目,所述 日志服務(wù)器包括獲取模塊,用于獲取前端服務(wù)器轉(zhuǎn)發(fā)的用戶的查詢信息;生成模塊,用于根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志;發(fā)送模塊,用于將所述生成模塊生成的所述日志發(fā)送給所述分析服務(wù)器進(jìn)行統(tǒng)計分析 獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后 續(xù)的查詢。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述分析服務(wù)器包括接收模塊,用于接收所述日志服務(wù)器發(fā)送的日志;統(tǒng)計分析模塊,用于對所述接收模塊接收的所述日志進(jìn)行統(tǒng)計分析,獲取統(tǒng)計分析結(jié)果;發(fā)送模塊,用于將所述統(tǒng)計分析模塊獲取的所述統(tǒng)計分析結(jié)果發(fā)送給查詢服務(wù)器,使 所述查詢服務(wù)器更新所述查詢服務(wù)器的查詢字典,用于后續(xù)的查詢。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述統(tǒng)計分析模塊包括統(tǒng)計分析子模塊,用于根據(jù)預(yù)設(shè)時間內(nèi)的所述獲取模塊獲取的所述日志進(jìn)行統(tǒng)計分 析,獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果為所述用戶查看的商品類目以及對應(yīng)的權(quán)重;所 述權(quán)重包括所述用戶查看的商品類目對應(yīng)的點擊次數(shù)以及在同級商品類目中對應(yīng)的點擊 概率;生成子模塊用于根據(jù)商品類目樹,將所述統(tǒng)計分析子模塊獲取的所述統(tǒng)計分析結(jié)果 生成查詢文件。
10.一種服務(wù)器,作為查詢服務(wù)器,應(yīng)用于包括查詢服務(wù)器、分析服務(wù)器和日志服務(wù)器 的系統(tǒng)中,其特征在于,包括獲取模塊,用于獲取用戶的查詢信息;用于獲取分析服務(wù)器發(fā)送的統(tǒng)計分析結(jié)果;查詢模塊,用于根據(jù)所述獲取模塊獲取的所述查詢信息在所述商品類目服務(wù)器的查詢 字典獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及 其對應(yīng)的權(quán)重;發(fā)送模塊,用于將所述查詢模塊獲取的所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán) 重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所 述用戶查看的商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng) 計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典, 用于后續(xù)的查詢;更新模塊,用于根據(jù)所述獲取模塊獲取的統(tǒng)計分析結(jié)果更新所述商品類目服務(wù)器的查 詢字典,并將所述更新后的查詢字典發(fā)送到所述查詢模塊,用于后續(xù)的查詢。
11.如權(quán)利要求10所述的服務(wù)器,其特征在于,所述發(fā)送模塊還用于設(shè)定一權(quán)重閾 值,將所述查詢結(jié)果中的權(quán)重大于所述權(quán)重閾值的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排
12.如權(quán)利要求10所述的服務(wù)器,其特征在于,所述查詢信息包括經(jīng)歸一化處理的所述查詢詞和所述商品類目對應(yīng)的商品類目ID ; 還包括拼接模塊,用于對所述查詢結(jié)果進(jìn)行拼接,所述拼接包括獲取所述查詢結(jié)果中 所述商品類目ID對應(yīng)的商品類目。
全文摘要
本申請實施例公開了一種垂直搜索的查詢方法、系統(tǒng)和裝置,該方法包括查詢服務(wù)器獲取用戶的查詢信息;所述查詢服務(wù)器根據(jù)所述查詢信息在所述商品類目服務(wù)器的查詢字典中獲取查詢結(jié)果,所述查詢結(jié)果為與所述查詢信息相匹配的商品類目下的子商品類目及其對應(yīng)的權(quán)重;所述查詢服務(wù)器將所述查詢結(jié)果中的子商品類目按照其對應(yīng)的權(quán)重進(jìn)行排序,并將排序結(jié)果發(fā)送給所述用戶,使所述用戶進(jìn)行查看,并使日志服務(wù)器根據(jù)所述用戶查看的商品類目和所述查詢信息生成日志,并將所述日志發(fā)送給分析服務(wù)器進(jìn)行統(tǒng)計分析獲得統(tǒng)計分析結(jié)果,所述統(tǒng)計分析結(jié)果用于更新所述商品類目服務(wù)器的查詢字典,用于后續(xù)的查詢。通過本申請,實現(xiàn)了根據(jù)用戶點擊記錄返回用戶的查詢結(jié)果,提高了查詢結(jié)果與用戶查詢的相關(guān)性。
文檔編號G06F17/30GK102053983SQ20091021042
公開日2011年5月11日 申請日期2009年11月2日 優(yōu)先權(quán)日2009年11月2日
發(fā)明者何杰 申請人:阿里巴巴集團(tuán)控股有限公司