基于本體的用戶需求描述方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明公開(kāi)了基于本體的用戶需求描述方法,屬于Web服務(wù)發(fā)現(xiàn)的技術(shù)領(lǐng)域。
【背景技術(shù)】
[0002] 在全球經(jīng)濟(jì)一體化和信息化進(jìn)程不斷縱向推進(jìn)的背景下,信息產(chǎn)業(yè)的格局正隨著 信息技術(shù)的融合化和服務(wù)化的發(fā)展趨勢(shì)不斷改變著,信息服務(wù)業(yè)已成為國(guó)民經(jīng)濟(jì)可持續(xù)發(fā) 展的重要推動(dòng)力量。面向服務(wù)的研究是信息時(shí)代的一次重要變革,通過(guò)服務(wù)能夠促進(jìn)信息 技術(shù)和企業(yè)經(jīng)營(yíng)人±的理解和交流。服務(wù)發(fā)現(xiàn)是面向服務(wù)的體系結(jié)構(gòu)中的重要環(huán)節(jié),是 指服務(wù)請(qǐng)求者依據(jù)自己的服務(wù)需求,通過(guò)服務(wù)發(fā)現(xiàn)算法從注冊(cè)中屯、尋找目標(biāo)服務(wù)集合的過(guò) 程。服務(wù)發(fā)現(xiàn)能夠?qū)崿F(xiàn)服務(wù)請(qǐng)求者對(duì)于所需服務(wù)的主觀W及客觀要求,是實(shí)現(xiàn)服務(wù)復(fù)用、共 享的重要前提。
[0003] 傳統(tǒng)的服務(wù)發(fā)現(xiàn)方法大都關(guān)注的是服務(wù)本身,比如說(shuō)基于關(guān)鍵字和基于語(yǔ)義的服 務(wù)發(fā)現(xiàn)方法。然而在網(wǎng)絡(luò)信息資源呈現(xiàn)大規(guī)模化W及多樣性的今天,用戶越來(lái)越關(guān)注與自 己興趣W及需求相符合的資源,用戶作為現(xiàn)實(shí)社會(huì)中的單獨(dú)實(shí)體,每個(gè)都會(huì)存在獨(dú)特的興 趣、個(gè)性化及習(xí)慣,面向用戶需求的服務(wù)發(fā)現(xiàn)能夠?qū)崿F(xiàn)用戶對(duì)服務(wù)的個(gè)性化需求。面向用戶 需求的服務(wù)發(fā)現(xiàn)的一個(gè)關(guān)鍵是實(shí)現(xiàn)用戶需求的形式化描述?,F(xiàn)有的用戶相關(guān)研究主要有基 于加權(quán)關(guān)鍵字的向量空間模型、基于本體的用戶模型、基于主題的用戶模型等,基于本體的 用戶模型能夠利用本體對(duì)概念描述的語(yǔ)義化、規(guī)范化的特點(diǎn),從概念層面對(duì)用戶的需求偏 好進(jìn)行建模,使得用戶的需求偏好信息具有語(yǔ)義特性,從而可W大大提高服務(wù)匹配的查全 率和查準(zhǔn)率。
[0004] 在服務(wù)發(fā)現(xiàn)過(guò)程中,服務(wù)描述語(yǔ)言是實(shí)現(xiàn)服務(wù)描述與匹配的關(guān)鍵,然而現(xiàn)有的服 務(wù)描述語(yǔ)言存在著用戶需求描述與服務(wù)描述之間的異構(gòu)性問(wèn)題,直接影響了服務(wù)發(fā)現(xiàn)的效 率。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問(wèn)題是針對(duì)上述【背景技術(shù)】的不足,提供了基于本體的用戶 需求描述方法,從用戶需求描述的角度出發(fā),利用本體構(gòu)建具有語(yǔ)義信息的用戶需求描述, 解決了服務(wù)描述語(yǔ)言存在異構(gòu)性的技術(shù)問(wèn)題。
[0006] 本發(fā)明為實(shí)現(xiàn)上述發(fā)明目的采用如下技術(shù)方案:
[0007] 基于本體的用戶需求描述方法,
[000引引入開(kāi)放式目錄信息,參照OWL語(yǔ)言的相關(guān)概念W及規(guī)則,構(gòu)建用戶特征信息本 體,所述用戶特征信息本體包含;基本信息集合、類集合、實(shí)例集合、屬性集合、關(guān)系集合、規(guī) 則集合;
[0009] 構(gòu)建用戶特征信息描述文檔,所述用戶特征信息描述文檔包含:用戶基本信息集 合、長(zhǎng)期興趣集合、短期興趣集合、其他特征信息集合、用戶特征信息本體到用戶特征信息 描述文檔的映射關(guān)系;
[0010] 由用戶特征信息描述文檔及用戶特征信息本體到用戶特征信息描述文檔的映射 關(guān)系構(gòu)建具有語(yǔ)義信息的用戶需求描述集合,所述用戶需求描述集合包含;受長(zhǎng)期興趣集 合、短期興趣集合、其他特征信息集合約束的用戶偏好描述集合,W及用戶偏好概念圖。
[0011] 作為所述基于本體的用戶需求描述方法的進(jìn)一步優(yōu)化方案,引入開(kāi)放式目錄信 息,參照OWL語(yǔ)言的相關(guān)概念W及規(guī)則,構(gòu)建用戶特征信息本體的方法為:
[0012] 首先,構(gòu)建描述用戶基本信息的基本信息集合;
[0013] 接著,按照自頂向下的方式構(gòu)建類集合:依托開(kāi)放式目錄信息構(gòu)建代表基本信息 一般概念的頂層概念類,從頂層概念類逐層拓展構(gòu)建具體概念類,所述頂層概念類包括核 屯、概念類W及構(gòu)成本體主體框架的關(guān)鍵概念類;
[0014] 然后,用OWL語(yǔ)言描述類集合,完善各概念類對(duì)應(yīng)的對(duì)象和數(shù)據(jù)屬性W構(gòu)建實(shí)例 集合和屬性集合;
[0015] 最后,由概念類之間的關(guān)系、實(shí)例之間的關(guān)系、概念類與實(shí)例之間的關(guān)系構(gòu)建關(guān)系 集合,由本體固有規(guī)則構(gòu)建規(guī)則集合。
[0016] 進(jìn)一步的,所述基于本體的用戶需求描述方法中,構(gòu)建用戶特征信息描述文檔的 方法為:通過(guò)用戶注冊(cè)信息W及個(gè)人信息完善功能并W包含概念特征詞的集合形式來(lái)描述 長(zhǎng)期興趣集合、其他特征信息集合,結(jié)合服務(wù)歷史交互記錄信息W包含概念特征詞的集合 形式來(lái)描述短期興趣集合。
[0017] 再進(jìn)一步的,所述基于本體的用戶需求描述方法中,短期興趣集合中,由表達(dá)式: Ssi= {ci,wi,AT,化te}表示短期興趣i的元素Ssi,ci為短期興趣i的概念特征詞,wi 為短期興趣i的興趣度,at為短期興趣i的生存時(shí)間,Date為最近一次用戶對(duì)短期興趣i 的關(guān)注時(shí)間,
其中,Nv為用戶瀏覽所有頁(yè)面的總次數(shù),nvi(urlc)為用戶 瀏覽與短期興趣i相關(guān)的頁(yè)面C的次數(shù),n為用戶瀏覽與短期興趣i相關(guān)的頁(yè)面總次數(shù)。
[0018] 更進(jìn)一步的,所述基于本體的用戶需求描述方法,考慮用戶需求的動(dòng)態(tài)更新因素, 由表達(dá)式
更新短期興趣的興趣度,其中,A為 衰減因子,nv(today-Date)為用戶上次關(guān)注短期興趣i到更新時(shí)該段時(shí)間內(nèi)用戶訪問(wèn)與 短期興趣i相關(guān)頁(yè)面的次數(shù),
k為衰減常數(shù)。
[0019] 作為所述基于本體的用戶需求描述方法的進(jìn)一步優(yōu)化方案,用戶偏好描述集合包 含概念特征詞WFW及偏好度e
其中,
[0020] 在概念特征詞WF來(lái)自長(zhǎng)期興趣集合Si"g時(shí),wl"為概念特征詞WF的興趣度;在概 念特征詞WF來(lái)自短期興趣集合S,h"t或其他特征信息集合0UFI時(shí),nvw(urla)為用戶訪問(wèn) 與概念特征詞WF相關(guān)的頁(yè)面a的次數(shù),m為用戶瀏覽與概念特征詞WF相關(guān)的頁(yè)面a的總 次數(shù);k'為調(diào)節(jié)常數(shù)。
[0021] 本發(fā)明采用上述技術(shù)方案,具有W下有益效果:
[002引 (1)提出依托0DP化及OWL語(yǔ)言自頂向下構(gòu)建本體的方法,并由本體到用戶特征信 息描述文檔的映射關(guān)系,將語(yǔ)義信息W及特征之間的相互關(guān)系映射給用戶特征描述文檔, 從而得到具有語(yǔ)義信息的用戶需求描述集合,解決了用戶需求描述與服務(wù)描述之間存在異 構(gòu)性的問(wèn)題,提高了服務(wù)發(fā)現(xiàn)效率;
[0023] (2)方案考慮了用戶信息獲取方式的完整性與有效性:采用顯性獲取與隱性反饋 結(jié)合的方式來(lái)獲取用戶信息,該樣得到的用戶信息不僅僅能夠獲取用戶明確的、長(zhǎng)期的W 及主觀的興趣W及需求信息,還能夠及時(shí)的獲取用戶的短期偏好W及需求,從而為用戶需 求的描述建立基礎(chǔ);
[0024] (3)方案考慮了用戶需求信息的語(yǔ)義描述;采用本體概念描述用戶需求信息,一 是可W為用戶的需求描述提供充足的語(yǔ)義信息,便于計(jì)算機(jī)理解,也便于后續(xù)的發(fā)現(xiàn)過(guò)程; 二是本體概念可W很好的表示用戶需求信息中各個(gè)信息之間直接的屬性關(guān)系,比如說(shuō)從 屬、并列等等,便于后續(xù)過(guò)程中對(duì)用戶需求信息的處理;
[0025] (4)方案考慮了用戶偏好需求的眾多影響因素:本方法中,我們將用戶的長(zhǎng)期興 趣與短期興趣設(shè)定為兩個(gè)影響用戶偏好的因素,并且與其他用戶特征信息一起影響用戶偏 好需求,為了能夠表現(xiàn)出用戶偏好直接可能存在的直接或者間接的關(guān)系,采用一個(gè)基于圖 的結(jié)構(gòu)來(lái)表示用戶的偏好概念;
[0026] (5)方案考慮了用戶需求的動(dòng)態(tài)更新過(guò)程:對(duì)用戶的短期興趣進(jìn)行動(dòng)態(tài)的更新是 保證用戶興趣符合用戶實(shí)時(shí)偏好需求的重要保障,本方法對(duì)用戶短期興趣的進(jìn)行動(dòng)態(tài)的更 新,實(shí)現(xiàn)用戶需求的實(shí)時(shí)描述。
【附圖說(shuō)明】
[0027] 圖1是基于本體的用戶需求描述方法的框架。
[0028] 圖2是用戶特征信息本體頂層概念類及描述。
[0029] 圖3是用戶特征信息本體的層次結(jié)構(gòu)。
[0030] 圖4是用戶興趣的更新流程。
[0031] 圖5是用戶生活休閑愛(ài)好的用戶偏好概念關(guān)系圖。
【具體實(shí)施方式】
[0032] 下面詳細(xì)描述本發(fā)明的實(shí)施方式,下面通過(guò)參考附圖描述的實(shí)施方式是示例性 的,僅用于解釋本發(fā)明,而不能解釋為對(duì)本發(fā)明的限制。
[0033] 本領(lǐng)域的技術(shù)人員可W理解,除非另外定義,該里使用的所有術(shù)語(yǔ)(包括技術(shù)術(shù) 語(yǔ)和科學(xué)術(shù)語(yǔ))具有本發(fā)明所屬技術(shù)領(lǐng)域中的普通技術(shù)人員的一般理解相同的意義。還應(yīng) 該理解的是,諸如通用字典中定義的那些術(shù)語(yǔ)應(yīng)該被理解為具有與現(xiàn)有技術(shù)的上下文中的 意義一致的意義,并且除非像該里一樣定義,不會(huì)用理想化或過(guò)于正式的含義來(lái)解釋。
[0034] 本發(fā)明設(shè)及的基于本體的用戶需求描述方法,包括用戶特征信息本體的構(gòu)建,用 戶需求信息的獲取和描述W及用戶需求描述集合形成,基本流程是:首先,基于開(kāi)放式目錄 信息 0DP(0penDirectoirInformation),參照 0WL(0ntologyWebLanguage)語(yǔ)言的相關(guān) 概念W及規(guī)則,自頂向下構(gòu)建用戶特征信息描述本體;其次,通過(guò)用戶信息中顯示獲取方式 與隱式獲取方式結(jié)合的方式,獲取用戶基本信息、興趣信息w及其他特征信息,并且構(gòu)建用 戶特征信息描述集合。最后,參照前兩步的成果,構(gòu)建用戶偏好信息描述集合,主要有兩部 分組成,即用戶偏好需求概念集合和偏好概念關(guān)系圖。
[0035] 下面先給出基于本體的用戶需求描述方法中的相關(guān)概念的定義及其描述:
[0036] (1)本體的ntolo