国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      用于文檔瀏覽的個性化分類處理方法及系統(tǒng)的制作方法

      文檔序號:6393866閱讀:140來源:國知局
      專利名稱:用于文檔瀏覽的個性化分類處理方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及在客戶機(jī)-服務(wù)器結(jié)構(gòu)網(wǎng)絡(luò)中的個性化信息服務(wù),特別涉及在互聯(lián)網(wǎng)系統(tǒng)中用于文檔瀏覽的個性化分類處理方法和系統(tǒng)。

      背景技術(shù)
      隨著計算技術(shù)的發(fā)展,人們越來越需要個性化的分類服務(wù)。所謂個性化的分類服務(wù),就是用戶可以定義自己的、不同于其他人的類別樹,所需要的文檔被映射到用戶自定義的類別樹,并產(chǎn)生文檔目錄。這種個性化分類服務(wù)十分重要,因為人們具有不同的興趣愛好和知識背景。
      在現(xiàn)有技術(shù)中,需要根據(jù)用戶的不同興趣,為每個人建立各自的分類模型。通常,因為文檔數(shù)據(jù)庫非常龐大,所有文檔都要在離線的狀態(tài)下映射到該用戶的這個分類模型,并產(chǎn)生文檔目錄(不能實(shí)時產(chǎn)生),而每個用戶的這個分類模型都要基于該用戶的輸入及其以前的歷史曰志來進(jìn)行訓(xùn)練和學(xué)習(xí),以不斷地進(jìn)行完善,這就使得對所有人提供統(tǒng)一的分類方案十分困難。
      如在文獻(xiàn)“Document Ontology Based Personalized Filtering System(基于文檔實(shí)體論的個性化篩選系統(tǒng))’by Kyung-Sam Choi et al”中,公開了根據(jù)用戶的不同興趣,為每個人建立各自的分類模型的技術(shù)方案。換句話說,不同的人具有不同的模型。
      對于提供商來說,提供這種服務(wù)的最大的問題是繁重的計算和存儲成本。而這個問題的根本原因就是,對于每個用戶來說,都需要訓(xùn)練和更新他們的分類模型。與用戶的興趣情況相比,其分類模型在存儲空間上更加龐大,并且即使系統(tǒng)支持的話,也將花費(fèi)巨大的存儲成本。若在文檔數(shù)據(jù)庫中進(jìn)行更新操作,通過對其分類模型施加分類算法,還會導(dǎo)致用戶的每個文檔目錄都發(fā)生更新,對這種類別樹的更新操作是非常復(fù)雜和昂貴的。
      因此,迫切需要一種靈活、簡單、成本低的個性化文檔分類處理方法和系統(tǒng)。


      發(fā)明內(nèi)容
      為了解決上述問題,本發(fā)明提供了一種個性化服務(wù)的一般分類模型,在這種結(jié)構(gòu)下,無論用戶的個性化分類設(shè)計之間存在什么差別,也僅僅只需要訓(xùn)練和更新唯一的系統(tǒng)分類模型,而用戶的個性化分類基于這個系統(tǒng)分類模型來產(chǎn)生,只需要很少的成本,因為只需要訓(xùn)練一個系統(tǒng)分類模型,而不是為每個用戶分別訓(xùn)練不同的分類模型。
      因此,本發(fā)明提供一種文檔分類處理方法,包括步驟在服務(wù)器端建立多個類別,將供用戶瀏覽的文檔分配到相應(yīng)的類別之下,并以扁平結(jié)構(gòu)管理多個所述類別;以及在客戶機(jī)端,從多個類別中選擇所需類別來建立個性化分類結(jié)構(gòu)。
      本發(fā)明還提供一種文檔分類處理系統(tǒng),包括通過網(wǎng)絡(luò)連接的服務(wù)器和客戶機(jī),其中還包括系統(tǒng)分類裝置,配置在所述服務(wù)器端,用于為供用戶瀏覽的各個文檔建立多個類別,將各個所述文檔分配到相應(yīng)的類別之下,并以扁平結(jié)構(gòu)管理所述多個類別;以及定制裝置,配置在所述客戶機(jī)端,用于從多個類別中選擇所需類別,以建立個性化分類結(jié)構(gòu)。
      在本發(fā)明中,上述個性化分類結(jié)構(gòu)是樹結(jié)構(gòu),所述樹結(jié)構(gòu)的每個節(jié)點(diǎn)包括一個或多個類別。
      這種結(jié)構(gòu)的優(yōu)點(diǎn)在于當(dāng)用戶改變其類別設(shè)計時,在服務(wù)器側(cè)不需要有任何改變,而當(dāng)服務(wù)器側(cè)被更新時,也只需要更新系統(tǒng)分類模型,并且用戶自己不需要是文檔分類方面的專家。這樣,本發(fā)明的系統(tǒng)和方法能夠節(jié)省大量的計算和存儲成本。



      圖1表示本發(fā)明的一般系統(tǒng)示意圖; 圖2表示本發(fā)明系統(tǒng)的較詳細(xì)的結(jié)構(gòu)圖; 圖3是本發(fā)明在服務(wù)器端以扁平結(jié)構(gòu)管理的分類結(jié)構(gòu)的示意圖; 圖4是本發(fā)明在客戶機(jī)端所定義的分類樹結(jié)構(gòu)的示意圖; 圖5是本發(fā)明在客戶機(jī)端所定義的另一分類樹結(jié)構(gòu)的示意圖; 圖6是本發(fā)明的分類矩陣的示意圖; 圖7是說明用于定義分類樹結(jié)構(gòu)的方式的示意圖;和 圖8是描述實(shí)現(xiàn)本發(fā)明的文檔分類處理方法的流程圖。

      具體實(shí)施例方式 在具體描述本發(fā)明的實(shí)施例之前,將先定義與本發(fā)明相關(guān)的一組概念。類別表示相關(guān)文檔的邏輯分組,每個類別(也可以稱為類別模型)經(jīng)常由一組密鑰字表示,以反映其所包含文檔的類別含義,例如新聞、財經(jīng)、體育、娛樂和新技術(shù),等等。
      個性化分類表示允許用戶定義他們自己的類別結(jié)構(gòu),并自動將文檔分類到這些結(jié)構(gòu)中。
      二值化器具有將輸入文檔轉(zhuǎn)化為二進(jìn)制符號(例如{0,1})的功能。下面結(jié)合附圖詳細(xì)說明本發(fā)明的具體實(shí)施例。
      圖1是表示本發(fā)明的一般系統(tǒng)原理的示意圖。如圖1所示,在服務(wù)器中,先為各種文檔生成多個系統(tǒng)類別,存儲于“系統(tǒng)類別庫”中,并自動將存儲于“文檔數(shù)據(jù)庫”中的相應(yīng)文檔分類到這些系統(tǒng)類別之下,這些系統(tǒng)類別在“系統(tǒng)類別庫”中是以扁平的結(jié)構(gòu)來管理的;在客戶機(jī)端,用戶定義所期望的分類樹結(jié)構(gòu),并將該樹結(jié)構(gòu)映射到服務(wù)器端的“系統(tǒng)類別庫”中;通過用戶對該分類樹結(jié)構(gòu)中的特定節(jié)點(diǎn)的選定,該“系統(tǒng)類別庫”為該用戶從“文檔數(shù)據(jù)庫”中提取其所需要的文檔,并將它們提供給該用戶的客戶機(jī)以進(jìn)行顯示。
      圖2表示本發(fā)明系統(tǒng)的較詳細(xì)的結(jié)構(gòu)圖。如圖2所示,本發(fā)明的系統(tǒng)主要包括兩個部分,即客戶機(jī)101和服務(wù)器102,它們通過可以諸如是局域網(wǎng)、廣域網(wǎng)(其中包括互聯(lián)網(wǎng))等的各種網(wǎng)絡(luò)103連接,形成一個客戶機(jī)-服務(wù)器結(jié)構(gòu)的系統(tǒng),其所適用的典型結(jié)構(gòu)是互聯(lián)網(wǎng)。
      服務(wù)器102包括數(shù)據(jù)庫122,其中存儲大量的文檔及其相關(guān)信息,以供用戶通過網(wǎng)絡(luò)進(jìn)行瀏覽,這些文檔包括服務(wù)提供商所能收集到的各種文檔;和系統(tǒng)分類裝置121,為要被瀏覽的文檔建立多個類別(模型),即所謂的系統(tǒng)分類模型,并將所述文檔分配到相應(yīng)的類別之下,而這些類別在服務(wù)器端是以扁平結(jié)構(gòu)進(jìn)行排列的。
      另外,本發(fā)明的系統(tǒng)還包括初始化部件200,與系統(tǒng)分類裝置121相連接或配置在其內(nèi),用于對各種基本信息模型進(jìn)行初始化(建模)操作;和更新部件201,與系統(tǒng)分類裝置121相連接或配置在其內(nèi),用于對文檔和/或類別進(jìn)行更新等操作。
      本發(fā)明的系統(tǒng)還可以包括控制端口104,用于通過向系統(tǒng)分類裝置121輸入控制指令,來控制系統(tǒng)分類裝置121中有關(guān)文檔處理的操作??刂贫丝?04可以是鍵盤、鼠標(biāo)、手寫板、麥克風(fēng)和照相部件等輸入裝置。
      當(dāng)然,本發(fā)明中的系統(tǒng)分類裝置121完全可以在軟件的控制下自主地完成上述操作,而不需要依靠管理員通過控制端口104來輸入相關(guān)的控制指令。另外,本發(fā)明中的系統(tǒng)分類裝置121也可以被配置為不包括或連接初始化部件200和更新部件201,而作為一個獨(dú)立的裝置或部件來完成上述各種功能。
      客戶機(jī)101中包括定制部件110,用于從服務(wù)器102所提供的多個類別中選擇所需要的類別,以建立個性化分類結(jié)構(gòu);和瀏覽裝置111,用于在選定分類樹結(jié)構(gòu)的特定節(jié)點(diǎn)的情況下,從系統(tǒng)分類裝置121接收用戶要瀏覽的文檔,并將其提供給用戶。上述的定制部件110和瀏覽部件111還可以被合并為一個部件,來完成同樣的功能。用戶通過服務(wù)器102所提供的例如網(wǎng)頁的圖形用戶接口(未示出)與服務(wù)器102進(jìn)行交互操作,并將自己定義的所期望的類別樹結(jié)構(gòu)映射給服務(wù)器102中的系統(tǒng)分類裝置121,該系統(tǒng)分類裝置121根據(jù)用戶所定義的類別樹結(jié)構(gòu),向客戶機(jī)101提供其所需要的文檔信息。
      在客戶機(jī)101與服務(wù)器102之間通過網(wǎng)絡(luò)進(jìn)行交互的過程中,可以使用在其上附加了相關(guān)描述信息的令牌,作為客戶機(jī)101和服務(wù)器102之間的信令,進(jìn)行各種消息的傳遞。當(dāng)然,也可以使用其它任何種類的消息傳遞方式,由于網(wǎng)絡(luò)中的消息傳遞方式不是本發(fā)明的目的,且其在目前已經(jīng)是非常成熟的技術(shù),在此將省略對其的詳細(xì)描述。
      當(dāng)然,在本發(fā)明中,服務(wù)器102和客戶機(jī)101中還包括CPU、各種存儲器和輸入、輸出裝置等各種通用的裝置,以實(shí)現(xiàn)各種基本操作。本發(fā)明的服務(wù)器102和客戶機(jī)101還可以是通用的服務(wù)器和客戶機(jī),其中通過加載能實(shí)現(xiàn)本發(fā)明各種功能的軟件程序來實(shí)現(xiàn)本發(fā)明。
      在本發(fā)明中,系統(tǒng)分類裝置121中的初始化部件200對數(shù)據(jù)庫122中所存儲的各種文檔,先建立一組列表、表格等基本信息模型,其中包括類別組、比特串組、類別表、類別更新列表、文檔組、文檔更新列表和分類矩陣等。
      下面將結(jié)合附圖來說明上述的各種基本信息模型及其初始化操作。在上述基本信息模型中,類別組表示為C={c1,c2,...,cm},這里ci(i=1,...,m)表示各個類別,m是該類別組中所有類別的總數(shù),i代表相應(yīng)的類別識別信息,即類別ID。這里,類別ID表現(xiàn)為各類別在類別組中的位置信息,當(dāng)然,類別ID還可以是其它任何可以用來識別該類別的信息,其中可以包括位置信息,而不僅僅是位置信息。例如,可以將數(shù)據(jù)庫122中有關(guān)網(wǎng)絡(luò)生活方面的文檔分為六個類別,即C例={互聯(lián)網(wǎng),軟件,編程,游戲,購物,硬件}。其中c1是“互聯(lián)網(wǎng)”,c2是“軟件”...等等,而其中的m=6,即共有六個類別。當(dāng)然,可以針對文檔的種類而將其分為任意數(shù)量,上述分類的方式僅為舉例說明,而并不用來限制本發(fā)明。
      圖3是本發(fā)明在服務(wù)器端以扁平結(jié)構(gòu)管理的分類結(jié)構(gòu)的示意圖。
      圖4是本發(fā)明在客戶機(jī)端所定義的分類樹結(jié)構(gòu)的示意圖。
      圖5是本發(fā)明在客戶機(jī)端所定義的另一分類樹結(jié)構(gòu)的示意圖。
      如圖3所示,在服務(wù)器102中,上述各個類別之間并沒有相互的從屬關(guān)系,而僅僅用一種扁平的結(jié)構(gòu)對其進(jìn)行管理。而在客戶機(jī)101中,用戶可以根據(jù)服務(wù)器102中的這個類別組來定義其自己的個性化分類模式,例如是樹結(jié)構(gòu),這個樹結(jié)構(gòu)的每個節(jié)點(diǎn)對應(yīng)于類別組C中的一個或幾個類別。例如,對于服務(wù)器102中的類別組C例,用戶可以在客戶機(jī)101中定義如圖4所示的樹結(jié)構(gòu),也可以定義如圖5所示的樹結(jié)構(gòu)。在圖5所示的樹結(jié)構(gòu)中,節(jié)點(diǎn)tr10對應(yīng)于類別組C例中的兩個類別,即“軟件”和“游戲”。
      這樣,因只對一個扁平的類別結(jié)構(gòu)進(jìn)行管理,在服務(wù)器102側(cè)對數(shù)據(jù)進(jìn)行管理的復(fù)雜程度被降低了,而用戶則可以在客戶機(jī)101上根據(jù)自己的喜好來定制自己所期望的分類瀏覽結(jié)構(gòu)。
      每個類別ci都有唯一與其對應(yīng)的二值化器fi,用于將該類別ci中的所有文檔二值化。在本發(fā)明中,可以使用任何種類的二值化器,例如SVM(支撐向量機(jī))二值化器、貝葉斯(Bayesian)二值化器等,它們都是本領(lǐng)域中的成熟技術(shù),在此將省略對它們的詳細(xì)描述。
      每個類別ci還有唯一與其對應(yīng)的比特串,該比特串代表該類別ci在類別組C中的位置,各個比特串組成一個比特串?dāng)?shù)組。這里,將比特串表示為si={bij|j=1...m,如果i<>j則bij=0,如果i=j(luò)則bij=1}。其含義可以這樣來理解,以上述類別組C例為例,其中c4=“游戲”,則與其對應(yīng)的比特串為s4={0,0,0,1,0,0},即當(dāng)j=i=4時,s4=b4,4=1,而該比特串中其余的比特為零,這表示該類別“游戲”在類別組C例中的第四個位置。在上述比特串?dāng)?shù)組中,包括了與該類別組C中的每個類別相對應(yīng)的各個比特串。
      文檔組被表示為D={d1,d2,...,dn},dj(y=1,2,...,n)表示文檔組D中的每個文檔,其中j代表每個文檔的識別信息,即文檔ID。這里,文檔ID表現(xiàn)為各個文檔在文檔組D中的位置信息,當(dāng)然,文檔ID還可以是其它任何可以用來識別該文檔的信息,其中可以包括其位置信息,而不僅僅是位置信息。該文檔組D包括了服務(wù)器102的數(shù)據(jù)庫122中所存儲的、允許用戶瀏覽的全部文檔,根據(jù)種類的不同,這些文檔被分配到相應(yīng)的類別當(dāng)中。用與各個類別ci對應(yīng)的二值化器fi處理所有的文檔dj,使每個文檔針對每個類別都成為一個二進(jìn)制的比特值,從而形成了每個文檔的輸出向量,表示為vj=(vj1,vj2,...,vjm)。這里,如果文檔dj屬于某一個類別,則該文檔在該類別下的二進(jìn)制值為1,而如果文檔dj不屬于某一個類別,則該文檔在該類別下的二進(jìn)制值為零。
      例如,在上述文檔組D中有八篇文檔,即D={d1,d2,...,d8},其中第3篇文檔d3屬于類別c2=“軟件”和c5=“購物”,則該文檔d3的輸出向量為{0,1,0,0,1,0}。
      圖6是本發(fā)明的分類矩陣的示意圖。
      通過上述定義的類別組C和文檔組D,可以將所有的類別和文檔形成一個j行i列的矩陣結(jié)構(gòu)M,這個矩陣結(jié)構(gòu)M中的每個元素mj,i=vj,i,代表文檔dj在類別ci項下的二值化結(jié)果,如圖6所示。
      另外,初始化部件200還提供了類別表,其被表示為CTi,每個類別表都與一個類別ci相對應(yīng),在其中存儲該類別中所包括的所有文檔的識別信息。為了提高存取速度,可以使用高效率的數(shù)據(jù)結(jié)構(gòu)來實(shí)現(xiàn)類別表,例如使用B樹結(jié)構(gòu)或Binary balance樹結(jié)構(gòu)等。因此,實(shí)際上類別表是一組列表(list),如上述所舉的例子,參考圖6可知共有6個類別,8篇文檔,其中類別表CT1={1,4,7},對應(yīng)于類別c1=“互聯(lián)網(wǎng)”,其中文檔d1,d4和d7屬于這個類別;類別表CT2={3,5,7},對應(yīng)于類別c2=“軟件”,其中文檔d3,d5和d7屬于這個類別;如此類推,類別表CT6={1,2,6},對應(yīng)于類別c6=“硬件”,其中文檔d1,d2和d6屬于這個類別。
      上述形成的各種基本信息模型,可以存儲在數(shù)據(jù)庫122中,也可以存儲在服務(wù)器102中的其它存儲裝置(未示出)中。
      另外,通過系統(tǒng)分類裝置121中的更新部件201,可以在上述形成的分類矩陣的基礎(chǔ)上,對文檔和類別進(jìn)行更新操作,即增加新的文檔或類別,或刪除原有的文檔或類別。
      這種更新操作可以由網(wǎng)絡(luò)(或服務(wù)器)管理員通過控制端口104輸入控制指令來完成,也可以通過軟件的控制由更新部件201自主完成。其中在文檔和類別的增加操作中,更新部件201將新增加的文檔或類別的內(nèi)容輸入二值化器(未示出),并從二值化器中輸出與文檔對應(yīng)的輸出向量(二值化結(jié)果),或與類別對應(yīng)的比特串,并將這些輸出值添加到分類矩陣M中。
      對于新插入的文檔,在這個分類矩陣M中將其表示為新插入的行,而對于刪除的文檔,則將其表示為該矩陣中所刪除的行。另外,對于類別組的更新,在該矩陣中將表示為相應(yīng)的列插入(增加類別)和列刪除(刪除類別)。
      為了有助于更新操作,初始化部件200還建立了類別更新列表Lc和文檔更新列表Ld。在類別更新列表Lc中,記錄有被刪除的類別ci在類別組C中的位置信息(即矩陣M中的某列),而在文檔更新列表Ld中,記錄有被刪除的文檔dj在文檔組D中的位置信息(即矩陣M中的某行)。文檔更新列表Ld和類別更新列表Lc都可以用堆棧式的數(shù)據(jù)結(jié)構(gòu)來實(shí)現(xiàn)。例如,對于上述例子,其中有6個類別,此時類別更新列表Lc為空。假定我們增加一個類別c7,因為Lc是空的,所以新增加類別的類別ID就為7,因而在矩陣M中將增加第7列c7。但是,這時類別更新列表Lc沒有變化。
      假定我們現(xiàn)在刪除類別c3,則在做相應(yīng)的刪除操作的同時,將識別信息3(在這里為位置信息)加入類別更新列表Lc中,即Lc={3},其中的識別信息“3”代表矩陣M中的第3列現(xiàn)在為空。這樣,如果我們以后再增加一個新的類別,因為Lc中有數(shù)值(即識別信息),就將識別信息“3”從Lc中提取出來,將其附值給新增加類別的ID,則新增加的類別就是c3,而不需要再為其增加一個新的類別ID“8”。這樣可以為服務(wù)器102節(jié)省大量的存儲空間,并因此大大地提高了整個系統(tǒng)的工作效率。
      另外,當(dāng)添加一個新的類別ci時,還應(yīng)該對所有文檔在該類別ci下的狀態(tài)進(jìn)行判斷,如果某個文檔dj在該類別ci下的二值化結(jié)果是1,則應(yīng)該將該文檔dj的識別信息j記錄到與該類別ci對應(yīng)的類別表CTi中。
      下面是用于實(shí)現(xiàn)上述刪除一個類別的操作的程序代碼 Delete an existing category cipush i inito Lc.delete CTi for(k=1,k<=n,k++)mk,i=0; delete ci from C 下面是用于實(shí)現(xiàn)上述添加一個類別的操作的程序代碼   Insert a new category c with associated classifier f;   if(Lc is empty)   Category id of ci=sizeof(C)+1   else   i=pop(Lc)   ci=c;fi=f;   initial si and CTi;   for(k=1,k<=n,k++)   {   mk,i=fi(dk);   if(mk,i=1)   {   insert k into CTk.   }   }   insert ci into C 文檔更新列表Ld的結(jié)構(gòu)和工作原理與類別更新列表Lc基本上是相同的。對于新插入的某個文檔dj,如果其在某個類別ci下的二值化結(jié)果為1,將該文檔的識別信息j插入到該類別的類別表CTi中。因此在這里將省略對其的詳細(xì)描述。
      下面是用于實(shí)現(xiàn)上述刪除一個文檔的操作的程序代碼   Delete an existing document dj   pushj into Ld   for(k=1,k<=m,k++)   {   if(mj,k=1)   {<!-- SIPO <DP n="8"> --><dp n="d8"/>   deletej in CTk;   set mj,k=0;   }  }  delete dj from D 下面是用于實(shí)現(xiàn)上述添加一個文檔的操作的程序代碼   Insert a new document d   if(Ld is empty)   document id of dj=sizeof(D)+1   else   j=pop(Ld)   dj=d;   insert dj to D;   calculate vj;   for(k=1,k<+m,k++)   {   mj,k=vj,k;   if(vj,k=1)   {   insert k into CTk   }  } 這樣,就在服務(wù)器102中建立了一個扁平分類結(jié)構(gòu)的統(tǒng)一模型,其結(jié)構(gòu)簡單,并且在使用過程中,只需要對這個模型進(jìn)行訓(xùn)練和更新,而無須訓(xùn)練和更新更多的分類模型。
      下面,將結(jié)合附圖對用戶定義個性化分類結(jié)構(gòu)的方法進(jìn)行描述。
      圖7是表示用戶在客戶機(jī)101上定義分類樹結(jié)構(gòu)的示例。這里以樹結(jié)構(gòu)作為個性化分類結(jié)構(gòu)的例子,當(dāng)然用戶也可以用其它結(jié)構(gòu)來實(shí)現(xiàn)個性化的分類結(jié)構(gòu)。對于用戶定義的樹結(jié)構(gòu)T,如前所述,對其中的每個節(jié)點(diǎn),用戶可以從服務(wù)器102側(cè)的扁平類別結(jié)構(gòu)中選擇一個或幾個類別。然后,對類別樹結(jié)構(gòu)T中的節(jié)點(diǎn)tx產(chǎn)生相應(yīng)的類別組Cx,該類別組Cx屬于類別組C,包括類別組C中的一個或幾個類別。例如,參照圖5可知,各個節(jié)點(diǎn)tr20、tr10、t12和t13分別是“軟件和游戲”、“互聯(lián)網(wǎng)”、“購物”和“硬件”,其中一個根節(jié)點(diǎn)tr10對應(yīng)于類別組C例中的類別“軟件”和“游戲”,并在此基礎(chǔ)上形成新的類別組Cx,其由類別“軟件”和“游戲”組成。
      用戶在客戶機(jī)101上形成分類樹結(jié)構(gòu)的操作方法是本領(lǐng)域技術(shù)人員的常識,例如可以通過服務(wù)器102提供的網(wǎng)頁上的提示,用鼠標(biāo)將網(wǎng)頁上顯示的類別圖標(biāo)拖動到特定位置來完成,當(dāng)然也可以通過向提示框中輸入文字信息來完成。這里將省略對其的詳細(xì)描述。
      當(dāng)用戶建立根節(jié)點(diǎn)tr時,如果用戶只選擇了一個類別ci,則將該類別ci分配給根節(jié)點(diǎn)tr,該根節(jié)點(diǎn)tr可以用該類別ci的比特串si來表示。例如,如果將節(jié)點(diǎn)c2=“軟件”分配給該根節(jié)點(diǎn)tr,因與類別c2=“軟件”對應(yīng)的比特串是si={0,1,0,0,0,0},則該根節(jié)點(diǎn)tr=s2={
      }。當(dāng)然也可以選擇兩個或多個根節(jié)點(diǎn),如圖4所示的結(jié)構(gòu),這時有根節(jié)點(diǎn)tr1=s2={
      }和根節(jié)點(diǎn)tr2=s6={
      }。
      如果用戶在根節(jié)點(diǎn)tr上選擇了兩個或多個類別,例如是ci和ci+2,在這種情況下,還要對這兩個或多個類別之間的邏輯關(guān)系進(jìn)行判斷。
      如果類別ci和ci+2之間是邏輯“或”的關(guān)系,即在該根節(jié)點(diǎn)中既要求有ci中的全部文檔,也要求有ci+2中的全部文檔,在這種情況下,對ci中的全部文檔和ci+2中的全部文檔進(jìn)行邏輯“或”運(yùn)算,其結(jié)果作為該根節(jié)點(diǎn)tr中的類別,而這時該根節(jié)點(diǎn)tr用{[si]∪[si+2]}來表示。例如,在上述例子中,如圖5所示,在根節(jié)點(diǎn)tr20中選擇了類別c2=“軟件”和c4=“游戲”,要求在該根節(jié)點(diǎn)中既要包括類別c2=“軟件”中的所有文檔,也要包括類別c4=“游戲”中的所有文檔,因與類別c2=“軟件”對應(yīng)的比特串為s2={0,1,0,0,0,0},與類別c4=“游戲”對應(yīng)的比特串為s4={0,0,0,1,0,0},則該根節(jié)點(diǎn)tr20表示為tr20={[s2]∪[s4]}={

      }。其含義為經(jīng)過上述邏輯“或”的處理,根節(jié)點(diǎn)tr20中包括類別c2=“軟件”中的全部文檔及類別c4=“游戲”中與類別c2=“軟件”中的文檔不重復(fù)的所有文檔。
      接下來介紹在客戶機(jī)101上定義根節(jié)點(diǎn)以下的各個次級節(jié)點(diǎn)的方法。
      在定義各次級節(jié)點(diǎn)時,除了進(jìn)行與上述定義根節(jié)點(diǎn)相同的處理外,還要將該被定義的次級節(jié)點(diǎn)所包含的類別與其父節(jié)點(diǎn)(即上級節(jié)點(diǎn))中所包含的類別進(jìn)行邏輯“與”運(yùn)算,該運(yùn)算結(jié)果作為該被定義的次級節(jié)點(diǎn)中最終所包含的類別。例如,參照圖5所示,在定義節(jié)點(diǎn)t12中所包含的類別時,先將類別c5=“購物”分配給節(jié)點(diǎn)t12,即t12=s5={
      }。然后,因其父節(jié)點(diǎn)tr20中包含類別c1=“互聯(lián)網(wǎng)”,即tr20=s1={1,0,0,0,0,0},則將類別c5=“購物”與類別c1=“互聯(lián)網(wǎng)”進(jìn)行邏輯“與”運(yùn)算,該運(yùn)算產(chǎn)生的結(jié)果作為節(jié)點(diǎn)t12中所包含的類別,即t12={[s5]∩[s1]}={
      ∩[1,0,0,0,0,0]}。其含義為經(jīng)過上述邏輯“與”的處理,節(jié)點(diǎn)t12中包括既屬于類別c5=“購物”、又同時屬于類別c1=“互聯(lián)網(wǎng)”的文檔。
      至此,用戶可以在客戶機(jī)101上定義自己所期望的文檔分類結(jié)構(gòu)了。例如,用戶定義了如圖4所示的分類結(jié)構(gòu)。
      用戶定義的這個分類結(jié)構(gòu)只需要映射到服務(wù)器102,使服務(wù)器102能夠從數(shù)據(jù)庫122中提取用戶所需要的文檔,并提供給客戶機(jī)101,而無須將該分類結(jié)構(gòu)作為一種固定的分類模型來進(jìn)行訓(xùn)練,因為用戶隨時都可以根據(jù)自己的意愿來對其進(jìn)行修改。這樣,就使服務(wù)器102中用于計算和存儲的工作負(fù)擔(dān)大大地減輕了。
      下面是一段可以實(shí)現(xiàn)該功能的程序代碼,可以根據(jù)下面的方法產(chǎn)生自定義的分類樹結(jié)構(gòu)。
        Algorithm calculating the node bit string of node ti   Bitstring node_bit_string(ti)   {   if ti=root(T)   {   bit_ret=0;   traversal all element c in Ci   {   bit_ret∨=bit string of c;//where∨is bit operation‘or’   }   }   else   {   bit_ret=0;<!-- SIPO <DP n="11"> --><dp n="d11"/>   traversal all element c in Ci   {   bit_ret∨=bit string of c;//where∨is bit operation‘or’   }   bit_ret∧=node_bit_string(parent node of ti);//where∧is bit<br/>operation‘a(chǎn)nd’   }   return bit_ret;  } 另外,在定義根節(jié)點(diǎn)tr時,在某些情況下,用戶所選定的類別ci和ci+2之間可以是邏輯“與”的關(guān)系(未示出),即要求在該根節(jié)點(diǎn)tr20中只包括類別ci和類別ci+2中同時存在的全部文檔。在這種情況下,與定義次級節(jié)點(diǎn)的方法相同,對ci中的全部文檔和ci+2中的全部文檔進(jìn)行邏輯“與”運(yùn)算,其結(jié)果作為該根節(jié)點(diǎn)tr中所包含的類別,而這時該根節(jié)點(diǎn)tr用{[si]∩[si+2]}來表示。例如,在上述例子中,如果在圖4的根節(jié)點(diǎn)tr20中選擇了類別c2=“軟件”和c4=“游戲”,要求在該根節(jié)點(diǎn)中包括同時存在于類別c2=“軟件”和類別c4=“游戲”中所有文檔。這時,因與類別c2=“軟件”對應(yīng)的比特串為s2={0,1,0,0,0,0},與類別c4=“游戲”對應(yīng)的比特串為s 4={0,0,0,1,0,0},則該根節(jié)點(diǎn)tr20表示為tr20={[s2]∪[s4]}={

      }。其含義為經(jīng)過上述邏輯“與”的處理,根節(jié)點(diǎn)tr20中包括既屬于類別c2=“軟件”、又同時屬于類別c4=“游戲”的文檔。
      以上是定義根節(jié)點(diǎn)及其各個次級節(jié)點(diǎn)的方法的簡單示例,在實(shí)際定義各個節(jié)點(diǎn)的過程中,總是存在多個類別,且各個類別之間是邏輯“或”和邏輯“與”相互交叉的復(fù)雜關(guān)系,在這種情況下,則可以根據(jù)上述方法的原則對其進(jìn)行相應(yīng)的邏輯運(yùn)算,只不過運(yùn)算后的結(jié)果會更加復(fù)雜。
      當(dāng)然,用戶也可以在一個客戶機(jī)101上同時定義多個分類樹結(jié)構(gòu),即確定多個根節(jié)點(diǎn),其方法與上述方法相同。
      下面將介紹用戶在客戶機(jī)101上通過選定節(jié)點(diǎn)而瀏覽相應(yīng)文檔的處理。
      當(dāng)在客戶機(jī)101上選定特定節(jié)點(diǎn)tx時,可以同時給出用戶所期望獲得的文檔的條件信息,如最大數(shù)量、日期等,如果未給出條件信息,則可以給出各個條件信息的默認(rèn)值。
      這時,通過該特定節(jié)點(diǎn)tx的比特串來確定該節(jié)點(diǎn)中所包含的各個類別及其相互之間的邏輯關(guān)系。例如,在圖4所示的示例中,如果選定節(jié)點(diǎn)t12,那么可以通過與其對應(yīng)的比特串t12={
      ∩[1,0,0,0,0,0]},來確定其包含有類別c5=“購物”和類別c1=“互聯(lián)網(wǎng)”,并且這兩個類別之間為邏輯“與”的關(guān)系。
      然后,系統(tǒng)分類裝置121遍歷(搜索)分別與各個類別對應(yīng)的各個類別表,以確定哪個類別中包括更少的文檔,并從被判斷為包含有最少數(shù)量文檔的類別開始,按從少到多的順序?qū)ι鲜鲱悇e進(jìn)行排列。例如,對與類別c5和c1對應(yīng)的類別表CT5和CT1進(jìn)行遍歷,發(fā)現(xiàn)在類別c5中包含有30篇文檔,而在類別c1中包含有500篇文檔,則系統(tǒng)分類裝置121確定在類別c5=“購物”中含有最少的文檔,并按c5、c1的順序?qū)@兩個類別進(jìn)行排列。
      接下來,系統(tǒng)分類裝置121在含有最少數(shù)量文檔的類別中搜索滿足該特定節(jié)點(diǎn)tx的條件的文檔,并在隨后的處理中將所搜索到的文檔提供給客戶機(jī)101,以供用戶瀏覽。即,系統(tǒng)分類裝置121在數(shù)據(jù)庫122中搜索包含于類別c5=“購物”中、且滿足條件t12={
      ∩[1,0,0,0,0,0]}的文檔,并在隨后的處理中將所搜索到的文檔提供給客戶機(jī)101。
      如果在含有最少數(shù)量文檔的類別中所找到的滿足條件的全部文檔仍然未達(dá)到用戶所要求的數(shù)量條件,則系統(tǒng)分類裝置121在所判斷的、包含有第二少數(shù)量文檔的類別中繼續(xù)搜索。在本例中,則在類別c1=“互聯(lián)網(wǎng)”中繼續(xù)搜索滿足上述條件的文檔,直至達(dá)到用戶所要求的數(shù)量為止。
      在上述搜索過程中,系統(tǒng)分類裝置121將搜索到的文檔的列表實(shí)時提供給客戶機(jī)101,形成一個實(shí)時提供的文檔列表,并在客戶機(jī)101的顯示器(未示出)上顯示出來。
      如果用戶希望閱讀在上述文檔列表中所列出的某篇文檔,則通過輸入裝置(未示出,例如鍵盤、鼠標(biāo)、手寫板等)進(jìn)行選定操作。然后,瀏覽裝置111將該選定結(jié)果通知給服務(wù)器102,這時服務(wù)器102將該被選定的文檔從數(shù)據(jù)庫122中提取出來,并將其提供給客戶機(jī)101上的瀏覽裝置,以在顯示器上進(jìn)行顯示。
      如果在如圖4所定義的分類樹結(jié)構(gòu)的情況下,參照圖6所示的分類矩陣,用戶在節(jié)點(diǎn)tr1即“軟件”項下,可以得到d3、d5和d7三篇文檔,在節(jié)點(diǎn)tr2即“硬件”項下,可以得到d1、d2和d6三篇文檔。在節(jié)點(diǎn)t1即“編程”項下,用戶可以得到d5一篇文檔,可見該文檔d5也屬于其上級節(jié)點(diǎn)tr1。而在節(jié)點(diǎn)t2即“互聯(lián)網(wǎng)”項下,用戶可以得到d1一篇文檔,在節(jié)點(diǎn)t3即“游戲”項下,用戶可以得到d1和d2兩篇文檔,可見文檔d1和d2也屬于其上級節(jié)點(diǎn)tr2。在上述過程中,服務(wù)器102將實(shí)時向客戶機(jī)101提供在每個類別項下的文檔列表,并在隨后的處理中,根據(jù)客戶機(jī)101上的選定結(jié)果,將用戶所需要的文檔提供給客戶機(jī)101。
      如果在特定節(jié)點(diǎn)tx中含有多個類別,則按上述方式以此類推進(jìn)行搜索。下面是用來實(shí)現(xiàn)上述功能的一段程序代碼。
        algorithm Anode(ti,T,max_return_number)   initial return document set ret_set=empty set   calculate node bit string si of node ti   arg min   find cj where sizeof(ck)(kth bit of si=1)   l=0;   traversal all document d in CTj   {   if((vd^si)==si)//where^is bit operation‘a(chǎn)nd’   {   insert d into ret_set;   1++;   if(1>=max_return_number)   return ret_set;   }   }   return ret_set; 其中,在上述程序中,變量ti代表用戶所指定的節(jié)點(diǎn),T代表該節(jié)點(diǎn)ti所屬于的分類樹,max_return_number代表用戶所期望返回的最大文檔數(shù)量,而ret_set代表實(shí)際返回的文檔。
      在上述搜索過程中,通過從記錄有最少文檔數(shù)量的類別中開始檢索要瀏覽的文檔,可以減少服務(wù)器102中的計算量和搜索量,因此可以有效地減少服務(wù)器102所承擔(dān)的計算負(fù)荷。
      下面,將結(jié)合附圖8簡要描述實(shí)現(xiàn)本發(fā)明的文檔分類方法的流程。
      圖8是描述實(shí)現(xiàn)本發(fā)明的文檔分類方法的流程圖。如圖8所示,首先,在服務(wù)器102上為要被瀏覽的文檔建立多個類別,并將所述文檔分配到相應(yīng)的類別之下,其中以扁平結(jié)構(gòu)管理多個所述類別(如圖3所示)。
      其中,在步驟S1中,分別建立類別組C和文檔組D,其中類別組C中包括多個所述類別ci,每個所述類別具有唯一的識別信息,文檔組D中包括要被瀏覽的全部文檔dj,每個所述文檔具有其唯一的識別信息。
      在步驟S2,建立包含多個比特串的比特串?dāng)?shù)組S,其中每個比特串si表示與其相應(yīng)的類別ci在所述類別組C中的位置。
      在步驟S3,為每個所述類別建立相應(yīng)的類別表CTi,其中存儲屬于該類別的各個文檔的唯一識別信息。其中將各個文檔dj二值化,如果一文檔屬于某一類別,則該文檔在該類別下的二值化結(jié)果為1,并將該文檔的識別信息插入到該類別的所述類別表中;如果一文檔不屬于某一類別,則該文檔在該類別下的二值化結(jié)果為0。
      在步驟S4,建立類別更新列表Lc和文檔更新列表Ld,用于分別記錄所述類別ci和所述文檔dj的更新狀態(tài)。其中所述類別ci的識別信息包括該類別ci在所述類別組C中的位置信息,并且所述文檔的識別信息包括該文檔dj在所述文檔組D中的位置信息。在更新過程中,可以包括如下的子步驟 當(dāng)刪除一類別ci時,刪除與其相應(yīng)的比特串si,并在所述類別更新列表Lc中標(biāo)記該類別ci在該類別更新列表Lc中的位置信息,表示該位置為空。
      當(dāng)插入一新類別ci時,先在所述類別更新列表Lc中進(jìn)行搜索,如果找到被標(biāo)記的位置信息,則將該類別ci插入所述類別組C中的相應(yīng)位置,并刪除所述類別更新列表Lc中的位置信息;如果沒有找到被標(biāo)記的位置信息,則將該類別ci插入到所述類別組C中的新位置;以及將與所插入的類別ci相應(yīng)的比特串si增加到比特串?dāng)?shù)組S中。
      當(dāng)要刪除一文檔dj時,從各個類別表CTi中刪除所述文檔的識別信息,并在所述文檔更新列表Ld中標(biāo)記所述文檔dj在文檔組D中的位置信息,表示該位置為空。
      當(dāng)要插入一文檔dj時,先在所述文檔更新列表Ld中進(jìn)行搜索,如果找到被標(biāo)記的文檔位置信息,則將該文檔dj插入到所述文檔組D中的相應(yīng)位置,并刪除所述文檔更新列表Ld中的該位置信息。
      如果沒有找到被標(biāo)記的所述文檔位置信息,則將所述文檔dj插入到所述文檔組D中的一個新位置,同時將所述文檔識別信息插入到各個類別表中。
      接下來,在步驟S5,在客戶機(jī)101上,從上述類別組C中選擇用戶所需要的類別,以建立個性化分類結(jié)構(gòu),并將該個性化分類結(jié)構(gòu)映射給服務(wù)器102,其中上述個性化分類結(jié)構(gòu)可以是樹結(jié)構(gòu),而所述樹結(jié)構(gòu)的每個節(jié)點(diǎn)包括一個或多個類別。其具體為在建立根節(jié)點(diǎn)tr時,對選定的一個或多個類別進(jìn)行邏輯“或”運(yùn)算或邏輯“與”運(yùn)算,其結(jié)果作為根節(jié)點(diǎn)tr所具有的類別;和在建立次級節(jié)點(diǎn)tx時,對為該次級節(jié)點(diǎn)tx選定的一個或多個類別進(jìn)行邏輯“或”運(yùn)算或邏輯“與”運(yùn)算,再將該結(jié)果與該次級節(jié)點(diǎn)tx的父節(jié)點(diǎn)中的類別進(jìn)行邏輯“與”運(yùn)算,并將邏輯“與”運(yùn)算的結(jié)果作為該次級節(jié)點(diǎn)tx中所具有的類別。
      在步驟S6中,用戶在客戶機(jī)101上選定樹結(jié)構(gòu)中的特定節(jié)點(diǎn),確定該節(jié)點(diǎn)中所包含的各個類別;將該選定結(jié)果通知給服務(wù)器102。
      在步驟S7中,服務(wù)器102響應(yīng)該選定請求,判定與各個類別相應(yīng)的類別表中所記錄的文檔數(shù)量的多少,并從記錄最少文檔數(shù)量的類別中開始檢索要瀏覽的文檔;將該節(jié)點(diǎn)所包含的被請求的文檔提供給客戶機(jī)101,供用戶進(jìn)行瀏覽。
      以上對本發(fā)明中的文檔分類方法進(jìn)行了描述。
      另外,本發(fā)明中所提供的程序代碼并不是唯一的,只要能實(shí)現(xiàn)本發(fā)明的目的,本領(lǐng)域的技術(shù)人員可以在上述思想的指導(dǎo)下,用各種程序代碼來實(shí)現(xiàn)。
      如上所述,對于本發(fā)明的個性化分類設(shè)計,我們需要做的全部事情就是在客戶機(jī)上對服務(wù)器所提供的扁平式的類別結(jié)構(gòu)進(jìn)行選擇(例如是鼠標(biāo)拖放操作),并對現(xiàn)有系統(tǒng)類別數(shù)據(jù)庫應(yīng)用上述方法Anode(例如是鼠標(biāo)點(diǎn)擊),因為在本發(fā)明中沒有針對于任何個性化結(jié)構(gòu)的模型(分類器),所以無需對多個分類模型進(jìn)行訓(xùn)練,并且所有的個性化文檔分類都可以基于一個統(tǒng)一的分類模型來產(chǎn)生。因此,本發(fā)明的方法對個性化分類來說,是非常有效和實(shí)用的。
      以上所述,僅為本發(fā)明的較佳實(shí)施例而已,不能以其限定本發(fā)明所要求保護(hù)的范圍。本領(lǐng)域技術(shù)人員知道,依照本發(fā)明的實(shí)施例可以做出各種均等變化與變形,其都應(yīng)屬于本發(fā)明所覆蓋的范圍之內(nèi)。
      權(quán)利要求
      1.一種文檔分類處理方法,包括步驟
      (1)在服務(wù)器端建立多個類別,將供用戶瀏覽的文檔分配到相應(yīng)的類別之下,并以扁平結(jié)構(gòu)管理多個所述類別;以及
      (2)在客戶機(jī)端,從多個類別中選擇所需類別來建立個性化分類結(jié)構(gòu)。
      2.如權(quán)利要求1所述的文檔分類處理方法,其特征在于所述個性化分類結(jié)構(gòu)是樹結(jié)構(gòu),所述樹結(jié)構(gòu)的每個節(jié)點(diǎn)包括一個或多個類別。
      3.如權(quán)利要求2所述的文檔分類處理方法,其特征在于還包括步驟
      (3)在客戶機(jī)端,通過選定樹結(jié)構(gòu)中的特定節(jié)點(diǎn),瀏覽所需文檔。
      4.如權(quán)利要求3所述的文檔分類處理方法,其特征在于所述步驟(1)還包括步驟
      建立類別組,其中類別組中包括多個所述類別,每個所述類別具有第一識別信息;
      建立文檔組,其中文檔組中包括要被瀏覽的全部文檔,每個所述文檔具有第二識別信息;
      建立包含多個比特串的比特串?dāng)?shù)組,其中每個比特串表示與其相應(yīng)的類別在所述類別組中的位置;和
      為每個所述類別建立相應(yīng)的類別表,其中存儲屬于該類別的各個文檔的第二識別信息。
      5.如權(quán)利要求4所述的文檔分類處理方法,其特征在于還包括步驟
      將各個文檔二值化,其中如果一文檔屬于某一類別,則該文檔在該類別下的二值化結(jié)果為1,并將該文檔的第二識別信息插入到該類別的所述類別表中;如果一文檔不屬于某一類別,則該文檔在該類別下的二值化結(jié)果為0。
      6.如權(quán)利要求5所述的文檔分類處理方法,其特征在于還包括步驟
      建立類別更新列表和文檔更新列表,用于分別記錄所述類別和所述文檔的更新狀態(tài)。
      7.如權(quán)利要求6所述的文檔分類處理方法,其特征在于所述類別的第一識別信息包括該類別在所述類別組中的第一位置信息,并且所述文檔的第二識別信息包括該文檔在所述文檔組中的第二位置信息。
      8.如權(quán)利要求7所述的文檔分類處理方法,其特征在于還包括步驟
      當(dāng)刪除一類別時,刪除與其相應(yīng)的比特串,并在所述類別更新列表中標(biāo)記所述第一位置信息,表示該位置為空。
      9.如權(quán)利要求8所述的文檔分類處理方法,其特征在于還包括步驟
      當(dāng)插入一類別時,先在所述類別更新列表中進(jìn)行搜索,如果找到被標(biāo)記的第一位置信息,則將該類別插入所述類別組中的相應(yīng)位置,并刪除所述類別更新列表中的所述第一位置信息;
      如果沒有找到被標(biāo)記的所述第一位置信息,則將該類別插入到所述類別組中的新位置;以及
      將與所插入的類別相應(yīng)的比特串增加到比特串?dāng)?shù)組中。
      10.如權(quán)利要求7所述的文檔分類處理方法,其特征在于還包括步驟
      當(dāng)刪除一文檔時,從所述類別表中刪除所述文檔的所述第二識別信息,并在所述文檔更新列表中標(biāo)記所述第二位置信息,表示該位置為空。
      11.如權(quán)利要求10所述的文檔分類處理方法,其特征在于還包括步驟
      當(dāng)插入一文檔時,先在所述文檔更新列表中進(jìn)行搜索,如果找到被標(biāo)記的所述第二位置信息,則將該文檔插入所述文檔組中的相應(yīng)位置,并刪除所述文檔更新列表中的該位置信息;
      如果沒有找到被標(biāo)記的所述第二位置信息,則將所述文檔插入到所述文檔組中的新位置;以及
      將所述第二識別信息插入到所述類別表中。
      12.如權(quán)利要求2所述的文檔分類處理方法,其特征在于步驟(2)還包括
      在建立根節(jié)點(diǎn)時,對選定的一個或多個類別進(jìn)行邏輯“或”運(yùn)算或邏輯“與”運(yùn)算,其結(jié)果作為根節(jié)點(diǎn)所具有的類別;和
      在建立次級節(jié)點(diǎn)時,對為該次級節(jié)點(diǎn)選定的一個或多個類別進(jìn)行邏輯“或”運(yùn)算或邏輯“與”運(yùn)算,再將該結(jié)果與該次級節(jié)點(diǎn)的父節(jié)點(diǎn)中的類別進(jìn)行邏輯“與”運(yùn)算,并將邏輯“與”運(yùn)算的結(jié)果作為該次級節(jié)點(diǎn)中所具有的類別。
      13.如權(quán)利要求3或12所述的文檔分類處理方法,其特征在于步驟(3)還包括
      通過選定特定節(jié)點(diǎn),確定該節(jié)點(diǎn)中所包含的各個類別;
      判定與各個類別相應(yīng)的類別表中所記錄的文檔數(shù)量的多少;以及
      從記錄最少文檔數(shù)量的類別中開始檢索要瀏覽的文檔。
      14.如權(quán)利要求13所述的文檔分類處理方法,其特征在于還包括步驟
      向所述客戶機(jī)端實(shí)時提供搜索到的所述文檔的列表。
      15.如權(quán)利要求14所述的文檔分類處理方法,其特征在于還包括步驟
      在所述客戶機(jī)端從所述文檔的列表中選定要瀏覽的文檔;以及
      向所述客戶機(jī)端提供被選定的文檔,以供用戶瀏覽。
      16.一種文檔分類處理系統(tǒng),包括通過網(wǎng)絡(luò)連接的服務(wù)器和客戶機(jī),其特征在于還包括
      系統(tǒng)分類裝置,配置在所述服務(wù)器端,用于為供用戶瀏覽的各個文檔建立多個類別,將各個所述文檔分配到相應(yīng)的類別之下,并以扁平結(jié)構(gòu)管理所述多個類別;以及
      定制裝置,配置在所述客戶機(jī)端,用于從多個類別中選擇所需類別,以建立個性化分類結(jié)構(gòu)。
      17.如權(quán)利要求16所述的文檔分類處理系統(tǒng),其特征在于,所述系統(tǒng)分類裝置還包括初始化部件,用于對各種基本信息模型進(jìn)行初始化操作。
      18.如權(quán)利要求17所述的文檔分類處理系統(tǒng),其特征在于,所述系統(tǒng)分類裝置還包括更新裝置,用于對所述文檔和所述類別進(jìn)行更新處理。
      19.如權(quán)利要求18所述的文檔分類處理系統(tǒng),其特征在于所述個性化分類結(jié)構(gòu)是樹結(jié)構(gòu),所述樹結(jié)構(gòu)的每個節(jié)點(diǎn)包括一個或多個類別。
      20.如權(quán)利要求16所述的文檔分類處理系統(tǒng),其特征在于還包括
      瀏覽裝置,配置在所述客戶機(jī)端,用于在選定樹結(jié)構(gòu)的特定節(jié)點(diǎn)的情況下,接收服務(wù)器端提供的所需文檔并呈現(xiàn)給用戶。
      全文摘要
      本發(fā)明提供一種文檔分類處理方法和系統(tǒng),用于互聯(lián)網(wǎng)中的文檔瀏覽,該方法包括步驟在服務(wù)器端建立多個類別,將供用戶瀏覽的文檔分配到相應(yīng)的類別之下,并以扁平結(jié)構(gòu)管理多個所述類別;以及在客戶機(jī)端,從多個類別中選擇所需類別來建立個性化分類結(jié)構(gòu)。利用本發(fā)明的系統(tǒng)和方法能夠節(jié)省大量的計算和存儲成本。
      文檔編號G06F17/30GK1667607SQ20041002839
      公開日2005年9月14日 申請日期2004年3月11日 優(yōu)先權(quán)日2004年3月11日
      發(fā)明者蘇中, 潘越 申請人:國際商業(yè)機(jī)器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1