專利名稱:自動查詢?nèi)杭闹谱鞣椒?br>
技術(shù)領(lǐng)域:
本發(fā)明總體上涉及計算機(jī)系統(tǒng),更具體而言,涉及一種通過分析與各種屬性集群相關(guān)聯(lián)的項分布來自動將信息項編組成項的更小子集的系統(tǒng)和方法。
背景技術(shù):
基于數(shù)據(jù)庫的操作系統(tǒng)的一個關(guān)鍵方面就是通過執(zhí)行可能包含許多項屬性的查詢快速查找期望的項的能力。應(yīng)當(dāng)將這個能力與先前的系統(tǒng)相比較,所述先前的系統(tǒng)例如需要對文件夾分層結(jié)構(gòu)內(nèi)的文件位置的認(rèn)知以便檢索期望的信息。雖然查詢解決方案是非常有效的,但是更新的系統(tǒng)的成功總體上取決于創(chuàng)建允許查詢對普通的用戶而言變得簡單而直觀的用戶接口(UI)的能力。在其固有的形式中,數(shù)據(jù)庫查詢(例如,用T-SQL語言來表示)讓專業(yè)程序設(shè)計員難以處理并且通常不適合于終端用戶。
查詢問題的一種解決方案就是顯露提供對一些數(shù)目的預(yù)定義查詢直接訪問的用戶接口命令。例如,可以提供預(yù)定義查詢以便查找盤(相片庫)上的所有圖片文件或所有未經(jīng)閱讀的電子郵件。此外,系統(tǒng)可以按某種方式建議分組結(jié)果,例如,可以根據(jù)拍攝的日期自動將相片放進(jìn)組中。預(yù)定義查詢的這種模式對于許多常見的情況都是有用的,但是對于開啟數(shù)據(jù)庫的最大能力來說一般是不夠的。利用相片示例,可能恰巧所有相片都是在同一天拍攝的(或者,可能沒有設(shè)定照相機(jī)時鐘),而在這樣情況下按日期進(jìn)行分組是沒有用的。當(dāng)處理第三方屬性(應(yīng)用定義的、管理員定義的或用戶定義的)時這種情況甚至更糟。由于這些屬性對于操作系統(tǒng)的創(chuàng)建來說是不為人所知的,因而為屬性設(shè)計預(yù)定義查詢可能幾乎是不可能的。
別一種解決方案就是給用戶提供具有文本查詢的查詢數(shù)據(jù)庫的能力,所述文本查詢顯得像自然語言。從數(shù)據(jù)庫的角度來看,這類查詢可能一般是足夠的并且易于讓用戶理解的。然而,如果允許能夠充分采取自由形式的自然語言查詢,那么就難以創(chuàng)建會在每一種情況下都正確理解用戶意圖的解析器。如果強(qiáng)加一些語法限制,則對于用戶而言就變得更加難以形成能夠時常圍繞大量表達(dá)式進(jìn)行工作的句法上正確的查詢。不論是哪一種情況,都需要鍵入查詢文本的非常想法也許不是許多用戶所呼吁的。少數(shù)小孩、非英語用戶和鍵盤較小的裝置(例如,便箋式PC)的用戶可能全都有文本鍵入的問題。由此,需要一種具有用于查找和檢索信息的點(diǎn)擊簡單性的查詢界面。
發(fā)明內(nèi)容
為了提供對本發(fā)明的一些方面的基本理解,下面展示了簡單化的發(fā)明內(nèi)容。這些內(nèi)容不是本發(fā)明的寬泛概述。并不意在確定本發(fā)明的關(guān)鍵/至關(guān)重要的元件或描繪本發(fā)明的范圍。其唯一目的就在于以簡化形式來展示本發(fā)明的一些概念,以作為稍后展示的更詳細(xì)說明的前奏。
本發(fā)明涉及將期望的信息自動檢索和顯示到易管理的信息集群的子集中。在文件系統(tǒng)用戶接口中,比如通過將項顯示成列表來導(dǎo)航大的項集合,當(dāng)試圖從這類列表中查找和檢索期望的信息時,這變得有問題。本發(fā)明提供了一種改進(jìn)的點(diǎn)擊接口,所述點(diǎn)擊接口便于導(dǎo)航按照項的相關(guān)屬性而分類的大的項集合。按照這些屬性群集的項能夠以類似文件夾的方式呈現(xiàn)(或其它的顯示類型),借此可以通過不同的或后續(xù)的屬性來執(zhí)行自動群集化以便將查詢結(jié)果拆分或編組成易管理的集群的子集??梢赃x擇這些子集來檢索期望的信息或執(zhí)行其它的群集程序(例如,嵌套的群集化)。群集的最佳屬性能夠通過分析各種屬性集群中的項分布來確定。
本發(fā)明的一個方面提供了群集化屬性的自動選擇。為了確定這類屬性,一個問題可以陳述如下假定項的起始集合以及一組能用于編組的項屬性,與項集合相關(guān)聯(lián)的哪一個屬性提供了最佳群集的結(jié)果?通過最佳群集的結(jié)果,本發(fā)明試圖提供將結(jié)果統(tǒng)一編組成適度的集群數(shù)目。由此,為了高效地查找和檢索期望的信息,當(dāng)存在只有少數(shù)幾個具有許多項的集群時的情況或當(dāng)存在每個集群中只有少數(shù)幾個項的許多集群時的情況典型地不是人們希望的。
上述問題能夠通過給每個項屬性分配群集化分?jǐn)?shù)并且選擇具有最高分的屬性來解決。群集化分?jǐn)?shù)能夠通過將每個集群中的項的數(shù)目彼此相乘來計算。對于N個項而言,當(dāng)把所述項分成√N(yùn)個集群時,將群集化分?jǐn)?shù)計算為集群尺寸的乘積的函數(shù)具有它的最大值,各個集群都具有√N(yùn)個項。對于其它分布而言,利用所述分?jǐn)?shù)來測算并比較所述分布離理想分布還差多遠(yuǎn)??蛇x分?jǐn)?shù)函數(shù)的一個示例例如可以是以二項式分布為基礎(chǔ)的。對于這些典型分布而言,所述分?jǐn)?shù)值具有提供能夠把N_total個項分成指定尺寸的集群的許多方式的統(tǒng)計解釋。對于用戶而言具有大多數(shù)值的群集化就是調(diào)節(jié)相間分布的最大數(shù)目的一種群集化。為了比較能用于后續(xù)群集化的不同屬性,能夠為所有的屬性計算群集化分?jǐn)?shù),其中可以利用項列表的單次遍歷來容易地執(zhí)行這種計算。
為了實現(xiàn)上述目的和相關(guān)的目的,在此結(jié)合下列說明和附圖描述了本發(fā)明的某些說明性的方面。這些方面表現(xiàn)出了各種方式,以所述各種方式可以實施本發(fā)明,所有這些方式都意在為本發(fā)明所涵蓋。當(dāng)結(jié)合附圖考慮時,通過下列發(fā)明詳述,本發(fā)明的其它優(yōu)點(diǎn)和新穎性特征可以變得明顯。
附圖簡要說明
圖1是依照本發(fā)明一個方面的群集系統(tǒng)的示意性框圖。
圖2是舉例說明依照本發(fā)明一個方面的自動查詢?nèi)杭^程的流程圖。
圖3-10舉例說明依照本發(fā)明一個方面的用于自動查詢?nèi)杭氖纠杂脩艚涌凇?br>
圖11是舉例說明依照本發(fā)明一個方面的適當(dāng)操作環(huán)境的示意性框圖。
圖12是本發(fā)明能與之交互的樣本計算環(huán)境的示意性框圖。
發(fā)明詳述本發(fā)明涉及一種用于本地或遠(yuǎn)程數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)項的自動群集化和顯示的系統(tǒng)和方法。這種群集化能夠以與諸如類型、位置、人、日期、時間、用戶定義等等之類的數(shù)據(jù)項相關(guān)聯(lián)的屬性為基礎(chǔ),其中可以采用初始屬性來形成群集化的第一層,并且可以自動確定后續(xù)屬性以形成從中查找和檢索期望的信息的優(yōu)化群集化。在一個方面,提供了一種用于編組和檢索數(shù)據(jù)的計算機(jī)化接口。所述接口包括用于為至少兩個集群屬性確定項分布的屬性分析器,還包括部分地根據(jù)項分布來形成新集群的編組器。
正如在本申請中使用的那樣,術(shù)語″組件″、″分析器″、″集群″、″系統(tǒng)″等等都是用來指代與計算機(jī)有關(guān)的實體,或者是硬件、硬件和軟件的組合、軟件,或者是正在執(zhí)行的軟件。例如,組件可以是但不限于運(yùn)行在處理器上的進(jìn)程、處理器、對象、可執(zhí)行的、執(zhí)行的線程、程序和/或計算機(jī)。通過舉例說明的方式,運(yùn)行在服務(wù)器上的應(yīng)用和服務(wù)器本身都可以是組件。一個或多個組件可以駐留在執(zhí)行的進(jìn)程和/或線程之內(nèi),并且可以在一個計算機(jī)上定位組件或者可以在兩個或多個計算機(jī)之間發(fā)布所述組件。此外,可以從具備其上所存儲的各種不同數(shù)據(jù)結(jié)構(gòu)的各種不同的計算機(jī)可讀介質(zhì)上執(zhí)行這些組件。所述組件可以經(jīng)由本地和/或遠(yuǎn)程進(jìn)程來進(jìn)行通信,比如依照具有一個或多個數(shù)據(jù)分組的信號來進(jìn)行通信(例如,來自于與本地系統(tǒng)、分布式系統(tǒng)中的其它組件相交互的一個組件的數(shù)據(jù),和/或經(jīng)由所述信號跨諸如因特網(wǎng)之類的網(wǎng)絡(luò)來與其它系統(tǒng)進(jìn)行交互)。
最初參照圖1,舉例說明了依照本發(fā)明一個方面的查詢?nèi)杭到y(tǒng)100。所述系統(tǒng)100包括數(shù)據(jù)存儲器110,其存儲將要在用戶接口(未示出)上顯示的多個數(shù)據(jù)項120。這里數(shù)據(jù)項120可能包括能夠以各種可查看狀態(tài)出現(xiàn)在用戶接口上的文檔、文件、文件夾、圖像、音頻文件、源代碼等等,在下面將更詳細(xì)地描述所述用戶接口。所述項120還與各種屬性(例如,元數(shù)據(jù))相關(guān)聯(lián),其中將上述方面描述成項類型(例如,圖像、文檔、電子表格、二進(jìn)制等等)、創(chuàng)建日期、與項相關(guān)聯(lián)的人、位置、類別、用戶定義的屬性等等。集結(jié)器130收集所述項120以及相關(guān)的屬性,并且將這些項呈現(xiàn)給屬性分析器140,所述屬性分析器執(zhí)行對各個項和屬性的分析。例如,這類分析可以包括自動確定各種潛在集群情況或潛在項組的分?jǐn)?shù)(score)。
根據(jù)分析器140的分析,集群編組器150向用戶展現(xiàn)新集群160的優(yōu)化編組。集群160的優(yōu)化編組便于從數(shù)據(jù)存儲器110中查找和檢索期望的信息,所述數(shù)據(jù)存儲器可以包括本地存儲介質(zhì)、遠(yuǎn)程存儲介質(zhì)或本地和遠(yuǎn)程存儲介質(zhì)的組合。
在自動集群的一個示例中,缺省頂層群集化能夠按照項類型來對這些項進(jìn)行編組。在用戶研究中,人們發(fā)現(xiàn)按照項類型的第一層編組是有用的并且更易于用戶理解的。然而,人們也發(fā)現(xiàn)按照其它屬性的第二層群集化不明顯并且難以發(fā)覺。由此,本發(fā)明的一個方面是群集化屬性的自動選擇。一個問題可以陳述如下假定當(dāng)開始能夠用于編組的項集合和項屬性集合時,哪個屬性提供了最佳群集結(jié)果?通過最佳化或優(yōu)化群集結(jié)果,一個目的就是提供將項統(tǒng)一編組成適度的集群數(shù)目。
上述目的可以通過給每個項屬性分配群集化分?jǐn)?shù)并且選擇具有最高分的屬性來實現(xiàn)。所述群集化分?jǐn)?shù)可以通過將每個集群中的項數(shù)目乘在一起來計算,比如通過下列等式來計算score=n_itemscluster1*n_itemscluster2*……
對于N個項而言,將群集化分?jǐn)?shù)計算為集群尺寸的乘積的函數(shù)當(dāng)把所述項分成√N(yùn)個集群時具有它的最大值,每個集群都具有√N(yùn)個項。對于其它分布而言,利用分?jǐn)?shù)來測算和比較它離理想的或最優(yōu)化的分布還差多遠(yuǎn)。人們發(fā)現(xiàn)上述合理產(chǎn)性的分?jǐn)?shù)函數(shù)會導(dǎo)致測試情況(test cases)。然而,應(yīng)當(dāng)注意使用的分?jǐn)?shù)函數(shù)是一個示例。例如,在理想分布之外,可以采用給所述分布提供不同相對加權(quán)的其它函數(shù)。
可選的分?jǐn)?shù)函數(shù)的示例是以如下的二項分布為基礎(chǔ)的score=(N_total)!/((n_itemscluster1)!*(n_itemscluter2)!*……)在這個示例中,分?jǐn)?shù)值具有這樣的統(tǒng)計解釋,它提供了能夠?qū)_total個項分成指定尺寸的集群的許多方式。具有大部分用戶值的群集化是緩和許許多多相間分布(alternative distributions)的一種群集化。為了比較能夠用于后續(xù)群集化的不同屬性,計算對應(yīng)所有屬性的群集化分?jǐn)?shù)。正如在圖2中略述的過程中更詳細(xì)描述的那樣,這可以容易地通過單次遍歷所有項的列表來實現(xiàn)。
圖2是舉例說明依照本發(fā)明一個方面的自動群集化過程200的流程圖。雖然為了說明的簡明性起見,示出了所述方法并且將其描述成一系列動作,但是應(yīng)當(dāng)理解和認(rèn)識到的是,不按動作的順序來限制本發(fā)明,因為依照本發(fā)明一些動作可能是以不同順序發(fā)生的或是與這里所述示出和描述的其它動作同時發(fā)生的。例如,本領(lǐng)域的技術(shù)人員將理解和認(rèn)識到的是作為選擇可以將一種方法表示成一系列相關(guān)狀態(tài)或事件,比如狀態(tài)圖中的狀態(tài)或事件。另外,實現(xiàn)依照本發(fā)明的方法并不需要所有舉例說明的動作。
在此假定要比較N個項和M個屬性,可以按如下采用過程200在210,初始化M個散列表。在220,遍及N個項進(jìn)行迭代。在230,對于每個項,遍及M個屬性進(jìn)行迭代。在240,對于每個項屬性,計算散列值。用這樣一種方法來選擇散列函數(shù),即進(jìn)入相同集群的兩個屬性值返回相同的散列值。例如,當(dāng)對日期/時間屬性進(jìn)行群集時,散列函數(shù)可以僅僅依據(jù)日期部分,而忽略時間部分。在250,采用散列表來追蹤集群數(shù)目以及每個集群中的項數(shù)目。在260,利用來自于每個屬性的相關(guān)的散列表來為所述這些屬性計算群集化分?jǐn)?shù)。
在270,按照集群可能產(chǎn)性的集群質(zhì)量來對列表中的屬性進(jìn)行排序。如果項數(shù)目超過某一閾值(例如,超過10項)的話,則可以在280自動地利用列表頂上的屬性來對結(jié)果進(jìn)行群集。同樣,作為選擇也可以建議將其它集群作為順序中的下一個集群。例如,當(dāng)選擇電子郵件消息(email message)類型的所有項時,在用于電子郵件消息的測試情況下,上述過程自動由消息發(fā)送方(messagesender)來將結(jié)果群集。然而,例如當(dāng)選擇Word文檔(Word Document)類型的項時,根據(jù)上次修改日期來創(chuàng)建群集,而卻利用C#_源文件(C#_source files)類型的項的文件夾容積(相當(dāng)于通過對項目進(jìn)行編排來進(jìn)行編組)來對這種類型的項進(jìn)行編組。上述解決方案的一般性質(zhì)允許確定極其適合于指定項集合的編組算法,這也被包含在自定義和第三方屬性的評估中。
圖3-10舉例說明了各種示例性用戶接口,所述示例性用戶接口舉例說明了一個或多個自動群集系統(tǒng)以及先前所描述的過程。應(yīng)當(dāng)注意的是這些接口可以包括具有一個或多個顯示對象的顯示器,所述顯示對象包括下列這類方面比如具有多個可配置維度、形狀、顏色、文本、數(shù)據(jù)和聲音的可配置圖標(biāo)、按鈕、滑塊、輸入框、選項、菜單、制表符等等,以便于與系統(tǒng)100一起操作。另外,所述接口還可以包括用于調(diào)節(jié)和配置本發(fā)明的一個或多個方面的多個其它的輸入或控件,并且將在下面更詳細(xì)地進(jìn)行描述。這可以包括從鼠標(biāo)、鍵盤、語音輸入、Web站點(diǎn)、遠(yuǎn)程Web服務(wù)和/或諸如照相機(jī)或視頻輸入之類的其它裝置來接收用戶命令,以便影響或修改系統(tǒng)100的接口或其它方面的操作。
下列論述描述了本發(fā)明的各個方面,且與圖3-10中描繪的示例性接口有關(guān)。當(dāng)設(shè)計文件夾或其它類型的結(jié)構(gòu)時,設(shè)計者(不論他是應(yīng)用程序設(shè)計員還是終端用戶)具有極高的自由度,這允許通過把來自頂層視窗的不重要的或很少使用的項放入隱藏文件夾中來隱藏這些項。同樣,當(dāng)創(chuàng)建基于瀏覽器的屬性時,即使群集算法定了高分,也能夠提供各種機(jī)制以隱藏?zé)o意義的或不是非常有用的屬性。
可以在不同的層上考慮屬性up/downgrading。在應(yīng)用層上,應(yīng)用設(shè)計者能夠指示出哪個屬性是將要在用戶接口中顯露的初級屬性,而那些是次級屬性或附屬屬性。典型地講,這將對應(yīng)每個項類型而單獨(dú)被定義。在先前部分中描述的自動查詢?nèi)杭ǔ?紤]到初級屬性。另外,每個項類型應(yīng)該為所有項所共有的屬性定義屬性映射。例如,可以將共有的數(shù)據(jù)(Date)屬性映射到用于畫面的Date Taken,但是作為文檔的上次修改日期加以映射。同樣,People字段可以是文檔的作者(Author)但卻是電子郵件的發(fā)送方(Sender),諸如此類。
通常來說,只有應(yīng)能判定哪個屬性為最佳的用戶才能查看他們各自的數(shù)據(jù)。可能存在顯式的UI來提升或降低任何特定的屬性,但是本發(fā)明還可以隱含地從用戶動作中學(xué)習(xí)(例如,通過學(xué)習(xí)算法)。每個屬性都具有它的加權(quán),當(dāng)用戶從不同的屬性群集化轉(zhuǎn)換成另一個屬性群集化時所述加權(quán)得到增大,而當(dāng)它們轉(zhuǎn)換出來時所述加權(quán)得到減小。每個屬性的最終等級(用來判定哪個屬性要群集起來)是屬性加權(quán)與群集化分?jǐn)?shù)(根據(jù)上述公式計算出的)的乘積。
正如上面所論述的那樣,用戶通常優(yōu)選在平面列表上群集項類型的分層式編組(hierarchical organization)。分層結(jié)構(gòu)引入了某種排序類型并且使之易于查找到所請求的項類型值。對具有超過幾個不同屬性值的任何屬性來說同樣是成立的。以下描述了用于將屬性值編組成分層查看的特定示例性技術(shù)。就常規(guī)的文件來說,項類型是由文件擴(kuò)展名來定義的。可以使用諸如由當(dāng)前視窗程序來定義的文件類型的用戶友好的名稱。通常,早已把產(chǎn)生相同友好名稱的不同文件擴(kuò)展名編組在一起(例如,.h和.hxx兩者都稱為C/C++頭文件)。另外,可以通過對相似類型的所有文件進(jìn)行編組來引入分層結(jié)構(gòu)的再一層。在設(shè)計原型中,考慮并處理文檔文件、圖片文件、音樂和視頻文件、程序文件及其它文件的元組。此外,可以將人元組處理為類對象。
例如,可以按照能用來到達(dá)指定人的通信信道類型來把項類型=人(itemtype=people)的列表分成小的部分。這例如包括能夠通過投寄郵件、通過語音、通過即時消息傳送或通過電子郵件來到達(dá)的人的組。如果期望的話,這些組中的每一組都能被進(jìn)一步劃分。例如,在公司環(huán)境中,可以把電子郵件地址分成內(nèi)部的(來源于公司的地址薄)和外部的(通常來源于用戶的個人聯(lián)系列表)。有些人可能有多種通信方法,而在這樣情況下,他們可能會終止于多個群集中。與傳統(tǒng)的文件夾不同,屬性群集沒有限制所述項只能處于一個地方。
文件夾表示用戶創(chuàng)建的項組。雖然預(yù)計隨著時間的過去,基于屬性的項的群集將會減少對文件夾的需要以及減少文件夾的顯著性,但是文件夾仍然能夠被支持。通常,對文件夾進(jìn)行分層結(jié)構(gòu)編組,并且文件夾群集應(yīng)該相似于這種分層結(jié)構(gòu)。文件夾分層結(jié)構(gòu)的一個缺點(diǎn)就在于像程序文件(Program Files)或Windows目錄(Windows directory)一樣,它包含用戶不太感興趣的許多目錄。當(dāng)利用現(xiàn)有的文件夾來將項編組成集群時,明顯的改善就是只在視窗中顯示包含一些項的文件夾分層結(jié)構(gòu)的一部分。
圖3是包含(C盤上的)程序文件的樣本接口300。在Windows Explorer中,例如,視窗包括完整的文件夾結(jié)構(gòu)。在設(shè)計原型中,按照″類別(category)″群集文件只包括與實際選擇的項集合(完整的文件夾樹的子集)相關(guān)的文件夾。
圖4是示范通過文件夾來進(jìn)行群集的接口400。文件夾分層結(jié)構(gòu)的另一方面就在于它加入帶有邏輯1的物理位置(這個或那個盤,或是外部共享)的概念(文件夾分層結(jié)構(gòu)中的布局)。由于可以創(chuàng)建可能跨過幾個物理位置的邏輯組,因而物理位置可以與文件夾屬性分離開,由此彼此具有相同名稱的當(dāng)前文件夾不論它們是什么物理位置都可以與文件夾屬性分離開。正如能夠認(rèn)識到的那樣,還提供了按照位置編組。
圖5是存在于兩個驅(qū)動器(C盤和D盤)中的文件夾(VSS)的示例性接口500。當(dāng)查看″類別″VSS時,在510,所述接口500組合來自于物理位置的文件夾內(nèi)容。這個功能是基于如下假設(shè)的,即恰巧如果兩個或多個文件夾都具有相同的名稱。如果情況不是這樣的話,就能夠通過在圖6中描繪的用戶接口600中的位置屬性610來容易地分離所述這些文件。
圖7是舉例說明按照日期屬性進(jìn)行群集的接口700。按照日期和時間進(jìn)行群集具有固有的year/month/day/hour/minute分層結(jié)構(gòu)。然而,還存在相對時間-相對現(xiàn)在的概念。相信這兩種概念都是重要的。日期集群包括許多預(yù)定義的查詢(動態(tài)編組),所述預(yù)定義的查詢包含從今天(today)、昨天(yesterday)、等等起的項。
一個感興趣的項分類是通過將項與人相關(guān)聯(lián)來完成的。存在可以用來創(chuàng)建上述關(guān)聯(lián)性的許多項屬性,例如電子郵件消息或附件的發(fā)送方或接收方、文檔的作者、照片的拍攝的人、等等。按人來對項進(jìn)行群集可能會由于任何人分層結(jié)構(gòu)的表示所承載的社會內(nèi)涵而形成特殊的難題。例如,可以按照一些形式屬性(像內(nèi)部的或外部的聯(lián)系)來對人進(jìn)行編組,但是這些組當(dāng)中的一些可能仍然太大以致于不能高效地處理。例如,樣本電子郵件消息所引用的內(nèi)部聯(lián)系列表有約5,000個名字。
可以按字母順序來所述列表進(jìn)行排序或者按首字母來對所述列表進(jìn)行編組(像詞典一樣),但是任何長的列表通常都難以被理解。一個問題就在于對用戶來說重要的人名無意中會被很少有人知道的人名搞混。假定最重要的聯(lián)系人就是那些用戶極其頻繁地和最近發(fā)過電子郵件的人,或是用戶盤上的文檔的作者或合作者,等等。利用一些加權(quán)分析,能夠構(gòu)造出按所有人對用戶而言的相對重要性來排序的所有人的列表。
然而,顯示按其計算出的重要性來排序的長人名列表可能是一個可以接受的解決方案。計算出的順序可能是隨機(jī)的并且可能沒有正確地反映人們的重要感,同時查找接近列表中間或底部的名字可能仍然是很難的。重要性信息應(yīng)為用來選擇哪個名字首先被顯示或在頂層上顯示,但是按字母順序?qū)γ诌M(jìn)行排序以便更容易地搜索特定名字并且調(diào)節(jié)關(guān)于人的相對重要性的可能建議。
圖8是舉例說明用于查看相關(guān)的人的半折疊列表的示例性接口800。這可以包括仍然作為單個平面的按字母順序排序的列表而呈現(xiàn)給用戶的人員列表的分層擴(kuò)展名。當(dāng)時首次顯示所述列表時,它只按字母順序包含頂部的少數(shù)幾個(10-20個)最重要的名字。這把對關(guān)于最相關(guān)的人的信息的簡易單擊訪問考慮進(jìn)去。同時,頂部名字充當(dāng)詞典書簽——每一個書簽都能被擴(kuò)展以便顯示第二層或另外的第三層的名字。
除了所有擴(kuò)展的名字都按照對等于第一層名字的方式而被顯示在頂層上之外,這有點(diǎn)類似于分層結(jié)構(gòu)擴(kuò)展名。例如,提供后者以便調(diào)節(jié)一個人在另一個人上方的涵義,如果它不遵循公司分層結(jié)構(gòu)的話,則可能會消極地感知所述涵義??梢岳^續(xù)列表擴(kuò)展直到來自重要性列表底部的名字進(jìn)入視野為止。然而,由于能夠?qū)α斜淼倪x定區(qū)域執(zhí)行擴(kuò)展,因而能夠限制可見的名字的總數(shù)目,典型情況下只限制在十個內(nèi)。在任何指定的時間,按字母順序?qū)梢姷拿峙判虿⑶绎@現(xiàn)成單個列表。這使得易于查找到所請求的名字。應(yīng)當(dāng)注意的是,可以將半折疊的列表應(yīng)用于許多不同的分類上,不僅僅是人。幾個明顯的分類就是關(guān)鍵詞(類別)的列表和詞典(百科全書)條目的列表。
將現(xiàn)有條目用作為目錄索引的想法是常見的。實際上,這是對印刷的詞典進(jìn)行編組的標(biāo)準(zhǔn)方式。然而,在標(biāo)準(zhǔn)的詞典解決方案中,在每一頁的起始和末尾設(shè)置索引以指示那一頁的內(nèi)容。這可以被稱為連續(xù)索引之間的″恒定空間″。無論如何,為索引選定的單詞都不是特定的,它們只是剛好處于頁面的起始或末尾。
在本發(fā)明中,為索引選定的名字是那些位于″重要性″列表頂部上的名字。通過利用詞典類推,這些單詞將成為最頻繁查找的單詞。而且,這些名字都是通過它們自己在名字上點(diǎn)擊選擇它而選定的條目。這提供了對最常見條目的單擊訪問,而不是翻到包含所述條目的頁面。在另一方面,在索引之間可能存在可變的第二級排序條目數(shù)。當(dāng)?shù)诙壟判虻臈l目數(shù)足夠大時,能夠創(chuàng)建第三級排序索引,依此類推。
圖9舉例說明了不完全的收縮的組900,然而當(dāng)從組900中選擇時,在圖10中的擴(kuò)展?fàn)顟B(tài)下示出了組1000。圖10還描繪了在1010中的半折疊狀態(tài)下的組1000。當(dāng)顯現(xiàn)集群(或?qū)⑺鲰椆餐幗M)時,另一個問題就是如何在屏幕上可視化集群??梢暬M的典型方式就是整體上顯示組的一些表示(收縮的視窗)或顯示組中的所有項的集合(放大視窗)。在標(biāo)準(zhǔn)的Windows顯示中,在所述顯示中在左邊有文件夾列表而在右邊有項列表,能夠被看作當(dāng)前可見文件夾的放大視窗和所有其它文件夾的收縮視窗。典型地,即使子文件夾的縮略圖可能包含它內(nèi)部幾項的拼貼,在收縮視窗中也會示出當(dāng)前文件夾的子文件夾。有時一個以上的已擴(kuò)展組可能是同時可見的,或者當(dāng)將所述項示為被編組成堆時。
在允許編組并且能夠同時顯示多個組的文件視窗中,通常對于將要″可收縮的″組來說,可以分別地顯示或隱藏一組的內(nèi)容。盡管如此,所述組也仍然能處于兩種狀態(tài)下,并且擴(kuò)展后的狀態(tài)允許與組中單獨(dú)的項進(jìn)行交互。在大組的情況下,擴(kuò)展一個組會混淆所有其它組的可視性,這使得多組視窗不像那么有用。
在本發(fā)明中,在900,引入第三種狀態(tài),所述第三種狀態(tài)示出所述組的最初幾項-這被稱為組的″擠壓″或″半折疊″狀態(tài)。在1000,重復(fù)點(diǎn)擊單個按鈕以便在已擴(kuò)展的狀態(tài)之間循環(huán),在1010,擠壓所述單個按鈕,并且在900,處于收縮狀態(tài)。所述接口900是顯示兩個半折疊的組的文件視窗(File Viewer),并且在910,第三個組足夠小以待充分打開地被顯示。
擠壓狀態(tài)的一個優(yōu)點(diǎn)就在于所述組比打開狀態(tài)要占用屏幕上的更少空間,但是卻比關(guān)閉狀態(tài)給了用戶更多關(guān)于所述組的信息。這允許更多的組將是可見的,同時仍然提供關(guān)于所述組的內(nèi)容的詳細(xì)信息。用戶能夠更快速地估計大的項集合中的組,這又提供了更多有效的評估和對大的項組的操縱。
第二個優(yōu)點(diǎn)就在于收縮狀態(tài)仍然提供了對少數(shù)可見的項的直接單擊訪問。假定通過可見的項對于用戶的″重要性″來選擇它們(例如,最近訪問的或過去最頻繁訪問的),那么所述可見的項就是那些用戶很可能正在查找的項。例如,為了打印出最近發(fā)送給某人的相片,用戶可以翻到相片組,并且所述文件應(yīng)當(dāng)剛好位于列表頂部上(作為最近訪問過的文件)??梢詫⑦@個與當(dāng)前的視窗相比-如果在文件夾圖標(biāo)中示出相片縮略圖,則用戶可能仍然需要打開文件夾來訪問所述文件。最后,擠壓視窗約為壓縮狀態(tài)和擴(kuò)展?fàn)顟B(tài)之間的一半長度它嘗試從整體上利用對單獨(dú)項的訪問來平衡對組的查看和操作。
由于半折疊的視窗提供了便利的方法來訪問來自所述組的選定項(無需處理它當(dāng)中的所有項),因而用戶能夠?qū)υ诎胝郫B的視窗中顯露出哪一項以及呈現(xiàn)多少項給予控制。在一種解決方案中,可以按照預(yù)定標(biāo)準(zhǔn)來對所述項進(jìn)行分類排序,并且那些所示出的項都是來自于分類排序后的列表的頂部。用戶可以改變分類排序的標(biāo)準(zhǔn)以及所顯示的元素數(shù)目。例如,對文檔進(jìn)行分類排序的便利而有用的方法就是按照上次修改日期來進(jìn)行。默認(rèn)時,半折疊的視窗可以顯示來自列表中的前n個最近的文檔,并且可以具有用以顯示下n個文檔的按鈕??蛇x方案就是具有用以顯示從今天、昨天、上星期、上個月等等起的保留文檔。典型地,在所有這些情況下,所示出的項的順序就是用于限制可見項的相同順序。然而,另一種解決方案就是以對于用戶而言最便利的方式來對所述這些項進(jìn)行排序,而不是必須與選擇所述項的標(biāo)準(zhǔn)相同。例如,即使選擇順序是按照″重要性″的,通常也仍按字母順序來最佳地對人進(jìn)行排序。
可以將擠壓組中的項顯示成半折疊的列表??梢杂羞x擇地擴(kuò)展半折疊的列表以便顯示更多的項。(作為選擇,可以擴(kuò)展整個組以便顯示所有的項)??梢詾槿魏晤愋偷捻検褂冒胝郫B的列表視窗,而且是當(dāng)分類排序順序不同于選擇順序時,(如果分類排序順序和選擇順序相同的話則還可以使用不完全擴(kuò)展的列表視窗)。一個示例就是按字母順序排序的最喜愛歌曲列表。用戶能夠擴(kuò)展一部分的列表以便顯示較少的流行歌曲,但是將按照歌曲的流行度來選擇進(jìn)入視窗中的下一首歌曲。
當(dāng)創(chuàng)建屬性分層結(jié)構(gòu)時,高層集群典型地包括所有嵌套的集群的內(nèi)容。例如,文檔(Documents)集群包括所有Word文檔、Excel工作表等等。同樣,來自2003年的項包括來自各個月的項,所述來自各個月的項又包括來自每天的項??梢园讶魏稳萜?集群或文件夾)都認(rèn)定為用來編組視窗的、將要作為單個實體來操作的獨(dú)立項或是僅僅一組項。
項瀏覽器的基本功能就是實現(xiàn)易于找到所請求的項。然而,沿著屬性集群進(jìn)行遍歷僅僅是其中一種方式??梢酝ㄟ^考慮到水平搜索來大大地增強(qiáng)瀏覽功能,所述水平搜索會前進(jìn)至一些相關(guān)項而不是沿著屬性分層結(jié)構(gòu)搜索下去。而且,瀏覽器應(yīng)該考慮以用戶定義的方式來對項進(jìn)行編組。當(dāng)搜索這些項時,用戶時常通過將所述項彼此關(guān)聯(lián)來進(jìn)行工作。例如,文檔何時被最后一次編輯的確切日期也許無人知道,但是用戶可能會記住最后一次編輯恰好是在一個重要會議之前。會議本身可能是容易找到的,在這一點(diǎn)上最相關(guān)的查詢就是″顯示所有來自相同日期的文檔″。
參照圖11,用于實現(xiàn)本發(fā)明的各個方面的示例性環(huán)境1110包括計算機(jī)1112。計算機(jī)1112包括處理單元1114、系統(tǒng)存儲器1116和系統(tǒng)總線1118。所述系統(tǒng)總線1118將系統(tǒng)組件(包括但不限于系統(tǒng)存儲器1116)耦合于處理單元1114。所述處理單元1114可以是各種可用的處理器中的任何一種。還可以采用雙微處理器及其它多處理機(jī)系統(tǒng)結(jié)構(gòu)以作為處理單元1114。
所述系統(tǒng)總線1118可以是幾種類型的總線結(jié)構(gòu)中的任何一種,所述總線結(jié)構(gòu)包括存儲器總線或存儲器控制器、外圍總線或外部總線、和/或采用任意種類的可用總線體系結(jié)構(gòu)的局部總線,所述可用總線體系結(jié)構(gòu)包括但不限于16位總線、工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(ISA)、微通道結(jié)構(gòu)(MSA)、擴(kuò)展ISA(EISA)、智能磁盤電子設(shè)備(IDE)、VESA局部總線(VLB)、外設(shè)部件互連(PCI)、通用串行總線(USB)、高級圖形端口(AGP)、個人計算機(jī)存儲器卡國際聯(lián)合會總線(PCMCIA)和小型計算機(jī)系統(tǒng)接口(SCSI)。
所述系統(tǒng)存儲器1116包括易失性存儲器1120和非易失存儲器1122。包含用于在計算機(jī)1112內(nèi)的元件之間傳送信息(比如在啟動期間)的基本例行程序的基本輸入/輸出系統(tǒng)(BIOS)被存儲在非易失存儲器1122中。通過舉例說明的方式,而不是限制,非易失存儲器1122可以包括只讀存儲器(ROM)、可編程序只讀存儲器(PROM)、電可編程序只讀存儲器(EPROM)、電可擦只讀存儲器(EEPROM)或快閃存儲器。易失性存儲器1120包括隨機(jī)存取存儲器(RAM),其充當(dāng)外部的高速緩沖存儲器。通過舉例說明的方式,而不是限制,可以以許多種形式使用RAM,比如同步RAM(SRAM)、動態(tài)RAM(DRAM)、同步DRAM(SDRAM)、雙數(shù)據(jù)速率SDRAM(DDR SDRAM)、增強(qiáng)型SDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)和direct Rambus RAM(DRRAM)。
計算機(jī)1112還包括可拆卸/不可拆卸、易失性/非易失性計算機(jī)存儲器介質(zhì)。圖11舉例說明了例如盤式存儲器1124。盤式存儲器1124包括但不限于像磁盤驅(qū)動器、軟盤驅(qū)動器、磁帶驅(qū)動器、Jaz驅(qū)動器、Zip驅(qū)動器、LS-100驅(qū)動器、快閃存儲卡或記憶棒那樣的裝置。另外,盤式存儲器1124可以包括獨(dú)立的存儲介質(zhì)或與其它存儲介質(zhì)相結(jié)合的存儲介質(zhì),包括但不限于諸如光盤ROM裝置(CD-ROM)之類的光盤驅(qū)動器、CD可刻錄驅(qū)動器(CD-R驅(qū)動器)、CD可重寫驅(qū)動器(CD-RW驅(qū)動器)或數(shù)字通用盤ROM驅(qū)動器(DVD-ROM)。為了便于將盤式存儲裝置1124連接到系統(tǒng)總線1118,典型地使用可拆卸或不可拆卸的接口,比如接口1126。
應(yīng)當(dāng)認(rèn)識到的是,圖11描述了充當(dāng)在適當(dāng)操作環(huán)境1110中所描述的用戶與計算機(jī)主機(jī)資源之間的媒介物的軟件。這類軟件包括操作系統(tǒng)1128。能被存儲在盤式存儲器1124上的操作系統(tǒng)1128,控制并分配計算機(jī)系統(tǒng)1112的資源。系統(tǒng)應(yīng)用程序1130通過存儲在系統(tǒng)存儲器1116中或盤式存儲器1124上的程序模塊1132和程序數(shù)據(jù)1134來利用操作系統(tǒng)1128的資源管理。應(yīng)當(dāng)認(rèn)識到的是能夠利用各種操作系統(tǒng)或操作系統(tǒng)的組合來實現(xiàn)本發(fā)明。
用戶通過輸入裝置1136將命令或信息輸入到計算機(jī)1112中。輸入裝置1136包括但不限于諸如鼠標(biāo)、軌跡球、鐵筆、觸摸板、鍵盤、麥克風(fēng)、操縱桿、游戲板、衛(wèi)星碟、掃描儀、電視調(diào)諧卡、數(shù)字照相機(jī)、數(shù)字視頻照相機(jī)、web照相機(jī)等等之類的指位裝置。這些及其它輸入裝置都經(jīng)由接口端口、通過系統(tǒng)總線1118而連接于處理單元1114。接口端口1138例如包括串行端口、并行端口、游戲端口和通用串行總線(USB)。輸出裝置1140使用與輸入裝置1136相同的一些類型的端口。由此,例如,USB端口可以用來向計算機(jī)1112提供輸入,并且從計算機(jī)1112向輸出裝置1140輸出信息。提供輸出適配器1142以便舉例說明了除了其它輸出裝置1140以外還存在像監(jiān)視器、揚(yáng)聲器和打印機(jī)這樣的需要專用適配器的一些輸出裝置1140。所述輸出適配器1142包括通過舉例說明的方式而非限制,提供輸出裝置1140與系統(tǒng)總線1118之間的連接裝置的視頻卡和聲卡。應(yīng)當(dāng)注意的是,其它裝置和/或裝置的系統(tǒng)既提供了輸入能力又提供了輸出能力,比如遠(yuǎn)程計算機(jī)1144。
計算機(jī)1112能夠利用到一個或多個遠(yuǎn)程計算機(jī)(比如遠(yuǎn)程計算機(jī)1144)的邏輯連接而在網(wǎng)絡(luò)環(huán)境中操作。遠(yuǎn)程計算機(jī)1144可以是個人計算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、工作站、基于微處理器的設(shè)備、對等裝置或其它公用網(wǎng)絡(luò)節(jié)點(diǎn)等等,并且典型地包括相對于計算機(jī)1112描述的許多元件或所有元件。為了簡潔起見,僅僅與遠(yuǎn)程計算機(jī)1144一并舉例說明了存儲器裝置1146。遠(yuǎn)程計算機(jī)1144邏輯上通過網(wǎng)絡(luò)接口1148而連接于計算機(jī)1112,然后經(jīng)由通信連接1150而物理相連。網(wǎng)絡(luò)接口1148涵蓋諸如局域網(wǎng)(LAN)和廣域網(wǎng)(WAN)之類的通信網(wǎng)絡(luò)。LAN技術(shù)包括光纖分布式數(shù)據(jù)接口(FDDI)、銅導(dǎo)線分布式數(shù)據(jù)接口(CDDI)、以太網(wǎng)/IEEE 1102.3、令牌環(huán)/IEEE 1102.5等等。WAN技術(shù)包括但不限于點(diǎn)對點(diǎn)鏈路、像綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)那樣的線路交換網(wǎng)絡(luò)及其變形、分組交換網(wǎng)絡(luò)和數(shù)字用戶線路(DSL)。
通信連接1150是指用以將網(wǎng)絡(luò)接口1148連接到總線1118的硬件/軟件。雖然為了說明清楚起見而示出通信連接1150是在計算機(jī)1112內(nèi),但是還可以位于計算機(jī)1112外。為連接到網(wǎng)絡(luò)接口1148所必需的硬件/田軟件包括僅作為舉例目的,諸如調(diào)制解調(diào)器之類的內(nèi)部和外部技術(shù),所述調(diào)制解調(diào)器包括常規(guī)的電話分級調(diào)制解調(diào)器、電纜調(diào)制解調(diào)器和DSL調(diào)制解調(diào)器、ISDN適配器和以太網(wǎng)卡。
圖12是本發(fā)明能夠與之交互的樣本計算環(huán)境1200的示意性框圖。所述系統(tǒng)1200包括一個或多個客戶端1210。所述客戶端1210可以是硬件和/或軟件(例如,線程、進(jìn)程、計算裝置)。所述系統(tǒng)1200還包括一個或多個服務(wù)器1230。所述服務(wù)器1230同樣也可以是硬件和/或軟件(例如,線程、進(jìn)程、計算裝置)。所述服務(wù)器1230例如能夠駐留線程以便通過采用本發(fā)明來執(zhí)行變換??蛻舳?210與服務(wù)器1230之間的一種潛在通信可以是按適應(yīng)于在兩個或多個計算機(jī)進(jìn)程之間傳輸?shù)臄?shù)據(jù)分組的形式。所述系統(tǒng)1200包括通信框架1250,可以采用所述通信框架以便于客戶端1210與服務(wù)器1230之間的通信。所述客戶端1210可操作連接于一個或多個客戶端數(shù)據(jù)存儲器1260,可以采用所述客戶端數(shù)據(jù)存儲器來將本地信息存儲到客戶端1210。同樣,所述服務(wù)器1230可操作連接于一個或多個服務(wù)器數(shù)據(jù)存儲器1240,可以采用所述服務(wù)器數(shù)據(jù)存儲來將本地信息存儲到服務(wù)器1230。
上面已經(jīng)描述的內(nèi)容包括本發(fā)明的示例。當(dāng)然,為了描述本發(fā)明起見,不可能描述每個可想到的組件或方法的組合,但是本領(lǐng)域普通技術(shù)人員可以認(rèn)識到的是許多本發(fā)明的另外的組合和替代都是可能的。因此,本發(fā)明是用來涵蓋落入所附權(quán)利要求的精神和范圍內(nèi)的所有這類替換、修改和變形。此外,就在詳細(xì)說明書或權(quán)利要求中使用的術(shù)語″包括″來講,當(dāng)在權(quán)利要求中被采用作為過渡單詞時,這類術(shù)語意在以類似于術(shù)語″包含″的方式被廣泛含義上地解釋。
權(quán)利要求
1.一種用于數(shù)據(jù)顯示的計算機(jī)化接口,其特征在于,它包括一屬性分析器,用于為至少兩個集群屬性確定項分布;以及一編組器,用于部分地基于項分布來形成新集群。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述集群屬性與一個或多個數(shù)據(jù)項相關(guān)聯(lián),所述數(shù)據(jù)項被存儲在本地存儲位置和遠(yuǎn)程存儲位置的至少其中之一中。
3.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述數(shù)據(jù)項包括文檔、文件、文件夾、圖像、音頻文件、視頻文件、代碼、消息以及包括人或地方在內(nèi)的外部對象的計算機(jī)表示。
4.如權(quán)利要求2所述的系統(tǒng),其特征在于,所述集群屬性與項的類型、創(chuàng)建的日期或時間、與所述數(shù)據(jù)項相關(guān)聯(lián)的人、位置、類別、以及系統(tǒng)、應(yīng)用程序、管理員或用戶定義的屬性的至少一個相關(guān)聯(lián)。
5.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述屬性分析器通過項的類型來確定集群,然后基于另一屬性來確定一后續(xù)的集群。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述屬性分析器給各種項屬性分配群集化分?jǐn)?shù),并且選擇一具有最高分?jǐn)?shù)的屬性。
7.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述群集化分?jǐn)?shù)是通過下列等式中的乘法來計算的score=n_itemscluster1*n_itemscluster2*……。
8.如權(quán)利要求6所述的系統(tǒng),其特征在于,所述群集化分?jǐn)?shù)是以下列二項式分布為基礎(chǔ)的score=(N_total)!/(n_itemscluster1)!*(n_itemscluster2)!*……)。
9.如權(quán)利要求1所述的系統(tǒng),其特征在于,它還包括一用戶界面,用于以下的至少其中之一顯示集群結(jié)果、接收查詢選擇、以及接收屬性信息、顯示與群集中的數(shù)據(jù)項有關(guān)的信息。
10.一種具有存儲在其上的計算機(jī)可讀指令的計算機(jī)可讀介質(zhì),所述計算機(jī)可讀指令用于實現(xiàn)權(quán)利要求1所述的屬性分析器和集群編組器。
11.一種用于自動群集查詢結(jié)果的系統(tǒng),其特征在于,它包括用于檢索多個項的屬性的裝置;用于基于所述屬性來為多個項確定分?jǐn)?shù)的裝置;以及用于基于所確定的分?jǐn)?shù)自動地將與所述項相關(guān)聯(lián)的數(shù)據(jù)群集的裝置。
12.一種自動查詢?nèi)杭姆椒?,其特征在于,它包括將一個或多個屬性與多個數(shù)據(jù)項相關(guān)聯(lián);基于所述屬性來確定數(shù)據(jù)項的分布;以及基于所確定的分布自動地將所述數(shù)據(jù)項群集。
13.如權(quán)利要求12所述的方法,其特征在于,所述分布是根據(jù)下列等式中的至少其中之一來確定的score=n_itemscluster1*n_itemscluster2*……score=(N_total)!/((n_itemscluster1)!*(n_itemscluster2)!*……)
14.如權(quán)利要求12所述的方法,其特征在于,它還包括處理N個項和M個屬性。
15.如權(quán)利要求14所述的方法,其特征在于,它還包括下列步驟中的至少其中之一初始化M個散列表、遍及N個項進(jìn)行迭代以及為每個項遍及M個屬性進(jìn)行迭代。
16.如權(quán)利要求15所述的方法,其特征在于,它還包括計算每個屬性的散列值。
17.如權(quán)利要求16所述的方法,其特征在于,它還包括利用來自一相關(guān)聯(lián)的散列表的數(shù)據(jù)來計算每個屬性的群集化分?jǐn)?shù)。
18.如權(quán)利要求12所述的方法,其特征在于,它還包括基于一預(yù)定閾值來自動地對集群進(jìn)行編組。
19.如權(quán)利要求18所述的方法,其特征在于,它還包括建議備選的集群分組。
20.如權(quán)利要求18所述的方法,其特征在于,它還包括基于用戶定義的屬性來對集群進(jìn)行編組。
21.一種圖形用戶界面,其特征在于,它包括存儲在一數(shù)據(jù)庫中的一個或多個數(shù)據(jù)項及其相關(guān)聯(lián)的屬性;為所述數(shù)據(jù)項創(chuàng)建的一個或多個顯示對象;一輸入組件,用于選擇所述數(shù)據(jù)項及其相關(guān)聯(lián)的屬性;以及一顯示組件,用于部分地基于所述屬性的自動分析來顯現(xiàn)所述顯示對象。
22.如權(quán)利要求21所述的界面,其特征在于,它還包括用于與所述屬性交互的控件。
23.如權(quán)利要求22所述的界面,其特征在于,所述屬性用于結(jié)果的嵌套查詢。
24.如權(quán)利要求22所述的界面,其特征在于,所述屬性包括類型、位置、類別、人、日期、時間和用戶定義的參數(shù)的至少其中之一。
25.如權(quán)利要求22所述的界面,其特征在于,它還包括一用于從用戶動作中隱式地學(xué)習(xí)的組件。
26.如權(quán)利要求22所述的界面,其特征在于,它還包括半折疊列表或組的至少其中之一。
27.如權(quán)利要求26所述的界面,其特征在于,它還包括用于擴(kuò)展所述列表或組的控件。
28.如權(quán)利要求27所述的界面,其特征在于,至少一個大屬性集群是利用半折疊的列表在擠壓視窗中顯現(xiàn)的。
全文摘要
本發(fā)明涉及一種用于本地或遠(yuǎn)程數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)項的自動群集化和顯示的系統(tǒng)和方法。這類群集化能夠以與諸如類型、位置、人、日期、時間、用戶定義的等等之類的數(shù)據(jù)項相關(guān)聯(lián)的屬性為基礎(chǔ),其中可以采用初始屬性來形成群集化的第一層,而可以自動地確定后續(xù)的屬性來形成優(yōu)化后的群集化,從所述優(yōu)化后的群集化中查找和檢索期望的信息。提供了一種用于編組和檢索數(shù)據(jù)的計算機(jī)化接口。所述接口包括用于為至少兩個集群屬性確定項分布的屬性分析器和部分地根據(jù)項分布來形成新集群的編組器。
文檔編號G06F17/30GK1648903SQ20051005092
公開日2005年8月3日 申請日期2005年1月26日 優(yōu)先權(quán)日2004年1月26日
發(fā)明者A·托斯基, L·程, M·麥克勞林, R·F·拉西德 申請人:微軟公司