国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      從數(shù)據(jù)挖掘模型內(nèi)容深入鉆取查詢的制作方法

      文檔序號:6419459閱讀:276來源:國知局
      專利名稱:從數(shù)據(jù)挖掘模型內(nèi)容深入鉆取查詢的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明一般涉及數(shù)據(jù)挖掘領(lǐng)域。本發(fā)明尤其涉及從計(jì)算模型提供源數(shù)據(jù)的深入鉆取(drill-through)特征。
      背景技術(shù)
      數(shù)據(jù)挖掘是大量數(shù)據(jù)的探測和分析,目的在于發(fā)現(xiàn)數(shù)據(jù)中的關(guān)系、模式和趨勢。也可使用數(shù)據(jù)挖掘來創(chuàng)建可用于預(yù)測將來的數(shù)據(jù)或分類現(xiàn)有數(shù)據(jù)的模型。
      例如,企業(yè)可收集有關(guān)其客戶的大量信息。該信息可包括采購信息和客戶可用的任何其它信息。可使用與客戶數(shù)據(jù)相關(guān)的模型的預(yù)測,以控制客戶流失、執(zhí)行信用風(fēng)險管理、偵查詐騙或制定銷售決策。
      可提供智能交叉銷售支持。例如,可使用數(shù)據(jù)挖掘功能,通過把用戶的有關(guān)特性或用戶已訂購的項(xiàng)目和其它用戶以前訂購的項(xiàng)目的數(shù)據(jù)庫相關(guān),建議用戶可能會感興趣的項(xiàng)目。根據(jù)用戶的行為或簡介對用戶進(jìn)行分段。數(shù)據(jù)挖掘使分段模型分析能夠發(fā)現(xiàn)將用戶分成人口區(qū)段的特征。另外,可預(yù)測用戶簡介數(shù)據(jù)中缺少的值。例如,當(dāng)用戶不提供數(shù)據(jù)時,可預(yù)測該數(shù)據(jù)的值。
      為了創(chuàng)建和測試數(shù)據(jù)挖掘模型,可將可用的數(shù)據(jù)分成兩個部分。其中一部分,即訓(xùn)練數(shù)據(jù)集,可用于創(chuàng)建模型。數(shù)據(jù)的其余部分,即測試數(shù)據(jù)集,可用于測試模型,從而確定模型作出預(yù)測時的精確度。一旦已創(chuàng)建數(shù)據(jù)挖掘模型,即可使用該模型對其它數(shù)據(jù)集中的數(shù)據(jù)作出相關(guān)的預(yù)測。
      將數(shù)據(jù)集中的數(shù)據(jù)分組成若干實(shí)例。例如,對于客戶數(shù)據(jù),每個實(shí)例可對應(yīng)于不同的客戶。一種實(shí)例中的數(shù)據(jù)可描述一個客戶或以其它方式與一個客戶相關(guān)??膳c一種實(shí)例(例如,對于給定的客戶)相關(guān)的一類數(shù)據(jù)是分類變量。分類變量將該實(shí)例分成幾種預(yù)定義的狀態(tài)之一。例如,一個這樣的變量可對應(yīng)于客戶的受教育程度。在一個例子中,該變量有各種可能的值。這些可能的值稱為狀態(tài)。例如,婚姻狀況變量的狀態(tài)可以是“已婚”或“未婚”,并可對應(yīng)于客戶的婚姻狀態(tài)。另一種變量是連續(xù)變量。連續(xù)變量是具有一可能值范圍的變量。例如,一個這樣的變量可對應(yīng)于客戶的年齡。與年齡變量相關(guān)的是該變量的可能值范圍。
      如上所述,將可用的數(shù)據(jù)分成兩組—訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。通常70%的數(shù)據(jù)用于訓(xùn)練,30%的數(shù)據(jù)用于測試。模型可在包括該信息的訓(xùn)練數(shù)據(jù)集上訓(xùn)練。一旦模型訓(xùn)練完畢,便可在測試數(shù)據(jù)集上運(yùn)行該模型以進(jìn)行評估。在該測試期間,會向模型提供除年齡數(shù)據(jù)之外的全部數(shù)據(jù),并要求模型在給定其它數(shù)據(jù)的情況下預(yù)測客戶的年齡。在訓(xùn)練和評估之后,可在其它數(shù)據(jù)集上使用該模型。
      在測試數(shù)據(jù)集上運(yùn)行模型,將模型所產(chǎn)生的結(jié)果和實(shí)際的測試數(shù)據(jù)進(jìn)行比較,以查看模型在正確地預(yù)測客戶年齡方面有多成功。
      當(dāng)已運(yùn)行模型之后,可產(chǎn)生應(yīng)用于數(shù)據(jù)集的模型的圖示。圖1是顯示將數(shù)據(jù)挖掘模型應(yīng)用于數(shù)據(jù)集的結(jié)果的決策樹圖模型的例子。該圖顯示應(yīng)用數(shù)據(jù)挖掘模型以針對數(shù)據(jù)集中的一組特定實(shí)例預(yù)測年齡的結(jié)果。模型中的每個實(shí)例存在于圖的一個或多個節(jié)點(diǎn)中。例如,圖的根節(jié)點(diǎn)1142標(biāo)為“全部”并包含圖中的全部實(shí)例??筛鶕?jù)“層”來描述節(jié)點(diǎn),其中從根到葉具有最長路徑的葉是決策樹中的第零層節(jié)點(diǎn),第n層節(jié)點(diǎn)的父節(jié)點(diǎn)是第n+1層節(jié)點(diǎn)。使用該術(shù)語,根節(jié)點(diǎn)1142是第四層節(jié)點(diǎn)。
      根節(jié)點(diǎn)1142之下的一層是第三層節(jié)點(diǎn)1132和1134。根據(jù)各實(shí)例中的婚姻狀況將所述實(shí)例分配到這些節(jié)點(diǎn)中。根據(jù)“Capitalgain(資本利得)”變量的值將節(jié)點(diǎn)所表示的各組實(shí)例進(jìn)一步分成四個第二層節(jié)點(diǎn)1122、1124、1126和1128。根據(jù)“Educationnum(受教育年數(shù))”變量將第二層節(jié)點(diǎn)1122所表示的實(shí)例進(jìn)一步分成第一層節(jié)點(diǎn)1112和1113。根據(jù)“Educationnum(受教育年數(shù))”變量將第二層節(jié)點(diǎn)1126所表示的實(shí)例進(jìn)一步分成兩個第一層節(jié)點(diǎn)1114和1116。并根據(jù)“Hoursperweek(每周工時)”變量將第二層節(jié)點(diǎn)1128所表示的實(shí)例進(jìn)一步分成兩個第一層節(jié)點(diǎn)1118和1119。根據(jù)年齡變量將第一層節(jié)點(diǎn)1114和1116中的實(shí)例進(jìn)一步分成第零層節(jié)點(diǎn)1102和1104(對于第一層節(jié)點(diǎn)1114)以及第零層節(jié)點(diǎn)1106和1108(對于第一層節(jié)點(diǎn)1116)。
      此圖呈現(xiàn)了向數(shù)據(jù)集應(yīng)用挖掘模型的視覺表示。其它圖(如群集圖)也可呈現(xiàn)向數(shù)據(jù)集應(yīng)用挖掘模型的此類視覺表示。在某些圖形顯示中,每個節(jié)點(diǎn)包括信息欄或其它包含與節(jié)點(diǎn)中所含實(shí)例相關(guān)的信息的顯示。
      雖然該信息可能有用,但可能需要找到與節(jié)點(diǎn)中所含實(shí)例有關(guān)的更多信息。某些程序可實(shí)施將數(shù)據(jù)挖掘模型應(yīng)用于數(shù)據(jù)集的結(jié)果的繪圖,這些程序使用戶能夠從節(jié)點(diǎn)存取數(shù)據(jù)。此類現(xiàn)有的解決方案是所用的數(shù)據(jù)挖掘模型所特有的并且是封閉的。此類存取不具有擴(kuò)充性或一般性。將功能關(guān)聯(lián)到用于產(chǎn)生和顯示圖形的工具上。但是,需要使用戶能夠使用寬泛范圍的應(yīng)用程序來存儲數(shù)據(jù)集、應(yīng)用數(shù)據(jù)挖掘模型并顯示數(shù)據(jù)挖掘圖形,以便為用戶提供靈活性。因此,需要具有從與應(yīng)用于數(shù)據(jù)集的數(shù)據(jù)挖掘模型的圖示數(shù)據(jù)相對應(yīng)的數(shù)據(jù)集存取數(shù)據(jù)的能力,而不管用于存儲數(shù)據(jù)集、應(yīng)用數(shù)據(jù)挖掘模型并顯示數(shù)據(jù)挖掘圖形的應(yīng)用程序。

      發(fā)明內(nèi)容
      圖示可由應(yīng)用于數(shù)據(jù)集的挖掘模型組成。檢測對所述至少一個節(jié)點(diǎn)中一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求。確定數(shù)據(jù)集中的哪些實(shí)例構(gòu)成該節(jié)點(diǎn)的基礎(chǔ)。提供與基礎(chǔ)實(shí)例有關(guān)的數(shù)據(jù)。提供與基礎(chǔ)實(shí)例有關(guān)的全部數(shù)據(jù),或當(dāng)請求時,提供與基礎(chǔ)實(shí)例有關(guān)的數(shù)據(jù)的采樣。
      以下說明其它實(shí)施例。


      當(dāng)結(jié)合附圖閱讀時,可較好地理解上述發(fā)明內(nèi)容以及以下有關(guān)目前優(yōu)選實(shí)施例的詳細(xì)說明?;谡f明本發(fā)明的目的,附圖中顯示本發(fā)明的示范性構(gòu)造;但本發(fā)明不限于所披露的特定方法和裝置。在附圖中附圖1是應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示的框圖;圖2是可實(shí)施本發(fā)明各方面的示范性計(jì)算環(huán)境的框圖;圖3是根據(jù)本發(fā)明的系統(tǒng)的框圖;圖4是窗口中所顯示的深入鉆取數(shù)據(jù)的例子;以及圖5是根據(jù)本發(fā)明一項(xiàng)實(shí)施例從圖示提供深入鉆取信息的方法的流程圖。
      具體實(shí)施例方式
      概述本發(fā)明提供從訓(xùn)練挖掘模型提供對挖掘模型源數(shù)據(jù)的廣泛深入鉆取的深入鉆取特征。為使用戶或應(yīng)用程序能獲得模型的給定節(jié)點(diǎn)上的模型內(nèi)容信息,在一項(xiàng)實(shí)施例中提供了一通用功能,用戶可通過該通用功能指定模型和數(shù)據(jù)集的節(jié)點(diǎn),并返回該模型和數(shù)據(jù)集的節(jié)點(diǎn)中的實(shí)例。
      示范性計(jì)算環(huán)境圖2說明了其中可實(shí)施本發(fā)明的適當(dāng)?shù)挠?jì)算系統(tǒng)環(huán)境100的例子。計(jì)算系統(tǒng)環(huán)境100只是適當(dāng)計(jì)算環(huán)境的一個例子,并不想對本發(fā)明的使用范圍或功能作出任何限制。也不應(yīng)將計(jì)算系統(tǒng)100解釋為具有與示范性操作環(huán)境100中所述的任一組件或各組件的組合相關(guān)的依賴性或要求。
      本領(lǐng)域的普通技術(shù)人員應(yīng)能明白,計(jì)算機(jī)或其它客戶機(jī)或服務(wù)器裝置可作為計(jì)算機(jī)網(wǎng)絡(luò)的一部分來部署,或部署在分布式計(jì)算環(huán)境中。在這點(diǎn)上,本發(fā)明適用于具有任意數(shù)量的內(nèi)存或存儲單元,和橫跨任一數(shù)量的存儲單元或存儲量而發(fā)生的任一數(shù)量的應(yīng)用程序和過程的任何可結(jié)合本發(fā)明使用的計(jì)算機(jī)系統(tǒng)。本發(fā)明可應(yīng)用于在具有遠(yuǎn)程或本地存儲器的網(wǎng)絡(luò)環(huán)境或分布式計(jì)算環(huán)境中部署有服務(wù)器計(jì)算機(jī)和客戶機(jī)計(jì)算機(jī)的環(huán)境。本發(fā)明還可應(yīng)用于獨(dú)立的計(jì)算裝置,所述計(jì)算裝置具有程序設(shè)計(jì)語言功能、用于產(chǎn)生、接收和傳輸與遠(yuǎn)程或本地服務(wù)相關(guān)的信息的解釋和執(zhí)行能力。
      本發(fā)明可結(jié)合眾多其它的通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置來操作。有很多眾所周知的計(jì)算系統(tǒng)、環(huán)境和/或配置適用于本發(fā)明,例如,包括但不限于個人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、掌上型裝置或膝上型裝置、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)者電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括上述任何系統(tǒng)或裝置的分布式計(jì)算環(huán)境等。
      大體按照計(jì)算機(jī)可執(zhí)行指令來說明本發(fā)明,例如由計(jì)算機(jī)執(zhí)行的程序模塊。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)嵤┨囟ǔ橄髷?shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等。也可以在分布式計(jì)算環(huán)境中實(shí)施本發(fā)明,在這樣的環(huán)境中,由通過通信網(wǎng)絡(luò)或其它數(shù)據(jù)傳輸媒質(zhì)連接的遠(yuǎn)程處理裝置來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊和其它數(shù)據(jù)可位于包括內(nèi)存存儲裝置的本地和遠(yuǎn)程計(jì)算機(jī)存儲媒質(zhì)中。分布式計(jì)算有助于通過計(jì)算裝置和系統(tǒng)之間的直接交換來共享計(jì)算機(jī)資源和服務(wù)。這些資源和服務(wù)包括信息的交換,高速緩沖存儲器和用于文件的磁盤存儲器。分布式計(jì)算利用網(wǎng)絡(luò)的連接性,使客戶機(jī)能夠?qū)ζ浼w力量施加杠桿作用,以利于整個企業(yè)。在這點(diǎn)上,多種裝置可具有利用本發(fā)明技術(shù)的應(yīng)用、對象或資源。
      參考圖2,用于實(shí)施本發(fā)明的一種示范性系統(tǒng)包括以計(jì)算機(jī)110為形式的通用計(jì)算裝置。計(jì)算機(jī)110的組件可包括但不限于處理單元120、系統(tǒng)內(nèi)存130,以及將包括系統(tǒng)內(nèi)存在內(nèi)的各種系統(tǒng)組件耦合到處理單元120的系統(tǒng)總線121。系統(tǒng)總線121可以采用各種類型的總線結(jié)構(gòu),包括內(nèi)存總線或內(nèi)存控制器、外圍總線以及使用各種總線結(jié)構(gòu)的任一種的局部總線。作為例子,而非限制,此類結(jié)構(gòu)包括工業(yè)標(biāo)準(zhǔn)結(jié)構(gòu)(ISA)總線、微通道結(jié)構(gòu)(MCA)總線、增強(qiáng)型ISA(EISA)總線、視頻電子標(biāo)準(zhǔn)協(xié)會(VESA)局部總線以及外圍組件互連(PCI)總線(也稱為Mezzanine總線)。
      計(jì)算機(jī)110通常包括多種計(jì)算機(jī)可讀媒質(zhì)。計(jì)算機(jī)可讀媒質(zhì)可以是任何可由計(jì)算機(jī)110存取的可用媒質(zhì),包括易失性與非易失性媒質(zhì)、可移動與非可移動媒質(zhì)。作為例子,而非限制,計(jì)算機(jī)可讀媒質(zhì)包括計(jì)算機(jī)存儲媒質(zhì)和通信媒質(zhì)。計(jì)算機(jī)存儲媒質(zhì)包括可以任何方法或技術(shù)實(shí)施的易失性與非易失性以及可移動與非可移動媒質(zhì),用來存儲信息,例如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它結(jié)構(gòu)。計(jì)算機(jī)存儲媒質(zhì)包括但不限于RAM、ROM、EEPROM、閃存或其它內(nèi)存技術(shù)、CDROM、數(shù)字化視頻光盤(DVD)或其它光盤存儲器、磁盒、磁帶、磁盤存儲器或其它磁性存儲裝置,或任何其它可用于存儲所需信息并且可由計(jì)算機(jī)110存取的媒質(zhì)。通信媒質(zhì)通常采用已調(diào)數(shù)據(jù)信號(例如載波或其它傳輸機(jī)制)來具體化計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊,或其它數(shù)據(jù),并且包括任何信息傳送媒質(zhì)。術(shù)語“已調(diào)數(shù)據(jù)信號”是指其一個或多個特性是以對信號內(nèi)信息進(jìn)行編碼的方式來設(shè)定或改變的信號。作為例子,而非限制,通信媒質(zhì)包括有線媒質(zhì),例如有線網(wǎng)絡(luò)或直線連接,還包括無線媒質(zhì),如聲音、RF、紅外線以及其它無線媒質(zhì)。上述媒質(zhì)的任何組合也應(yīng)包括在計(jì)算機(jī)可讀媒質(zhì)的范圍之內(nèi)。
      系統(tǒng)內(nèi)存130包括以易失性和/或非易失性內(nèi)存為形式的計(jì)算機(jī)存儲媒質(zhì),例如只讀存儲器(ROM)131和隨機(jī)存取存儲器(RAM)132?;据斎?輸出系統(tǒng)133(BIOS)所含有的基本例程有助于在計(jì)算機(jī)110內(nèi)的元件之間傳送信息,例如在啟動期間。BIOS系統(tǒng)133通常存儲在ROM 131內(nèi)。RAM 132通常包含可由處理單元120即時存取和/或目前在操作的數(shù)據(jù)和/或程序模塊。作為例子,而非限制,圖2說明了操作系統(tǒng)134、應(yīng)用程序135、其它程序模塊136以及程序數(shù)據(jù)137。
      計(jì)算機(jī)110亦可包括其它可移動/非可移動、易失性/非易失性的計(jì)算機(jī)存儲媒質(zhì)。舉例而言,圖2說明了讀寫非可移動、非易失性磁性媒質(zhì)的硬盤驅(qū)動器140、讀寫可移動、非易失性磁盤152的磁盤驅(qū)動器151以及讀寫可移動、非易失性光盤156(例如CD ROM或其它光學(xué)媒質(zhì))的光盤驅(qū)動器155。其它可用于示范性操作環(huán)境的可移動/非可移動、易失性/非易失性計(jì)算機(jī)存儲媒質(zhì)包括但不限于磁帶盒、閃存卡、數(shù)字化視頻光盤、數(shù)字錄像帶、固態(tài)RAM、固態(tài)ROM等。硬盤驅(qū)動器141通常通過非可移動存儲接口(例如接口140)連接到系統(tǒng)總線121,磁盤驅(qū)動器151和光盤驅(qū)動器155通常通過可移動存儲接口150連接到系統(tǒng)總線121。
      上文所討論以及圖2所述的驅(qū)動器及其相關(guān)的計(jì)算機(jī)存儲媒質(zhì)可為計(jì)算機(jī)110存儲計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊和其它數(shù)據(jù)。例如,圖2所述的硬盤驅(qū)動器141存儲操作系統(tǒng)144、應(yīng)用程序145、其它程序模塊146和程序數(shù)據(jù)147。注意到這些組件可以和操作系統(tǒng)134、應(yīng)用程序135、其它程序模塊136以及程序數(shù)據(jù)137相同,也可以不同。這里為操作系統(tǒng)144、應(yīng)用程序145、其它程序模塊146和程序數(shù)據(jù)147給出不同的編號,用來說明它們至少是不同的副本。用戶可通過輸入裝置(例如鍵盤162和指示裝置161,后者常稱為鼠標(biāo)、軌跡球或觸控墊)向計(jì)算機(jī)20輸入命令和信息。其它輸入裝置(未示出)可包括麥克風(fēng)、操縱桿、游戲墊、圓盤式衛(wèi)星電視天線、掃描儀等。這些和其它輸入裝置通常通過用戶輸入接口160(與系統(tǒng)總線耦合)連接到處理單元120,但也可以由其它接口和總線結(jié)構(gòu)連接,例如并行端口、游戲端口或通用串行總線(USB)。監(jiān)視器191或其它類型的顯示裝置也可經(jīng)由一個接口(例如視頻接口190)連接到系統(tǒng)總線121。除了監(jiān)視器以外,計(jì)算機(jī)還可以包括其它可通過輸出外圍接口196連接的外圍輸出裝置,例如揚(yáng)聲器197和打印機(jī)190。
      計(jì)算機(jī)110可在網(wǎng)絡(luò)化的環(huán)境中操作,該環(huán)境使用邏輯連接與一個或多個遠(yuǎn)程計(jì)算機(jī)(例如遠(yuǎn)程計(jì)算機(jī)180)連接。遠(yuǎn)程計(jì)算機(jī)180可以是個人計(jì)算機(jī)、服務(wù)器、路由器、網(wǎng)絡(luò)PC、對等裝置或其它公共網(wǎng)絡(luò)節(jié)點(diǎn),并且通常包括以上關(guān)于計(jì)算機(jī)110所述的許多或全部元件,盡管圖2中只說明了內(nèi)存存儲裝置181。圖2中描述的邏輯連接包括局域網(wǎng)(LAN)171和廣域網(wǎng)(WAN)173,但也可包括其它網(wǎng)絡(luò)。此類網(wǎng)絡(luò)環(huán)境在辦公室、公司范圍的計(jì)算機(jī)網(wǎng)絡(luò)、企業(yè)內(nèi)部網(wǎng)和因特網(wǎng)中非常普遍。
      當(dāng)用在LAN網(wǎng)絡(luò)環(huán)境中時,計(jì)算機(jī)110可通過網(wǎng)絡(luò)接口或適配器170連接到LAN 171。當(dāng)用在WAN網(wǎng)絡(luò)環(huán)境中時,計(jì)算機(jī)110通常包括調(diào)制解調(diào)器172或其它用于在WAN(例如因特網(wǎng))173上建立通信的裝置。調(diào)制解調(diào)器172(可為內(nèi)置型或外置型)可經(jīng)由用戶輸入接口160或其它適當(dāng)?shù)臋C(jī)制連接到系統(tǒng)總線121。在網(wǎng)絡(luò)化的環(huán)境中,關(guān)于計(jì)算機(jī)110所述的程序模塊或其部分可存儲在遠(yuǎn)程內(nèi)存存儲裝置中。作為例子,而非限制,圖2說明了駐留在內(nèi)存裝置181上的遠(yuǎn)程應(yīng)用程序185。應(yīng)明白,所示的網(wǎng)絡(luò)連接是示范性的,可使用其它在計(jì)算機(jī)之間建立通信連接的裝置。
      雖然本文的某些示范性實(shí)施例結(jié)合駐留在計(jì)算裝置上的軟件來說明,但也可經(jīng)由操作系統(tǒng)、應(yīng)用程序設(shè)計(jì)接口(API)、“中間人”對象、控制對象、硬件、固件等來實(shí)施本發(fā)明的一個或多個部分,使得所述方法包括于全部。NET語言和服務(wù)、得到全部。NET語言和服務(wù)的支持或經(jīng)由全部。NET語言和服務(wù)來存取,并且在其它分布式計(jì)算框架之內(nèi)。
      深入鉆取功能如上所述,數(shù)據(jù)挖掘應(yīng)用允許在數(shù)據(jù)集上訓(xùn)練和使用模型。一般而言,數(shù)據(jù)集可表示為數(shù)據(jù)表??捎帽淼囊恍衼肀硎久總€實(shí)例,表的每列對應(yīng)于一變量。行R和列C所索引的單元格中的值對應(yīng)于一變量的值,該變量對應(yīng)于與行R對應(yīng)的實(shí)例的列C。雖然數(shù)據(jù)集可表示為數(shù)據(jù)表并通常存儲在表結(jié)構(gòu)中,但本發(fā)明也涵蓋其它數(shù)據(jù)集存儲和表示形式。
      當(dāng)將挖掘模型應(yīng)用于數(shù)據(jù)集中時,結(jié)果得到數(shù)據(jù)的圖示。圖示包括節(jié)點(diǎn)??捎脕碜詳?shù)據(jù)集的實(shí)例來填充圖示的節(jié)點(diǎn)。將挖掘模型應(yīng)用于數(shù)據(jù)集的應(yīng)用程序從數(shù)據(jù)集取得數(shù)據(jù),用它來填充應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示。但是,圖示中可能會遺漏特定的信息。例如,在應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示中,可根據(jù)節(jié)點(diǎn)處的實(shí)例數(shù)量來遮蔽節(jié)點(diǎn)。根節(jié)點(diǎn)處顯示了數(shù)據(jù)集中的全部實(shí)例。將對應(yīng)地遮蔽該節(jié)點(diǎn)。在下一層中分裂實(shí)例,并且該層中的遮蔽將指示哪個節(jié)點(diǎn)的數(shù)據(jù)較多,哪個節(jié)點(diǎn)的數(shù)據(jù)較少。然而,即使在此類被遮蔽的圖示中,雖然遮蔽可指示每個節(jié)點(diǎn)中的實(shí)例有多少,但也會遺漏來自數(shù)據(jù)集的其它信息。例如,數(shù)據(jù)集可包含“Income”變量。在圖1的圖示中將實(shí)例分配于各節(jié)點(diǎn)時沒有使用該變量。圖示中不使用某一變量的原因有很多。例如,用戶可明示地請求在挖掘模型的使用或創(chuàng)建中不包括特定的變量。在其它實(shí)例中,可開發(fā)不使用特定變量的挖掘模型,因?yàn)樵撟兞坎粫δP偷念A(yù)測能力產(chǎn)生積極的影響。然而,用戶可能需要查看該特定變量的值。
      如圖3所示,數(shù)據(jù)集程序300提供對存儲的數(shù)據(jù)集310的存取??山?jīng)由查詢語言提供對數(shù)據(jù)集的存取。例如,當(dāng)數(shù)據(jù)集存儲程序300是從微軟公司獲得的SQL應(yīng)用程序之一時,查詢語言是SQL查詢語言。其它數(shù)據(jù)庫應(yīng)用程序可包括挖掘模型或相關(guān)的功能,本發(fā)明亦可使用此類其它的應(yīng)用程序。
      本發(fā)明的一項(xiàng)實(shí)施例中亦可存儲挖掘模型320。除此之外,在一項(xiàng)實(shí)施例中,將挖掘模型320應(yīng)用于數(shù)據(jù)集310可產(chǎn)生習(xí)得圖(learned graph)330。這些習(xí)得圖330可由用戶350存儲,也可由用戶350通過內(nèi)容瀏覽器340予以使用。內(nèi)容瀏覽器可以是單獨(dú)的應(yīng)用程序,如圖3所示,或可集成到數(shù)據(jù)集程序300中。內(nèi)容瀏覽器340可提供對基于習(xí)得圖330信息的圖示(例如圖1中的示范性圖示)的存取。除圖1所示的決策樹之外,圖示還可包括群集顯示以及其它的圖示。
      內(nèi)容瀏覽器340的用戶350可以是直接或間接地與內(nèi)容瀏覽器340的用戶界面交互作用的人類用戶。用戶350也可以是使用內(nèi)容瀏覽器340的另一應(yīng)用程序或工具。根據(jù)本發(fā)明一項(xiàng)實(shí)施例,用戶350可從與指定節(jié)點(diǎn)中的實(shí)例對應(yīng)的數(shù)據(jù)集請求數(shù)據(jù)的顯示。該數(shù)據(jù)稱為“深入鉆取”數(shù)據(jù)。例如,在內(nèi)容瀏覽器340上瀏覽數(shù)據(jù)的人類用戶可能希望瀏覽指定節(jié)點(diǎn)處的基礎(chǔ)數(shù)據(jù),以確定該節(jié)點(diǎn)中實(shí)例的其它特征。例如,內(nèi)容瀏覽器340可經(jīng)由鼠標(biāo)點(diǎn)擊來接收用戶350對節(jié)點(diǎn)的請求。為提供數(shù)據(jù),內(nèi)容瀏覽器340可從數(shù)據(jù)集程序300請求實(shí)例數(shù)據(jù)。根據(jù)本發(fā)明一項(xiàng)實(shí)施例,非人類用戶也可從數(shù)據(jù)集程序300請求實(shí)例數(shù)據(jù)。在一項(xiàng)實(shí)施例中,通過使用自動查詢來完成這項(xiàng)操作。
      在一項(xiàng)實(shí)施例中,內(nèi)容瀏覽器340經(jīng)由查詢從數(shù)據(jù)集程序300請求指定節(jié)點(diǎn)的實(shí)例數(shù)據(jù)。例如,在本發(fā)明一項(xiàng)實(shí)施例中,基于該目的而采用SQL型語法。例如,在一項(xiàng)實(shí)施例中,從模型“model-one”查詢給定節(jié)點(diǎn)“NodeSelected的實(shí)例可以是Select*from[model-one].casesWhere IsInNode(‘NodeSelected’)此語法向數(shù)據(jù)集程序300指示其應(yīng)返回模型“model-one中節(jié)點(diǎn)“NodeSelected”中的實(shí)例。在一項(xiàng)實(shí)施例中,當(dāng)“.cases”在查詢中時返回的實(shí)例是該模型在其上訓(xùn)練的該模型的訓(xùn)練實(shí)例。
      因?yàn)榭捎谜埱髞磉x擇大量的實(shí)例,因此只從數(shù)據(jù)集程序300返回此類實(shí)例的采樣可能有用。這使對基礎(chǔ)數(shù)據(jù)的請求返回基礎(chǔ)數(shù)據(jù)的采樣而非全部基礎(chǔ)數(shù)據(jù)。這可在數(shù)據(jù)傳送成本方面提供優(yōu)勢。在此類情形中,可請求只提供模型中所選節(jié)點(diǎn)處的實(shí)例的子集,而不用從模型中的全部實(shí)例請求數(shù)據(jù)(在該例子中的“from[model-one].cases”)。該子集包括表示該節(jié)點(diǎn)處數(shù)據(jù)的采樣實(shí)例。例如,在一項(xiàng)實(shí)施例中,請求的語法可為Select*from[model-one].sample_casesWhere IsInNode(‘NodeSelected’)數(shù)據(jù)集程序300解釋此請求并提供NodeSelected的基礎(chǔ)數(shù)據(jù)的采樣。
      在另一實(shí)施例中,當(dāng)請求實(shí)例的采樣時,并非返回該節(jié)點(diǎn)處的實(shí)際實(shí)例,而是返回假設(shè)的實(shí)例。因?yàn)闉榱私忉尮?jié)點(diǎn)的內(nèi)容而完成對實(shí)例采樣的請求,一種增加清晰性的方式是提供解釋被查詢節(jié)點(diǎn)的內(nèi)容的假設(shè)實(shí)例。在某些實(shí)例中,實(shí)際數(shù)據(jù)可能不如假設(shè)的實(shí)例清晰。雖然此類假設(shè)的實(shí)例可能不是模型的訓(xùn)練數(shù)據(jù)的一部分,但如果假設(shè)的實(shí)例是訓(xùn)練數(shù)據(jù)的一部分,那么返回的假設(shè)實(shí)例將已在節(jié)點(diǎn)中。假設(shè)實(shí)例可能已在以前產(chǎn)生或提供,從而當(dāng)作出對假設(shè)實(shí)例的請求時,可找到適當(dāng)?shù)募僭O(shè)實(shí)例。在此類實(shí)例中,除了顯示為已存儲并可用于圖3中的數(shù)據(jù)集程序300的信息之外,還可將假設(shè)的實(shí)例信息用于數(shù)據(jù)集程序300?;蛘?,當(dāng)作出請求時,可即時產(chǎn)生假設(shè)的實(shí)例。
      如圖3所示,在一項(xiàng)實(shí)施例中,除了存儲習(xí)得圖330信息之外,數(shù)據(jù)集程序還可存儲映射信息335。此映射信息可存儲有關(guān)將實(shí)例映射到習(xí)得圖330之一中的節(jié)點(diǎn)的信息。這樣,即使不可存取習(xí)得圖的模型,也可在查詢之后返回習(xí)得圖的實(shí)例信息。
      圖4顯示深入鉆取數(shù)據(jù)的例子。該數(shù)據(jù)對應(yīng)于圖1中節(jié)點(diǎn)1112的深入鉆取。如圖所示,窗口400中顯示節(jié)點(diǎn)的實(shí)例信息,包括圖1的決策樹中未示出的變量的數(shù)據(jù)。
      圖5的流程圖中顯示根據(jù)本發(fā)明一項(xiàng)實(shí)施例的方法。步驟500中接收對所述至少一個節(jié)點(diǎn)中一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求。在步驟51O中確定數(shù)據(jù)集中的哪些實(shí)例構(gòu)成該節(jié)點(diǎn)的基礎(chǔ)。在步驟520中提供與基礎(chǔ)實(shí)例有關(guān)的數(shù)據(jù)。提供與基礎(chǔ)實(shí)例有關(guān)的全部數(shù)據(jù),或當(dāng)請求時,提供與基礎(chǔ)實(shí)例有關(guān)的數(shù)據(jù)的采樣。
      雖然本發(fā)明已參考相關(guān)的數(shù)據(jù)源加以說明,但所述本發(fā)明的適用性不限于此類數(shù)據(jù)源。例如,但不作限制,預(yù)期本發(fā)明可實(shí)施于多維數(shù)據(jù)源的環(huán)境中,例如在線分析處理(OLAP)立方源,或任何其它挖掘模型數(shù)據(jù)類型。
      有多種實(shí)施本發(fā)明的方式,例如適當(dāng)?shù)腁PI、工具套件、驅(qū)動程序代碼、操作系統(tǒng)、控件、獨(dú)立或可下載軟件對象等,它們使應(yīng)用和服務(wù)可使用本發(fā)明的產(chǎn)品配置方法。本發(fā)明期望通過API(或其它軟件對象)的觀點(diǎn),以及通過在產(chǎn)品配置數(shù)據(jù)方面進(jìn)行通信的軟件或硬件對象來使用本發(fā)明。因此,本文所述的本發(fā)明的各種實(shí)施方案可具有全部用硬件、部分用硬件和部分用軟件以及用軟件的方面。
      如上所述,雖然本發(fā)明的示范性實(shí)施例已結(jié)合各種計(jì)算裝置和網(wǎng)絡(luò)結(jié)構(gòu)加以說明,但可將基本概念應(yīng)用于任何需要在其中實(shí)施產(chǎn)品配置的計(jì)算裝置或系統(tǒng)。因此,根據(jù)本發(fā)明的編碼/解碼數(shù)據(jù)的技術(shù)可應(yīng)用于多種應(yīng)用和裝置。例如,本發(fā)明的演算法和硬件實(shí)施方案可應(yīng)用于計(jì)算裝置的操作系統(tǒng),作為裝置上的單獨(dú)對象、作為另一對象的部分、作為可再使用的控件、作為可從服務(wù)器下載的對象、作為裝置或?qū)ο蠛途W(wǎng)絡(luò)之間的“中間人”、作為分布式對象、作為硬件,在內(nèi)存中,前面任何項(xiàng)的組合,等等。雖然本文選擇示范性的程序設(shè)計(jì)語言、名稱和例子作為各種選擇的代表,但這些語言、名稱和例子并非想要作限制。有關(guān)參考使用控件來實(shí)現(xiàn)本發(fā)明的實(shí)施例,本發(fā)明不限于提供.NET控件,而是應(yīng)在根據(jù)本發(fā)明實(shí)現(xiàn)配置目的的任何軟件(和/或硬件)的較寬泛方面進(jìn)行考慮。本領(lǐng)域的普通技術(shù)人員應(yīng)明白,有多種方式可提供用于實(shí)現(xiàn)通過本發(fā)明各種實(shí)施例實(shí)現(xiàn)的相同、相似或等效功能的對象代碼和命名法。本文所用的術(shù)語“產(chǎn)品”指代產(chǎn)品和/或服務(wù),和/或可用于通過因特網(wǎng)目錄銷售的任何其它物品。也可結(jié)合在線拍賣或投標(biāo)網(wǎng)站實(shí)施本發(fā)明。
      如上所述,可結(jié)合硬件或軟件或在適當(dāng)?shù)那闆r下結(jié)合兩者的組合來實(shí)施本文所述的各種技術(shù)。因此,本發(fā)明的方法和裝置,或其某些方面或部分,可采取有形媒質(zhì)(例如軟盤、CD-ROM、硬盤驅(qū)動器或任何其它機(jī)器可讀存儲媒質(zhì))中所具體化的程序代碼(即指令)的形式,其中當(dāng)將程序代碼載入機(jī)器(例如計(jì)算機(jī))并由機(jī)器來執(zhí)行時,該機(jī)器變?yōu)橛糜趯?shí)施本發(fā)明的裝置。在可編程計(jì)算機(jī)中執(zhí)行程序代碼的實(shí)例下,計(jì)算裝置一般將包括處理器、可由處理器讀取的存儲媒質(zhì)(包括易失性和非易失性內(nèi)存和/或存儲元件)、至少一輸入裝置和至少一輸出裝置。可利用本發(fā)明的產(chǎn)品配置技術(shù)(例如透過使用數(shù)據(jù)處理API、可再使用控件等)的一個或多個程序較佳地實(shí)施于高級面向過程或面向?qū)ο蟮某绦蛟O(shè)計(jì)語言中,以與計(jì)算機(jī)系統(tǒng)通信。然而,如需要,可用匯編或機(jī)器語言來實(shí)施程序。在任何實(shí)例下,語言可以是經(jīng)編譯或解釋的語言,并可與硬件實(shí)施方案結(jié)合。
      本發(fā)明的方法和裝置亦可經(jīng)由以程序代碼為形式具體化的通信來實(shí)施,該程序代碼通過某一傳輸媒質(zhì)(例如通過電線或電纜、通過光纖或經(jīng)由任一其它的傳輸形式)來傳輸,其中,當(dāng)接收程序代碼、將程序代碼載入機(jī)器(如EPROM、門陣列、可編程邏輯裝置(PLD)、客戶機(jī)計(jì)算機(jī)、錄像機(jī)等或如以上示范性實(shí)施例中所述具有信號處理能力的接收裝置)并由機(jī)器來執(zhí)行程序代碼時,該機(jī)器變?yōu)橛糜趯?shí)施本發(fā)明的裝置。當(dāng)在通用處理器上實(shí)施時,程序代碼可與處理器結(jié)合,以提供用來調(diào)用本發(fā)明的功能的獨(dú)特裝置。另外,結(jié)合本發(fā)明使用的任何存儲技術(shù)總可以是硬件和軟件的組合。
      雖然本發(fā)明已結(jié)合各圖的優(yōu)選實(shí)施例來說明,應(yīng)了解可使用其它類似的實(shí)施例,并可對所述實(shí)施例進(jìn)行修改和添加以執(zhí)行本發(fā)明的相同功能,而不致脫離本發(fā)明。例如,雖然本發(fā)明的示范性網(wǎng)絡(luò)環(huán)境在網(wǎng)絡(luò)化的環(huán)境(對等網(wǎng)絡(luò)化環(huán)境)中說明,本領(lǐng)域的熟練技術(shù)人員應(yīng)明白,本發(fā)明不限于此,并且本申請中所述的方法可應(yīng)用于任一計(jì)算裝置或環(huán)境,例如游戲控制臺、掌上型計(jì)算機(jī)、便攜式計(jì)算機(jī)等(有線或無線),并可應(yīng)用于經(jīng)由通信網(wǎng)絡(luò)連接并可橫跨網(wǎng)絡(luò)交互作用的任一數(shù)量的此類計(jì)算裝置。此外,應(yīng)強(qiáng)調(diào),本發(fā)明涵蓋多種計(jì)算機(jī)平臺,包括掌上型裝置操作系統(tǒng)和其它專用操作系統(tǒng),尤其當(dāng)無線網(wǎng)絡(luò)化裝置的數(shù)量持續(xù)增長時。而且,本發(fā)明可實(shí)施于多個處理芯片或裝置中,或橫跨多個處理芯片或裝置來實(shí)施,并且可橫跨多個裝置類似地實(shí)現(xiàn)存儲器。因此,本發(fā)明不應(yīng)限于任何單項(xiàng)實(shí)施例,而應(yīng)在與隨附權(quán)利要求書一致的廣度和范圍內(nèi)進(jìn)行解釋。
      權(quán)利要求
      1.一種用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的方法,其特征在于,所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個相對應(yīng)的至少一個節(jié)點(diǎn),所述方法包括接收對所述至少一個節(jié)點(diǎn)中一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求;確定所述至少一個實(shí)例中的哪個對應(yīng)于所述指定節(jié)點(diǎn);以及提供和所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述接收包括檢測對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求,所述檢測包括接收具有與其相關(guān)的查詢信息的查詢;以及檢測出所述查詢信息包括對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的所述請求。
      3.根據(jù)權(quán)利要求2所述的方法,其特征在于所述接收查詢包括接收以特定查詢語言表示的查詢。
      4.根據(jù)權(quán)利要求3所述的方法,其特征在于所述接收查詢包括接收以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      5.根據(jù)權(quán)利要求1所述的方法,其特征在于所述提供與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)包括提供與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      6.根據(jù)權(quán)利要求1所述的方法,其特征在于所述接收請求包括接收對數(shù)據(jù)采樣的請求,所述提供與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)包括提供與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)。
      7.一種包括計(jì)算機(jī)可執(zhí)行模塊的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述模塊具有用于執(zhí)行根據(jù)權(quán)利要求1所述的方法的計(jì)算機(jī)可執(zhí)行指令。
      8.一種包括具有計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可執(zhí)行模塊的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述模塊用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示有關(guān)的信息,所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個對應(yīng)的至少一個節(jié)點(diǎn),所述計(jì)算機(jī)可執(zhí)行模塊包括輸入組件,用于從所述至少一個節(jié)點(diǎn)中接收一節(jié)點(diǎn)的指示;分析組件,用于確定所述至少一個實(shí)例中的哪個對應(yīng)于所述指定節(jié)點(diǎn);以及輸出組件,用于輸出與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)。
      9.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸入組件檢測對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求。
      10.根據(jù)權(quán)利要求9所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸入組件接收查詢,并檢測出所述查詢包括對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的所述請求。
      11.根據(jù)權(quán)利要求10所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸入組件接收以特定查詢語言表示的查詢。
      12.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸入組件接收以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      13.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸出組件提供與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      14.根據(jù)權(quán)利要求8所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于所述輸入組件接收對數(shù)據(jù)采樣的請求,并且所述輸出組件輸出與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)。
      15.一種和提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示有關(guān)的信息結(jié)合使用的應(yīng)用程序設(shè)計(jì)接口,所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個對應(yīng)的至少一個節(jié)點(diǎn),其特征在于所述應(yīng)用程序設(shè)計(jì)接口接收對所述至少一個節(jié)點(diǎn)中的一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求作為輸入,將查詢發(fā)送到包括所述數(shù)據(jù)的數(shù)據(jù)庫,以檢索所述至少一個實(shí)例的哪個對應(yīng)于所述指定節(jié)點(diǎn),并輸出與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)。
      16.根據(jù)權(quán)利要求15所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于所述應(yīng)用程序設(shè)計(jì)接口通過接收查詢并檢測出所述查詢包括對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的所述請求,而檢測對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求。
      17.根據(jù)權(quán)利要求16所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于所述應(yīng)用程序設(shè)計(jì)接口向數(shù)據(jù)庫發(fā)送以特定查詢語言表示的查詢。
      18.根據(jù)權(quán)利要求17所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于所述應(yīng)用程序設(shè)計(jì)接口發(fā)送以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      19.根據(jù)權(quán)利要求15所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于所述應(yīng)用程序設(shè)計(jì)接口輸出與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      20.根據(jù)權(quán)利要求15所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于當(dāng)所述應(yīng)用程序設(shè)計(jì)接口接收對數(shù)據(jù)采樣的請求時,所述應(yīng)用程序設(shè)計(jì)接口輸出與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)。
      21.根據(jù)權(quán)利要求20所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于所述應(yīng)用程序設(shè)計(jì)接口執(zhí)行(a)和(b)之一(a)格式化所述應(yīng)用程序設(shè)計(jì)接口發(fā)送到數(shù)據(jù)庫以檢索采樣的查詢和(b)對全部對應(yīng)實(shí)例的標(biāo)準(zhǔn)查詢的完整結(jié)果進(jìn)行采樣。
      22.根據(jù)權(quán)利要求15所述的應(yīng)用程序設(shè)計(jì)接口,其特征在于經(jīng)由至少一個網(wǎng)絡(luò)發(fā)送所述查詢并檢索所述結(jié)果。
      23.一種展現(xiàn)一通用功能的用戶界面,其特征在于,所述通用功能使用戶可經(jīng)由用戶界面,從應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示指定一節(jié)點(diǎn),所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個對應(yīng)的至少一個節(jié)點(diǎn),并對所述用戶指定節(jié)點(diǎn)作出響應(yīng),檢索并向用戶顯示所述模型的所述節(jié)點(diǎn)和數(shù)據(jù)集的基礎(chǔ)實(shí)例。
      24.根據(jù)權(quán)利要求23所述的用戶界面,其特征在于所述用戶界面檢測對所述指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求,并對之作出響應(yīng)而經(jīng)由應(yīng)用程序設(shè)計(jì)接口發(fā)送對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求。
      25.根據(jù)權(quán)利要求24所述的用戶界面,其特征在于所述應(yīng)用程序設(shè)計(jì)接口向數(shù)據(jù)庫發(fā)送以特定查詢語言表示的查詢。
      26.根據(jù)權(quán)利要求25所述的用戶界面,其特征在于所述應(yīng)用程序設(shè)計(jì)接口發(fā)送以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      27.根據(jù)權(quán)利要求23所述的用戶界面,其特征在于所述用戶界面顯示了與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      28.根據(jù)權(quán)利要求24所述的用戶界面,其特征在于當(dāng)所述用戶界面接收對與指定節(jié)點(diǎn)相關(guān)的數(shù)據(jù)的采樣的請求時,所述用戶界面向應(yīng)用程序設(shè)計(jì)接口發(fā)送與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)的請求。
      29.根據(jù)權(quán)利要求28所述的用戶界面,其特征在于所述用戶界面顯示了對應(yīng)實(shí)例的采樣。
      30.一種用于提供與應(yīng)用于包括至少一個實(shí)例的數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的方法,其特征在于,所述系統(tǒng)包括應(yīng)用程序設(shè)計(jì)接口,所述應(yīng)用程序設(shè)計(jì)接口(a)接收對來自應(yīng)用于所述數(shù)據(jù)集的挖掘模型的圖示的指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求,所述圖示包括與所述至少一個實(shí)例的至少一個相對應(yīng)的至少一個節(jié)點(diǎn),(b)發(fā)送包括所述數(shù)據(jù)的查詢,以從所述至少一個實(shí)例檢索出與所述指定節(jié)點(diǎn)相對應(yīng)的一個或多個對應(yīng)實(shí)例,并且(c)用與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)對所述請求作出響應(yīng);以及用于存儲所述數(shù)據(jù)集的數(shù)據(jù)庫,它與所述應(yīng)用程序設(shè)計(jì)接口操作性地連接,并用于接收所述查詢并將與所述對應(yīng)實(shí)例相關(guān)的所述數(shù)據(jù)返回到所述應(yīng)用程序設(shè)計(jì)接口。
      31.根據(jù)權(quán)利要求30所述的系統(tǒng),其特征在于所述查詢包括以特定查詢語言表示的查詢。
      32.根據(jù)權(quán)利要求31所述的系統(tǒng),其特征在于所述接收查詢包括接收以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      33.根據(jù)權(quán)利要求30所述的系統(tǒng),其特征在于所述提供與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)包括提供與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      34.根據(jù)權(quán)利要求30所述的系統(tǒng),其特征在于所述請求包括對數(shù)據(jù)采樣的請求,并且與所述對應(yīng)實(shí)例相關(guān)的所述數(shù)據(jù)包括與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)。
      35.一種用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的系統(tǒng),其特征在于,所述系統(tǒng)包括用戶界面,所述用戶界面(a)接收對來自應(yīng)用于包括至少一個實(shí)例的數(shù)據(jù)集的挖掘模型的圖示的指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求作為輸入,所述圖示包括與所述至少一個實(shí)例的至少一個對應(yīng)的至少一個節(jié)點(diǎn),(b)發(fā)送包括所述數(shù)據(jù)的查詢,以從所述至少一個實(shí)例中檢索出與所述指定節(jié)點(diǎn)對應(yīng)的一個或多個對應(yīng)實(shí)例,以及(c)用與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)對所述請求作出響應(yīng);以及用于存儲所述數(shù)據(jù)集的數(shù)據(jù)庫,它與所述用戶界面操作性連接,并用于接收所述查詢并將與所述對應(yīng)實(shí)例相關(guān)的所述數(shù)據(jù)返回到所述應(yīng)用程序設(shè)計(jì)接口。
      36.根據(jù)權(quán)利要求35所述的系統(tǒng),其特征在于所述查詢包括以特定查詢語言表示的查詢。
      37.根據(jù)權(quán)利要求36所述的系統(tǒng),其特征在于所述接收查詢包括接收以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      38.根據(jù)權(quán)利要求35所述的系統(tǒng),其特征在于所述提供與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)包括提供與所述對應(yīng)實(shí)例的每個實(shí)例相關(guān)的數(shù)據(jù)。
      39.根據(jù)權(quán)利要求35所述的系統(tǒng),其特征在于所述請求包括對數(shù)據(jù)采樣的請求,并且與所述對應(yīng)實(shí)例相關(guān)的所述數(shù)據(jù)包括與所述對應(yīng)實(shí)例的采樣相關(guān)的數(shù)據(jù)。
      40.根據(jù)權(quán)利要求35所述的系統(tǒng),其特征在于對挖掘模型的圖示的一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的所述請求包括用戶已選擇所述節(jié)點(diǎn)的指示。
      41.根據(jù)權(quán)利要求40所述的系統(tǒng),其特征在于所述指示包括鼠標(biāo)點(diǎn)擊。
      42.一種用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的系統(tǒng),其特征在于,所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個相對應(yīng)的至少一個節(jié)點(diǎn),所述系統(tǒng)包括請求接收裝置,用于接收對所述至少一個節(jié)點(diǎn)中一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求;對應(yīng)確定裝置,用于確定所述至少一個實(shí)例中的哪個對應(yīng)于所述指定節(jié)點(diǎn);以及數(shù)據(jù)提供裝置,用于提供與所述對應(yīng)實(shí)例相關(guān)的數(shù)據(jù)。
      43.一種用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的方法,其特征在于,所述數(shù)據(jù)集包括至少一實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個相對應(yīng)的至少一個節(jié)點(diǎn),所述方法包括接收對所述至少一個節(jié)點(diǎn)中一指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求;確定與所述指定節(jié)點(diǎn)對應(yīng)的至少一個假設(shè)實(shí)例;以及提供和所述對應(yīng)的假設(shè)實(shí)例相關(guān)的數(shù)據(jù)。
      44.根據(jù)權(quán)利要求43所述的方法,其特征在于,所述接收包括檢測對指定節(jié)點(diǎn)的基礎(chǔ)數(shù)據(jù)的請求,所述檢測包括接收具有與其相關(guān)的查詢信息的查詢;以及檢測出所述查詢信息包括對與指定節(jié)點(diǎn)對應(yīng)的假設(shè)數(shù)據(jù)的所述請求。
      45.根據(jù)權(quán)利要求44所述的方法,其特征在于,所述接收查詢包括接收以特定查詢語言表示的查詢。
      46.根據(jù)權(quán)利要求44所述的方法,其特征在于,所述接收查詢包括接收以SQL數(shù)據(jù)庫查詢語言表示的查詢。
      47.一種包括計(jì)算機(jī)可執(zhí)行模塊的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述模塊具有用于執(zhí)行權(quán)利要求43所述的方法的計(jì)算機(jī)可執(zhí)行指令。
      48.一種包括具有計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)可執(zhí)行模塊的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述模塊用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息,所述數(shù)據(jù)集包括至少一個實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個對應(yīng)的至少一個節(jié)點(diǎn),所述計(jì)算機(jī)可執(zhí)行模塊包括輸入組件,用于接收所述至少一個節(jié)點(diǎn)中的一節(jié)點(diǎn)的指示;分析組件,用于確定與所述指定節(jié)點(diǎn)相對應(yīng)的至少一個假設(shè)實(shí)例;以及輸出組件,用于輸出與所述對應(yīng)的假設(shè)實(shí)例相關(guān)的數(shù)據(jù)。
      49.根據(jù)權(quán)利要求48所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述輸入組件檢測對指定節(jié)點(diǎn)的基礎(chǔ)假設(shè)數(shù)據(jù)的請求。
      50.根據(jù)權(quán)利要求49所述的計(jì)算機(jī)可讀媒質(zhì),其特征在于,所述輸入組件接收查詢,并檢測出所述查詢包括對指定節(jié)點(diǎn)的基礎(chǔ)假設(shè)數(shù)據(jù)的所述請求。
      51.一種用于提供與應(yīng)用于數(shù)據(jù)集的挖掘模型的圖示相關(guān)的信息的系統(tǒng),其特征在于,所述數(shù)據(jù)集包括至少一實(shí)例,所述圖示包括與所述至少一個實(shí)例的至少一個相對應(yīng)的至少一個節(jié)點(diǎn),所述系統(tǒng)包括請求接收裝置,用于接收對與所述至少一個節(jié)點(diǎn)中的一指定節(jié)點(diǎn)對應(yīng)的假設(shè)數(shù)據(jù)的請求;假設(shè)實(shí)例提供裝置,用于提供與所述指定節(jié)點(diǎn)相對應(yīng)的至少一個假設(shè)實(shí)例;以及數(shù)據(jù)提供裝置,用于提供與所述對應(yīng)的假設(shè)實(shí)例相關(guān)的數(shù)據(jù)。
      全文摘要
      本發(fā)明提供從訓(xùn)練挖掘模型提供對挖掘模型源數(shù)據(jù)的廣泛深入鉆取的深入鉆取特征。為使用戶或應(yīng)用程序能獲得模型的給定節(jié)點(diǎn)上的模型內(nèi)容信息,提供了一通用功能,用戶可通過該通用功能指定模型的節(jié)點(diǎn)和數(shù)據(jù)集,并返回模型的節(jié)點(diǎn)和數(shù)據(jù)集的基礎(chǔ)實(shí)例??商峁┗A(chǔ)實(shí)例的采樣,其中只請求節(jié)點(diǎn)中所表示的實(shí)例的采樣。
      文檔編號G06F17/20GK1577335SQ20041006324
      公開日2005年2月9日 申請日期2004年6月30日 優(yōu)先權(quán)日2003年6月30日
      發(fā)明者P·金, C·J·麥克勒南, 唐朝暉, R·埃耶 申請人:微軟公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1