国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于搜索的數(shù)據(jù)的檢測、鏈接和獲取的方法和系統(tǒng)的制作方法

      文檔序號:10471166閱讀:408來源:國知局
      基于搜索的數(shù)據(jù)的檢測、鏈接和獲取的方法和系統(tǒng)的制作方法
      【專利摘要】計算裝置可以接收自然語言查詢。計算裝置可以基于該自然語言查詢來確定搜索條件集合。計算裝置可以至少部分地基于在搜索條件集合和多個數(shù)據(jù)集合的屬性之間的匹配,從多個數(shù)據(jù)集合中確定與該自然語言查詢相關(guān)的兩個或更多數(shù)據(jù)集合。計算裝置可以聯(lián)合兩個或更多數(shù)據(jù)集合,包括聯(lián)合兩個或更多數(shù)據(jù)集合的一個或多個行以及一個或多個列以產(chǎn)生聯(lián)合數(shù)據(jù)集合。計算裝置可以輸出聯(lián)合數(shù)據(jù)集合的表示。
      【專利說明】
      基于搜索的數(shù)據(jù)的檢測、鏈接和獲取的方法和系統(tǒng)
      技術(shù)領(lǐng)域
      [0001] 本公開設(shè)及商業(yè)智能系統(tǒng),并且更具體地設(shè)及與查詢(query)有關(guān)的數(shù)據(jù)的獲取。
      【背景技術(shù)】
      [0002] 企業(yè)軟件系統(tǒng)可能包含財務(wù)規(guī)劃系統(tǒng)、預(yù)算規(guī)劃系統(tǒng)、訂單管理系統(tǒng)、庫存管理系 統(tǒng)、銷售人員管理系統(tǒng)、商業(yè)智能工具、企業(yè)報告工具、工程和資源管理工具等。企業(yè)軟件系 統(tǒng)可W維護(hù)、鏈接至或者另外管理相關(guān)數(shù)據(jù)。越來越多地,運樣的數(shù)據(jù)W多種膽存機(jī)制和方 案存儲在多種數(shù)據(jù)源中,多種數(shù)據(jù)源包含在企業(yè)軟件系統(tǒng)內(nèi)部的數(shù)據(jù)源W及在企業(yè)軟件系 統(tǒng)外部的數(shù)據(jù)源。例如,企業(yè)軟件系統(tǒng)可W包含作為企業(yè)軟件系統(tǒng)的部分的一個或多個數(shù) 據(jù)庫。企業(yè)軟件系統(tǒng)也可W鏈接至在企業(yè)軟件系統(tǒng)外部的數(shù)據(jù)源,諸如外部網(wǎng)站、遠(yuǎn)程數(shù)據(jù) 庫等。

      【發(fā)明內(nèi)容】

      [0003] -般地,本公開的方面指向用于與自然語言查詢相關(guān)的數(shù)據(jù)的獲取和鏈接的技 術(shù)。企業(yè)軟件系統(tǒng)可W接收自然語言查詢并進(jìn)行語法分析(parse) W確定捜索條件集合。企 業(yè)商業(yè)智能系統(tǒng)可W基于數(shù)據(jù)集合的語義注釋確定與捜索條件集合最佳地匹配的多個數(shù) 據(jù)集合。數(shù)據(jù)集合可W具有各種數(shù)據(jù)格式,并且可W存儲在企業(yè)商業(yè)智能系統(tǒng)內(nèi)部W及在 其外部的各種數(shù)據(jù)源中。企業(yè)商業(yè)智能系統(tǒng)可W將多個數(shù)據(jù)集合組合成組合數(shù)據(jù)集合,該 組合數(shù)據(jù)集合可W被返回W提供對自然語言查詢的回答。
      [0004] 在一方面,本公開指向一種方法。該方法可W包括通過計算裝置接收自然語言查 詢。該方法還可W包括通過計算裝置并且基于自然語言查詢來確定捜索條件集合。該方法 還可W包括至少部分地基于在捜索條件集合與存儲在一個或多個存儲裝置中的多個數(shù)據(jù) 集合的屬性之間的匹配,通過計算裝置并且從多個數(shù)據(jù)集合中確定與自然語言查詢有關(guān)的 兩個或更多數(shù)據(jù)集合。該方法還可W包括通過計算裝置來聯(lián)合兩個或更多數(shù)據(jù)集合,包括 聯(lián)合兩個或更多數(shù)據(jù)集合的一個或多個行W及一個或多個列W產(chǎn)生聯(lián)合數(shù)據(jù)集合。該方法 還可W包括通過計算裝置輸出聯(lián)合數(shù)據(jù)集合的表示。
      [0005] 在另一方面,本公開指向一種計算機(jī)系統(tǒng)。該計算機(jī)系統(tǒng)可W包括一個或多個處 理器、一個或多個計算機(jī)可讀的存儲器、和一個或多個計算機(jī)可讀的有形存儲裝置。計算機(jī) 系統(tǒng)還可W包括在一個或多個存儲裝置的至少一個上存儲的程序指令,用于通過一個或多 個處理器中的至少一個經(jīng)由一個或多個存儲器中的至少一個執(zhí)行,W接收自然語言查詢。 該計算機(jī)系統(tǒng)還可W包括在一個或多個存儲裝置的至少一個上存儲的程序指令,用于通過 一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器中的至少一個執(zhí)行,W基于自然語 言查詢確定捜索條件集合。該計算機(jī)系統(tǒng)還可W包括在一個或多個存儲裝置的至少一個上 存儲的程序指令,用于通過一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器中的至 少一個執(zhí)行,W至少部分地基于在捜索條件集合與在一個或多個存儲裝置的至少一個中存 儲的多個數(shù)據(jù)集合的屬性之間的匹配,從多個數(shù)據(jù)集合中確定與該自然語言查詢相關(guān)的兩 個或更多數(shù)據(jù)集合。該計算機(jī)系統(tǒng)還可w包括在一個或多個存儲裝置的至少一個上存儲的 程序指令,用于通過一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器中的至少一個 執(zhí)行,聯(lián)合兩個或更多數(shù)據(jù)集合,包括聯(lián)合兩個或更多數(shù)據(jù)集合的一個或多個行W及一個 或多個列,W產(chǎn)生聯(lián)合數(shù)據(jù)集合。該計算機(jī)系統(tǒng)還可W包括在一個或多個存儲裝置的至少 一個上存儲的程序指令,用于通過一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器 中的至少一個執(zhí)行,W輸出該聯(lián)合數(shù)據(jù)集合的表示。
      [0006] 在另一方面,本公開設(shè)及一種計算機(jī)產(chǎn)品,包括在其中包含有程序代碼的計算機(jī) 可讀的存儲介質(zhì)。該程序代碼可W由計算裝置執(zhí)行,W接收自然語言查詢。該程序代碼還可 W由計算裝置執(zhí)行,W基于該自然語言查詢來確定捜索條件集合。該程序代碼還可W由計 算裝置執(zhí)行,W至少部分地基于在捜索條件集合與多個數(shù)據(jù)集合的屬性之間的匹配,從多 個數(shù)據(jù)集合中確定與自然語言查詢有關(guān)的兩個或更多數(shù)據(jù)集合。該程序代碼還可W由計算 裝置執(zhí)行,W聯(lián)合兩個或更多數(shù)據(jù)集合,包括聯(lián)合兩個或更多數(shù)據(jù)集合的一個或多個行W 及一個或多個列W產(chǎn)生聯(lián)合數(shù)據(jù)集合。該程序代碼還可W由計算裝置執(zhí)行,W輸出聯(lián)合數(shù) 據(jù)集合的表示。
      [0007] 在附圖和下面的描述中闡述了本公開的一個或多個方面的細(xì)節(jié)。根據(jù)該描述、附 圖和權(quán)利要求書,本公開的其他特征、目的和優(yōu)點將是顯而易見的。
      【附圖說明】
      [000引圖1是例示示例企業(yè)的方框圖,該示例企業(yè)具有其中用戶與企業(yè)商業(yè)智能系統(tǒng)進(jìn) 行交互的計算環(huán)境和可通過公共網(wǎng)路訪問的數(shù)據(jù)源。
      [0009] 圖2是進(jìn)一步詳細(xì)例示圖1示出的企業(yè)商業(yè)智能系統(tǒng)的一個實施例的部分的方框 圖。
      [0010] 圖3是例示商業(yè)智能系統(tǒng)中在用于返回與自然語言查詢有關(guān)的聯(lián)合數(shù)據(jù)集合的操 作背景下的數(shù)據(jù)分析器的整體架構(gòu)的示例的方框圖。
      [0011] 圖4A-4E是例示將兩個或更多數(shù)據(jù)集合聯(lián)合為聯(lián)合數(shù)據(jù)集合的示例的方框圖。
      [0012] 圖5是例示由聯(lián)合模塊使用的示例元數(shù)據(jù)模型的方框圖。
      [OOK]圖6A和她例示聯(lián)合數(shù)據(jù)集合的示例可視化。
      [0014] 圖7是例示在一個或多個計算裝置上執(zhí)行的數(shù)據(jù)分析器可W進(jìn)行的示例處理的流 程圖。
      [0015] 圖8是根據(jù)說明性示例可W用于執(zhí)行數(shù)據(jù)分析器的計算裝置的方框圖。
      【具體實施方式】
      [0016] -般地,本公開的方面指向由企業(yè)軟件系統(tǒng)對與查詢有關(guān)的數(shù)據(jù)進(jìn)行獲取和鏈接 的技術(shù)。考慮到企業(yè)軟件系統(tǒng)所管理的數(shù)據(jù)的多種多樣性,對于企業(yè)軟件系統(tǒng)而言有效地 確定其管理的數(shù)據(jù)中哪些與所接收到的查詢有關(guān)W及如何將來自于完全不同的數(shù)據(jù)集合 的相關(guān)數(shù)據(jù)組合成可W由企業(yè)軟件系統(tǒng)提供W回答查詢的聯(lián)合數(shù)據(jù)集合可能是一種挑戰(zhàn)。
      [0017] 為了有可能更好地確定與給定的查詢有關(guān)的數(shù)據(jù),企業(yè)軟件系統(tǒng)可W將其管理的 數(shù)據(jù)集合編目錄和編索引,包括為每個數(shù)據(jù)集合進(jìn)行語義注釋。響應(yīng)于接收到查詢,企業(yè)軟 件系統(tǒng)可W對該查詢進(jìn)行語法分析W確定在該查詢中包括的捜索條件集合,并且可W進(jìn)行 在捜索條件集合和數(shù)據(jù)集合語義注釋之間的匹配w確定與查詢最相關(guān)的一個或多個數(shù)據(jù) 集合。如果相關(guān)數(shù)據(jù)集合的組合可W比僅單獨的數(shù)據(jù)集合更好地覆蓋查詢的捜索條件,貝U 企業(yè)軟件系統(tǒng)可W基于各種啟發(fā)式規(guī)則來確定如何可W將多個數(shù)據(jù)集合合并為聯(lián)合數(shù)據(jù) 集合。W運種方式,企業(yè)軟件系統(tǒng)可W有可能呈現(xiàn)單個聯(lián)合數(shù)據(jù)集合作為對該查詢的響應(yīng), 而無需對數(shù)據(jù)集合的外延先驗建模(extensive prior modeling)。
      [0018] 圖1例示其中可W使用本公開的系統(tǒng)的示例性背景。圖1是例示具有計算環(huán)境10的 示例性企業(yè)4的方框圖,在該計算環(huán)境10中,多個用戶12A-12N(統(tǒng)稱"用戶12")可W與企業(yè) 商業(yè)智能(BI)系統(tǒng)14交互。在圖1示出的系統(tǒng)中,企業(yè)商業(yè)智能系統(tǒng)14通過企業(yè)網(wǎng)絡(luò)18通信 禪合至多個客戶端計算裝置16A-16N(統(tǒng)稱"客戶端計算裝置16"或"計算裝置16")。用戶12 與其各自的計算裝置交互W訪問企業(yè)商業(yè)智能系統(tǒng)14。用戶12、計算裝置16A-16N、企業(yè)網(wǎng) 絡(luò)18和企業(yè)商業(yè)智能系統(tǒng)14在不同的示例中可W全部位于單一的設(shè)施內(nèi)或者可W廣泛分 布在世界上任何地方的兩個或更多位置。
      [0019] 出于示例的目的,本公開的技術(shù)的各種示例可W容易地應(yīng)用于各種軟件系統(tǒng),包 括企業(yè)商業(yè)智能系統(tǒng)或其他大型企業(yè)軟件系統(tǒng)。企業(yè)軟件系統(tǒng)的示例包括企業(yè)財務(wù)或預(yù)算 規(guī)劃系統(tǒng)、訂單管理系統(tǒng)、庫存管理系統(tǒng)、銷售人員管理系統(tǒng)、商業(yè)智能工具、企業(yè)報告工 具、工程和資源管理系統(tǒng)、和其他企業(yè)軟件系統(tǒng)。
      [0020] 在該示例中,企業(yè)BI系統(tǒng)14包括運行BI儀表盤(das化oard)網(wǎng)絡(luò)應(yīng)用的服務(wù)器,并 且可W提供商業(yè)分析軟件。用戶12可W使用在客戶端計算裝置16上的BI 口戶W便經(jīng)由其各 自的計算裝置16來瀏覽和操縱諸如商業(yè)智能報告(B巧良告)和數(shù)據(jù)的其他集合和可視化之 類的信息。運可W包括來自各種各樣來源中的任意的、包括來自在企業(yè)4內(nèi)的多維數(shù)據(jù)結(jié)構(gòu) 和關(guān)系數(shù)據(jù)庫的數(shù)據(jù)W及來自可W通過公共網(wǎng)絡(luò)15訪問的多種外部源的數(shù)據(jù)。
      [0021] 用戶12可W使用多種不同類型的計算裝置16W便與企業(yè)商業(yè)智能系統(tǒng)14交互,并 且經(jīng)由企業(yè)網(wǎng)絡(luò)18來訪問數(shù)據(jù)可視化工具和其他資源。例如,企業(yè)用戶12可W使用可W運 行網(wǎng)絡(luò)瀏覽器的膝上型計算機(jī)、桌面型計算機(jī)等與企業(yè)商業(yè)智能系統(tǒng)14交互并且運行商業(yè) 智能(BI) 口戶(例如商業(yè)智能儀表盤等)??商鎿Q地,企業(yè)用戶可W使用在網(wǎng)絡(luò)瀏覽器中或 者在專用移動應(yīng)用中運行商業(yè)智能儀表盤的智能電話、平板計算機(jī)或者相似的裝置用于與 企業(yè)商業(yè)智能系統(tǒng)14交互。
      [0022] 企業(yè)網(wǎng)絡(luò)18和公共網(wǎng)絡(luò)15可W代表任何通信網(wǎng)絡(luò),并且可W包括諸如私有企業(yè)內(nèi) 聯(lián)網(wǎng)或像因特網(wǎng)之類的公共網(wǎng)絡(luò)的基于分組的數(shù)字網(wǎng)絡(luò)。W運種方式,計算環(huán)境10可W容 易地縮放(scale) W適應(yīng)大企業(yè)。企業(yè)用戶12可W經(jīng)由局域網(wǎng)直接訪問企業(yè)商業(yè)智能系統(tǒng) 14,或者經(jīng)由虛擬專用網(wǎng)絡(luò)、遠(yuǎn)程撥號、或相似的遠(yuǎn)程訪問通信機(jī)制來遠(yuǎn)程訪問企業(yè)商業(yè)智 能系統(tǒng)14。
      [0023] 根據(jù)本公開的方面,企業(yè)商業(yè)智能系統(tǒng)14可W接收自然語言查詢。商業(yè)智能系統(tǒng) 14可W基于自然語言查詢來確定捜索條件集合。商業(yè)智能系統(tǒng)14可W至少部分地基于在捜 索條件集合和多個數(shù)據(jù)集合的屬性之間的匹配,從在一個或多個存儲裝置中存儲的多個數(shù) 據(jù)集合中確定兩個或更多與該自然語言查詢相關(guān)的數(shù)據(jù)集合。商業(yè)智能系統(tǒng)14可W聯(lián)合兩 個或更多數(shù)據(jù)集合,運包括將兩個或更多數(shù)據(jù)集合的一個或多個行W及一個或多個列聯(lián)合 W產(chǎn)生聯(lián)合數(shù)據(jù)集合。商業(yè)智能系統(tǒng)14可W輸出聯(lián)合數(shù)據(jù)集合的表示。
      [0024] 圖2是更詳細(xì)地例示圖1示出的企業(yè)商業(yè)智能(BI)系統(tǒng)14的一個實施例的部分的 方框圖。在該示例實施中,單個客戶端計算裝置16A被示出用于描述的目的,并且其包括BI 口戶24W及一個或多個客戶端企業(yè)軟件應(yīng)用26,用戶可W通過該BI 口戶W及應(yīng)用26輸入對 于數(shù)據(jù)的自然語言查詢,并且用戶可W通過該BI口戶W及應(yīng)用26瀏覽由企業(yè)商業(yè)智能系統(tǒng) 14響應(yīng)于該自然語言查詢而返回的聯(lián)合數(shù)據(jù)集合。BI 口戶24可W呈現(xiàn)在一般網(wǎng)絡(luò)瀏覽器應(yīng) 用內(nèi)、在本地主管化ost)的應(yīng)用或移動應(yīng)用內(nèi)、或者其他用戶界面內(nèi)??蒞使用對于正在其 上產(chǎn)生BI 口戶的計算裝置本地的、和/或在一個或多個應(yīng)用服務(wù)器或其他遠(yuǎn)程資源中遠(yuǎn)程 主管的應(yīng)用軟件和數(shù)據(jù)的任意組合來產(chǎn)生或呈現(xiàn)BI 口戶24。
      [0025] 在一些示例中,BI 口戶24可W輸出聯(lián)合數(shù)據(jù)集合的數(shù)據(jù)可視化,用于用戶根據(jù)下 文中更詳細(xì)闡述的各種技術(shù)來瀏覽和操縱。BI 口戶24可W例如W用戶可操縱的圖表或圖形 的形式來呈現(xiàn)數(shù)據(jù)。BI 口戶24可W基于來自于例如可W利用企業(yè)商業(yè)智能系統(tǒng)14生成的諸 如W報告之類的源的、或另一 BI儀表盤的數(shù)據(jù)W及通過公共網(wǎng)絡(luò)15來源于外部資源的其他 類型的數(shù)據(jù),呈現(xiàn)數(shù)據(jù)的可視化。
      [0026] 圖2描繪企業(yè)商業(yè)智能系統(tǒng)14的附加細(xì)節(jié)W及可W如何經(jīng)由與BI 口戶24的交互來 訪問該企業(yè)商業(yè)智能系統(tǒng)14用于查詢商業(yè)智能系統(tǒng)14W及響應(yīng)于該查詢來描繪和提供商 業(yè)數(shù)據(jù)的可視化。BI 口戶24可W接收自然語言查詢,并且商業(yè)智能系統(tǒng)14可W從任意的各 種類型的數(shù)據(jù)源提供與該查詢有關(guān)的數(shù)據(jù)的指示,該數(shù)據(jù)源諸如BI報告、軟件應(yīng)用、數(shù)據(jù) 庫、電子表格、數(shù)據(jù)結(jié)構(gòu)、平面文件、可擴(kuò)展標(biāo)記語言("XML")數(shù)據(jù)、逗號分隔值(CSV)文件、 數(shù)據(jù)流、未組織的文本或數(shù)據(jù)、或者其他類型的文件或資源。
      [0027] 數(shù)據(jù)分析器23可W接收自然語言查詢,分析該自然語言查詢W便確定捜索條件集 合,并且可W基于在數(shù)據(jù)源中包括的數(shù)據(jù)集合的語義注釋來確定潛在地與該自然語言查詢 最相關(guān)的數(shù)據(jù)集合。在一些示例中,數(shù)據(jù)分析器23可W如在圖2中描繪的示例中那樣在企業(yè) 應(yīng)用25中被主管,或者可W被在其他地方被主管,包括在客戶端計算裝置16A上、或者分布 在企業(yè)商業(yè)智能系統(tǒng)14中的各種計算資源之間。數(shù)據(jù)分析器23可W被實施為或者采取的形 式為單獨的應(yīng)用、較大應(yīng)用的一部分或附加項(add-on)、應(yīng)用代碼庫、多個應(yīng)用和/或應(yīng)用 的部分的集合或者其他形式,并且可W由任何一個或多個服務(wù)器、客戶端計算裝置、處理器 或處理單元或者其他類型的計算裝置執(zhí)行。
      [0028] 如圖2所描繪的,按照Ξ層架構(gòu)來實施企業(yè)商業(yè)智能系統(tǒng)14:(1)一個或多個網(wǎng)路 服務(wù)器14A,其提供包括服務(wù)器側(cè)BI 口戶應(yīng)用21在內(nèi)的具有用戶界面功能的網(wǎng)絡(luò)應(yīng)用23; (2) -個或多個應(yīng)用服務(wù)器14B,其提供用于企業(yè)軟件應(yīng)用25和數(shù)據(jù)訪問裝置20的操作環(huán) 境;和(3)數(shù)據(jù)庫服務(wù)器14C,其提供一個或多個數(shù)據(jù)源38Α、38Β、···、38Ν("數(shù)據(jù)源38")。企業(yè) 軟件應(yīng)用25可W包括數(shù)據(jù)分析器25,作為企業(yè)軟件應(yīng)用25之一或者作為一個或多個企業(yè)軟 件應(yīng)用25的一部分或多個部分。數(shù)據(jù)源38可W包括二維數(shù)據(jù)庫和/或多維數(shù)據(jù)庫或數(shù)據(jù)立 方(data cube)。可W使用各種供應(yīng)商平臺實現(xiàn)數(shù)據(jù)源,并且數(shù)據(jù)源可W遍布企業(yè)而分布。 作為一個示例,數(shù)據(jù)源38可W是被配置用于在線分析處理(0LAP)的多維數(shù)據(jù)庫。作為另一 示例,數(shù)據(jù)源38可W是被配置W接收和執(zhí)行某個任意復(fù)雜度的多維表達(dá)式(MDX)查詢的多 維數(shù)據(jù)庫。多維數(shù)據(jù)結(jié)構(gòu)是"多維"在于每個多維數(shù)據(jù)元素由多個不同的對象類型定義,其 中每個對象與不同的維度相關(guān)聯(lián)。作為又一示例,數(shù)據(jù)源38可W是被配置W接收和執(zhí)行也 具有任意復(fù)雜度的S化查詢的二維關(guān)系數(shù)據(jù)庫。
      [0029] 數(shù)據(jù)源38可W包括結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)集合,其包括諸如商業(yè)信息之類的信 息。下面的數(shù)據(jù)集合1是包括與加拿大氣候歷史有關(guān)的信息的示例數(shù)據(jù)集合的樣本:
      [0030] 數(shù)據(jù)集合1
      [0031]
      [0032] 下面的數(shù)據(jù)集合2是包括與產(chǎn)品銷售有關(guān)的信息的示例數(shù)據(jù)集合的樣本: '
      [0033] 數(shù)據(jù)集合2
      [0034]
      [0035] 在客戶端計算裝置16A上的企業(yè)應(yīng)用26可W向企業(yè)商業(yè)智能系統(tǒng)14發(fā)出商業(yè)查詢 W建立報告。運些商業(yè)查詢可W是由計算裝置16A的用戶輸入的自然語言查詢。自然語言查 詢的一些示例可W包括"2003和2012年花在看電視上的時間"、"我們的客戶中有多少出現(xiàn) 在財富500強(qiáng)名單上"、"過去兩年里遠(yuǎn)東辦公區(qū)銷售的產(chǎn)品"和"溫度如何影響產(chǎn)品銷售"。 自然語言查詢也被稱作捜索短語。企業(yè)商業(yè)智能系統(tǒng)14包括數(shù)據(jù)分析器23,該數(shù)據(jù)分析器 分析該捜索短語并且從數(shù)據(jù)源38中確定用于最佳地回答查詢的最相關(guān)的數(shù)據(jù)集合。客戶端 計算裝置16A可W通過企業(yè)網(wǎng)絡(luò)18將捜索短語發(fā)送至數(shù)據(jù)分析器23。數(shù)據(jù)分析器23可W將 捜索短語分解為其元素。數(shù)據(jù)分析器23可W沿著詞邊界(word boundary)分解捜索短語。數(shù) 據(jù)分析器23也可W在需要時(as warranted)沿著詞組合來將捜索短語分解為捜索條件集 合,比如如果詞組合與數(shù)據(jù)源39中的數(shù)據(jù)集合的數(shù)據(jù)項名稱或具體值相匹配。數(shù)據(jù)分析器 23也可W進(jìn)行所分解的詞或詞組合的詞干提取。
      [0036] 數(shù)據(jù)分析器23可W至少部分地基于數(shù)據(jù)源39中的每個數(shù)據(jù)集合的數(shù)據(jù)項的語義 注釋,確定在數(shù)據(jù)源39中的與捜索短語相關(guān)的數(shù)據(jù)集合。在美國專利No. 13/844,612中描述 了商業(yè)智能系統(tǒng)14可W如何進(jìn)行數(shù)據(jù)源39中的數(shù)據(jù)集合的運種語義注釋的細(xì)節(jié),該專利通 過引用合并于此。數(shù)據(jù)分析器25可W進(jìn)行從捜索短語中所確定的條件集合與在數(shù)據(jù)源39中 的每個數(shù)據(jù)集合的數(shù)據(jù)項的語義注釋的匹配,W確定在數(shù)據(jù)源39中的每個數(shù)據(jù)集合的相關(guān) 度得分。數(shù)據(jù)分析器23可W至少部分地基于該相關(guān)度得分來對數(shù)據(jù)源39中的數(shù)據(jù)集合進(jìn)行 排序(rank),并且還可W確定數(shù)據(jù)集合的組合的覆蓋度得分W確定將多個數(shù)據(jù)集合組合是 否可W提供對該捜索短語的更為相關(guān)的答案。
      [0037] 如果數(shù)據(jù)分析器23確定在數(shù)據(jù)源39中的兩個或更多數(shù)據(jù)集合的組合與在數(shù)據(jù)源 39中的兩個或更多數(shù)據(jù)集合的其他組合相比較可W提供對捜索短語的最相關(guān)的答案,則數(shù) 據(jù)分析器23可W確定運兩個或更多數(shù)據(jù)集合是否可W聯(lián)合為聯(lián)合數(shù)據(jù)集合W及確定如何 聯(lián)合運兩個或更多數(shù)據(jù)集合。
      [0038] 數(shù)據(jù)分析器23可W使用數(shù)據(jù)訪問服務(wù)20W取回由數(shù)據(jù)分析器23確定的提供針對 捜索短語的最相關(guān)答案的兩個或更多數(shù)據(jù)集合,該數(shù)據(jù)訪問服務(wù)提供到數(shù)據(jù)源38的邏輯接 口。數(shù)據(jù)訪問服務(wù)20例如可W在企業(yè)軟件應(yīng)用25和在數(shù)據(jù)庫服務(wù)器14C中的下層數(shù)據(jù)源的 中間的應(yīng)用服務(wù)器上運行。數(shù)據(jù)訪問服務(wù)20根據(jù)查詢規(guī)范從下層數(shù)據(jù)源取回數(shù)據(jù)集合。
      [0039] 數(shù)據(jù)分析器23可W將所取回的兩個或更多數(shù)據(jù)集合聯(lián)合為聯(lián)合數(shù)據(jù)集合,并且可 W經(jīng)由BI 口戶應(yīng)用21輸出該聯(lián)合數(shù)據(jù)集合的表示,其中用戶可W在用客戶端計算裝置16A 經(jīng)由BI 口戶24瀏覽該表示。聯(lián)合數(shù)據(jù)集合的表示可W包括數(shù)據(jù)集合的可視化,比如聯(lián)合數(shù) 據(jù)集合的圖表、圖形等,作為示意性的示例,比如隨時間的產(chǎn)品收益趨勢或者比較在特定時 間段內(nèi)的產(chǎn)品收益的圖表。
      [0040] 圖3是例示在商業(yè)智能系統(tǒng)中用于返回與自然語言查詢相關(guān)的聯(lián)合數(shù)據(jù)集合的操 作背景中的數(shù)據(jù)分析器的整體架構(gòu)的方框圖。如圖3所示,數(shù)據(jù)源38可W包括數(shù)據(jù)庫42、數(shù) 據(jù)立方或多維數(shù)據(jù)結(jié)構(gòu)44、電子表格46、逗號分隔值(CSV)文件48、簡易信息聚合(RSS)饋送 50、W及其他的諸如網(wǎng)頁、文本文件、多媒體文件等的數(shù)據(jù)源52。數(shù)據(jù)源38可W存儲在諸如 在企業(yè)智能系統(tǒng)14中所包括的企業(yè)存儲系統(tǒng)之類的企業(yè)存儲系統(tǒng)中、W及諸如在外部網(wǎng)絡(luò) 服務(wù)器中存儲的網(wǎng)頁之類的在商業(yè)智能系統(tǒng)14之外的存儲系統(tǒng)中。
      [0041] 語義索引器22可W對數(shù)據(jù)源38中的數(shù)據(jù)集合進(jìn)行編索引和編目錄,W便對數(shù)據(jù)集 合的數(shù)據(jù)項進(jìn)行語義注釋并且將運樣的語義注釋作為數(shù)據(jù)集合的屬性存儲在語義索引62 中。語義索引器22可W沿著詞匯線索(lexical clues)、語義注釋和統(tǒng)計學(xué)上重要的樣本值 和數(shù)據(jù)對數(shù)據(jù)集合進(jìn)行編目錄,并且可W將運樣的語義元數(shù)據(jù)、詞匯線索、樣本值和數(shù)值統(tǒng) 計作為數(shù)據(jù)源38中的數(shù)據(jù)集合的屬性存儲在語義索引62中。對于每個數(shù)據(jù)集合,語義索引 器22可W將各種項目標(biāo)題化eading)W其原始形式W及W令牌化形式存儲至語義索引62 中,運可W用于通過名稱來查找數(shù)據(jù)集合。對于每個數(shù)據(jù)項,語義索引器22可W將樣本值、 統(tǒng)計值(例如最小/最大值)、唯一值的集合、和值的總數(shù)量收集至語義索引62中。對于每個 數(shù)據(jù)集合,語義索引器22還可W進(jìn)行語義分析,W便捕獲上位概念W及解釋數(shù)據(jù)集合是關(guān) 于何的商業(yè)概念。例如,對于數(shù)據(jù)集合1和數(shù)據(jù)集合2,語義分析可W識別諸如年和月之類的 時間概念、諸如城市之類的地理概念、諸如收益之類的貨幣度量、和諸如對于降水量的英寸 W及對于平均溫度的華氏溫度之類的測量單位并且將其捕獲至語義索引62中。
      [0042] 數(shù)據(jù)分析器23可W經(jīng)由商業(yè)智能口戶24接收自然語言查詢。例如,用戶可W經(jīng)由 網(wǎng)絡(luò)瀏覽器訪問商業(yè)智能口戶24,并且可W向由商業(yè)智能口戶24呈現(xiàn)的網(wǎng)頁的文本輸入框 中輸入自然語言查詢。自然語言查詢的示例可W是"溫度如何影響產(chǎn)品銷售"或者"過去兩 年里遠(yuǎn)東辦公區(qū)銷售的產(chǎn)品"。
      [0043] 查詢分析器64可W對自然語言查詢進(jìn)行語法分析,W確定捜索條件集合并且確定 總體希望的分析的估計。對自然語言查詢的語法分析可W包括沿著詞邊界或者詞組合將自 然語言查詢分解為元素。在"溫度如何影響產(chǎn)品銷售化OW does temperature impact product sales)"的自然語言查詢的示例中,查詢分析器64可W將該查詢分解成{溫度,如 何,影響,產(chǎn)品,銷售}(化 OW, does, temperature, impact, product, sales})的捜索條件集 合,并且可W確定銷售值與溫度的相關(guān)性的總體希望的分析。在"過去兩年里遠(yuǎn)東辦公區(qū)銷 售的產(chǎn)品(products sold by 化!· Blast office in last two years)"的自然語言查詢的 示例中,查詢分析器可W將該查詢分解成{過去,兩年,里,遠(yuǎn)東,辦公區(qū),銷售,產(chǎn)品} ({products, sell, by, 'Far East',off ice, in, last, two, years})的捜索條件集合,并且可 W確定遠(yuǎn)東辦公區(qū)銷售的產(chǎn)品與過去兩年的時間段的相關(guān)性的總體希望的分析。
      [0044] 匹配模塊66可W確定在從自然語言查詢得到的捜索條件集合和在數(shù)據(jù)源38中的 數(shù)據(jù)集合的語義索引62中所存儲的屬性之間的匹配。捜索條件集合和數(shù)據(jù)集合屬性之間的 匹配可W包括W下的一個或多個:文字匹配、值匹配、語義匹配或者部分名稱匹配。文字匹 配可W是在捜索條件之一與諸如特定行、列、標(biāo)題等的特定標(biāo)簽之間的文字匹配。例如,捜 索條件"年"可W與"年(YEAR)"數(shù)據(jù)列文字匹配。值匹配可W是在捜索條件之一與包括數(shù)據(jù) 項的特定值的數(shù)據(jù)項集合之間的匹配。例如,"遠(yuǎn)泉'捜索條件可W與包括"遠(yuǎn)泉'數(shù)據(jù)項值 的數(shù)據(jù)項集合"銷售區(qū)域"具有值匹配。語義匹配可W是捜索條件之一與概念上相關(guān)的數(shù)據(jù) 項集合之間的匹配。例如,"客戶端"捜索條件可W與"CUST0MER_ID"("消費者_(dá)ID")或 "CUST0MER_NAME" Γ消費者_(dá)名稱")數(shù)據(jù)項具有語義匹配。部分名稱匹配可W是捜索條件之 一與數(shù)據(jù)項集合的名稱之間的部分匹配。例如,"TV"捜索條件可W與具有"電視和電影(非 宗教r或者"電視(宗教r標(biāo)題的數(shù)據(jù)項具有部分名稱匹配。
      [0045] 匹配模塊66可W將強(qiáng)度的指示與每個匹配相關(guān)聯(lián)。強(qiáng)度的指示可W從文字匹配到 值匹配到語義匹配到部分名稱匹配在強(qiáng)度上降低,使得文字匹配可W與比值匹配相對更高 的強(qiáng)度指示相關(guān)聯(lián),等等。匹配模塊66可W至少部分基于與各個匹配相關(guān)聯(lián)的匹配強(qiáng)度指 示來對匹配進(jìn)行排序。例如,一個數(shù)據(jù)集合可W包括經(jīng)由文字匹配、值匹配、語義匹配和/或 部分名稱匹配中的一個或多個而與捜索條件相匹配的一組或多組數(shù)據(jù)項目??蒞根據(jù)與匹 配相關(guān)聯(lián)的強(qiáng)度指示來對每個匹配進(jìn)行加權(quán),使得文字匹配可W比值匹配等具有更大的權(quán) 重。
      [0046] 匹配模塊66可W至少部分地基于在捜索條件集合與數(shù)據(jù)集合屬性之間的加權(quán)的 各個匹配的綜合來確定對于每個數(shù)據(jù)集合的總體相關(guān)性,并且可W至少部分基于每個數(shù)據(jù) 集合的總體相關(guān)性來對數(shù)據(jù)源38中的數(shù)據(jù)集合進(jìn)行排序。W運種方式,匹配模塊66可W基 于排序確定哪些數(shù)據(jù)集合相對而言與捜索條件集合更為相關(guān)。
      [0047] 匹配模塊66可W確定數(shù)據(jù)源38中的數(shù)據(jù)集合的覆蓋度得分。數(shù)據(jù)集合的覆蓋度得 分可W被確定為聯(lián)系于(bound to)與數(shù)據(jù)集合相關(guān)聯(lián)的一個或多個屬性的自然語言查詢 的百分比。匹配模塊66也可W確定對于兩個或更多數(shù)據(jù)集合的一個或多個組合中的每一個 組合的覆蓋度得分,W確定兩個或更多數(shù)據(jù)集合的組合是否可W得到比任何單個數(shù)據(jù)集合 更高的覆蓋度得分。例如,考慮自然語言查詢"溫度如何影響產(chǎn)品銷售",數(shù)據(jù)集合1可能能 夠覆蓋捜索條件"溫度",而數(shù)據(jù)集合2可能能夠覆蓋捜索條件"產(chǎn)品銷售"。通過組合數(shù)據(jù)集 合1和數(shù)據(jù)集合2,該數(shù)據(jù)集合的組合可能能夠覆蓋"溫度"和"產(chǎn)品銷售"兩者,由此得到比 數(shù)據(jù)集合1或2自身更高的覆蓋度得分。
      [0048] 運樣,聯(lián)合模塊68可W至少部分地基于對于兩個或更多數(shù)據(jù)集合的一個或多個組 合中的一個組合確定的覆蓋度得分,將兩個或更多數(shù)據(jù)集合的一個或多個組合中的該一個 組合確定為用于聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集合。在圖3的示例中,聯(lián)合模塊68 可W至少部分基于由匹配模塊66對于數(shù)據(jù)集合1和2的組合確定的覆蓋度得分來確定數(shù)據(jù) 集合1和數(shù)據(jù)集合2的組合作為兩個或更多用于聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集 厶 1=1 ο
      [0049] 如果聯(lián)合模塊6如角定出聯(lián)合兩個或更多數(shù)據(jù)集合的組合可W提供相對較高的覆 蓋度得分,則聯(lián)合模塊68可W確定運兩個或更多數(shù)據(jù)集合是否可W被聯(lián)合在一起W及如何 聯(lián)合運兩個或更多數(shù)據(jù)集合。聯(lián)合模塊68可W基于試探規(guī)則集合進(jìn)行操作W確定用于聯(lián)合 兩個或更多數(shù)據(jù)集合的聯(lián)合路徑,并且可W建立即刻發(fā)生的(on the fly)查詢W從構(gòu)成該 聯(lián)合數(shù)據(jù)集合的數(shù)據(jù)源38取回數(shù)據(jù)項的集合。
      [0050] 在兩個或更多數(shù)據(jù)集合之間的聯(lián)合路徑可W是可W被聯(lián)合在一起W便形成聯(lián)合 數(shù)據(jù)項集合的數(shù)據(jù)組的數(shù)據(jù)項集合。例如,來自兩個或更多數(shù)據(jù)集合的每一個中的各行的 數(shù)據(jù)項可W被聯(lián)合在一起,或者來自兩個或更多數(shù)據(jù)集合的每一個中的各列的數(shù)據(jù)項可W 被聯(lián)合在一起。運樣,聯(lián)合兩個或更多數(shù)據(jù)集合可W包括至少部分地基于所確定的用于產(chǎn) 生聯(lián)合數(shù)據(jù)路徑的聯(lián)合路徑,來聯(lián)合兩個或更多數(shù)據(jù)集合的一個或多個行和一個或多個 列。
      [0051] 聯(lián)合模塊68可W確定在兩個或更多數(shù)據(jù)集合中包括匹配的數(shù)據(jù)項的兩個或更多 數(shù)據(jù)集合之間的聯(lián)合路徑。例如,來自第一數(shù)據(jù)集合的年列可W與來自第二數(shù)據(jù)集合的年 列聯(lián)合,W產(chǎn)生聯(lián)合的年列。
      [0052] 聯(lián)合模塊68也可W確定在兩個或更多數(shù)據(jù)集合中包括值重疊的兩個或更多數(shù)據(jù) 集合之間的聯(lián)合路徑。在將來自第一數(shù)據(jù)集合的年列與來自第二數(shù)據(jù)集合的年列聯(lián)合的示 例中,當(dāng)且僅當(dāng)在相應(yīng)的年列之間存在值重疊時,聯(lián)合模塊68可W聯(lián)合相應(yīng)的年列。例如, 如果第一數(shù)據(jù)集合的年列的范圍為從2005至2008,并且如果第二數(shù)據(jù)集合的年列的范圍為 從2007至2013,則聯(lián)合模塊68能夠聯(lián)合運些年列。相反,如果相應(yīng)的年列的值并不重疊,比 如如果第一數(shù)據(jù)集合的年列的范圍為從2005到2008,并且第二數(shù)據(jù)集合的年列的范圍為從 2009到2013,則聯(lián)合模塊68可W確定不聯(lián)合來自第一數(shù)據(jù)集合的年列與來自第二數(shù)據(jù)集合 的年列。
      [0053] 由于很少希望聯(lián)合諸如收益、數(shù)量或溫度之類的度量項,所W聯(lián)合模塊68可W將 度量項排除而不被包括在聯(lián)合路徑中。
      [0054] 聯(lián)合模塊68也可W至少部分地基于概念特定規(guī)則確定在兩個或更多數(shù)據(jù)集合之 間的數(shù)據(jù)項的一個或多個聯(lián)合路徑,該概念特定規(guī)則可W是取決于從數(shù)據(jù)項中檢測到的具 體概念而特定的規(guī)則。例如,具有諸如日期之類的時間概念的數(shù)據(jù)項在沒有其他也被包括 在聯(lián)合路徑中的數(shù)據(jù)項的情況下可能其自身并不是良好的聯(lián)合路徑候選者,原因在于,由 于任何具有日期的數(shù)據(jù)集合都可能潛在地被聯(lián)合在一起,其可能導(dǎo)致誤判(false positive)。但是,如果日期屬性是數(shù)據(jù)集合的唯一關(guān)鍵字化ey),則數(shù)據(jù)集合很可能是過渡 的(transitional)數(shù)據(jù)集合,并且在此情況下日期數(shù)據(jù)可能是良好的聯(lián)合路徑候選者。
      [0055] 圖4A-4E是例示將兩個或更多數(shù)據(jù)集合聯(lián)合為聯(lián)合數(shù)據(jù)集合的示例的方框圖。如 圖4A所示,考慮示例性數(shù)據(jù)集合70和72,其每一個包括兩行兩列,聯(lián)合模塊68可W確定在包 括一個或多個匹配行的數(shù)據(jù)集合70和72之間的聯(lián)合路徑。在圖4A的示例中,通過確定可W 被聯(lián)合在一起成為匹配行71的在數(shù)據(jù)集合70和72中的行,聯(lián)合模塊68可W聯(lián)合數(shù)據(jù)集合70 和72。在圖1的示例中,匹配行71可W是被包括在聯(lián)合數(shù)據(jù)集合中的數(shù)據(jù)集合70和72的僅一 行。如圖4B中所示,在一些示例中,除了匹配行71之外,數(shù)據(jù)集合70或數(shù)據(jù)集合72的行可W 被包括在從將數(shù)據(jù)集合70和72進(jìn)行聯(lián)合所得到的聯(lián)合數(shù)據(jù)集合中。例如,從將數(shù)據(jù)集合70 和72進(jìn)行聯(lián)合所得到的聯(lián)合數(shù)據(jù)集合可W包括匹配行7lW及來自數(shù)據(jù)集合70的行73。如圖 4C所示,在另一示例中,從將數(shù)據(jù)集合70和72進(jìn)行聯(lián)合所得到的聯(lián)合數(shù)據(jù)集合可W包括匹 配行71W及來自數(shù)據(jù)集合72的行75。如圖4D所示,在另一示例中,從將數(shù)據(jù)集合70和72進(jìn)行 聯(lián)合所得到的聯(lián)合數(shù)據(jù)集合可W包括匹配行71W及來自于數(shù)據(jù)集合70的行73和來自于數(shù) 據(jù)集合72的行75。
      [0056] 如圖4E中所示,聯(lián)合模塊68也可W確定在包括一個或多個匹配列的數(shù)據(jù)集合之間 的聯(lián)合路徑。列74可W表示數(shù)據(jù)集合1的列,并且列76可W表示數(shù)據(jù)集合2的列。列74可W包 括年列78、月列80、城市列82和平均溫度列84,而列76可W包括產(chǎn)品類型列86、年列88、月列 90和城市列92。聯(lián)合模塊68可W聯(lián)合年列78與年列88、月列80與月列90、W及城市列82與城 市列92。
      [0057] 在聯(lián)合路徑中參與的項并不是必須是聯(lián)系于自然語言查詢的相同的項。例如,盡 管自然語言查詢"溫度如何影響產(chǎn)品銷售"并未提到年、月或城市,但是聯(lián)合模塊86仍可W 將年列78和88、月列80和90、W及城市列82和92包括到用于數(shù)據(jù)集合1和數(shù)據(jù)集合2的聯(lián)合 路徑中。
      [0058] 聯(lián)合模塊68可W確定在兩個或更多數(shù)據(jù)集合的屬性之間的一個或多個候選聯(lián)合 路徑,并且在一些示例中可W將一個或多個候選聯(lián)合路徑呈現(xiàn)給用戶用于對在兩個或更多 數(shù)據(jù)集合之間的一個或多個聯(lián)合路徑的用戶確認(rèn)。聯(lián)合模塊68可W接收調(diào)整一個或多個候 選聯(lián)合路徑的用戶輸入,并且可W至少部分地基于該用戶輸入來調(diào)整一個或多個候選聯(lián)合 路徑W便確定在兩個或更多數(shù)據(jù)集合之間的一個或多個聯(lián)合路徑。
      [0059] 在確定數(shù)據(jù)集合之間的聯(lián)合路徑W及產(chǎn)生聯(lián)合數(shù)據(jù)集合時,聯(lián)合模塊68可W確定 如何最佳地在數(shù)據(jù)集合之間正確合并和聚合。下面兩個示例的數(shù)據(jù)集合可W是聯(lián)合模塊68 正試圖將其聯(lián)合為聯(lián)合數(shù)據(jù)集合的數(shù)據(jù)集合:
      [0060] 產(chǎn)品銷售數(shù)據(jù)集合
      [0061]
      [0062]
      [0063]產(chǎn)品銷售預(yù)期數(shù)據(jù)集合
      [0064]
      [0066] 如上所示,在收益值在產(chǎn)品銷售數(shù)據(jù)集合中沿著各個項目重復(fù)的同時,預(yù)期值在 產(chǎn)品銷售數(shù)據(jù)集合中沿著品種重復(fù)。如果聯(lián)合模塊68通過將每個數(shù)據(jù)集合的"行業(yè)"和"品 種"列匹配來將產(chǎn)品銷售數(shù)據(jù)集合與產(chǎn)品銷售預(yù)期數(shù)據(jù)集合聯(lián)合,則對于在產(chǎn)品銷售預(yù)期 數(shù)據(jù)集合中的"行業(yè)"和"品種"列的每一個唯一組合,在產(chǎn)品銷售數(shù)據(jù)集合中存在多個相應(yīng) 的行。運樣,聯(lián)合模塊68可W至少部分地基于用于產(chǎn)品銷售數(shù)據(jù)集合和產(chǎn)品銷售預(yù)期數(shù)據(jù) 集合的元數(shù)據(jù)模型來確定對于每個產(chǎn)品項目顯示哪些預(yù)期值。
      [0067] 圖5是例示由聯(lián)合模塊68使用的示例性元數(shù)據(jù)模型的方框圖。如圖5所示,元數(shù)據(jù) 模型94可W是產(chǎn)品銷售數(shù)據(jù)集合的元數(shù)據(jù)模型,并且元數(shù)據(jù)模型96可W是產(chǎn)品銷售預(yù)期數(shù) 據(jù)集合的元數(shù)據(jù)模型。語義索引器22可W構(gòu)造元數(shù)據(jù)模型94和96,并且可W在語義索引62 中存儲元數(shù)據(jù)模型94和96。。1(16]11:1門61'^]16((3標(biāo)識符行業(yè))98、(31(16]11:1門6;1"1161]1山標(biāo)識 符項目)104、cldentifier Brand(c 標(biāo)識符品種)106、cldentifie;r Line 108、和 cldentifier Brand 114 可 W 是數(shù)據(jù)項,并且 cP;roduct(c 產(chǎn)品)100、cP;roduct 101、 cP;roductl02、cP;roduct 110和cProduct 112可W是與前述數(shù)據(jù)項目相關(guān)聯(lián)的產(chǎn)品類別。連 接cProduct lOCKcProduct lOUcProduct 102、cP;roduct 110和cProduct 112的帶箭頭的 線可W指示數(shù)據(jù)層級,該數(shù)據(jù)層級是一對多的關(guān)聯(lián)。聯(lián)合模塊68可W基于元數(shù)據(jù)模型94和 96來確定產(chǎn)品銷售數(shù)據(jù)集合包含行業(yè)-〉品種-〉項目的Ξ級深的層級,而產(chǎn)品銷售預(yù)期數(shù)據(jù) 集合包含行業(yè)-〉品種的兩層深的層級。聯(lián)合模塊68因此可W確定在聯(lián)合數(shù)據(jù)集合中對于在 單個品種下的每個項目重復(fù)預(yù)期值。
      [0068] 響應(yīng)于確定聯(lián)合數(shù)據(jù)集合,聯(lián)合模塊68可W比如經(jīng)由數(shù)據(jù)訪問服務(wù)20查詢數(shù)據(jù)源 38W取回包含該聯(lián)合數(shù)據(jù)集合的數(shù)據(jù)項。查詢可W指定從數(shù)據(jù)源38返回哪些數(shù)據(jù)集合的哪 些數(shù)據(jù)項,包括指定從數(shù)據(jù)源38返回的指定數(shù)據(jù)項的范圍。查詢還可W指定從數(shù)據(jù)源38返 回的數(shù)據(jù)項如何被合并和/或布置。數(shù)據(jù)分析器23可W經(jīng)由商業(yè)智能口戶24輸出該聯(lián)合數(shù) 據(jù)集合的表示,使得客戶端計算裝置16A可W訪問并且瀏覽該聯(lián)合數(shù)據(jù)集合的表示。通過商 業(yè)智能口戶24輸出的聯(lián)合數(shù)據(jù)集合的表示可W是聯(lián)合數(shù)據(jù)集合的邏輯合并的視圖,比如聯(lián) 合數(shù)據(jù)集合的行和列的電子表格??商鎿Q地,聯(lián)合數(shù)據(jù)集合的表示可W包括在聯(lián)合數(shù)據(jù)集 合中包含的數(shù)據(jù)的可視化。
      [0069] 圖6A和6B例示聯(lián)合數(shù)據(jù)集合的示例可視化。如圖6A中所示,商業(yè)智能口戶24可W 輸出圖形116,圖形116可W是聯(lián)合數(shù)據(jù)集合的圖形,該聯(lián)合數(shù)據(jù)集合是用于回答自然語言 查詢"溫度如何影響產(chǎn)品銷售"的數(shù)據(jù)集合1和數(shù)據(jù)集合2的組合。如圖6B中所示,商業(yè)智能 口戶24可W輸出圖形118,圖形118是聯(lián)合數(shù)據(jù)集合的圖形,該聯(lián)合數(shù)據(jù)結(jié)合是產(chǎn)品銷售數(shù) 據(jù)集合和銷售預(yù)期數(shù)據(jù)集合的組合。
      [0070] 圖7是例示在一個或多個計算裝置(例如服務(wù)器、計算機(jī)、處理器等)上執(zhí)行的數(shù)據(jù) 分析器23可W進(jìn)行的示例處理700的流程圖。數(shù)據(jù)分析器23可W接收自然語言查詢(702)。 數(shù)據(jù)分析器23可W基于該自然語言查詢確定捜索條件結(jié)合(704)。數(shù)據(jù)分析器23可W至少 部分地基于在捜索條件集合和在一個或多個存儲裝置中存儲的多個數(shù)據(jù)集合的屬性之間 的匹配,從在多個數(shù)據(jù)集合中確定與該自然語言查詢相關(guān)的兩個或更多數(shù)據(jù)集合(706)。數(shù) 據(jù)分析器23可W聯(lián)合運兩個或更多數(shù)據(jù)集合,包括聯(lián)合運兩個或更多數(shù)據(jù)集合的一個或多 個行W及一個或多個列W產(chǎn)生聯(lián)合數(shù)據(jù)集合(708)。數(shù)據(jù)分析器23可W輸出聯(lián)合數(shù)據(jù)集合 的表示(710)。
      [0071] 在一些示例中,在捜索條件集合和多個數(shù)據(jù)集合的屬性之間的匹配包括W下的一 個或多個:文字匹配、值匹配、語義匹配和部分名稱匹配,并且其中多個數(shù)據(jù)集合的屬性包 括W下的一個或多個:語義元數(shù)據(jù)、詞匯線索、樣本值和數(shù)字統(tǒng)計。在一些示例中,數(shù)據(jù)分析 器23可W將匹配強(qiáng)度d指示與每個匹配相關(guān)聯(lián),并且可W基于與相應(yīng)的匹配相關(guān)聯(lián)的匹配 強(qiáng)度的指示來對匹配排序。
      [0072] 在一些示例中,數(shù)據(jù)分析器23可W至少部分地基于匹配的排序來確定多個數(shù)據(jù)集 合中的兩個或更多數(shù)據(jù)集合的一個或多個組合中的每一個組合的覆蓋度得分,并且可W至 少部分地基于對于兩個或更多數(shù)據(jù)集合的一個或多個組合中的一個組合所確定的覆蓋度 得分來將該兩個或更多數(shù)據(jù)集合的一個或多個組合中的該一個組合確定為要被聯(lián)合為聯(lián) 合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集合。在一些示例中,將兩個或更多數(shù)據(jù)集合的一個或多個 組合中的一個組合確定為要聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集合可W包括確定在 運兩個或更多數(shù)據(jù)集合之間的數(shù)據(jù)項的一個或多個聯(lián)合路徑。在一些示例中,數(shù)據(jù)分析器 23可W聯(lián)合兩個或更多數(shù)據(jù)集合,包括聯(lián)合運兩個或更多數(shù)據(jù)集合的一個或多個行W及一 個或多個列W產(chǎn)生聯(lián)合數(shù)據(jù)集合還包括至少部分地基于一個或多個聯(lián)合路徑來聯(lián)合兩個 或更多數(shù)據(jù)集合。
      [0073] 在一些示例中,一個或多個聯(lián)合路徑可W包括在兩個或更多數(shù)據(jù)集合中的值重 疊。在一些示例中,一個或多個聯(lián)合路徑可W包括在兩個或更多數(shù)據(jù)集合中的匹配的數(shù)據(jù) 項。在一些示例中,確定在兩個或更多數(shù)據(jù)集合之間的數(shù)據(jù)項的一個或多個聯(lián)合路徑至少 部分地基于概念特定規(guī)則。在一些示例中,確定在兩個或更多數(shù)據(jù)集合之間的數(shù)據(jù)項的一 個或多個聯(lián)合路徑可W包含從一個或多個聯(lián)合路徑中排除度量數(shù)據(jù)項。在一些示例中,確 定在兩個或更多數(shù)據(jù)集合的數(shù)據(jù)項的一個或多個聯(lián)合路徑可W包括至少部分地基于用戶 輸入來調(diào)整一個或多個聯(lián)合路徑。
      [0074] 圖8是根據(jù)示意性示例可W用于執(zhí)行數(shù)據(jù)分析器23的計算裝置800的方框圖。計算 裝置800可W是如上文參考圖2所述的服務(wù)器,包括網(wǎng)絡(luò)服務(wù)器14A、應(yīng)用服務(wù)器14B和數(shù)據(jù) 庫服務(wù)器14C中的一個或多個。計算裝置800也可W是用于在各種示例中提供數(shù)據(jù)分析器23 的任何服務(wù)器,包括可W從任意數(shù)量的計算裝置運行或并入任意數(shù)量的計算裝置的虛擬服 務(wù)器。計算裝置可W作為真實或虛擬服務(wù)器的全部或者部分而操作,并且可W是或者可W 并入工作站、服務(wù)器、大型計算機(jī)、筆記型或膝上型計算機(jī)、桌上型計算機(jī)、平板、智能電話、 功能電話或者任何類型的其他可編程數(shù)據(jù)處理設(shè)備。計算裝置800的其他實現(xiàn)方式可W包 括具有除了或超出在此所述的那些的性能或格式的計算機(jī)。
      [0075] 在圖8的示意性示例中,計算裝置800包含通信構(gòu)造882,其提供在處理器單元884、 存儲器886、持久性數(shù)據(jù)存儲裝置888、通信單元890和輸入/輸出(I/O)單元892之間的通信。 通信構(gòu)造882可W包括專用系統(tǒng)總線、通用系統(tǒng)總線、W層次形式布置的多個總線、任何其 他類型的總線、總線網(wǎng)絡(luò)、交換構(gòu)造或者其他互連技術(shù)。通信構(gòu)造882支持在計算裝置800的 各種子系統(tǒng)之間傳送數(shù)據(jù)、命令和其他信息。
      [0076] 處理器單元884可W是可編程中央處理單元(CPU),其被配置用于執(zhí)行在存儲器 886中存儲的編程的指令。在另一示意性示例中,可W使用一個或多個異構(gòu)處理器系統(tǒng)實現(xiàn) 處理器單元884,在該異構(gòu)處理器系統(tǒng)中存在主處理器,次級處理器在單個忍片上。在另一 示意性示例中,處理器單元884可W是對稱多處理器系統(tǒng),其包含多個相同類型的處理器。 處理器單元884可W是諸如IBM⑥公司的PowerPC⑧處理器之類的精簡指令集計算 (RISC)微處理器、諸如I址el⑧公司的Pentium?處理器之類的χ86兼容處理器、Advanced Micro Devices愈公司的A化Icm愈處理器、或者任何其他合適的處理器。在各種示例中,處 理器單元884例如可W包括諸如雙核或四核處理器之類的多核處理器。處理器單元884例如 可W在一個裸忍上包括多個處理忍片、和/或在一個封裝或基板上包括多個裸忍。處理器單 元884例如也可W包括一級或多級的集成緩存存儲器。在各種示例中,處理器單元884可W 包括在一個或多個地點之間分布的一個或多個CPU。
      [0077] 數(shù)據(jù)存儲裝置896包括存儲器886和持久性數(shù)據(jù)存儲裝置888,它們通過通信構(gòu)造 882來與處理器單元884通信。存儲器886可W包括隨機(jī)存取半導(dǎo)體存儲器(RAM),用于存儲 用于處理的應(yīng)用數(shù)據(jù)、即計算機(jī)程序數(shù)據(jù)。盡管存儲器886在概念上被描繪為單個單片實 體,但是在各種示例中,存儲器886可W被布置在緩存的層次中W及其他存儲器裝置中、單 個物理位置上、或者W各種形式分布在多個物理系統(tǒng)之間。盡管存儲器886被描述為物理上 與處理器單元884W及計算裝置800的其他元件相分離,但是存儲器886同樣可W指代在整 個計算裝置800的任何位置處的任何中間的或緩存存儲器,包括接近處理器單元884或者與 處理器單元884集成的緩存存儲器或者接近處理器單元884的各個核或與各個核相集成的 緩存存儲器。
      [0078] 持久性數(shù)據(jù)存儲裝置888可W包括一個或多個硬盤驅(qū)動器、固態(tài)驅(qū)動器、快閃驅(qū)動 器、可重寫光盤驅(qū)動器、磁帶驅(qū)動器或者運些或其他數(shù)據(jù)存儲介質(zhì)的任何組合。持久性數(shù)據(jù) 存儲裝置888可W存儲用于操作系統(tǒng)的計算機(jī)可執(zhí)行指令或者計算機(jī)可讀程序代碼、包括 程序代碼的應(yīng)用文件、數(shù)據(jù)結(jié)構(gòu)或數(shù)據(jù)文件、和任何其他類型的數(shù)據(jù)。運些計算機(jī)可執(zhí)行指 令可W從持久性數(shù)據(jù)存儲裝置888加載至存儲器886中,W由處理器單元884或其他處理器 讀取和執(zhí)行。數(shù)據(jù)存儲裝置896也可W包含能夠基于臨時基礎(chǔ)和/或永久基礎(chǔ)而存儲諸如例 如但不限于數(shù)據(jù)、函數(shù)形式的程序代碼和/或其他合適的信息的信息的任何其他硬件元件。
      [0079] 持久性數(shù)據(jù)存儲裝置888和存儲器886是物理的、有形的、非暫時性的計算機(jī)可讀 數(shù)據(jù)存儲裝置的示例。數(shù)據(jù)存儲裝置896可W包含任意的各種形式的易失性存儲器,其可能 需要被周期性地電刷新W便在存儲器中維持?jǐn)?shù)據(jù),而本領(lǐng)域技術(shù)人員將認(rèn)識到,運也構(gòu)成 物理的、有形的、非暫時性計算機(jī)可讀數(shù)據(jù)存儲裝置的示例。當(dāng)程序代碼被加載、存儲、中 繼、緩沖或緩存在非暫時性物理介質(zhì)或裝置上、包括只要僅短持續(xù)時間或僅W易失性存儲 器形式時,可執(zhí)行的指令可W存儲在非暫時性介質(zhì)上。
      [0080] 處理器單元884也可W適當(dāng)?shù)乇痪幊蘔讀取、加載和執(zhí)行用于數(shù)據(jù)分析器23的計 算機(jī)可執(zhí)行指令或計算機(jī)可讀程序代碼,如上文中更詳細(xì)描述的。改程序代碼可W存儲在 存儲器886、持久性數(shù)據(jù)存儲裝置888、或者計算裝置800的其他位置上。該程序代碼也可W 采取存儲在計算機(jī)程序產(chǎn)品800中包括的計算機(jī)可讀介質(zhì)802上的程序代碼804的形式,并 且可W通過任意的各種本地或遠(yuǎn)程方式從計算機(jī)程序產(chǎn)品800傳送或傳達(dá)至計算裝置800, W能夠被處理器單元884執(zhí)行,如下文中進(jìn)一步解釋的。
      [0081] 操作系統(tǒng)可W提供諸如裝置接口管理、存儲器管理和多任務(wù)管理之類的功能。操 作系統(tǒng)可W是諸如來自描M?公司的AIX?操作系統(tǒng)之類的基于化ix的操作系統(tǒng)、諸如來 自Mic的地ft?公司的Windows?操作系統(tǒng)家族之類的非基于化ix的操作系統(tǒng)、諸如來自 Oracle?公司的JavaOS'i,么類的網(wǎng)絡(luò)操作系統(tǒng)、或者其他任何合適的操作系統(tǒng)。處理器單 元884可W適當(dāng)?shù)乇痪幊?,W讀取、加載和執(zhí)行操作系統(tǒng)的指令。
      [0082] 通信單元890在該示例中提供與其他計算或通信系統(tǒng)或裝置的通信。通信單元890 可W通過使用物理的和/或無線的通信鏈路來提供通信。通信單元890可W包含網(wǎng)絡(luò)接口 卡,用于與企業(yè)網(wǎng)絡(luò)18、公共網(wǎng)絡(luò)15、W太網(wǎng)適配器、令牌環(huán)適配器、用于連接到諸如電話線 之類的傳輸系統(tǒng)的調(diào)制調(diào)解器、或者任何其他類型的通信接口相接口。通信單元890可W用 于操作地將各種類型的外圍計算裝置連接到計算裝置800,比如打印機(jī)、總線適配器和其他 計算機(jī)。通信單元890可W被實施為擴(kuò)展卡或者例如內(nèi)置在母板中。
      [0083] 輸入/輸出單元892可W支持適于通過可W連接到計算裝置800的其他裝置來輸入 和輸出數(shù)據(jù)的裝置,比如鍵盤、鼠標(biāo)或者其他指示器、觸摸屏界面、用于打印機(jī)或任何其他 外圍裝置的接口、可移除磁盤或光盤驅(qū)動器(包括CD-ROM、DVD-ROM、或藍(lán)光)、通用串行總線 (USB)接收器、或者任何其他類型的輸入和/或輸出裝置。輸入/輸出單元892在各種示例中 還可W包括任何類型的用于W任何類型的視頻輸出協(xié)議輸出的視頻的接口、W及任何類型 的顯示器或其他視頻顯示技術(shù)??蒞理解的是,運些示例中的一些可W彼此重疊,或者與通 信單元890或數(shù)據(jù)存儲裝置896的示例部件重疊。輸入/輸出單元892還可W包含用于任何類 型的外部裝置的合適的裝置驅(qū)動器,或者運樣的裝置驅(qū)動器可W在適當(dāng)時駐留于計算裝置 800上的其他位置。
      [0084] 在該示意性示例中,計算裝置800還包括顯示適配器894,其提供用于諸如顯示裝 置898的一個或多個顯示裝置的一個或多個連接,該顯示裝置可W包括任意的多種類型的 顯示裝置??蒞理解的是,運些示例中的一些可能與通信單元890或輸入/輸出單元892中的 示例部件重疊。輸入/輸出單元892也可W包含用于任意類型的外部裝置的合適的裝置驅(qū)動 器,或者運樣的裝置驅(qū)動器可W在適當(dāng)時駐留于計算裝置800上的其他位置。在各種示例 中,顯示適配器894可W包括一個或多個視頻卡、一個或多個圖形處理單元(GPU)、一個或多 個可視頻連接端口、或者能夠傳送視頻數(shù)據(jù)的任何其他類型的數(shù)據(jù)連接器。在各種示例中, 顯示裝置898可W是任何種類的顯示裝置,比如監(jiān)視器、電視、或投影儀。
      [0085] 輸入/輸出單元892可W包括用于接收計算機(jī)程序產(chǎn)品801的驅(qū)動器、插口或出口, 計算機(jī)程序產(chǎn)品801包括具有在其上存儲的計算機(jī)程序代碼104的計算機(jī)可讀介質(zhì)802。例 如,計算機(jī)程序產(chǎn)品801可W是作為示意性示例的CD-ROM、DVD-ROM、藍(lán)光盤、磁盤、USB棒、閃 存盤或者外部硬盤、或者任何其他合適的數(shù)據(jù)存儲技術(shù)。
      [0086] 計算機(jī)可讀介質(zhì)802可W任何類型的光、磁、或者其他物理介質(zhì),其將程序代碼804 物理地編碼為在存儲器的每個單元中的不同物理狀態(tài)的二進(jìn)制序列,在被計算裝置800讀 取時引起由處理器884讀取的、與存儲介質(zhì)802的基本數(shù)據(jù)存儲元件的物理狀態(tài)相對應(yīng)的物 理信號,并且引起處理器單元884的物理狀態(tài)上的相應(yīng)改變。該物理程序代碼信號可諸 如高級編程語言、匯編語言或者機(jī)器語言之類的任意的各種抽象級別建?;蛘吒拍罨?,但 是最終構(gòu)成一系列物理的電和/或磁相互作用,該相互作用在物理上引起處理器單元884的 物理狀態(tài)上的改變,因此W物理上W使得計算裝置800在物理上采取其直到通過加載在程 序代碼804中包含的可執(zhí)行指令來改變其物理狀態(tài)時才具備的新性能運種方式,在物理上 引起或者配置處理器單元884W生成與計算機(jī)可執(zhí)行的指令相對應(yīng)的物理輸出。
      [0087] 在一些示意性示例中,可W通過網(wǎng)絡(luò)從另一裝置或計算機(jī)系統(tǒng)將程序代碼804下 載至數(shù)據(jù)存儲裝置896, W在計算裝置800中使用。包括計算機(jī)可執(zhí)行指令的程序代碼804可 W通過到通信單元890的硬線或無線通信鏈路和/或通過與輸入/輸出單元892的連接從計 算機(jī)可讀介質(zhì)802傳送或傳輸至計算裝置800。包括程序代碼804的計算機(jī)可讀介質(zhì)802可W 位于與計算裝置800相分離的位置或者計算裝置800的遠(yuǎn)程位置,并且可W位于包括世界上 任何地方的任何遠(yuǎn)程地理位置在內(nèi)的任何地方,并且可W通過諸如因特網(wǎng)和/或其他分組 數(shù)據(jù)網(wǎng)絡(luò)之類的任意類型的一個或多個通信鏈路將程序代碼804中繼至計算裝置800。例 如,程序代碼804可W通過無線因特網(wǎng)連接或者通過諸如無線LAN、Bluetooth?、Wi-Fi?或 者紅外連接之類的較短距離直接無線連接而傳輸。在其他實現(xiàn)方式中也可W使用任何其他 的無線或遠(yuǎn)程通信協(xié)議。
      [0088] 通信鏈路和/或連接在各種示意性示例中可W包括有線和/或無線連接,并且可W 通過包含程序代碼804的諸如通信鏈路或無線傳輸之類的無形介質(zhì)從源計算機(jī)可讀的介質(zhì) 802傳輸程序代碼804。程序代碼804可W在從其初始源介質(zhì)到計算裝置800的路途上或多或 少地暫時性地或者長久地存儲在任何數(shù)量的中間有形的、物理的計算機(jī)可讀的裝置和介質(zhì) 上,比如任何數(shù)量的物理緩沖器、緩存、主存儲器、或者服務(wù)器的數(shù)據(jù)存儲部件、網(wǎng)關(guān)、網(wǎng)絡(luò) 節(jié)點、移動性管理實體、或者其他網(wǎng)絡(luò)設(shè)施。
      [0089] 本發(fā)明可W是系統(tǒng)、方法和/或計算機(jī)程序產(chǎn)品。計算機(jī)程序產(chǎn)品可W包括計算機(jī) 可讀存儲介質(zhì),其上載有用于使處理器實現(xiàn)本發(fā)明的各個方面的計算機(jī)可讀程序指令。
      [0090] 計算機(jī)可讀存儲介質(zhì)可W是可W保持和存儲由指令執(zhí)行設(shè)備使用的指令的有形 設(shè)備。計算機(jī)可讀存儲介質(zhì)例如可W是一-但不限于一-電存儲設(shè)備、磁存儲設(shè)備、光存儲 設(shè)備、電磁存儲設(shè)備、半導(dǎo)體存儲設(shè)備或者上述的任意合適的組合。計算機(jī)可讀存儲介質(zhì)的 更具體的例子(非窮舉的列表)包括:便攜式計算機(jī)盤、硬盤、隨機(jī)存取存儲器(RAM)、只讀存 儲器(ROM)、可擦式可編程只讀存儲器化PROM或閃存)、靜態(tài)隨機(jī)存取存儲器(SRAM)、便攜式 壓縮盤只讀存儲器(CD-ROM)、數(shù)字多功能盤(DVD)、記憶棒、軟盤、機(jī)械編碼設(shè)備、例如其上 存儲有指令的打孔卡或凹槽內(nèi)凸起結(jié)構(gòu)、W及上述的任意合適的組合。運里所使用的計算 機(jī)可讀存儲介質(zhì)不被解釋為瞬時信號本身,諸如無線電波或者其他自由傳播的電磁波、通 過波導(dǎo)或其他傳輸媒介傳播的電磁波(例如,通過光纖電纜的光脈沖)、或者通過電線傳輸 的電信號。
      [0091] 運里所描述的計算機(jī)可讀程序指令可W從計算機(jī)可讀存儲介質(zhì)下載到各個計算/ 處理設(shè)備,或者通過網(wǎng)絡(luò)、例如因特網(wǎng)、局域網(wǎng)、廣域網(wǎng)和/或無線網(wǎng)下載到外部計算機(jī)或外 部存儲設(shè)備。網(wǎng)絡(luò)可W包括銅傳輸電纜、光纖傳輸、無線傳輸、路由器、防火墻、交換機(jī)、網(wǎng)關(guān) 計算機(jī)和/或邊緣服務(wù)器。每個計算/處理設(shè)備中的網(wǎng)絡(luò)適配卡或者網(wǎng)絡(luò)接口從網(wǎng)絡(luò)接收計 算機(jī)可讀程序指令,并轉(zhuǎn)發(fā)該計算機(jī)可讀程序指令,W供存儲在各個計算/處理設(shè)備中的計 算機(jī)可讀存儲介質(zhì)中。
      [0092] 用于執(zhí)行本發(fā)明操作的計算機(jī)程序指令可W是匯編指令、指令集架構(gòu)(ISA)指令、 機(jī)器指令、機(jī)器相關(guān)指令、微代碼、固件指令、狀態(tài)設(shè)置數(shù)據(jù)、或者W-種或多種編程語言的 任意組合編寫的源代碼或目標(biāo)代碼,所述編程語言包括面向?qū)ο蟮木幊陶Z言一諸如 Smalltalk、C++等,W及常規(guī)的過程式編程語言一諸如"C"語言或類似的編程語言。計算機(jī) 可讀程序指令可W完全地在用戶計算機(jī)上執(zhí)行、部分地在用戶計算機(jī)上執(zhí)行、作為一個獨 立的軟件包執(zhí)行、部分在用戶計算機(jī)上部分在遠(yuǎn)程計算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計算機(jī) 或服務(wù)器上執(zhí)行。在設(shè)及遠(yuǎn)程計算機(jī)的情形中,遠(yuǎn)程計算機(jī)可W通過任意種類的網(wǎng)絡(luò)一包 括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)-連接到用戶計算機(jī),或者,可W連接到外部計算機(jī)(例如利 用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。在一些實施例中,通過利用計算機(jī)可讀程序指令 的狀態(tài)信息來個性化定制電子電路,例如可編程邏輯電路、現(xiàn)場可編程口陣列(FPGA)或可 編程邏輯陣列(PLA),該電子電路可W執(zhí)行計算機(jī)可讀程序指令,從而實現(xiàn)本發(fā)明的各個方 面。
      [0093] 運里參照根據(jù)本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機(jī)程序產(chǎn)品的流程圖和/ 或框圖描述了本發(fā)明的各個方面。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框W及流程圖和/ 或框圖中各方框的組合,都可W由計算機(jī)可讀程序指令實現(xiàn)。
      [0094] 運些計算機(jī)可讀程序指令可W提供給通用計算機(jī)、專用計算機(jī)或其它可編程數(shù)據(jù) 處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得運些指令在通過計算機(jī)或其它可編程數(shù)據(jù) 處理裝置的處理器執(zhí)行時,產(chǎn)生了實現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功 能/動作的裝置。也可W把運些計算機(jī)可讀程序指令存儲在計算機(jī)可讀存儲介質(zhì)中,運些指 令使得計算機(jī)、可編程數(shù)據(jù)處理裝置和/或其他設(shè)備W特定方式工作,從而,存儲有指令的 計算機(jī)可讀介質(zhì)則包括一個制造品,其包括實現(xiàn)流程圖和/或框圖中的一個或多個方框中 規(guī)定的功能/動作的各個方面的指令。
      [0095] 也可W把計算機(jī)可讀程序指令加載到計算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它 設(shè)備上,使得在計算機(jī)、其它可編程數(shù)據(jù)處理裝置或其它設(shè)備上執(zhí)行一系列操作步驟,W產(chǎn) 生計算機(jī)實現(xiàn)的過程,從而使得在計算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備上執(zhí)行的 指令實現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作。
      [0096] 附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的系統(tǒng)、方法和計算機(jī)程 序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在運點上,流程圖或框圖中的每個方框可W代 表一個模塊、程序段或指令的一部分,所述模塊、程序段或指令的一部分包含一個或多個用 于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也 可不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可W基本并行地執(zhí) 行,它們有時也可W按相反的順序執(zhí)行,運依所設(shè)及的功能而定。也要注意的是,框圖和/或 流程圖中的每個方框、W及框圖和/或流程圖中的方框的組合,可W用執(zhí)行規(guī)定的功能或動 作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可W用專用硬件與計算機(jī)指令的組合來實現(xiàn)。
      [0097] 為了例示的目的已經(jīng)給出了對本發(fā)明的各個實施例的描述,但是不意圖窮盡或者 限制到所公開的實施例。不脫離所描述的實施例的范圍和精神,許多修改和變化對于本領(lǐng) 域技術(shù)人員而言將是顯而易見的。選擇在此使用的技術(shù)W最佳地說明實施例的原理、實際 應(yīng)用或者相比于在市場上找到的技術(shù)的技術(shù)改進(jìn),或者使得本領(lǐng)域技術(shù)人員能夠理解在此 公開的實施例。
      【主權(quán)項】
      1. 一種方法,包括: 通過計算裝置接收自然語言查詢; 通過該計算裝置并且基于該自然語言查詢來確定搜索條件集合; 至少部分地基于在所述搜索條件集合和在一個或多個存儲裝置中存儲的多個數(shù)據(jù)集 合的屬性之間的匹配,通過該計算裝置并且從所述多個數(shù)據(jù)集合中確定與該自然語言查詢 相關(guān)的兩個或更多數(shù)據(jù)集合; 通過該計算裝置聯(lián)合所述兩個或更多數(shù)據(jù)集合,包括聯(lián)合所述兩個或更多數(shù)據(jù)集合的 一個或多個行以及一個或多個列,以產(chǎn)生聯(lián)合數(shù)據(jù)集合;以及 通過該計算裝置輸出所述聯(lián)合數(shù)據(jù)集合的表示。2. 根據(jù)權(quán)利要求1所述的方法, 其中,在所述搜索條件集合和所述多個數(shù)據(jù)集合的屬性之間的匹配包括以下的一個或 多個:文字匹配、值匹配、語義匹配或部分名稱匹配,并且 其中,所述多個數(shù)據(jù)集合的屬性包括以下的一個或多個:語義元數(shù)據(jù)、詞匯線索、樣本 值或數(shù)值統(tǒng)計。3. 根據(jù)權(quán)利要求2所述的方法,還包括: 通過該計算裝置將匹配強(qiáng)度的指示與每個匹配相關(guān)聯(lián);以及 通過該計算裝置基于與每個匹配相關(guān)聯(lián)的各自的匹配強(qiáng)度的指示來對匹配排序。4. 根據(jù)權(quán)利要求3所述的方法,還包括: 通過該計算裝置至少部分地基于匹配的排序來確定對于所述多個數(shù)據(jù)集合中的兩個 或更多數(shù)據(jù)集合的一個或多個組合中的每一個組合的覆蓋度得分;以及 至少部分地基于對于兩個或更多數(shù)據(jù)集合的所述一個或多個組合中的一個組合的每 一個的各自確定的覆蓋度得分,確定兩個或更多數(shù)據(jù)集合的所述一個或多個組合中的該一 個組合作為要聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集合。5. 根據(jù)權(quán)利要求4所述的方法,其中, 通過該計算裝置確定兩個或更多數(shù)據(jù)集合的所述一個或多個組合中的該一個組合作 為要聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù)據(jù)集合還包括:確定在所述兩個或更多數(shù)據(jù)集合 之間的數(shù)據(jù)項的一個或多個聯(lián)合路徑;以及 通過該計算裝置確定所述兩個或更多數(shù)據(jù)集合還包括:至少部分地基于所述一個或多 個聯(lián)合路徑來聯(lián)合所述兩個或更多數(shù)據(jù)集合。6. 根據(jù)權(quán)利要求5所述的方法,其中,所述一個或多個聯(lián)合路徑包括在所述兩個或更多 數(shù)據(jù)集合中的值重疊。7. 根據(jù)權(quán)利要求5所述的方法,其中,所述一個或多個聯(lián)合路徑包括在所述兩個或更多 數(shù)據(jù)集合中的匹配數(shù)據(jù)項。8. 根據(jù)權(quán)利要求5所述的方法,其中,至少部分地基于概念特定規(guī)則來確定所述一個或 多個聯(lián)合路徑。9. 根據(jù)權(quán)利要求5所述的方法,其中,確定所述一個或多個聯(lián)合路徑還包括從所述一個 或多個聯(lián)合路徑中排除度量數(shù)據(jù)項。10. 根據(jù)權(quán)利要求5所述的方法,其中,確定數(shù)據(jù)項的一個或多個聯(lián)合路徑還包括至少 部分地基于用戶輸入來調(diào)整所述一個或多個聯(lián)合路徑。11. 一種計算機(jī)系統(tǒng),包括: 一個或多個處理器、一個或多個計算機(jī)可讀的存儲器、以及一個或多個計算機(jī)可讀的 有形存儲裝置; 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以接收自然語言查詢; 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以基于所述自然語言查詢來 確定搜索條件集合; 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以至少部分地基于所述搜索 條件集合與在所述一個或多個存儲裝置中存儲的多個數(shù)據(jù)集合的屬性之間的匹配,從所述 多個數(shù)據(jù)集合中確定與所述自然語言查詢相關(guān)的兩個或更多數(shù)據(jù)集合; 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,聯(lián)合所述兩個或更多數(shù)據(jù)集 合,包括聯(lián)合所述兩個或更多數(shù)據(jù)集合的一個或多個行以及一個或多個列以產(chǎn)生聯(lián)合數(shù)據(jù) 集合;和 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以輸出所述聯(lián)合數(shù)據(jù)集合的 表不。12. 根據(jù)權(quán)利要求11所述的計算機(jī)系統(tǒng),其中,所述搜索條件集合和所述多個數(shù)據(jù)集合 的屬性之間的匹配包括以下的一個或多個:文字匹配、值匹配、語義匹配和部分名稱匹配, 并且其中,所述多個數(shù)據(jù)集合的屬性包括以下的一個或多個:語義元數(shù)據(jù)、詞匯線索、樣本 值和數(shù)值統(tǒng)計。13. 根據(jù)權(quán)利要求12所述的計算機(jī)系統(tǒng),還包括: 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以將匹配強(qiáng)度的指示與每個 匹配相關(guān)聯(lián);和 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以基于與各個匹配相關(guān)聯(lián)的 匹配強(qiáng)度的指示來對匹配排序。14. 根據(jù)權(quán)利要求13所述的計算機(jī)系統(tǒng),還包括: 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以至少部分地基于匹配的排 序確定對于所述多個數(shù)據(jù)集合中的兩個或更多數(shù)據(jù)集合的一個或多個組合中的每一個組 合的覆蓋度得分;和 程序指令,存儲在一個或多個存儲裝置中的至少一個上,用于由所述一個或多個處理 器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來執(zhí)行,以至少部分地基于對于兩個 或更多數(shù)據(jù)集合的一個或多個組合中的一個組合所確定的覆蓋度得分,確定兩個或更多數(shù) 據(jù)集合的一個或多個組合中的所述一個組合作為要聯(lián)合為聯(lián)合數(shù)據(jù)集合的兩個或更多數(shù) 據(jù)集合。15.根據(jù)權(quán)利要求14所述的計算機(jī)系統(tǒng),其中: 用于確定兩個或更多數(shù)據(jù)集合的一個或多個組合中的一個組合作為要聯(lián)合為聯(lián)合數(shù) 據(jù)集合的兩個或更多數(shù)據(jù)集合的程序指令還包括存儲在一個或多個存儲裝置中的至少一 個上、用于由所述一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器中的至少一個來 執(zhí)行、以確定在所述兩個或更多數(shù)據(jù)集合之間的數(shù)據(jù)項的一個或多個聯(lián)合路徑的程序指 令;和 用于聯(lián)合所述兩個或更多數(shù)據(jù)集合、包括聯(lián)合所述兩個或更多數(shù)據(jù)集合的一個或多個 行以及一個或多個列以產(chǎn)生所述聯(lián)合數(shù)據(jù)集合的程序指令還包括存儲在一個或多個存儲 裝置中的至少一個上、用于由所述一個或多個處理器中的至少一個經(jīng)由一個或多個存儲器 中的至少一個來執(zhí)行、以至少部分地基于所述一個或多個聯(lián)合路徑來聯(lián)合所述兩個或更多 數(shù)據(jù)集合的程序指令。
      【文檔編號】G06F17/30GK105824872SQ201610051916
      【公開日】2016年8月3日
      【申請日】2016年1月26日
      【發(fā)明人】M.雷斯-加塞姆, R.N.格羅塞特
      【申請人】國際商業(yè)機(jī)器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1