国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      識(shí)別網(wǎng)絡(luò)通信模式的制作方法

      文檔序號(hào):7994261閱讀:309來源:國(guó)知局
      識(shí)別網(wǎng)絡(luò)通信模式的制作方法
      【專利摘要】本發(fā)明的示例包括方法、設(shè)備和/或系統(tǒng)。識(shí)別網(wǎng)絡(luò)通信模式可以包括分析網(wǎng)絡(luò)的分布式計(jì)算機(jī)程序、基于該分析來估計(jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)、以及將虛擬網(wǎng)絡(luò)通信業(yè)務(wù)映射到物理網(wǎng)絡(luò)鏈路。識(shí)別網(wǎng)絡(luò)通信模式還可以包括識(shí)別該網(wǎng)絡(luò)通信模式以及基于所映射的通信業(yè)務(wù)的所估計(jì)的通信強(qiáng)度和該網(wǎng)絡(luò)通信模式來分類物理通信網(wǎng)絡(luò)鏈路。識(shí)別網(wǎng)絡(luò)通信模式還可以包括基于該分類來優(yōu)化網(wǎng)絡(luò)所使用的能量。
      【專利說明】識(shí)別網(wǎng)絡(luò)通信模式

      【背景技術(shù)】
      [0001] 高性能計(jì)算(HPC)工作負(fù)載可以涉及其通信被組織在規(guī)則模式中的應(yīng)用。HPC應(yīng) 用的并行實(shí)現(xiàn)可以跨多個(gè)節(jié)點(diǎn)并行化,其中一些節(jié)點(diǎn)可以通過網(wǎng)絡(luò)與第一較小節(jié)點(diǎn)集合交 換消息和/或與第二較大節(jié)點(diǎn)集合交換其它消息。用于該HPC集群的基礎(chǔ)聯(lián)網(wǎng)拓?fù)淇梢园?括復(fù)雜的通用多級(jí)交換機(jī)拓?fù)洌ɡ绱謽浜?或折疊式克勞斯(folded clos)),其中網(wǎng)絡(luò) 性能鏈路可以通過同步消息和/或交換機(jī)路由的顯式配置而被保持為活動(dòng)。

      【專利附圖】

      【附圖說明】
      [0002] 圖1是圖示了根據(jù)本公開的用于識(shí)別網(wǎng)絡(luò)通信模式的方法的示例的流程圖。
      [0003] 圖2是根據(jù)本公開的與識(shí)別網(wǎng)絡(luò)通信模式相關(guān)聯(lián)的功能框圖。
      [0004] 圖3是圖示了根據(jù)本公開的用于識(shí)別網(wǎng)絡(luò)通信模式的方法的示例的流程圖。
      [0005] 圖4是根據(jù)本公開的與用于識(shí)別網(wǎng)絡(luò)通信模式的處理資源通信的計(jì)算機(jī)可讀介 質(zhì)的示例的框圖。

      【具體實(shí)施方式】
      [0006] 本公開的示例包括方法、設(shè)備和/或系統(tǒng)。用于識(shí)別網(wǎng)絡(luò)通信模式的示例方法可 以包括分析網(wǎng)絡(luò)的分布式計(jì)算機(jī)程序、基于該分析來估計(jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)、以及將虛擬 網(wǎng)絡(luò)通信業(yè)務(wù)映射到物理網(wǎng)絡(luò)鏈路。示例方法還可以包括識(shí)別網(wǎng)絡(luò)通信模式以及基于所映 射的通信業(yè)務(wù)的所估計(jì)的通信強(qiáng)度和該網(wǎng)絡(luò)通信模式來分類物理通信網(wǎng)絡(luò)鏈路。示例方法 還可以包括基于該分類來優(yōu)化網(wǎng)絡(luò)所使用的能量。
      [0007] 在本公開的以下詳細(xì)描述中,對(duì)附圖進(jìn)行了參考,附圖形成該詳細(xì)描述的一部分, 并且在附圖中通過圖示的方式示出可如何實(shí)踐本公開的示例。以足夠的細(xì)節(jié)描述這些示例 以使得本領(lǐng)域普通技術(shù)人員能夠?qū)嵺`本公開的示例,并且要理解到,可以利用其它示例,并 且在不脫離本公開的范圍的情況下可以做出過程、電氣和/或結(jié)構(gòu)上的改變。
      [0008] 本文中的附圖遵循一種編號(hào)慣例,其中最前面的一個(gè)或多個(gè)數(shù)字對(duì)應(yīng)于附圖號(hào)碼 并且其余數(shù)字標(biāo)識(shí)圖中的元件或組件。在本文的各個(gè)附圖中示出的元件可以被添加、交換 和/或消除以便提供本公開的多個(gè)附加示例。此外,在附圖中提供的元件的比例和相對(duì)尺 度旨在圖示本公開的示例,且不應(yīng)當(dāng)在限制的意義上采用。
      [0009] 高性能計(jì)算(HPC)系統(tǒng)可以包括服務(wù)器的集群,其具有多個(gè)個(gè)體節(jié)點(diǎn)(例如,數(shù)萬 個(gè)節(jié)點(diǎn))。節(jié)點(diǎn)可以包括例如具有單個(gè)共享地址空間的計(jì)算機(jī)(例如,由并行執(zhí)行的多個(gè)處 理CPU核組成的計(jì)算機(jī))。節(jié)點(diǎn)的集群可以包括具有允許消息在節(jié)點(diǎn)之間發(fā)送的通信網(wǎng)絡(luò) 的節(jié)點(diǎn)集合。隨著集群在大小上增加,集群的聯(lián)網(wǎng)組件可能消耗日益增加的量的電力。 [0010] 網(wǎng)絡(luò)電力使用可能是供應(yīng)不足的,這意味著:可用的總電力(例如電力預(yù)算)可能 不足以在任何時(shí)間點(diǎn)處以全功率運(yùn)行HPC系統(tǒng)中的所有計(jì)算節(jié)點(diǎn)。相比于不采用該電力移 位方法(例如電力優(yōu)化)的網(wǎng)絡(luò)而言,將電力預(yù)算的較大部分(例如片段)從第一聯(lián)網(wǎng)元件移 位到更直接貢獻(xiàn)于總體性能的第二聯(lián)網(wǎng)元件可以導(dǎo)致更高效的電力供應(yīng)。當(dāng)分析識(shí)別出不 需要這些鏈路高效執(zhí)行HPC應(yīng)用時(shí),網(wǎng)絡(luò)鏈路的一部分(例如在諸如多維陣列或粗樹之類 的多路徑網(wǎng)絡(luò)拓?fù)渲校┻€可以被關(guān)閉和/或配置在低功率低性能模式中。這種移位和關(guān)閉 可以被稱為優(yōu)化網(wǎng)絡(luò)電力。
      [0011] 聯(lián)網(wǎng)資源的電力供應(yīng)可以靜態(tài)地和/或動(dòng)態(tài)地在中間件庫(kù)(例如消息傳遞接口 (MPI)庫(kù))中執(zhí)行。這樣的庫(kù)可以包括用于創(chuàng)建通信拓?fù)浜途W(wǎng)絡(luò)鏈路使用的映射以及用于 隨運(yùn)行時(shí)條件改變而動(dòng)態(tài)地重新調(diào)整映射的信息。此外,可以利用HPC應(yīng)用的通信模式的 應(yīng)用特定知識(shí)來例如除了其它之外選擇性地識(shí)別貢獻(xiàn)于性能的鏈路并向網(wǎng)絡(luò)交換機(jī)通知 其它鏈路可以被關(guān)閉或置于低功率模式中。
      [0012] 相比于試圖僅使用當(dāng)前業(yè)務(wù)需求的本地知識(shí)來更頻繁地給各個(gè)鏈路供電的網(wǎng)絡(luò) 而言,識(shí)別網(wǎng)絡(luò)通信模式呼叫允許總體應(yīng)用通信模式的識(shí)別以及鏈路能力和電力的更持久 調(diào)整。相比于例如指望諸如通信容量和消息計(jì)數(shù)之類的其它特性的其它方法而言,識(shí)別網(wǎng) 絡(luò)通信模式還可以允許拓?fù)鋯栴}的檢查。
      [0013] 圖1是圖示了根據(jù)本公開的用于識(shí)別網(wǎng)絡(luò)通信模式的方法100的示例的流程圖。 方法100可以包括利用HPC應(yīng)用的通信模式的應(yīng)用特定知識(shí)來選擇性地識(shí)別貢獻(xiàn)于性能的 網(wǎng)絡(luò)鏈路。方法100還可以包括例如向網(wǎng)絡(luò)交換機(jī)通知其它網(wǎng)絡(luò)鏈路可以被關(guān)閉或置于低 功率模式中。
      [0014] 在102處,分析網(wǎng)絡(luò)內(nèi)的分布式計(jì)算機(jī)程序。在示例中,在編譯時(shí)期間分析HPC中 間件程序。中間件程序可以包括例如遠(yuǎn)程直接存儲(chǔ)器訪問(RDMA)和/或低級(jí)別通信庫(kù),諸 如MPI或Charm。諸如MPI之類的中間件程序可以被裝備成收集用于創(chuàng)建通信拓?fù)浜?或 網(wǎng)絡(luò)鏈路的初始映射的信息。中間件程序還可以被裝備成收集可允許隨程序開始和運(yùn)行時(shí) 條件改變而對(duì)通信拓?fù)浜?或鏈路進(jìn)行動(dòng)態(tài)重新調(diào)整的信息。
      [0015] HPC中間件程序的通信模式可以在編譯時(shí)期間被分析,并可以包括:針對(duì)通信網(wǎng) 絡(luò)中的每個(gè)節(jié)點(diǎn),發(fā)現(xiàn)可能邏輯目的地的列表。該分析可以包括:確定、測(cè)量和/或估計(jì)節(jié) 點(diǎn)之間的網(wǎng)絡(luò)鏈路內(nèi)的通信頻率(例如頻率帶寬)和/或通過網(wǎng)絡(luò)鏈路傳遞可被用于向網(wǎng)絡(luò) 鏈路指派"權(quán)重"的多少數(shù)據(jù)。列表還可以基于根據(jù)通信頻率和所傳遞的數(shù)據(jù)量計(jì)算的權(quán) 重而排序。
      [0016] 在104處,基于分布式計(jì)算機(jī)程序分析來估計(jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)。在示例中,基于 HPC中間件程序的模式分析來創(chuàng)建虛擬網(wǎng)絡(luò)通信拓?fù)洹9烙?jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)可以包括: 基于運(yùn)行時(shí)采樣來估計(jì)分布式計(jì)算機(jī)程序的應(yīng)用的完整運(yùn)行和/或編譯時(shí)估計(jì)。虛擬網(wǎng)絡(luò) 通信拓?fù)淇梢园ňW(wǎng)絡(luò)中的多個(gè)節(jié)點(diǎn)以及連接到該多個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)鏈路。更強(qiáng)地鏈接到特 定節(jié)點(diǎn)的節(jié)點(diǎn)相比于不同節(jié)點(diǎn)而言可以與該特定節(jié)點(diǎn)連同在其中它共享類似地強(qiáng)的連接 的其它節(jié)點(diǎn)一起被成組在"目的地集團(tuán)"(DC)中??梢葬槍?duì)網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)創(chuàng)建DC。在 示例中,可以存在獨(dú)立于與DC相關(guān)聯(lián)的過程的數(shù)目的DC大小的上界。
      [0017] 在106處,將虛擬網(wǎng)絡(luò)通信業(yè)務(wù)映射到物理網(wǎng)絡(luò)鏈路,并且在108處,識(shí)別網(wǎng)絡(luò)通 信模式,并且基于所映射的通信業(yè)務(wù)的所估計(jì)的通信強(qiáng)度和該網(wǎng)絡(luò)通信模式來分類物理通 信網(wǎng)絡(luò)鏈路。
      [0018] 映射虛擬網(wǎng)絡(luò)通信業(yè)務(wù)可以包括使用固定路由表進(jìn)行映射和/或基于虛擬通信 業(yè)務(wù)來優(yōu)化路由。通信強(qiáng)度可以包括物理通信網(wǎng)絡(luò)鏈路上的業(yè)務(wù)量。在多個(gè)實(shí)施例中,鏈 路分類可以基于鏈路是否在特定閾值以上(例如"強(qiáng)地")進(jìn)行通信、在特定閾值以下(例如 "弱地")進(jìn)行通信和/或根本不進(jìn)行通信。
      [0019] 在示例中,在網(wǎng)絡(luò)拓?fù)鋬?nèi)基于HPC中間件程序分析和網(wǎng)絡(luò)拓?fù)鋪矸诸愇锢硗ㄐ啪W(wǎng) 絡(luò)鏈路??梢詫⒕W(wǎng)絡(luò)鏈路分類成多個(gè)類別。通過這樣做,相比于不具有經(jīng)分類的網(wǎng)絡(luò)鏈路 的拓?fù)涠裕梢詣?chuàng)建具有更高效電力供應(yīng)的聯(lián)網(wǎng)拓?fù)?例如聯(lián)網(wǎng)組織)。
      [0020] 除了其它之外,網(wǎng)絡(luò)鏈路類別可以包括"始終開啟"、"始終關(guān)閉"以及"備用"。始 終開啟類別可以包括屬于每個(gè)節(jié)點(diǎn)的DC的拓?fù)渲械木W(wǎng)絡(luò)鏈路。始終關(guān)閉類別可以包括未 被目標(biāo)HPC應(yīng)用中的任何DC使用(例如不需要)的拓?fù)渲械木W(wǎng)絡(luò)鏈路。備用類別可以包括 未被包括在始終開始或始終關(guān)閉類別中的所有鏈路。例如,這可以包括其中程序模式分析 不完善或所提供的數(shù)據(jù)不完整的情形。
      [0021] 可以將網(wǎng)絡(luò)鏈路分類繼續(xù)傳遞到網(wǎng)絡(luò)交換機(jī),該網(wǎng)絡(luò)交換機(jī)可以使用該信息來對(duì) 網(wǎng)絡(luò)鏈路進(jìn)行編程(例如優(yōu)化)并對(duì)多級(jí)交換機(jī)中的路由進(jìn)行編程以連接多個(gè)(例如兩個(gè)) 節(jié)點(diǎn)。例如,始終開啟網(wǎng)絡(luò)鏈路可以被編程為處于網(wǎng)絡(luò)中可用的最快模式中(例如需要最大 聯(lián)網(wǎng)性能),始終關(guān)閉網(wǎng)絡(luò)鏈路可以被關(guān)閉(例如,通過重編程路由表和/或在網(wǎng)絡(luò)交換機(jī)中 誰的路由可以被關(guān)閉來完全關(guān)閉),并且備用網(wǎng)絡(luò)鏈路可以被編程為可通過動(dòng)態(tài)鏈路級(jí)機(jī) 制而控制(例如,以利用諸如能量高效以太網(wǎng)(EEE)所提出的標(biāo)準(zhǔn)所提倡的機(jī)制之類的動(dòng)態(tài) 節(jié)電機(jī)制)。在示例中,可以將備用網(wǎng)絡(luò)鏈路的電力管理留在特定鏈路實(shí)現(xiàn)的控制之下。
      [0022] 可以基于在運(yùn)行時(shí)期間在中間件程序內(nèi)進(jìn)行的測(cè)量來修訂網(wǎng)絡(luò)拓?fù)?。?dāng)程序不再 處于編譯時(shí)中時(shí),可以考慮關(guān)于節(jié)點(diǎn)之間的網(wǎng)絡(luò)鏈路內(nèi)的通信和/或通過網(wǎng)絡(luò)鏈路傳遞多 少數(shù)據(jù)的確定、測(cè)量和/或估計(jì)。這可以允許根據(jù)在運(yùn)行時(shí)期間對(duì)程序或網(wǎng)絡(luò)的改變來對(duì) 網(wǎng)絡(luò)拓?fù)溥M(jìn)行修訂。
      [0023] 例如,可以在基于時(shí)間和/或基于網(wǎng)絡(luò)事件的"時(shí)期"中監(jiān)視中間件程序,其中,時(shí) 期持續(xù)時(shí)間是基于總體網(wǎng)絡(luò)架構(gòu)的特性和應(yīng)用的大小來估計(jì)的。時(shí)期持續(xù)時(shí)間例如可以被 啟發(fā)式地估計(jì),并可以以經(jīng)過的時(shí)間、聯(lián)網(wǎng)事件(例如消息)的數(shù)目和/或業(yè)務(wù)加以表述。
      [0024] 可以基于在中間件程序內(nèi)進(jìn)行的測(cè)量和經(jīng)修訂的拓?fù)鋪碓诮?jīng)修訂的拓?fù)鋬?nèi)分類 物理通信網(wǎng)絡(luò)鏈路。使用可考慮到在運(yùn)行時(shí)期間的改變的經(jīng)修訂的拓?fù)?,可以?duì)網(wǎng)絡(luò)鏈路 進(jìn)行分類和/或重分類。類似于在運(yùn)行時(shí)中做出的分類,除了其它之外,可以將網(wǎng)絡(luò)鏈路分 類為"始終開啟"、"始終關(guān)閉"和"備用"。
      [0025] 可以將分類和網(wǎng)絡(luò)通信模式(例如,經(jīng)修訂的拓?fù)洌├^續(xù)傳遞到網(wǎng)絡(luò)交換機(jī)以用于 編程。例如,可以使用邊信道網(wǎng)絡(luò)管理消息將網(wǎng)絡(luò)通信模式(例如,經(jīng)修訂的網(wǎng)絡(luò)拓?fù)?傳送 到多個(gè)網(wǎng)絡(luò)交換機(jī),并且通信路由可以在交換機(jī)中被重編程。可以基于分類來編程網(wǎng)絡(luò)交 換機(jī)以重編程交換機(jī)使用以在拓?fù)渲械亩鄠€(gè)(例如兩個(gè))節(jié)點(diǎn)之間建立通信的路由。
      [0026] 在110處,基于物理通信網(wǎng)絡(luò)鏈路的分類來優(yōu)化網(wǎng)絡(luò)所使用的能量。例如,可以將 網(wǎng)絡(luò)所使用的能量(例如網(wǎng)絡(luò)電力使用)優(yōu)化成匹配于通信模式并將電力預(yù)算的片段(例如 較大片段)移位到可更直接貢獻(xiàn)于程序的總體性能的HPC中間件程序的計(jì)算元件。例如,通 過路由,可以優(yōu)化所使用的能量??梢砸蕴囟ǚ绞郊芯W(wǎng)絡(luò)業(yè)務(wù),和/或未使用或比其它鏈 路更不頻繁使用的物理鏈路可以被關(guān)閉或置于較低功率狀態(tài)中。
      [0027] 圖2是根據(jù)本公開的與識(shí)別網(wǎng)絡(luò)通信模式相關(guān)聯(lián)的功能框圖212。識(shí)別網(wǎng)絡(luò)通信 模式可以包括靜態(tài)初始化階段,其中在運(yùn)行前(例如在編譯時(shí)處)離線分析HPC程序。圖2 圖示了利用靜態(tài)分析器216 (例如,在編譯期間或之后且在執(zhí)行HPC程序之前)靜態(tài)分析的 中間件程序214 (例如MPI程序庫(kù)),其中靜態(tài)分析器216可以針對(duì)網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)發(fā)現(xiàn) 可能目的地的列表(例如或許可能目的地的列表)。靜態(tài)分析器還可以從編程者接收關(guān)于可 能目的地的輸入。
      [0028] 基于經(jīng)由通過裝備中間件程序(例如識(shí)別諸如環(huán)回之類的規(guī)律模式)和啟發(fā)式估 計(jì)對(duì)通信模式的分析而推斷的控制流信息,靜態(tài)分析器216可以基于通信頻率和所傳遞的 數(shù)據(jù)的量(例如權(quán)重)來輸出目的地的經(jīng)排序的列表218。
      [0029] 靜態(tài)分析器216和網(wǎng)絡(luò)優(yōu)化器220可以考慮原始網(wǎng)絡(luò)拓?fù)浜湍康牡氐慕?jīng)排序的列 表218,并通過將鏈路歸類(例如分類)成類別來計(jì)算"優(yōu)化的"聯(lián)網(wǎng)拓?fù)?22。例如,除了其 它之外,可以將網(wǎng)絡(luò)鏈路歸類為始終開啟、始終關(guān)閉和/或備用。優(yōu)化網(wǎng)絡(luò)通信模式可以包 括例如對(duì)修改進(jìn)行編程以提高減小DC大小的概率。例如,可以關(guān)閉多路徑拓?fù)渲械木W(wǎng)絡(luò)鏈 路的一部分(例如,片段)(例如在具有兩個(gè)維度的多維陣列中,通過關(guān)閉奇數(shù)行)。
      [0030] 網(wǎng)絡(luò)優(yōu)化器220可以利用經(jīng)排序的列表218和經(jīng)分類的網(wǎng)絡(luò)鏈路以輸出經(jīng)優(yōu)化的 網(wǎng)絡(luò)拓?fù)?22。經(jīng)優(yōu)化的網(wǎng)絡(luò)拓?fù)?22可以包括具有相比于在沒有考慮網(wǎng)絡(luò)鏈路分類和/ 或目的地列表(例如列表218)的情況下創(chuàng)建的網(wǎng)絡(luò)拓?fù)涠愿倪M(jìn)的電力供應(yīng)和/或電力供 應(yīng)效率的網(wǎng)絡(luò)拓?fù)洹=?jīng)優(yōu)化的網(wǎng)絡(luò)拓?fù)?22還可以包括具有相比于先前的網(wǎng)絡(luò)拓?fù)涠愿?進(jìn)的電力供應(yīng)的網(wǎng)絡(luò)拓?fù)洹?br> [0031] 可以將網(wǎng)絡(luò)鏈路分類和經(jīng)優(yōu)化的拓?fù)湫畔鬟f到網(wǎng)絡(luò)交換機(jī),并且可以相應(yīng)地對(duì) 網(wǎng)絡(luò)鏈路進(jìn)行編程。例如,始終開啟鏈路可以被編程為處于網(wǎng)絡(luò)中可用的最快模式中,始終 關(guān)閉鏈路可以是通過重編程交換機(jī)路由表來完全關(guān)閉的,并且備用鏈路可以被編程為可通 過動(dòng)態(tài)鏈路級(jí)機(jī)制(例如EEE)而控制。
      [0032] 交換機(jī)對(duì)鏈路歸類信息做什么可以取決于具體網(wǎng)絡(luò)。例如,在粗樹或折疊式克勞 斯網(wǎng)絡(luò)中,可以關(guān)閉整個(gè)上級(jí)交換機(jī),從而使樹變細(xì)并且增加節(jié)電。還可以通過減小鏈路帶 寬來減小鏈路功率,其中網(wǎng)絡(luò)鏈路具有相比于其它網(wǎng)絡(luò)鏈路更低的利用率。在另一示例中, 以太網(wǎng)鏈路可以協(xié)商減小的數(shù)據(jù)速率(例如從10G到1G或100M),并且,可以調(diào)整各種功率 域。
      [0033] 中間件程序庫(kù)(例如MPI庫(kù))可以依照用戶程序逐節(jié)點(diǎn)地確定通信模式,并且這可 以通過運(yùn)行時(shí)而映射到物理節(jié)點(diǎn)上,且通過網(wǎng)絡(luò)交換機(jī)管理而映射到物理路由上。關(guān)于DC 的信息也可以被用于通過確保與集團(tuán)中的節(jié)點(diǎn)相對(duì)應(yīng)的過程是近鄰(例如在相同套接字內(nèi) 部的不同核中或連接到相同的葉交換機(jī))來優(yōu)化邏輯到物理映射。
      [0034] 圖3是圖示了根據(jù)本公開的用于識(shí)別網(wǎng)絡(luò)通信模式的方法326的示例的流程圖。 識(shí)別網(wǎng)絡(luò)通信模式可以包括動(dòng)態(tài)階段(例如動(dòng)態(tài)優(yōu)化階段),其中基于在低級(jí)別通信庫(kù)(例 如MPI庫(kù))內(nèi)進(jìn)行的測(cè)量來(例如周期性地)修訂初始的經(jīng)優(yōu)化的拓?fù)洳⑶沂褂眠呅诺谰W(wǎng)絡(luò) 管理消息將初始的經(jīng)優(yōu)化的拓?fù)鋫魉偷浇粨Q機(jī)。例如,諸如如圖2中圖示的拓?fù)?22之類 的在編譯時(shí)期間確定的經(jīng)優(yōu)化的拓?fù)淇梢栽谶\(yùn)行時(shí)中加以修訂以適配于改變。當(dāng)HPC程序 開始時(shí)(例如在動(dòng)態(tài)階段的開始期間),可以發(fā)起分離的監(jiān)視過程,并且,該過程可以掛靠到 中間件程序庫(kù)(例如,諸如MPI或Charm庫(kù)之類的低級(jí)別通信庫(kù))中。
      [0035] 在328處,啟動(dòng)HPC程序(例如MPI程序)。在330處做出是否已經(jīng)從中間件程序 庫(kù)接收到消息的確定。如果已經(jīng)接收到消息,則在332處可以利用庫(kù)內(nèi)的動(dòng)態(tài)統(tǒng)計(jì)量收集 模塊來收集統(tǒng)計(jì)量。這些統(tǒng)計(jì)量可以包括如給定網(wǎng)絡(luò)系統(tǒng)的管理和監(jiān)視支持所提供的網(wǎng)絡(luò) 鏈路的通信級(jí)別和電力使用。這些統(tǒng)計(jì)量還可以包括可能的邏輯目的地和網(wǎng)絡(luò)節(jié)點(diǎn)的大 小。還可以收集每節(jié)點(diǎn)的統(tǒng)計(jì)量,諸如例如消息大小和消息計(jì)數(shù)的累積。通過該統(tǒng)計(jì)信息, 在330處可以再次做出是否已經(jīng)從庫(kù)接收到消息的確定。
      [0036] 如果尚未從低級(jí)別通信庫(kù)接收到消息,則在336處做出是否已經(jīng)達(dá)到時(shí)期的末尾 的確定。監(jiān)視過程可以工作在基于時(shí)間的"時(shí)期"中,該"時(shí)期"的持續(xù)時(shí)間可以是從總體 網(wǎng)絡(luò)拓?fù)涞奶匦院筒⑿袘?yīng)用的規(guī)律性特性啟發(fā)式地估計(jì)的。例如,相比于較小網(wǎng)絡(luò),較大網(wǎng) 絡(luò)可能需要更長(zhǎng)的時(shí)間以通過交換機(jī)的管理邊信道來傳送改變。相比于較小網(wǎng)絡(luò),這可能 導(dǎo)致更長(zhǎng)的時(shí)期。相比于較大網(wǎng)絡(luò)而言,較小網(wǎng)絡(luò)可以更迅速地反應(yīng),且可以允許網(wǎng)絡(luò)參數(shù) 和路由的更快重新調(diào)整。
      [0037] 可以基于所收集的統(tǒng)計(jì)量針對(duì)多個(gè)時(shí)期確定網(wǎng)絡(luò)優(yōu)化架構(gòu),并且可以基于統(tǒng)計(jì)量 來周期性地修訂這些架構(gòu)??梢杂?jì)算架構(gòu)之間的性能差異,并且這可以與閾值性能差異相 比較?;谠摫容^,可以識(shí)別網(wǎng)絡(luò)通信模式,并且,可以基于該比較來在架構(gòu)內(nèi)分類網(wǎng)絡(luò)鏈 路??梢韵鄳?yīng)地編程這些網(wǎng)絡(luò)鏈路。
      [0038] 在338處,如果尚未達(dá)到時(shí)期的末尾,則對(duì)中間件消息的等待繼續(xù),并且方法326 返回到330以確定是否已經(jīng)接收到中間件消息。
      [0039] 如果時(shí)期的末尾已出現(xiàn),則在334處,可以重新計(jì)算和重新排序DC的矢量。在示 例中,如果差異相對(duì)于先前的時(shí)期矢量超過某個(gè)啟發(fā)式閾值,則重配置階段可以使用DC中 的新節(jié)點(diǎn)集合來再優(yōu)化網(wǎng)絡(luò)參數(shù),類似于初始優(yōu)化階段。在每個(gè)時(shí)期的末尾處,例如,可以 將舊的統(tǒng)計(jì)量保存在時(shí)期歷史矢量中,并且可以將新的統(tǒng)計(jì)量重置成零。該方法可以返回 到確定是否已經(jīng)接收到中間件消息??梢缘貓?zhí)行方法326,包括在運(yùn)行時(shí)期間迭代地修 訂網(wǎng)絡(luò)拓?fù)?例如網(wǎng)絡(luò)通信模式、聯(lián)網(wǎng)組織)。
      [0040] 用于網(wǎng)絡(luò)交換機(jī)和網(wǎng)絡(luò)鏈路的控制機(jī)制可以由交換機(jī)管理器處理。從實(shí)際并行應(yīng) 用的通信路徑可以與交換機(jī)管理器和各個(gè)交換機(jī)對(duì)話。這可以涉及通過諸如傳輸控制協(xié)議 /因特網(wǎng)協(xié)議(TCP/IP)之類的消息傳遞機(jī)制的通信。取決于網(wǎng)絡(luò)拓?fù)洌@些考慮可以用在 建立限定閾值(例如最小值閾值)可能粒度的時(shí)期持續(xù)時(shí)間中,可以以所述閾值可能粒度進(jìn) 行更新。
      [0041] 在示例中,運(yùn)行時(shí)系統(tǒng)可以支持節(jié)點(diǎn)遷移,并且聯(lián)網(wǎng)重配置階段可以觸發(fā)屬于DC 的邏輯節(jié)點(diǎn)到連接至本地交換機(jī)的物理節(jié)點(diǎn)的遷移,使得能夠關(guān)閉交換機(jī)的概率增加。
      [0042] 圖4是根據(jù)本公開的與用于識(shí)別網(wǎng)絡(luò)通信模式的處理資源450-1、450-2…… 450-N通信的計(jì)算機(jī)可讀介質(zhì)446的示例的框圖440。計(jì)算機(jī)可讀介質(zhì)(CRM)446可以與具 有多于或少于450-1、450-2……450-N的處理器資源的計(jì)算設(shè)備448通信,計(jì)算設(shè)備448可 以與存儲(chǔ)用于識(shí)別網(wǎng)絡(luò)通信模式的處理器資源450-U450-2……450-N中的一個(gè)或多個(gè)可 執(zhí)行的計(jì)算機(jī)可讀指令集444的有形非瞬變CRM 446通信和/或?qū)ζ溥M(jìn)行接收。計(jì)算設(shè)備 448可以包括存儲(chǔ)器資源452,并且處理器資源450-1、450-2……450-N可以耦合到存儲(chǔ)器 資源452。
      [0043] 處理器資源可以執(zhí)行計(jì)算機(jī)可讀指令444以用于更新用于服務(wù)測(cè)試的WSDL,且被 存儲(chǔ)在內(nèi)部或外部非瞬變CRM 446上。如本文所使用的,非瞬變CRM (例如CRM 446)可以 包括易失性和/或非易失性存儲(chǔ)器。易失性存儲(chǔ)器可以包括取決于電力來存儲(chǔ)信息的存儲(chǔ) 器,諸如除了其它之外的各種類型的動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)。非易失性存儲(chǔ)器可以包 括不取決于電力來存儲(chǔ)信息的存儲(chǔ)器。非易失性存儲(chǔ)器的示例可以包括固態(tài)介質(zhì),諸如閃 速存儲(chǔ)器、EEPROM、相變隨機(jī)存取存儲(chǔ)器(PCRAM)、諸如硬盤、磁帶驅(qū)動(dòng)器、軟盤和/或磁帶 存儲(chǔ)器之類的磁存儲(chǔ)器、光盤、數(shù)字多功能盤(DVD)、藍(lán)光盤(BD)、壓縮盤(⑶)和/或固態(tài)驅(qū) 動(dòng)器(SSD)、閃速存儲(chǔ)器等,以及其它類型的CRM。
      [0044] 非瞬變CRM 446可以作為計(jì)算設(shè)備(例如計(jì)算設(shè)備448)的組成部分,或者以有線 或無線的方式通信耦合到計(jì)算設(shè)備(例如計(jì)算設(shè)備448)。例如,非瞬變CRM 446可以是內(nèi)部 存儲(chǔ)器、便攜式存儲(chǔ)器、便攜式盤或位于另一計(jì)算資源內(nèi)部的存儲(chǔ)器(例如使得計(jì)算機(jī)可讀 指令444能夠通過因特網(wǎng)而被下載)。
      [0045] CRM 446可以經(jīng)由通信路徑442與處理器資源450-U450-2……450-N通信。通信 路徑442可以對(duì)與處理器資源450-1、450-2……450-N相關(guān)聯(lián)的機(jī)器來說本地或遠(yuǎn)程。本 地通信路徑442的示例可以包括諸如計(jì)算機(jī)之類的機(jī)器內(nèi)部的電子總線,其中CRM 446是 經(jīng)由電子總線與處理器資源450-U450-2……450-N通信的易失性、非易失性、固定和/或 可移除存儲(chǔ)介質(zhì)中的一個(gè)。除其它類型的電子總線及其變型外,這樣的電子總線的示例可 以包括工業(yè)標(biāo)準(zhǔn)架構(gòu)(ISA)、外圍組件互連(PCI)、高級(jí)技術(shù)附件(ΑΤΑ)、小型計(jì)算機(jī)系統(tǒng)接 口(SCSI)、通用串行總線(USB)。
      [0046] 通信路徑442可以使得CRM 446遠(yuǎn)離處理器資源(例如處理器資源450-1、 450-2......450-N),諸如在CRM 446和處理器資源450-1、450-2......450-N之間的網(wǎng)絡(luò)連接 的示例中。即,通信路徑442可以是網(wǎng)絡(luò)連接。除了其它之外,這樣的網(wǎng)絡(luò)連接的示例可以 包括局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)、個(gè)域網(wǎng)(PAN)和因特網(wǎng)。在這樣的示例中,CRM 446可以 與第一計(jì)算設(shè)備相關(guān)聯(lián),并且處理器資源450-U450-2……450-N可以與第二計(jì)算設(shè)備相關(guān) 聯(lián)。
      [0047] 在多個(gè)實(shí)施例中,非瞬變CRM可以存儲(chǔ)指令集,計(jì)算機(jī)可執(zhí)行該指令集以使計(jì)算 機(jī)在編譯時(shí)期間分析MPI程序并基于該分析針對(duì)網(wǎng)絡(luò)中的多個(gè)節(jié)點(diǎn)中的每一個(gè)確定邏輯 目的地的列表。在示例中,MPI程序可以分析MPI程序并在運(yùn)行時(shí)處而不是排他地在編譯 時(shí)處找到通信模式。指令還可以是計(jì)算機(jī)可執(zhí)行的,以使計(jì)算機(jī)基于該多個(gè)節(jié)點(diǎn)之間的多 個(gè)網(wǎng)絡(luò)鏈路中的每一個(gè)的頻率帶寬和數(shù)據(jù)使用來對(duì)列表排序,通過分類該多個(gè)網(wǎng)絡(luò)鏈路中 的每一個(gè)來計(jì)算用于網(wǎng)絡(luò)的聯(lián)網(wǎng)組織,并且將該分類傳送到網(wǎng)絡(luò)交換機(jī)。
      [0048] 耦合到存儲(chǔ)器452的處理器資源450-1、450-2……450-N可以在時(shí)期(例如基于時(shí) 間的和/或基于網(wǎng)絡(luò)事件的時(shí)期)中監(jiān)視在運(yùn)行時(shí)期間中間件通信庫(kù)(例如MPI庫(kù))內(nèi)的網(wǎng) 絡(luò)性能,并基于該監(jiān)視來收集關(guān)于網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)的多個(gè)統(tǒng)計(jì)量。耦合到存儲(chǔ)器452的處理 器資源450-U450-2……450-N可以基于統(tǒng)計(jì)量來確定第一時(shí)期內(nèi)的第一網(wǎng)絡(luò)優(yōu)化架構(gòu)和 第二時(shí)期內(nèi)的第二網(wǎng)絡(luò)優(yōu)化架構(gòu)并基于統(tǒng)計(jì)量來周期性地修訂第一和第二架構(gòu)。
      [0049] 耦合到存儲(chǔ)器452的處理器資源450-1、450-2……450-N可以計(jì)算第一架構(gòu)和第 二架構(gòu)之間的性能差異并將性能差異與閾值相比較,基于該比較來識(shí)別通信模式以分類第 一和第二架構(gòu)內(nèi)的網(wǎng)絡(luò)鏈路,并且基于該分類來編程網(wǎng)絡(luò)鏈路。
      [0050] 在本公開的一些示例中,耦合到存儲(chǔ)器452的處理器資源450-1、450-2……450-N 可以在編譯時(shí)期間分析消息傳遞接口(MPI)程序并且基于該分析針對(duì)網(wǎng)絡(luò)中的多個(gè)節(jié)點(diǎn)中 的每一個(gè)確定邏輯目的地的列表。耦合到存儲(chǔ)器452的處理器資源450-1、450-2……450-N 可以基于該多個(gè)節(jié)點(diǎn)之間的多個(gè)網(wǎng)絡(luò)鏈路中的每一個(gè)的頻率帶寬和數(shù)據(jù)使用來排序列表, 通過分類該多個(gè)網(wǎng)絡(luò)鏈路中的每一個(gè)來計(jì)算用于網(wǎng)絡(luò)的聯(lián)網(wǎng)組織,并將該分類傳送到網(wǎng)絡(luò) 交換機(jī)。
      [0051] 以上說明書、示例和數(shù)據(jù)提供了方法和應(yīng)用的描述以及本公開的系統(tǒng)和方法的使 用。由于可以在不脫離本公開的系統(tǒng)和方法的精神和范圍的情況下做出許多示例,因此本 說明書僅僅陳述了許多可能的示例配置和實(shí)現(xiàn)中的一些。
      [0052] 盡管已經(jīng)在本文中圖示和描述了特定示例,但是被計(jì)算以實(shí)現(xiàn)相同結(jié)果的布置可 以替代所示出的特定示例。本公開旨在覆蓋本公開的一個(gè)或多個(gè)示例的改編或變型。要理 解到,已經(jīng)以說明性的方式而非限制性的方式進(jìn)行以上描述。在回顧了以上描述后,以上示 例和未在本文中具體描述的其它示例的組合對(duì)本領(lǐng)域技術(shù)人員來說將是顯而易見的。本公 開的一個(gè)或多個(gè)示例的范圍包括其中使用以上結(jié)構(gòu)和方法的其它應(yīng)用。因此,應(yīng)當(dāng)參照所 附權(quán)利要求連同這樣的權(quán)利要求被賦予的等同物的全部范圍來確定本公開的一個(gè)或多個(gè) 示例的范圍。
      【權(quán)利要求】
      1. 一種用于識(shí)別網(wǎng)絡(luò)通信模式的計(jì)算機(jī)實(shí)現(xiàn)方法,包括: 分析網(wǎng)絡(luò)的分布式計(jì)算機(jī)程序(102); 基于該分析來估計(jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)(104); 將虛擬網(wǎng)絡(luò)通信業(yè)務(wù)映射到物理網(wǎng)絡(luò)鏈路(106); 識(shí)別網(wǎng)絡(luò)通信模式并且基于所映射的通信業(yè)務(wù)的所估計(jì)的通信強(qiáng)度和該網(wǎng)絡(luò)通信模 式來分類物理通信網(wǎng)絡(luò)鏈路(108);以及 基于該分類來優(yōu)化網(wǎng)絡(luò)所使用的能量(110)。
      2. 權(quán)利要求1的方法,還包括:使用邊信道網(wǎng)絡(luò)管理消息將網(wǎng)絡(luò)通信模式傳送到多個(gè) 網(wǎng)絡(luò)交換機(jī)并且重編程該多個(gè)交換機(jī)中的通信路由(108)。
      3. 權(quán)利要求1的方法,其中分類物理通信網(wǎng)絡(luò)鏈路包括:將物理通信網(wǎng)絡(luò)鏈路分類為 始終開啟網(wǎng)絡(luò)鏈路(108)。
      4. 權(quán)利要求1的方法,其中分類物理通信網(wǎng)絡(luò)鏈路包括:將物理通信網(wǎng)絡(luò)鏈路分類為 始終關(guān)閉網(wǎng)絡(luò)鏈路,其路由能夠在網(wǎng)絡(luò)的受換機(jī)內(nèi)被關(guān)閉(108)。
      5. 權(quán)利要求1的方法,其中分類物理通信網(wǎng)絡(luò)鏈路包括:將物理通信網(wǎng)絡(luò)鏈路分類為 備用網(wǎng)絡(luò)鏈路,其電力管理受特定網(wǎng)絡(luò)鏈路實(shí)現(xiàn)控制(108)。
      6. 權(quán)利要求1的方法,其中估計(jì)虛擬網(wǎng)絡(luò)通信業(yè)務(wù)包括:基于運(yùn)行時(shí)采樣、分布式計(jì)算 機(jī)程序的應(yīng)用的完整運(yùn)行和編譯時(shí)估計(jì)中的至少一個(gè)來估計(jì)業(yè)務(wù)(104)。
      7. -種用于識(shí)別網(wǎng)絡(luò)通信模式的計(jì)算系統(tǒng)(440),包括: 存儲(chǔ)器資源(452);和 耦合到存儲(chǔ)器資源的處理器資源(450),其用于: 在時(shí)期中監(jiān)視在運(yùn)行時(shí)期間中間件通信庫(kù)內(nèi)的網(wǎng)絡(luò)性能(328、336); 基于該監(jiān)視來收集關(guān)于網(wǎng)絡(luò)內(nèi)的節(jié)點(diǎn)的多個(gè)統(tǒng)計(jì)量(332); 基于統(tǒng)計(jì)量來確定第一時(shí)期內(nèi)的第一網(wǎng)絡(luò)優(yōu)化架構(gòu)和第二時(shí)期內(nèi)的第二網(wǎng)絡(luò)優(yōu)化架 構(gòu)(326); 基于統(tǒng)計(jì)量來周期性地修訂第一和第二架構(gòu)(326); 計(jì)算第一架構(gòu)和第二架構(gòu)之間的性能差異并且將性能差異與閾值進(jìn)行比較(326); 基于該比較來識(shí)別網(wǎng)絡(luò)通信模式以分類第一和第二架構(gòu)內(nèi)的網(wǎng)絡(luò)鏈路(326);以及 基于該分類來編程網(wǎng)絡(luò)鏈路(326)。
      8. 權(quán)利要求7的系統(tǒng),其中處理器資源還耦合到存儲(chǔ)器資源(450),以基于總體網(wǎng)絡(luò)拓 撲的特性來確定第一和第二時(shí)期的持續(xù)時(shí)間(326)。
      9. 權(quán)利要求7的系統(tǒng),其中處理器資源還耦合到存儲(chǔ)器資源(450),以將網(wǎng)絡(luò)鏈路編程 為處于最快網(wǎng)絡(luò)模式中(1〇8、326)。
      10. 權(quán)利要求7的系統(tǒng),其中處理器資源還耦合到存儲(chǔ)器資源(450),以將網(wǎng)絡(luò)鏈路編 程為通過重編程交換機(jī)路由表而關(guān)閉(11〇、326)。
      11. 權(quán)利要求7的系統(tǒng),其中處理器資源還耦合到存儲(chǔ)器資源(450),以將網(wǎng)絡(luò)鏈路編 程為能夠通過動(dòng)態(tài)鏈路級(jí)機(jī)制而控制(108、326)。
      12. -種存儲(chǔ)指令集的非瞬變計(jì)算機(jī)可讀介質(zhì),計(jì)算機(jī)(440、446、444、448)能夠執(zhí)行 所述指令集以使所述計(jì)算機(jī)執(zhí)行以下操作 : 在編譯時(shí)期間分析消息傳遞接口(MPI)程序(212、214、216); 基于該分析針對(duì)網(wǎng)絡(luò)中的多個(gè)節(jié)點(diǎn)中的每一個(gè)確定邏輯目的地的列表(216、218); 基于該多個(gè)節(jié)點(diǎn)之間的多個(gè)網(wǎng)絡(luò)鏈路中的每一個(gè)的頻率帶寬和數(shù)據(jù)使用來對(duì)列表進(jìn) 行排序(216、218); 通過分類該多個(gè)網(wǎng)絡(luò)鏈路中的每一個(gè)來計(jì)算用于網(wǎng)絡(luò)的聯(lián)網(wǎng)組織(220、222);以及 將該分類傳送到網(wǎng)絡(luò)交換機(jī)(212、222)。
      13. 權(quán)利要求12的非瞬變計(jì)算機(jī)可讀介質(zhì)(446),還包括能夠執(zhí)行以基于該分類來編 程網(wǎng)絡(luò)交換機(jī)(1〇8、212)的指令。
      14. 權(quán)利要求12的非瞬變計(jì)算機(jī)可讀介質(zhì)(446),還包括能夠執(zhí)行以關(guān)閉多維陣列中 的多個(gè)網(wǎng)絡(luò)鏈路的一部分(222)的指令。
      15. 權(quán)利要求12的非瞬變計(jì)算機(jī)可讀介質(zhì)(446),還包括能夠執(zhí)行以在運(yùn)行時(shí)期間迭 代地修訂網(wǎng)絡(luò)拓?fù)洌?26)的指令。
      【文檔編號(hào)】H04L12/26GK104067560SQ201280068655
      【公開日】2014年9月24日 申請(qǐng)日期:2012年4月24日 優(yōu)先權(quán)日:2012年4月24日
      【發(fā)明者】P.法拉博施, M.麥克拉倫, D.S.米羅吉奇奇, R.施雷貝爾 申請(qǐng)人:惠普發(fā)展公司,有限責(zé)任合伙企業(yè)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1