不同浮點格式的浮點加法的制作方法

文檔序號：6570676閱讀：250來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：不同浮點格式的浮點加法的制作方法
技術(shù)領(lǐng)域：
一般來說，本公開涉及電子領(lǐng)域。更具體來說，本發(fā)明的一個實施例涉及用于在計算機系統(tǒng)中執(zhí)行浮點加法的技術(shù)。
背景技術(shù)：
在對實數(shù)執(zhí)行算術(shù)運算時，數(shù)值的浮點表示可用來提供效率。根據(jù)精度要求，可利用不同的浮點表示格式。例如，可將實數(shù)表示為單精度浮點數(shù)、雙精度浮點數(shù)或擴展雙精度浮點數(shù)。為了提高計算效率，一些處理器或計算機系統(tǒng)可包括一個以上浮點加法器以便對具有不同浮點格式的數(shù)值進行運算。具有用于不同浮點格式的不同浮點加法器會導(dǎo)致在處理器上耗用更多管芯面積以及附加功率。

參照附圖來提供詳細描述。附圖中，附圖標(biāo)記最左邊的數(shù)字標(biāo)識首次出現(xiàn)該附圖標(biāo)記的附圖。不同附圖中使用相同的附圖標(biāo)記來表示相似或相同的項。
圖1、圖8和圖9示出可用來實現(xiàn)本文論述的各種實施例的計算
系統(tǒng)的實施例的框圖。
圖2示出根據(jù)本發(fā)明的一個實施例的處理器核的部分的框圖。圖3a-b和圖4示出根據(jù)本發(fā)明的各種實施例的浮點加法器的部分
的框圖。
圖5和圖6示出根據(jù)本發(fā)明的各種實施例的操作數(shù)格式。
圖7示出根據(jù)本發(fā)明的一個實施例的方法的一個實施例的流程圖。
具體實施例方式
在以下描述中，闡明大量具體細節(jié)，以便提供對各種實施例的透徹了解。但是，即使沒有這些具體細節(jié)，也可實施一些實施例。在其它情況下，沒有詳細描述眾所周知的方法、過程、組件和電路，以免影響對具體實施例的理解?？墒褂弥T如集成半導(dǎo)體電路("硬件")、組織成一個或多個程序的計算機可讀指令("軟件")或者硬件和軟件
開的目的，提到"邏輯，，時應(yīng)表示硬件、軟件或者它們的某種組合。
本文論述的一些實施例可提供用于將浮點數(shù)相加的有效機制。在一個實施例中，加法和/或減法可使用相同的邏輯。例如，相反符號的浮點數(shù)的加法可對應(yīng)于減法運算。另外，在一個實施例中，用不同的浮點表示格式表示的浮點數(shù)(例如，單精度、雙精度和/或擴展雙精度浮點數(shù))的加法(和/或減法)可使用相同的浮點加法器邏輯。此外，這樣一
種浮點加法器可在處理器核(例如，參照圖1-9論述的處理器核)中使用。更具體來說，圖1示出根據(jù)本發(fā)明的一個實施例的計算系統(tǒng)100 的框圖。系統(tǒng)100可包括一個或多個處理器102-1至102-N(本文中一般稱作"處理器102")。處理器102可經(jīng)由互連或總線104進行通信。每個處理器都可包括各種組件，為了清楚起見，僅參照處理器102-1 來論述其中一些組件。因此，其余每個處理器102-2至102-N可包括與參照處理器102-1論述的組件相同或相似的組件。
在一個實施例中，處理器102-1可包括一個或多個處理器核106-1 至106-M(本文中稱作"核106")、高速緩存108(在各種實施例中，它可以是共享高速緩存或?qū)Ｓ酶咚倬彺?和/或路由器110。處理器核106 可在單個集成電路(IC)芯片上實現(xiàn)。另外，該芯片可包括一個或多個共享和/或?qū)Ｓ酶咚倬彺?例如高速緩存108)、總線或互連(例如總線或互連112)、存儲器控制器(例如，參照圖8和圖9論述的存儲器控制器) 或其它組件。在一個實施例中，路由器110可用于在處理器102-1和/或系統(tǒng)100 的各個組件之間進行通信。另外，處理器102-1可包括一個以上路由器110。另外，這些路由器(110)可進行通信，以便使得能夠在處理器 102-1的內(nèi)部或外部的各個組件之間路由數(shù)據(jù)。
高速緩存108可存儲供處理器102-1的一個或多個組件(如核106) 使用的數(shù)據(jù)(例如，包括指令)。例如，高速緩存108可本地緩存存儲在存儲器114中的數(shù)據(jù)，以便由處理器102的組件進行更快速的訪問。如圖1所示，存儲器114可經(jīng)由互連104與處理器102進行通信。在一個實施例中，高速緩存108(可以#皮共享)可包括中間級高速》爰存和/ 或最后一級高速緩存(LLC)。并且，每個核106還可包括1級(L1)高速緩存(116-1)(本文中一般稱作"L1高速緩存116")。處理器102-1的各個組件可直接、或通過總線(例如總線112)和/或存儲器控制器或集線器來與高速緩存108進行通信。
圖2示出根據(jù)本發(fā)明的一個實施例的處理器核106的部分的框圖。在一個實施例中，圖2中示出的箭頭說明指令在核106中的流向。一個或多個處理器核(例如處理器核106)可在單個集成電路芯片(或管芯) 上實現(xiàn)，例如參照圖1所論述的。另外，該芯片可包括一個或多個共享和/或?qū)Ｓ酶咚倬彺?例如，圖1中的高速緩存108)、互連(例如，圖 1中的互連104和/或112)、存儲器控制器或其它組件。
如圖2所示，處理器核106可包括用于提取指令以供核106執(zhí)行的提取單元202?？蓮闹T如存儲器114和/或參照圖8和圖9論述的存儲器裝置的任何存儲裝置中提取指令。核106還可包括用于對所提取的指令進行解碼的解碼單元204。例如，解碼單元204可將提取的指令解碼為多個pop(微操作)。此外，核106可包括調(diào)度單元206。調(diào)度單元206可執(zhí)行與存儲解碼指令(例如，從解碼單元204接收的指令) 關(guān)聯(lián)的各種操作，直到指令準(zhǔn)備好用于分發(fā)為止，例如直到解碼指令的所有源值變?yōu)榭捎脼橹?。在一個實施例中，調(diào)度單元206可向執(zhí)行單元208調(diào)度和/或發(fā)出(或分發(fā))解碼指令以用于執(zhí)行。執(zhí)行單元208可在指令被解碼(例如，由解碼單元204解碼)和分發(fā)(例如，由調(diào)度單元206分發(fā))之后執(zhí)行分發(fā)的指令。在一個實施例中，執(zhí)行單元208可包括一個以上執(zhí)行單元，例如存儲器執(zhí)行單元、整數(shù)執(zhí)行單元、浮點執(zhí)行單元或其它執(zhí)行單元。執(zhí)行單元208還可寺丸行各種算術(shù)運算，例如加法、減法、乘法和/或除法，并且可包括一個或多個算術(shù)邏輯單元 (ALU)。在一個實施例中，協(xié)處理器(未示出)可結(jié)合執(zhí)行單元208來執(zhí) 行各種算術(shù)運算。
如圖2所示，執(zhí)行單元208可包括浮點(FP)加法器209，用于對可用不同的浮點表示格式表示的浮點數(shù)執(zhí)行加法、減法、比較和/或才各式轉(zhuǎn)換。在一個實施例中，相加和/或相減的浮點數(shù)可具有任何格式，例如包括單精度、雙精度和/或擴展雙精度浮點數(shù)格式(例如，參照圖5 和圖6論述的格式)。在一個實施例中，加法器209可響應(yīng)單指令多數(shù) 據(jù)(SIMD)指令而進行操作。一般來說，SIMD指令可導(dǎo)致同時(例如，并行地)對多個數(shù)據(jù)片段執(zhí)行相同操作。另外，根據(jù)至少一個指令集架構(gòu)，SIMD指令可對應(yīng)于SIMD流技術(shù)擴展(SSE)或其它形式的SIMD 流技術(shù)實現(xiàn)(例如，SIMD流技術(shù)擴展2(SSE2))。本文將參照例如圖3-7 進一步論迷與加法器209的各種實施例有關(guān)的其它細節(jié)。而且，執(zhí)行單元208可包括一個以上浮點加法器209。另外，^L行單元208可無序地執(zhí)行指令。因此，在一個實施例中，處理器核106可以是無序處理器核。核106還可包括引退(retirement)單元210。引退單元210可在提交執(zhí)行指令之后引退執(zhí)行指令。在一個實施例中，執(zhí)行指令的引退可導(dǎo)致從指令的執(zhí)行中提交處理器狀態(tài)、解除對指令所用的物理寄存器的分配等。
此外，核106還可包括跟蹤高速緩存或微代碼只讀存儲器 OROM)212,它用于存儲所提取(例如由提取單元202提取)的指令的微代碼和/或蹤跡。存儲在pROM212中的微代碼可用來配置核106的各種硬件組件。在一個實施例中，可從與處理器核106通信的另一個組件(例如，參照圖8和圖9論述的計算機可讀介質(zhì)或其它存儲裝置)中加載存儲在[iROM 212中的微代碼。核106還可包括總線單元220，它用于使得能夠經(jīng)由一條或多條總線(例如，總線104和/或112)而在處理器核106的組件與其它組件(例如，參照圖1論述的組件)之間進4亍通信。核106還可包括一個或多個寄存器222，用于存儲供核106的各個組件訪問的數(shù)據(jù)。
圖3a-b示出根據(jù)本發(fā)明的一個實施例的浮點加法器(209)的各部分的框圖。圖3a-b中的浮點加法器209可以與參照圖2論述的浮點加法器209相同或相似。根據(jù)本發(fā)明的一個實施例，加法器209的各種信號通路的寬度如圖3a-b所示。而且，如圖3a-b所示，加法器209可包括指數(shù)Cexponent)通路302和尾數(shù)通路304，用于執(zhí)行與兩個操作數(shù) 306和308的加法(或減法)對應(yīng)的各種運算。
如圖3a-b所示，加法器209可包括包咱"寸齊部分305在內(nèi)的多個部分。對齊部分305可包括操作數(shù)格式轉(zhuǎn)換邏輯310，用于例如將操作數(shù)306和308中的一個或多個操作數(shù)從第一才各式(例如，如圖5所示的格式)修改為第二格式(例如，如圖6所示的格式)。指數(shù)通路302可接收與算術(shù)運算(例如，加法或減法)對應(yīng)的操作碼312。邏輯314可確定(例如，從包含預(yù)定義數(shù)據(jù)的表或存儲單元中查找)與轉(zhuǎn)換指令的操作碼312對應(yīng)的指數(shù)。一般來說，轉(zhuǎn)換指令可對單個操作數(shù)(例如操作數(shù)308)進行運算，而向另一個操作數(shù)(例如操作數(shù)306)提供零值。因此，在一個實施例中，來自邏輯314的預(yù)定義指數(shù)可用來計算所得指數(shù)，并在需要時對齊數(shù)據(jù)，這將參照圖3a-b進一步論述。為此，復(fù)用器316 可接收和選擇來自邏輯314的指數(shù)之一以及與操作數(shù)之一(例如操作數(shù) 306)對應(yīng)的指數(shù)。在一個實施例中，復(fù)用器316可根據(jù)操作碼312來選擇它的輸入之一。指數(shù)差邏輯318可接收和比較來自復(fù)用器316的所選指數(shù)以及與操作數(shù)308對應(yīng)的指數(shù)。邏輯318可根據(jù)比較(在一個實施例中，可以是一個或多個減法運算)的結(jié)果來生成一個或多個信號，并將生成的信號(例如，減法結(jié)果和進位輸出)提供給加法器209 的各個組件，以便例如提供尾數(shù)對齊，例如參照圖3a-b所述和所示。尾數(shù)通路304可包括邏輯320和322,它們用于從邏輯310 4妄收格式轉(zhuǎn)換的操作數(shù)，并根據(jù)例如從邏輯318進行的指數(shù)差計算中生成的進位輸出信號來交換尾數(shù)(或提取尾數(shù)的一部分)。使用旋轉(zhuǎn)器(例如邏輯324和326)和掩碼生成器(例如掩碼生成器336和338)來執(zhí)行與具有較小指數(shù)的操作數(shù)對應(yīng)的尾數(shù)的對齊。在一個實施例中，可使用由邏輯318生成的一個或多個信號來確定移位碼對齊，以便例如使得能夠通過旋轉(zhuǎn)器324和326來將對應(yīng)于具有較小指數(shù)的操作數(shù)的尾數(shù)向右循環(huán)移位。而且，在一個實施例中，邏輯318向邏輯324和326提供的移位碼信號可以是五位寬。對于雙精度和擴展雙精度操作數(shù)，在一個實施例中，提供給邏輯324和326的移位碼(和/或進位輸出)信號可以相同。另外，邏輯320和322可向反相器328和330以及復(fù)用器 332和334提供具有較大指數(shù)的操作數(shù)306和308的尾數(shù)。另外，掩碼生成器336和338可根據(jù)來自邏輯318的移位碼信號來生成掩碼，以便使得能夠?qū)⑦壿?24和326的輸出移動一個或多個位。
如圖3a-b所示，邏輯324和326的輸出可分別通過邏輯340和342 向左移一個位。具體來說，操作數(shù)分析器344可分析操作數(shù)306和308, 并且如果操作數(shù)之一是不規(guī)則的，則生成一個或多個信號以便使得能夠在邏輯340和342中移位。邏輯346在邏輯上組合(例如，通過使用 "與，，運算)掩碼生成器336和邏輯340的輸出。類似地，邏輯348在邏輯上組合(例如，通過使用"與"運算)掩碼生成器338和邏輯342 的輸出。復(fù)用邏輯350接收邏輯346和348的輸出，并向加法器209 的加法部分355中的每個加法器352和354的輸入端之一提供信號。將參照圖4進一步論述與邏輯346、 348和350的一個實施例有關(guān)的其它細節(jié)。
如圖3a-b所示，加法器352和354還可從復(fù)用器332和334接收輸入信號。復(fù)用器332和334可根據(jù)基于操作碼(312)和操作數(shù)(例如，操作數(shù)306和308)的符號生成的信號356(Compl一Hi)和358(Compl—Lo) 來選擇它們的輸入之一，以便由操作碼解碼器邏輯(未示出)來提供(真正的)減法(例如，相同符號的操作數(shù)的減法或者不同符號的操作數(shù)的加法)或(真正的)加法(例如，不同符號的操作數(shù)的減法或者相同符號的
操作數(shù)的加法)運算。因此，加法器352和354可分別通過例如復(fù)用器 332和334來接收對齊和非對齊的尾數(shù)，而復(fù)用器332和334又可提供通過邏輯320和322選擇的非反相或反相(例如通過反相器328和 330反相)的尾數(shù)。加法器352和354還接收進位輸入(cany in)信號。例如，加法器354接收信號358作為進位輸入信號，以便例如為真正的減法情況提供全二的補碼。加法器352接收通過復(fù)用器362根據(jù)操作碼312的精度格式提供的來自加法器354的進位輸出(cany out)信號 360或信號356作為其進位輸入信號。將加法器352和354的輸出提供給反相器364和366以及復(fù)用器368和370。復(fù)用器368和370可分別根據(jù)由加法器352和復(fù)用器371生成的選擇信號來選擇它們的輸入信號之一作為輸出。在一個實施例中，由于對于真正的減法情況，
可對具有較大或相等指數(shù)的操作數(shù)的尾數(shù)進行二的補碼，所以加法的結(jié)果可以為負，并且可進行二的補碼?？赏ㄟ^反演加法器352和354 的結(jié)果，并使用舍入器硬件(例如邏輯397)將二進制一("1")相加，來才丸4亍二的補碼(two，s complementing)。由于例如力口法器209可支持漸進下溢，所以加法部分355的指數(shù)通路302還可包括用于生成歸一化用的限制器移位值的邏輯372。
將復(fù)用器368和370以及邏輯372的輸出提供給(加法器209的) 歸一化部分373,它包括前導(dǎo)零檢測(LZD)邏輯374和376。更具體來說，通過例如檢測由加法器352和354通過復(fù)用器368和370提供的加法結(jié)果中的前導(dǎo)零，邏輯374和376可確定用于歸一化的移位碼。可將來自邏輯374和376的輸出信號連同來自復(fù)用器368和370的輸出信號一起提供給邏輯378和380。邏輯378和380可根據(jù)邏輯374 和376的輸出來執(zhí)行向左循環(huán)移位，以便提供對加法結(jié)果的歸一化。如圖3a-b所示，可將邏輯374和376的輸出提供給指數(shù)調(diào)節(jié)邏輯382 以及掩碼生成器384和386。掩碼生成器384和386可根據(jù)來自邏輯374和376的移位碼信號來生成掩碼，以便使得能夠分別通過邏輯388 和390來對邏輯378和380的輸出進行歸一化(normalization)。在一個實施例中，邏輯388和390可在邏輯上組合它們的輸入(例如，通過利用邏輯"與"運算)，例如參照邏輯346和348所論述的?？赏ㄟ^復(fù)用邏輯392(例如，在一個實施例中參照邏輯350所論述的)來選擇來自邏輯388和390的輸出信號，以便將輸出提供給加法器209的舍入部分 393。根據(jù)一個實施例，邏輯392可向舍入部分393提供保護位和/或舍入位。
在一個實施例中，在加法器209的加法部分355中，通過例如在邏輯上組合(例如，通過邏輯"或"運算)由邏輯346和348提供的移位輸出位，邏輯394和395可計算粘著位(stickybit)，這將參照圖4進一步進行^侖述。而邏輯396又可組合邏輯394和395的輸出，以便為兩個單精度操作數(shù)提供兩個粘著位以及為雙精度和擴展雙精度操作數(shù)提供單個粘著位。將來自邏輯396和392的輸出信號提供給舍入器邏輯 397，以便對尾數(shù)的加法(或減法)執(zhí)行舍入。此外，邏輯398可接收來自邏輯382的指數(shù)，并且通過例如在發(fā)生上舍入時添加一來修改(或固定)上舍入情況的指數(shù)。另外，邏輯382可根據(jù)歸一化用的移位碼(例如，由邏輯374和376提供)來調(diào)節(jié)指數(shù)(例如，從邏輯318接收的)。在一個實施例中，邏輯382可將由邏輯318提供的較大指數(shù)減去從邏輯374 和376接收的移位碼。因此，在一個實施例中，可對于歸一化(例如，通過邏輯382)和上舍入(round up)情況(例如，通過邏輯398)來校正由邏輯318提供的較大指數(shù)。
在一個實施例中(例如，如圖3a-b所示)，尾數(shù)通路304可包括兩個獨立通路，用于處理操作數(shù)306和308的最高有效(MS)32位和最低有效(LS)36位。例如，第一MS32位通路(例如，包括邏輯320、 324、 352和/或378)可對第一組數(shù)據(jù)(例如，一對單精度浮點尾數(shù)，例如參照圖6中的操作數(shù)602所論述)進行操作，而第二 LS 36位通路(例如，包括邏輯322、 326、 354和/或380)可對第二組數(shù)據(jù)(可以是一對不同的單精度浮點尾數(shù))進行操作。因此，可在這兩個通路中單獨處理兩^"單精度尾數(shù)。并且，可使用第一和笫二通路的組合來對雙精度或擴展雙
精度操作數(shù)(例如，圖6中的操作數(shù)630和/或650)進行操作。如圖3a-b 所示，邏輯350和392可實現(xiàn)這兩個尾數(shù)通路之間的信號的組合。
圖4示出根據(jù)本發(fā)明的一個實施例的圖3a-b中的加法器209的各部分的其它細節(jié)的框圖。如圖4所示，可將由邏輯318生成的信號 402-410提供給復(fù)用器412-416。可通過根據(jù)操作碼312的精度格式生成的信號來選擇復(fù)用器412-416的輸入。分別將復(fù)用器412、 414和416 的輸出提供給邏輯320、邏輯336和324、以及邏輯338和326。在各種實施例中，信號402可對應(yīng)于用于在單精度情況對齊MS 32位的移位碼；信號404可對應(yīng)于用于在雙精度或擴展雙精度情況對齊的移位碼；信號406可對應(yīng)于用于在單精度情況對齊LS 36位的移位碼；信號408可對應(yīng)于來自第二對單精度數(shù)據(jù)的指數(shù)差的進位輸出信號；以及信號410可對應(yīng)于來自雙精度或擴展雙精度數(shù)據(jù)的指數(shù)差的進位輸出信號。
如圖4所示，在一個實施例中，邏輯346可包括用于將邏輯340 和336的輸出組合的"與"門424和426。類似地，邏輯348可包括用于將邏輯338和342的輸出組合的"與"門428和430?？蓪㈤T426 和430的輸入之一反演(invert),例如如圖4所示。另外，"或(OR)" 門434可將門426和428的輸出組合(例如，通過在邏輯上對門426和 428的輸出進行"或"運算)。此外，邏輯350可包括復(fù)用器436-440。如圖所示，復(fù)用器436-440的輸入可通過信號442來選擇，信號442 由邏輯(例如，根據(jù)操作碼312的精度格式以及來自圖3中的318的信號)生成以指示如何將對齊的尾數(shù)與來自存儲單元441(在一個實施例中，它可以是硬件寄存器)以及邏輯424、 434和428的信號進行組合。此外，復(fù)用器436-440可接收來自存儲單元441的信號(例如，包含全零)，以便對于指數(shù)差大于32位的情況采用零來填充邏輯350的輸出的前32位，或者對于指數(shù)差大于64位的情況采用零來填充邏輯350的輸出的前64位。邏輯350可釆用68位格式444(在一個實施例中，它包括最高有效(MS)32位部分446、中間32位部分448和最低有效 (LS)4位部分450)來將復(fù)用器436-440的輸出提供給加法器352和354，例如如圖4所示。
在各種實施例中，可按照下列情況中的一種或多種情況來提供各部分446、 448和450:
-如果操作碼312對應(yīng)于單精度格式，并且第二對單精度操作數(shù) (306和308)的指數(shù)差(318)小于24，則可由邏輯424通過邏輯436來提供部分446。類似的情況也可適用于第一對操作數(shù)(306、 308);即，可由邏輯428通過邏輯438來提供部分448。另外，在一個實施例中(例如，參照圖5和圖6所論述)，每個操作數(shù)(306和308)可包括兩個單精度數(shù)(例如，opl={xl,xO}， JLop2={yl, yO}，其中"{}，，表示并置)。在這樣一個實施例中，第一對可對應(yīng)于xO和yO,而第二對可對應(yīng)于 xl和yl;
-如果操作碼312對應(yīng)于雙精度或擴展雙精度格式，并且指數(shù)差 (318)小于32,則可由邏輯424來提供部分446，并且可由邏輯434來提供部分448;
-如果操作碼312對應(yīng)于雙精度或者擴展雙精度格式，并且指數(shù) 差(318)小于64但大于32，則可由存儲單元441來提供部分446，并且可由邏輯424來提供部分448;
-如果操作碼312對應(yīng)于雙精度或擴展雙精度格式，并且指數(shù)差 (318)大于64,則可從存儲單元441來提供部分446,可由存儲單元441 來提供部分448,并且可由邏輯424來提供部分450。
圖5示出#>據(jù)本發(fā)明的一個實施例的圖3a-b中的才喿作數(shù)306和308 的示例操作數(shù)格式500。圖6示出在通過圖3a-b中的邏輯310格式轉(zhuǎn) 換圖5中的操作數(shù)之后、與圖5中的格式500對應(yīng)的格式轉(zhuǎn)換的浮點加法器操作數(shù)格式600。根據(jù)本發(fā)明的一些實施例來說明圖5和圖6 中示出的操作數(shù)的每個字段的寬度。參照圖5,單精度操作數(shù)502(在一個實施例中，它可表示兩個單精度浮點數(shù))可包括符號字段504和506、指數(shù)字段508和510、以及尾數(shù)字段512和514。并且，雙精度操作數(shù)520也可包括符號字段522、指數(shù)字段524和尾數(shù)字段526。另外，擴展雙精度操作數(shù)530可包括符號字段532、指數(shù)字段534、 J字段536(它可指示尾數(shù)是否是歸一化的)和尾數(shù)字段538。一般來說，J位(536)可對應(yīng)于尾數(shù)的整數(shù)部分，它在單精度和雙精度格式中可隱藏。另外，對于不規(guī)則數(shù)，可將J位設(shè)置為零。
參照圖6,單精度操作數(shù)602可包括符號字段604(它可對應(yīng)于符號字段504)、指數(shù)字段606和608(在一個實施例中，它們可對應(yīng)于字段508和510)、零字段610(它可對應(yīng)于符號字段506)、上溢字段612 和614(例如，指示加法器209的通路中的上溢條件)、J字段616和 618(例如，指示對應(yīng)浮點數(shù)是規(guī)則的)、以及尾數(shù)字段620和622(在一個實施例中，它們可對應(yīng)于字段512和514)。并且，雙精度操作數(shù)630 可包括符號字段632(在一個實施例中，它可對應(yīng)于字段522)、指數(shù)字段634(在一個實施例中，它可對應(yīng)于字段524)、上溢字段636(例如，指示上溢條件)、J字段638(例如，指示對應(yīng)浮點數(shù)是規(guī)則的)、以及尾數(shù)字段640(在一個實施例中，它可對應(yīng)于字段526)。另外，擴展雙精度操作數(shù)650可包括符號字段652(在一個實施例中，它可對應(yīng)于字段 532)、指數(shù)字段654(在一個實施例中，它可對應(yīng)于字段534)、上溢字段656(例如，指示上溢條件)、J字段658(例如，指示對應(yīng)浮點數(shù)是規(guī) 則的)、以及尾數(shù)字段660(在一個實施例中，它可對應(yīng)于字段538)。如圖6所示，操作數(shù)602、 630和650的其它字段可以不使用(例如具有全零)。在一個實施例中，邏輯310可分別將操作數(shù)502、 520和530 格式轉(zhuǎn)換為操作數(shù)602、 630和650。
圖7示出根據(jù)本發(fā)明的一個實施例用于將浮點數(shù)相加和/或相減的方法的一個實施例的流程圖。在一個實施例中，可用不同的浮點表示格式來表示相加和/或相減的浮點數(shù)，例如兩個單精度、雙精度和/或擴展雙精度浮點數(shù)(例如，參照圖5和圖6所論述的浮點數(shù))。在一個實施例中，可利用參照圖l-6和圖8-9論述的各種組件來執(zhí)行參照圖7論述的一個或多個操作。例如，方法700可用于將由諸如高速緩存108、高速緩存116、存儲器114和/或寄存器222的存儲單元存儲(和/或從其中讀取)的浮點數(shù)相加和/或相減。
參照圖1-7,在操作702,加法器209可接收操作碼312和操作數(shù) 306-308。在操作704，邏輯310可將操作數(shù)306-308格式轉(zhuǎn)換，例如參照圖3a-b所論述的。在操作706,邏輯318可比較指數(shù)，例如參照圖3a-b所論述的。在操作708,可通過對齊部分305來對齊格式轉(zhuǎn)換后的操作數(shù)的尾數(shù)。在操作710，可將對齊的尾數(shù)進行組合(例如相加或相減)，例如參照圖3a-b中的加法部分355所論述的。在操作712, 可通過歸一化部分373來將加法器209的加法部分355的結(jié)果進行歸一化。然后，在操作714,可通過例如參照圖3a-b論述的舍入部分393 來對來自加法器209的歸一化部分373的結(jié)果進行舍入。
圖8示出根據(jù)本發(fā)明的一個實施例的計算系統(tǒng)800的框圖。計算系統(tǒng)800可包括一個或多個中央處理單元(CPU)802或處理器，它們經(jīng) 由互連網(wǎng)絡(luò)(或總線)804進行通信。處理器802可包括通用處理器、網(wǎng) 絡(luò)處理器(用于處理通過計算機網(wǎng)絡(luò)803傳遞的數(shù)據(jù))或其它類型的處理器(包括精筒指令集計算機(RISC)處理器或復(fù)雜指令集計算機(CISC) 處理器)。另外，處理器802可具有單核或多核設(shè)計。具有多核設(shè)計的處理器802可將不同類型的處理器核集成在同一個集成電路(IC)管芯上。而且，具有多核設(shè)計的處理器802可實現(xiàn)為對稱或不對稱的多處理器。在一個實施例中，其中一個或多個處理器802可以與圖1中的處理器102相同或相似。例如，其中一個或多個處理器802可包括一個或多個核106(例如，包括加法器209)和/或高速緩存108。并且，可由系統(tǒng)800的一個或多個組件來執(zhí)行參照圖l-7論述的操作。
芯片組806也可與互連網(wǎng)絡(luò)804進行通信。芯片組806可包括存儲器控制器集線器(MCH)808。 MCH 808可包括與存儲器114進行通信的存儲器控制器810。存儲器114可存儲數(shù)據(jù)，包括供CPU 802或計算系統(tǒng)800中包含的任何其它裝置執(zhí)行的指令序列。在本發(fā)明的一個實施例中，存儲器114可包括一個或多個易失性存儲(或存儲器)裝置，例如隨機存取存儲器(RAM)、動態(tài)RAM(DRAM)、同步 DRAM(SDRAM)、靜態(tài)RAM(SRAM)或其它類型的存儲裝置。還可使用非易失性存儲器，例如硬盤。附加裝置可經(jīng)由互連網(wǎng)絡(luò)804進行通信，例如多個CPU和/或多個系統(tǒng)存儲器。
MCH 808還可包括與圖形加速器816進行通信的圖形接口 814。在本發(fā)明的一個實施例中，圖形接口 814可經(jīng)由加速圖形端口(AGP) 與圖形加速器816進行通信。在本發(fā)明的一個實施例中，顯示器(例如平板顯示器)可通過例如信號轉(zhuǎn)換器與圖形接口 814進行通信，其中信號轉(zhuǎn)換器用于將存儲在諸如視頻存儲器或系統(tǒng)存儲器的存儲裝置中的圖像的數(shù)字表示轉(zhuǎn)換成可由顯示器解釋和顯示的顯示信號。由顯示裝置產(chǎn)生的顯示信號可經(jīng)過各種控制裝置，然后由顯示器進行解釋并且隨后在顯示器上顯示。
集線器接口 818可允許MCH 808和輸入/輸出控制器集線器 (ICH)820進行通信。ICH 820可提供到與計算系統(tǒng)800進行通信的I/O 裝置的接口。 ICH 820可通過諸如外圍組件互連(PCI)橋、通用串行總線(USB)控制器或其它類型的外圍橋或控制器的外圍橋(或控制器)824 來與總線822進行通信。橋824可提供CPU 802與外圍裝置之間的數(shù) 據(jù)通路?？墒褂闷渌愋偷耐貥恪６?，多條總線可通過例如多個橋或控制器來與ICH 820進行通信。另外，在本發(fā)明的各種實施例中，與ICH 820進行通信的其它外圍設(shè)備可包括集成驅(qū)動電子裝置(IDE)或小型計算機系統(tǒng)接口(SCSI)硬盤驅(qū)動器、USB端口、鍵盤、鼠標(biāo)、并行端口、串行端口、軟盤驅(qū)動器、數(shù)字輸出支持裝置(例如數(shù)字視頻接口(DVI))或其它裝置。
總線822可與音頻裝置826、一個或多個磁盤驅(qū)動器828和網(wǎng)絡(luò) 接口裝置830(它與計算機網(wǎng)絡(luò)803通信)進行通信。其它裝置可經(jīng)由總線822進行通信。而且，在本發(fā)明的一些實施例中，各種組件(例如網(wǎng) 絡(luò)#~口裝置830)也可與MCH 808進行通信。此外，可將處理器802 和MCH808組合以形成單個芯片。另外，在本發(fā)明的其它實施例中，圖形加速器816可包含在MCH808中。
另外，計算系統(tǒng)800可包括易失性和/或非易失性存儲器(或存儲裝置)。例如，非易失性存儲器可包括下列存儲器中的一種或多種存儲器只讀存儲器(ROM),可編程ROM(PROM),可擦除PROM(EPROM), 電EPROM(EEPROM)，磁盤驅(qū)動器(例如828)，軟盤，致密盤 ROM(CD-ROM),數(shù)字多功能盤(DVD)，閃速存儲器，磁-光盤，或者能夠存儲電子數(shù)據(jù)(例如包括指令)的其它類型的非易失性機器可讀介質(zhì)。
圖9示出根據(jù)本發(fā)明的一個實施例按照點對點(PtP)酉己置布置的計算系統(tǒng)900。具體來說，圖9示出其中處理器、存儲器和輸入/輸出裝置通過多個點對點接口互連的系統(tǒng)?？赏ㄟ^系統(tǒng)900的一個或多個組件來執(zhí)行參照圖l-8論述的操作。
如圖9所示，系統(tǒng)900可包括若干個處理器，為了清楚起見，僅示出其中兩個處理器，即處理器902和904。處理器902包括用于實現(xiàn)與存儲器910的通信的本地存儲器控制器集線器(MCH)906，處理器 904包括用于實現(xiàn)與存儲器912的通信的本地存儲器控制器集線器 (MCH)908。存儲器910和/或912可存儲各種數(shù)據(jù)，例如參照圖8中的存儲器114論述的數(shù)據(jù)。
在一個實施例中，處理器902和904可以是參照圖8論述的其中一個處理器802。處理器902和904可分別使用點對點(PtP)接口電路 916和918經(jīng)由PtP接口 914來交換數(shù)據(jù)。并且，處理器902可使用點對點接口電路926、 930經(jīng)由單獨PtP接口 922來與芯片組920交換數(shù) 據(jù)，處理器904可使用點對點接口電路928、 932經(jīng)由單獨PtP接口 924 來與芯片組920交換數(shù)據(jù)。芯片組920還可使用例如PtP接口電路937 經(jīng)由高性能圖形接口 936來與高性能圖形電路934交換數(shù)據(jù)?？稍谔幚砥?02和904中提供本發(fā)明的至少一個實施例。例如，圖1中的一個或多個核106(例如包括加法器209)和/或高速緩存108可設(shè)置在處理器902和904中。但是，本發(fā)明的其它實施例可存在于圖 9的系統(tǒng)900的其它電路、邏輯單元或裝置中。另外，本發(fā)明的其它實施例可分布在若干個如圖9所示的電路、邏輯單元或裝置上。
芯片組920可使用PtP接口電路941來與總線940進行通信?？?線940可具有與其通信的一個或多個裝置，例如總線橋942和I/O裝置943。經(jīng)由總線944，總線橋943可與諸如鍵盤/鼠標(biāo)945、通信裝置 946(例如，調(diào)制解調(diào)器、網(wǎng)絡(luò)接口裝置或可與計算機網(wǎng)絡(luò)803進行通信的其它通信裝置)、音頻I/O裝置和/或數(shù)據(jù)存儲裝置948的其它裝置進行通信。數(shù)據(jù)存儲裝置948可存儲可供處理器902和/或904執(zhí)行的代碼949。
在本發(fā)明的各種實施例中，本文中參照例如圖1-9論述的操作可實現(xiàn)為硬件(例如電路)、軟件、固件、微代碼或者它們的組合，它們可作為計算機程序產(chǎn)品來提供，包括例如其中存儲了用于將計算機編程為執(zhí)行本文論述的過程的指令(或軟件過程)的機器可讀或計算機可讀介質(zhì)。并且，舉例來說，術(shù)語"邏輯"可包括軟件、硬件或者軟件和硬件的組合。機器可讀介質(zhì)可包括例如針對圖l-9論述的存儲裝置。此外，這類計算機可讀介質(zhì)可作為計算機程序產(chǎn)品來下載，其中，程序可通過在載波或其它傳播介質(zhì)中實施的數(shù)據(jù)信號、經(jīng)由通信鏈路(例如，總線、調(diào)制解調(diào)器或網(wǎng)絡(luò)連接)從遠程計算機(例如服務(wù)器)傳遞到請求計算機(例如客戶機)。因此，在本文中，應(yīng)將載波視為是包括機
器可讀介質(zhì)。
說明書中提到"一個實施例"時表示，結(jié)合該實施例描述的特定特征、結(jié)構(gòu)或特性包含在至少一個實現(xiàn)中。在本說明書的各個位置中出現(xiàn)短語"在一個實施例中"時可能或者可能不是全部指同一個實施例。
而且，在本描述和權(quán)利要求中，可使用術(shù)語"耦合"和"連接"及其派生詞。在本發(fā)明的一些實施例中，"連接"可用來指示兩個或兩個以上元件相互直接物理或電接觸。"耦合"可表示兩個或兩個以上元件直接物理或電接觸。但是，"耦合"也可表示兩個或兩個以上元件可能不是相互直接接觸，而是可能仍然相互配合或交互。
因此，雖然上文用結(jié)構(gòu)特征和/或方法動作特有的語言描述了本發(fā) 明的實施例，但是應(yīng)理解，要求權(quán)利的主題可不局限于所描述的特定特征或動作。確切地說，這些特定特征和動作是作為實現(xiàn)要求權(quán)利的主題的示例形式來公開的。
權(quán)利要求
1. 一種處理器，包括第一邏輯(310)，用于將第一操作數(shù)(306，308)從第一格式(502，520，530)轉(zhuǎn)換成第二格式(602，630，650)；以及第二邏輯(352，354)，用于將轉(zhuǎn)換后的第一操作數(shù)的一部分與所述第二格式的第二操作數(shù)的一部分進行組合。
2. 如權(quán)利要求1所述的處理器，還包括第三邏輯(318),用于將對應(yīng)于所述第一操作數(shù)的第一指數(shù)與所述第二操作數(shù)的第二指數(shù)進行比較。
3. 如權(quán)利要求1所述的處理器，其中，所述第二邏輯在與雙精度指數(shù)或擴展雙精度通路相同的通路(304)中組合多個單精度操作數(shù)。
4. 如權(quán)利要求1所述的處理器，還包括第三邏輯(310)，用于將所述第二操作數(shù)從第三格式轉(zhuǎn)換成所述第二格式。
5. 如權(quán)利要求1所述的處理器，其中，所述第二邏輯通過加法運算或減法運算來組合轉(zhuǎn)換后的第一操作數(shù)的所述部分和所述第二操作數(shù)的所述部分。
6. 如權(quán)利要求1所述的處理器，還包括第三邏輯(397),用于對通過所述第二邏輯進行的所述組合的結(jié)果進行舍入。
7. 如權(quán)利要求1所述的處理器，還包括第三邏輯(344)，用于分析轉(zhuǎn)換后的第一操作數(shù)和所述第二操作數(shù)的一部分，以便確定所述第一或第二操作數(shù)其中之一是否對應(yīng)于不規(guī)則操作數(shù)。
8. 如權(quán)利要求1所述的處理器，還包括一個或多個處理器核 (106)，其中所述一個或多個處理器核中的至少一些處理器核包括所述第一邏輯或所述第二邏輯中的一個或多個邏輯。
9. 如權(quán)利要求8所述的設(shè)備，其中，所述一個或多個處理器核(106) 中的至少一個處理器核、所述第一邏輯和所述第二邏輯在相同管芯上。
10. —種方法，包括將多個操作數(shù)修改(704)成相同格式；以及組合(710)與所修改的多個操作數(shù)對應(yīng)的多個尾數(shù)。
11. 如權(quán)利要求IO所述的方法，還包括比較(706)所修改的多個操作數(shù)的部分。
12. 如權(quán)利要求IO所述的方法，還包括對齊(708)所述多個尾數(shù) 的部分。
13. 如權(quán)利要求IO所述的方法，還包括對所述多個尾數(shù)的組合結(jié)果進行歸一化(712)。
14. 如權(quán)利要求IO所述的方法，還包括對所述多個尾數(shù)的組合結(jié)果進行舍入(714)。
15. —種系統(tǒng)，包括存儲器(108, 114, 116)，用于存儲數(shù)據(jù)；第一邏輯(202),用于從所述存儲器中提取操作碼(312)、第一操作數(shù)(306)和第二操作數(shù)(308);第二邏輯(310)，用于將所述第一操作數(shù)和所述第二操作數(shù)修改成相同格式；以及第三邏輯(324， 326),用于根據(jù)對應(yīng)于所述第一操作數(shù)的笫一指數(shù)與對應(yīng)于所述第二操作數(shù)的第二指數(shù)的比較(318)來對齊所述第一或第二操作數(shù)其中之一。
16. 如權(quán)利要求15所述的系統(tǒng)，還包括第四邏輯(352， 354)，用于將所述第一操作數(shù)的一部分與所述第二操作數(shù)的一部分進行組合。
17. 如權(quán)利要求15所述的系統(tǒng)，還包括第四邏輯(344)，用于分析所述第一操作數(shù)和所述第二操作數(shù)的一部分，以便確定所述第一或第二操作數(shù)其中之一是否對應(yīng)于不規(guī)則操作數(shù)。
18. 如權(quán)利要求15所述的系統(tǒng)，其中，所述存儲器包括l級高速緩存、中間級高速緩存或最后一級高速緩存中的一個或多個高速緩存。
19. 如權(quán)利要求15所述的系統(tǒng)，還包括用于訪問存儲在所述存儲器中的數(shù)據(jù)的多個處理器核(106)。
20.如權(quán)利要求15所述的系統(tǒng)，還包括音頻裝置(947)。
全文摘要
描述用于執(zhí)行浮點加法的方法和設(shè)備。在一個實施例中，將多個操作數(shù)(306，308)格式轉(zhuǎn)換(310)為共有格式(602，630，650)并進行組合(例如，相加或相減)。
文檔編號G06F7/48GK101438232SQ200680054583
公開日2009年5月20日申請日期2006年5月16日優(yōu)先權(quán)日2006年5月16日
發(fā)明者A·Y·西夫特索夫, V·Y·戈什泰因申請人:英特爾公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：A.Y.西夫特索夫;V.Y.戈什泰因
技術(shù)所有人：英特爾公司
我是此專利的發(fā)明人

上一篇：促進公司與招聘人員之間的雇用與通信的方法
上一篇：具有虛擬小鍵盤的移動設(shè)備的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機構(gòu)動力學(xué)與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡(luò)安全 2.計算機仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

浮點數(shù)加法相關(guān)技術(shù)

浮點數(shù)加減法相關(guān)技術(shù)

浮點數(shù)的加減法運算相關(guān)技術(shù)

浮點加法器相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

不同浮點格式的浮點加法的制作方法