使能/禁止控制simd處理器切片的方法和設(shè)備的制作方法

文檔序號(hào)：6554417閱讀：277來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：使能/禁止控制simd處理器切片的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及控制單指令，多數(shù)據(jù)(SIMD)處理流水線的方法和設(shè)備。
背景技術(shù)：
近年來(lái)，由于刀鋒(cutting-edge)計(jì)算機(jī)應(yīng)用涉及實(shí)時(shí)，多媒體功能，所以存在永不滿足的對(duì)更快速計(jì)算機(jī)處理數(shù)據(jù)吞吐率的需求。由于圖形應(yīng)用需要在相對(duì)短時(shí)間段內(nèi)進(jìn)行這種大量數(shù)據(jù)訪問(wèn)，數(shù)據(jù)計(jì)算和數(shù)據(jù)操作以實(shí)現(xiàn)期望的可見(jiàn)結(jié)果，所以在各種應(yīng)用中，圖形應(yīng)用對(duì)處理系統(tǒng)有最高的要求。這些應(yīng)用需要非?？焖俚奶幚硭俣龋缑棵朐S多千兆位的數(shù)據(jù)。雖然某些處理系統(tǒng)使用單處理器實(shí)現(xiàn)快速處理速度，但是其它則使用多處理器體系結(jié)構(gòu)實(shí)現(xiàn)。在多處理器系統(tǒng)中，多個(gè)子處理器能夠并行(或至少一致)地操作以實(shí)現(xiàn)期望的處理結(jié)果。
在經(jīng)歷變化的等待時(shí)間數(shù)據(jù)路徑的深流水線SIMD處理器中，標(biāo)量和向量(SIMD)的存在操作可以復(fù)雜化數(shù)據(jù)相關(guān)性檢查。SIMD處理器可以執(zhí)行許多操作和/或指令，其中每個(gè)具有其自身的和可能不同的等待時(shí)間。例如，Intel IA-32 SSE指令集使用不同指令進(jìn)行標(biāo)量和SIMD計(jì)算/操作。標(biāo)量操作使用相同寄存器但是始終使用相同切片(slice)。如果目的寄存器的未使用切片字必須保持不變，則大大增加了適當(dāng)流水線操作和數(shù)據(jù)傳遞的復(fù)雜度。
此外，SIMD處理器包含多個(gè)級(jí)段，其中每個(gè)級(jí)段可以同時(shí)執(zhí)行其操作，并且設(shè)法在其目的寄存器中放置結(jié)果。當(dāng)流水線中的兩個(gè)或更多操作使相同目的寄存器具有不同未使用切片時(shí)，數(shù)據(jù)相關(guān)性檢查變得更加復(fù)雜。當(dāng)遇到寫后寫(WAW)或?qū)懞笞x(RAW)相關(guān)性時(shí)，停止條件可能惡化。由于每個(gè)切片具有不同相關(guān)性，所以RAW相關(guān)性尤其有問(wèn)題。
與未使用切片的相關(guān)性檢查相關(guān)的復(fù)雜度可以通過(guò)讀取要發(fā)出指令的目的寄存器(操作數(shù))(例如，源寄存器)及不經(jīng)修改地流水線化未使用切片的數(shù)據(jù)來(lái)解決。不幸的是，這需要讀取目的寄存器的附加硬件并且可能導(dǎo)致停止的增加。這是由于目的操作數(shù)(以及源操作數(shù))可能具有RAW相關(guān)性。此外，當(dāng)不經(jīng)修改地流水線化未使用切片的數(shù)據(jù)時(shí)，難以實(shí)現(xiàn)節(jié)能。
可以解決與未使用切片的相關(guān)性檢查相關(guān)的復(fù)雜度的另一種方式是把指令的發(fā)行延遲或停轉(zhuǎn)一段足夠時(shí)間以便流水線中的多數(shù)操作(具有相同目的寄存器)完成其寫回階段。不幸的是，這可能導(dǎo)致顯著的性能退化。

發(fā)明內(nèi)容
根據(jù)本發(fā)明的一或多個(gè)實(shí)施例，為分別使能和禁止SIMD切片而沒(méi)有性能退化，提供靈活性(例如，等待時(shí)間和/或吞吐率)。這個(gè)功能最好通過(guò)使能標(biāo)記來(lái)提供。存在可以實(shí)現(xiàn)使能標(biāo)志的若干方式，例如(i)在每個(gè)SIMD指令中嵌入使能標(biāo)志；(ii)由每個(gè)SIMD指令之前或之后加入的前綴或后綴控制指令指定使能標(biāo)志(如果沒(méi)有前綴/后綴控制指令存在，則使能全部切片)；(iii)提供存儲(chǔ)一組使能標(biāo)志的控制寄存器(使用嵌入指令代碼或前綴/后綴控制指令選擇標(biāo)志，并且使用加載或移動(dòng)指令動(dòng)態(tài)修改)；及(iv)上述的組合。
通過(guò)使用使能標(biāo)志控制針對(duì)SIMD切片的時(shí)鐘信號(hào)，實(shí)現(xiàn)節(jié)電?？梢匀缤率鰧?shí)現(xiàn)數(shù)據(jù)傳遞相關(guān)性檢查單元檢測(cè)要發(fā)出指令的源寄存器和每個(gè)流水線級(jí)段中操作的目的寄存器之間的數(shù)據(jù)相關(guān)性。如果相關(guān)性存在并且結(jié)果仍無(wú)效，則停止指令發(fā)出。如果相關(guān)性存在并且結(jié)果有效，則向要發(fā)出的指令的操作數(shù)傳遞結(jié)果。然而，最好單獨(dú)控制每個(gè)切片的結(jié)果的傳遞以便避免停轉(zhuǎn)。
根據(jù)本發(fā)明的一或多個(gè)實(shí)施例，方法和設(shè)備設(shè)置為響應(yīng)指定周期內(nèi)一或多個(gè)使能標(biāo)志，禁止SIMD處理流水線的至少某些數(shù)據(jù)路徑處理電路，該流水線中處理電路被組織成切片和級(jí)段的矩陣。最好是，禁止步驟包含響應(yīng)使能標(biāo)志中的相應(yīng)標(biāo)志獨(dú)立禁止處理電路。
例如，禁止步驟可以包含響應(yīng)使能標(biāo)志的狀態(tài)而中斷對(duì)相應(yīng)處理電路的時(shí)鐘信號(hào)。
可選地或另外，禁止步驟可以包含根據(jù)使能標(biāo)志阻止來(lái)自相應(yīng)處理電路的相應(yīng)數(shù)據(jù)結(jié)果被寫入到一或多個(gè)目的寄存器。禁止特征的另一個(gè)擴(kuò)展是使得能夠向流水線的源操作數(shù)傳遞處理電路的至少某些結(jié)果。
最好是，禁止和/或傳遞步驟在逐個(gè)周期地執(zhí)行。
在相關(guān)性檢查的情形中，禁止步驟最好基于相關(guān)性檢查電路的確定和使能標(biāo)志，相關(guān)性檢查電路可以確定仍進(jìn)入流水線的切片的指令的任何操作數(shù)是否取決于處理電路的任何數(shù)據(jù)結(jié)果。
當(dāng)結(jié)合附圖對(duì)本發(fā)明進(jìn)行描述時(shí)，本領(lǐng)域技術(shù)人員將明白其它方面，特征，優(yōu)點(diǎn)等等。

出于說(shuō)明本發(fā)明的各種方面的目的，以附圖形式示出當(dāng)前優(yōu)選的方式，然而，可以理解本發(fā)明不局限于示出的具體方案和手段。
圖1是說(shuō)明可以根據(jù)本發(fā)明的一或多個(gè)方面進(jìn)行調(diào)整的處理系統(tǒng)的結(jié)構(gòu)的模塊圖；圖2是說(shuō)明適用于圖1的處理系統(tǒng)和/或這里的其它實(shí)施例的SIMD處理流水線的模塊圖；圖3是說(shuō)明使能標(biāo)志和圖2的處理流水線和/或這里的其它實(shí)施例的操作之間的關(guān)系的真值表的框圖；圖4是說(shuō)明適用于圖1的處理系統(tǒng)和/或這里的其它實(shí)施例的可選SIMD處理流水線的模塊圖；圖5是說(shuō)明使能標(biāo)志可以通過(guò)解碼包含使能/禁止信息的SIMD指令來(lái)調(diào)用的模塊圖；圖6是說(shuō)明使能標(biāo)志可以通過(guò)解碼包含與SIMD指令相關(guān)的使能/禁止信息的SIMD控制指令來(lái)調(diào)用的模塊圖；圖7是說(shuō)明使能標(biāo)志可以通過(guò)解碼SIMD指令和使用其中使能/禁止信息選擇和/或改變預(yù)定位來(lái)調(diào)用的模塊圖；圖8是說(shuō)明使能標(biāo)志可以通過(guò)解碼SIMD指令和使用其中使能/禁止信息選擇預(yù)定使能標(biāo)志來(lái)調(diào)用的模塊圖；圖9是說(shuō)明適用于圖1的處理系統(tǒng)和/或這里的其它實(shí)施例的傳遞電路的模塊圖；圖10是說(shuō)明目的寄存器的內(nèi)容和使用圖9和/或這里的其它實(shí)施例的使能標(biāo)志和傳遞電路控制的傳遞操作數(shù)的表；圖11是說(shuō)明具有可以根據(jù)本發(fā)明的一或多個(gè)方面來(lái)調(diào)整的兩個(gè)或更多子處理器的多處理系統(tǒng)的結(jié)構(gòu)的模塊圖；圖12是說(shuō)明可以被用來(lái)實(shí)現(xiàn)本發(fā)明的一或多個(gè)其它方面的最優(yōu)處理器單元(PE)的框圖；圖13是說(shuō)明可以根據(jù)本發(fā)明的一或多個(gè)其它方面來(lái)調(diào)整的圖12的系統(tǒng)的示例性子處理單元(SPU)的結(jié)構(gòu)的框圖；及圖14是說(shuō)明可以根據(jù)本發(fā)明的一或多個(gè)其它方面來(lái)調(diào)整的圖12的系統(tǒng)的示例性處理單元(PU)的結(jié)構(gòu)的框圖。
具體實(shí)施例方式
參照附圖，其中類似附圖標(biāo)記指示類似單元，圖1中示出了適于執(zhí)行本發(fā)明的一或多個(gè)特征的處理系統(tǒng)100的至少一部分。出于簡(jiǎn)潔和清晰的目的，圖1的模塊圖在這里將被稱作和描述為如圖所示的設(shè)備100，然而，可以理解，描述可以容易地被應(yīng)用于具有相同作用的方法的各個(gè)方面。
裝置100最好包含處理器102，本地存儲(chǔ)器104，主存儲(chǔ)器106(例如，DRAM)和總線108。處理器102可以使用能向系統(tǒng)存儲(chǔ)器106請(qǐng)求數(shù)據(jù)，并且操作數(shù)據(jù)以實(shí)現(xiàn)期望結(jié)果的任何已知技術(shù)來(lái)實(shí)現(xiàn)。例如，處理器102可以使用能執(zhí)行軟件和/或固件、包含標(biāo)準(zhǔn)微處理器，分布式微處理器等等的任何已知微處理器實(shí)現(xiàn)。如下所述，處理器102最好使用處理流水線實(shí)現(xiàn)。例如，一或多個(gè)處理器102可以是能請(qǐng)求和操作包含灰度信息，色彩信息，紋理數(shù)據(jù)，多邊形信息，視頻幀信息等等，例如像素?cái)?shù)據(jù)的數(shù)據(jù)的圖形處理器。
本地存儲(chǔ)器104位于處理器102附近，使得處理器可以執(zhí)行程序代碼，以及另外在與系統(tǒng)存儲(chǔ)器106相對(duì)的本地存儲(chǔ)器104內(nèi)操作數(shù)據(jù)。本地存儲(chǔ)器104可以是或不是傳統(tǒng)硬件高速緩沖存儲(chǔ)器。因?yàn)槠瑑?nèi)空間受限制，所以本地存儲(chǔ)器104的大小可能比系統(tǒng)存儲(chǔ)器106小很多。處理器102最好提供數(shù)據(jù)訪問(wèn)請(qǐng)求，以通過(guò)總線108把系統(tǒng)存儲(chǔ)器106的數(shù)據(jù)(可包含程序數(shù)據(jù))復(fù)制到用于程序處理和數(shù)據(jù)操作的本地存儲(chǔ)器104。利于數(shù)據(jù)訪問(wèn)的機(jī)構(gòu)最好使用存儲(chǔ)器接口110內(nèi)的直接存儲(chǔ)器存取控制器DMAC實(shí)現(xiàn)。
根據(jù)本發(fā)明的一或多個(gè)實(shí)施例，處理器102可以通過(guò)把來(lái)自主存儲(chǔ)器106的可執(zhí)行代碼復(fù)制到本地存儲(chǔ)器104(通過(guò)MIF 110)來(lái)執(zhí)行軟件程序，并且運(yùn)行本地存儲(chǔ)器104內(nèi)的軟件程序。因?yàn)楸镜卮鎯?chǔ)器104可以相對(duì)較小(例如256KB)，所以可能期望允許部分軟件程序(與整個(gè)程序相反)和任何相關(guān)數(shù)據(jù)被復(fù)制到本地存儲(chǔ)器104并且被執(zhí)行。這需要某個(gè)機(jī)構(gòu)，其被用來(lái)控制和管理移動(dòng)部分軟件程序到本地存儲(chǔ)器，執(zhí)行部分程序，函數(shù)調(diào)用等等。
參照?qǐng)D2，處理器102最好使用處理流水線實(shí)現(xiàn)，其中邏輯指令以流水線方式處理。流水線可以被分成任何數(shù)量的切片(所示四個(gè))和處理指令的任何數(shù)量的級(jí)段(所示三個(gè)級(jí)段)。流水線通常包括獲取一或多個(gè)指令，解碼指令，檢查指令間的相關(guān)性，發(fā)出指令和執(zhí)行指令。在這點(diǎn)上，處理器102可以包含指令緩沖器，指令解碼電路，相關(guān)性檢查電路，指令發(fā)出電路及執(zhí)行級(jí)段。
處理流水線可以由組織成切片(切片0，切片1，切片2，切片3...)和級(jí)段(級(jí)段0，級(jí)段1，級(jí)段2...)的矩陣的多個(gè)數(shù)據(jù)路徑處理電路120組成。根據(jù)SIMD處理技術(shù)，切片從一或多個(gè)源寄存器122接收數(shù)據(jù)操作數(shù)，根據(jù)SIMD指令處理數(shù)據(jù)，并且把數(shù)據(jù)操作的結(jié)果寫入到一或多個(gè)目的寄存器124。應(yīng)當(dāng)注意，根據(jù)處理電路120內(nèi)的算術(shù)邏輯單元的結(jié)構(gòu)和流水線內(nèi)執(zhí)行的特定編程指令，可以把結(jié)果寫入到流水線的特定級(jí)段(或其特定周期)的目的寄存器124。如果特定級(jí)段的結(jié)果就緒(即，操作完成)，則結(jié)果穿過(guò)流水線中的任何剩余級(jí)段，直至寄存器寫回級(jí)段?？蛇x地，結(jié)果可以被臨時(shí)保存，直到寫回周期。
處理器102最好包含存儲(chǔ)部件，其包括多個(gè)存儲(chǔ)單元EF0，EF1，EF2...，其中每個(gè)處理級(jí)段均有一個(gè)單元與之相關(guān)。存儲(chǔ)單元保存多個(gè)使能標(biāo)志126，最好組織成相應(yīng)集合。因而，每組使能標(biāo)志126在特定處理周期內(nèi)與處理流水線的一個(gè)級(jí)段相關(guān)。例如，在指定處理周期中，EF0內(nèi)的使能標(biāo)志126可以與處理流水線的級(jí)段0相關(guān)，EF1內(nèi)的使能標(biāo)志126可以與處理流水線1的級(jí)段1相關(guān)，并且EF2內(nèi)的使能標(biāo)志126可以與處理流水線的級(jí)段2相關(guān)。在下一個(gè)處理周期中，EF2內(nèi)的使能標(biāo)志126將被丟棄或?qū)⑶斑M(jìn)到下一個(gè)處理級(jí)段(如果下一個(gè)級(jí)段存在)，EF1內(nèi)的使能標(biāo)志126將前進(jìn)到EF2并且EF0內(nèi)的使能標(biāo)志126將前進(jìn)到EF1。因?yàn)閷⒃谙挛闹懈敿?xì)地討論，所以新的使能標(biāo)志126組將結(jié)合發(fā)出到流水線的新SIMD指令被輸入到EF0。例如，單元EF0，EF1，EF2，...可以是能在流水線的指定級(jí)段保存切片的每個(gè)處理電路120的一或多個(gè)信息位的硬件寄存器，鎖存器等等。
根據(jù)本發(fā)明的一或多個(gè)實(shí)施例，至少某些處理電路120用以在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志126至少部分地禁止操作。
現(xiàn)在參考圖3，其是說(shuō)明使能標(biāo)志126和處理流水線的切片之間的關(guān)系的真值表。例如，假定EF0內(nèi)的使能標(biāo)志126為0，0，0，0，則級(jí)段0的切片0，切片1，切片2和切片3內(nèi)的處理電路120優(yōu)選地在指定周期內(nèi)被至少部分地禁止。如果使能標(biāo)志126為0，0，0，1，則優(yōu)選地，級(jí)段0的切片3的處理電路120被使能，而該級(jí)段的其它處理電路120優(yōu)選地被禁止。如果使能標(biāo)志126為0，0，1，0，則優(yōu)選地，級(jí)段0的切片2的處理電路120被使能，而該級(jí)段的其它處理電路120優(yōu)選地被禁止。關(guān)于其它使能標(biāo)志126的組合可以容易地確定類似關(guān)系。通過(guò)這種方式，響應(yīng)相應(yīng)使能標(biāo)志126，處理電路120可以被獨(dú)立禁止(至少部分地)。
參照?qǐng)D4，盡管響應(yīng)使能標(biāo)志126而進(jìn)行處理電路120的部分或全部禁止的數(shù)字硬件的適當(dāng)實(shí)現(xiàn)有許多，但是一個(gè)可能性是，處理電路120可以包含用于在指定周期內(nèi)響應(yīng)使能標(biāo)志126的狀態(tài)(例如，邏輯真，假)而部分或全部禁止處理電路120的禁止終端(或等價(jià)輸入單元)。在這點(diǎn)上，最好SIMD處理流水線包含控制邏輯和數(shù)據(jù)路徑邏輯?？刂七壿嫯a(chǎn)生響應(yīng)在指定處理電路120中執(zhí)行的操作類型，并且控制指定電路120的處理行為的一或多個(gè)控制信號(hào)。控制信號(hào)可以包含處理電路120的各個(gè)部分的時(shí)鐘選通信號(hào)，使能信號(hào)等等。使能標(biāo)志126可以用一或多個(gè)控制信號(hào)邏輯選通(例如，進(jìn)行與操作)以部分或完全禁止處理電路120。可選或另外地，處理電路120可以包含選通時(shí)鐘輸入，其中使能標(biāo)志126的狀態(tài)選通時(shí)鐘信號(hào)到該處理電路120以便在指定周期內(nèi)禁止處理。這可以通過(guò)用時(shí)鐘信號(hào)選通被選通使能標(biāo)志126與控制信號(hào)的結(jié)果來(lái)實(shí)現(xiàn)。
使能/禁止流水線的相應(yīng)切片的能力增加了用于某些操作，例如標(biāo)量操作的寄存器的表面數(shù)量，并且允許在指定級(jí)段使用相對(duì)少的SIMD指令在每個(gè)切片內(nèi)進(jìn)行不同操作。
如將在下文中更詳細(xì)地討論的，使能標(biāo)志126可以在指定工作周期內(nèi)使能或禁止特定處理電路120向目的寄存器124傳送處理結(jié)果的能力。
有利的是，選通單個(gè)處理電路120的時(shí)鐘的能力允許大量節(jié)電而無(wú)需消極影響處理吞吐率。
現(xiàn)在參考圖5，其是說(shuō)明使能標(biāo)志和SIMD指令之間的關(guān)系的模塊圖。最好是，每組使能標(biāo)志126與相應(yīng)SIMD指令相關(guān)。如圖5的圖解，一組使能標(biāo)志126可以被包含在SIMD指令內(nèi)并且在解碼操作期間被提取。一旦被提取，則使能標(biāo)志126可以在向處理流水線發(fā)出SIMD操作時(shí)被傳送到存儲(chǔ)單元EF0。此后，在后續(xù)處理周期內(nèi)，與該SIMD指令相關(guān)的使能標(biāo)志126最好前進(jìn)到相繼存儲(chǔ)單元EF1，EF2等等。
參照?qǐng)D6，使能標(biāo)志126可以被包含在與相應(yīng)SIMD指令相關(guān)的SIMD控制指令內(nèi)。SIMD控制指令可以在SIMD指令前面或后面(即，充當(dāng)前綴或后綴)?？梢栽诮獯a處理期間通過(guò)經(jīng)由提取邏輯激活使能標(biāo)志來(lái)由SIMD控制指令產(chǎn)生使能標(biāo)志126。例如，一部分SIMD控制指令可以包含表示使能標(biāo)志126的4位，其在解碼處理期間被輸入到提取邏輯。另一部分SIMD控制指令可以在解碼處理期間被用來(lái)激活或選通提取邏輯內(nèi)的位以產(chǎn)生使能標(biāo)志126。在可選實(shí)施例中，來(lái)自SIMD控制指令的使能標(biāo)志126的提取處理可以使用考慮在這里公開(kāi)內(nèi)容的本領(lǐng)域技術(shù)人員所知道的任何其它技術(shù)實(shí)現(xiàn)。
參照?qǐng)D7，可以響應(yīng)缺省位或來(lái)從SIMD指令解碼的信息來(lái)產(chǎn)生使能標(biāo)志126。例如，如果SIMD指令包含使能標(biāo)志126，則可以通過(guò)選擇邏輯選擇此。另一方面，如果SIMD指令不包含使能標(biāo)志126，則缺省位(例如，1，1，1，1)可產(chǎn)生使能標(biāo)志126。通過(guò)其它例子，如果存在與SIMD指令相關(guān)的SIMD控制指令，則使能標(biāo)志126可以從SIMD控制指令獲得。如果SIMD指令其中包含使能標(biāo)志126，則使能標(biāo)志126可以從SIMD指令自身獲得。另外，使能標(biāo)志126可以從缺省位獲得。
參照?qǐng)D8，可以響應(yīng)從SIMD控制指令或SIMD指令自身解碼的信息產(chǎn)生使能標(biāo)志126，其中信息被用來(lái)選擇使能標(biāo)志126N的預(yù)定組。例如，處理器102可以包含控制寄存器，其包含多組使能標(biāo)志126，例如組0，組1，組2，...組N。來(lái)自控制寄存器的使能標(biāo)志126組可以與選擇邏輯通信。從SIMD控制指令或SIMD指令獲得的信息可以被輸入到選擇邏輯，以便選擇N組使能標(biāo)志126中的一組。例如，選擇邏輯可以表示簡(jiǎn)單選通功能或復(fù)用器電路。
考慮這里的公開(kāi)的本領(lǐng)域的技術(shù)人員將理解，使能標(biāo)志可以根據(jù)任何一個(gè)以上討論的技術(shù)或其組合產(chǎn)生。
現(xiàn)在參考圖9，其是圖解適于實(shí)現(xiàn)使結(jié)果中所使用的切片字從處理電路120傳遞到一或多個(gè)源操作數(shù)的功能的電路結(jié)構(gòu)的例子的模塊圖。在本發(fā)明的這個(gè)實(shí)施例中，處理器102可以包含充當(dāng)傳遞電路以便根據(jù)使能標(biāo)志126把結(jié)果中所使用的切片字從相應(yīng)處理電路120傳遞到一或多個(gè)源操作數(shù)的控制電路132和/或數(shù)據(jù)路徑電路134。應(yīng)當(dāng)注意，傳遞電路可以單獨(dú)或結(jié)合圖2和/或4的結(jié)構(gòu)使用，使得禁止把結(jié)果中未使用切片字從處理電路120寫入到目的寄存器124的附加功能也可以被實(shí)現(xiàn)。
控制電路132最好從相關(guān)性檢查電路130接收使能標(biāo)志126和結(jié)果?？刂齐娐?32可以使用多個(gè)門實(shí)現(xiàn)，以便產(chǎn)生每個(gè)切片的相應(yīng)傳遞控制信號(hào)136。相應(yīng)傳遞控制信號(hào)136被輸入到專用于每個(gè)切片的數(shù)據(jù)路徑電路134的相應(yīng)部分。數(shù)據(jù)路徑電路134用以根據(jù)使能標(biāo)志126傳遞所使用的切片字到一或多個(gè)源操作數(shù)。例如，數(shù)據(jù)路徑電路134的每個(gè)部分可以使用一或多個(gè)復(fù)用器(或選擇器)實(shí)現(xiàn)，其中每個(gè)復(fù)用器的輸入(入)可以包含一或多個(gè)(i)流水線的每個(gè)(或至少一個(gè))級(jí)段的結(jié)果；及(ii)來(lái)自源寄存器122的數(shù)據(jù)。
相關(guān)性檢查電路130被用以確定仍進(jìn)入流水線的切片的指令的任何操作數(shù)是否依賴流水線內(nèi)處理電路120的任何數(shù)據(jù)結(jié)果。當(dāng)存在未使用切片字時(shí)，相關(guān)性為假，并且當(dāng)在指定處理電路120的結(jié)果中存在使用的切片字時(shí)，相關(guān)性是真。相關(guān)性檢查電路130通過(guò)處理流水線的每個(gè)級(jí)段(級(jí)段0結(jié)果，級(jí)段1結(jié)果等等)的相應(yīng)檢查結(jié)果，提供這個(gè)確定結(jié)果。這種檢查結(jié)果最好針對(duì)每個(gè)級(jí)段內(nèi)的使能標(biāo)志126選通，以便終止任何假相關(guān)性并且保持任何真相關(guān)性。選通結(jié)果最好被輸入到切片邏輯，以便產(chǎn)生傳遞控制信號(hào)136，其用于逐個(gè)周期地選擇每個(gè)切片的最早流水線級(jí)段中的最近有效結(jié)果。
數(shù)據(jù)路徑電路134(例如，選擇器或復(fù)用器)基于傳遞控制信號(hào)136選擇最近結(jié)果，并且把它傳送到每個(gè)切片的源操作數(shù)。如果在一或多個(gè)切片中不存在相關(guān)性(真)，則從源寄存器122讀取的數(shù)據(jù)被選擇，并且被傳送到該切片的源操作數(shù)。最好是，傳遞電路(控制電路132和/或數(shù)據(jù)路徑電路134)用以逐個(gè)切片地(換言之，針對(duì)每個(gè)切片獨(dú)立地)選擇數(shù)據(jù)并且將其傳送到源操作數(shù)。
參照?qǐng)D10，圖解了傳遞電路怎樣被用來(lái)控制向源操作數(shù)傳遞處理結(jié)果的例子。針對(duì)這個(gè)例子的目的，假定要發(fā)出到處理流水線的指令包含操作數(shù)，其與通過(guò)處理流水線內(nèi)的處理電路120執(zhí)行的一或多個(gè)操作的結(jié)果相關(guān)。也假定所圖解的情況涉及高度復(fù)雜數(shù)據(jù)相關(guān)性的情況，例如其中相同目的寄存器被用于在級(jí)段0，1，2和3中執(zhí)行的全部操作。
假定目的寄存器124的內(nèi)容最初是A，B，C，D。在級(jí)段3，使能標(biāo)志為0，0，0，1，其允許切片3(E)的處理電路120的結(jié)果被寫入目的寄存器124。在級(jí)段2，使能標(biāo)志為1，0，0，0，其允許切片0(F)的處理電路120的結(jié)果被寫入目的寄存器124。在級(jí)段1，使能標(biāo)志126為0，1，0，0，其允許切片1(G)的處理電路120的結(jié)果被寫入目的寄存器124。在級(jí)段0，使能標(biāo)志126為1，1，0，0，其允許切片0和切片1(H和I，分別地)中的處理電路120的結(jié)果被寫入目的寄存器124。
在每個(gè)周期的結(jié)束，每個(gè)級(jí)段的操作(和使能標(biāo)志)執(zhí)行到下一個(gè)級(jí)段(即，級(jí)段0-＞級(jí)段1-＞級(jí)段2-＞級(jí)段3等等)。
基于使能標(biāo)志126，結(jié)果的使用切片字在寫回階段則被寫入到目的寄存器124。結(jié)果中的未使用切片字是不確定的，并且在寫回階段期間不被寫入到目的寄存器124。
如果操作在這些或較早級(jí)段被完成(即，結(jié)果就緒)，則最好執(zhí)行下列操作(i)對(duì)于切片0，H被從級(jí)段0傳遞到源操作數(shù)，(ii)對(duì)于切片1，I被從級(jí)段0傳遞到源操作數(shù)；(iii)對(duì)于切片2，C被從源寄存器122讀取并且選擇用于源操作數(shù)；及(iv)對(duì)于切片3，E被從級(jí)段3傳遞到源操作數(shù)。如果在至少級(jí)段0和級(jí)段3中的操作未完成，則停止指令發(fā)出。在級(jí)段2(F)處的切片0的結(jié)果和在級(jí)段1(G)處的切片1的結(jié)果是傳遞的候選。實(shí)際上，由于在級(jí)段0的結(jié)果是最近的，所以在級(jí)段0(H，I)處而不是在級(jí)段1和級(jí)段2處的切片0和切片1的結(jié)果被傳遞到源操作數(shù)。把流水線的使用切片傳遞到源操作數(shù)(和不傳遞未使用切片)的能力避免不必要的停轉(zhuǎn)。
圖11是適于實(shí)現(xiàn)這里討論的特征和本發(fā)明的一或多個(gè)其它實(shí)施例的多處理系統(tǒng)100A的模塊圖。系統(tǒng)100A包含與本地存儲(chǔ)器104A-D相關(guān)的多個(gè)處理器102A-D，和通過(guò)總線108互連的共享存儲(chǔ)器106。這里共享存儲(chǔ)器106也可以被稱作主存儲(chǔ)器或系統(tǒng)存儲(chǔ)器。盡管通過(guò)例子圖解了四個(gè)處理器102，但是可以在不偏離本發(fā)明的宗旨和范圍的前提下使用任何數(shù)量。每個(gè)處理器102可以有相似構(gòu)造或不同構(gòu)造。
本地存儲(chǔ)器104最好位于與其相應(yīng)處理器102相同的芯片(相同半導(dǎo)體基底)上；然而，本地存儲(chǔ)器104最好不是其中不存在實(shí)現(xiàn)硬件高速緩沖存儲(chǔ)器功能的片上或芯片外硬件高速緩存電路，高速緩存寄存器，高速緩沖存儲(chǔ)器控制器等等的傳統(tǒng)硬件高速緩沖存儲(chǔ)器。
處理器102最好提供數(shù)據(jù)訪問(wèn)請(qǐng)求，以通過(guò)總線108把系統(tǒng)存儲(chǔ)器106的數(shù)據(jù)復(fù)制到其相應(yīng)的用于程序執(zhí)行和數(shù)據(jù)操作的本地存儲(chǔ)器104。利于數(shù)據(jù)訪問(wèn)的機(jī)構(gòu)最好使用未示出的直接存儲(chǔ)器存取控制器(DMAC)實(shí)現(xiàn)。每個(gè)處理器的DMAC最好與上文相對(duì)于本發(fā)明的其它特征所述的性能基本相同。
系統(tǒng)存儲(chǔ)器106最好是通過(guò)存儲(chǔ)器連接(未示出)連接到處理器102的動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)。盡管系統(tǒng)存儲(chǔ)器106最好是DRAM，但是存儲(chǔ)器106可以使用其它器件實(shí)現(xiàn)，例如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)，磁性隨機(jī)訪問(wèn)存儲(chǔ)器(MRAM)，光學(xué)存儲(chǔ)器，全息存儲(chǔ)器等等。
每個(gè)處理器102最好使用處理流水線實(shí)現(xiàn)，其中邏輯指令以流水線方式處理。盡管流水線可以被分成處理指令的任何數(shù)量的級(jí)段，但是流水線通常包括獲取一或多個(gè)指令，解碼指令，檢查指令間的相關(guān)性，發(fā)出指令及執(zhí)行指令。在這點(diǎn)上，處理器102可以包含指令緩沖器，指令解碼電路，相關(guān)性檢查電路，指令發(fā)出電路及執(zhí)行級(jí)段。
在一或多個(gè)實(shí)施例中，處理器102和本地存儲(chǔ)器104可以被布置在公共半導(dǎo)體基底上。在一或多個(gè)其它實(shí)施例中，共享存儲(chǔ)器106也可以被布置在公共半導(dǎo)體基底上或它可以被分別布置。
在一或多個(gè)可選實(shí)施例中，一或多個(gè)處理器102可以充當(dāng)在操作中連接其它處理器102并且能通過(guò)總線108被連接到共享存儲(chǔ)器106的主處理器。主處理器102可以安排和協(xié)調(diào)其它處理器102的數(shù)據(jù)的處理。然而，不同于其它處理器102，主處理器可以被連接到硬件高速緩沖存儲(chǔ)器，其用以高速緩存從至少一個(gè)共享存儲(chǔ)器106和處理器102的一或多個(gè)本地存儲(chǔ)器104獲得的數(shù)據(jù)。主處理器可以提供數(shù)據(jù)訪問(wèn)請(qǐng)求，以通過(guò)總線108，使用例如DMA技術(shù)的任何已知技術(shù)，把系統(tǒng)存儲(chǔ)器106的數(shù)據(jù)(其可以包含程序數(shù)據(jù))復(fù)制到用于程序執(zhí)行和數(shù)據(jù)操作的本地存儲(chǔ)器104。
現(xiàn)在描述多處理器系統(tǒng)的最優(yōu)計(jì)算機(jī)體系結(jié)構(gòu)，其適于執(zhí)行這里討論的一或多個(gè)特征。根據(jù)一或多個(gè)實(shí)施例，多處理器系統(tǒng)可以被實(shí)現(xiàn)成用于例如游戲系統(tǒng)，家庭終端，PC系統(tǒng)，服務(wù)器系統(tǒng)和工作站的媒體豐富應(yīng)用的獨(dú)立和/或分布式處理的單芯片解決方案。在例如游戲系統(tǒng)和家庭終端的某些應(yīng)用中，實(shí)時(shí)計(jì)算是必要的。例如，在實(shí)時(shí)，分布式游戲應(yīng)用中，一或多個(gè)網(wǎng)絡(luò)圖像解壓縮，3D計(jì)算機(jī)圖形，音頻生成，網(wǎng)絡(luò)通信，物理模擬及人工智能處理必須被足夠快速地執(zhí)行以為用戶提供實(shí)時(shí)經(jīng)歷的假象。因而，多處理器系統(tǒng)中的每個(gè)處理器必須在短并且可預(yù)測(cè)的時(shí)間內(nèi)完成任務(wù)。
因此，并且根據(jù)該計(jì)算機(jī)體系結(jié)構(gòu)，多處理計(jì)算機(jī)系統(tǒng)的全部處理器根據(jù)公共計(jì)算模塊(或單元)構(gòu)造。這個(gè)公共計(jì)算模塊具有一致的結(jié)構(gòu)并且最好使用相同指令集體系結(jié)構(gòu)。多處理計(jì)算機(jī)系統(tǒng)能夠由一或多個(gè)客戶端，服務(wù)器，PC，移動(dòng)計(jì)算機(jī)，游戲機(jī)，PDA，機(jī)頂盒，電器，數(shù)字電視和使用計(jì)算機(jī)處理器的其它設(shè)備構(gòu)成。
需要時(shí)，多個(gè)計(jì)算機(jī)系統(tǒng)也可以是網(wǎng)絡(luò)的構(gòu)件。一致模塊化結(jié)構(gòu)允許多處理計(jì)算機(jī)系統(tǒng)高效，高速處理應(yīng)用和數(shù)據(jù)，并且如果使用網(wǎng)絡(luò)，則通過(guò)網(wǎng)絡(luò)快速傳輸應(yīng)用和數(shù)據(jù)。這個(gè)結(jié)構(gòu)還簡(jiǎn)化了不同規(guī)模和處理能力的網(wǎng)絡(luò)成員的建立，及這些成員對(duì)處理應(yīng)用的準(zhǔn)備。
參照?qǐng)D12，基本處理模塊是處理器單元(PE)500。PE 500包括I/O接口502，處理單元(PU)504及多個(gè)子處理單元508，即子處理單元508A，子處理單元508B，子處理單元508C和子處理單元508D。本地(或內(nèi)部)PE總線512在PU 504，子處理單元508和存儲(chǔ)器接口511間發(fā)送數(shù)據(jù)和應(yīng)用。本地PE總線512可以具有例如傳統(tǒng)體系結(jié)構(gòu)或可以被實(shí)現(xiàn)成分組交換網(wǎng)。如果實(shí)現(xiàn)為分組交換網(wǎng)絡(luò)，雖然需要更多硬件，但增加了可用帶寬。
可以使用實(shí)現(xiàn)數(shù)字邏輯的不同方法構(gòu)造PE 500。然而，PE 500最好被構(gòu)造為在硅質(zhì)基底上使用互補(bǔ)金屬氧化物半導(dǎo)體(CMOS)的單集成電路?；椎目蛇x材料包含砷化鎵(gallium arsinide)，砷化鎵鋁和使用各種摻雜劑的其它所謂III-B化合物。還可以使用例如快速單磁通量子(RSFQ)邏輯的超導(dǎo)材料來(lái)實(shí)現(xiàn)PE 500。
PE 500通過(guò)高帶寬存儲(chǔ)器連接516與共享(主)存儲(chǔ)器514緊密相關(guān)。盡管存儲(chǔ)器514最好是動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)，但是存儲(chǔ)器514可以使用其它手段實(shí)現(xiàn)為例如靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)，磁性隨機(jī)訪問(wèn)存儲(chǔ)器(MRAM)，光學(xué)存儲(chǔ)器，全息存儲(chǔ)器等等。
PU 504和子處理單元508最好均連接到包含直接存儲(chǔ)器訪問(wèn)DMA功能的存儲(chǔ)流控制器(MFC)，其結(jié)合存儲(chǔ)器接口511，利于DRAM514和PE 500的子處理單元508和PU 504之間的數(shù)據(jù)傳送。應(yīng)當(dāng)注意，DMAC和/或存儲(chǔ)器接口511可以相對(duì)于子處理單元508和PU 504被集成或分別布置。實(shí)際上，DMAC功能和/或存儲(chǔ)器接口511功能可以與一或多個(gè)(最好全部)子處理單元508和PU 504集成。還應(yīng)當(dāng)注意，DRAM 514可以相對(duì)于PE 500被集成或分別布置。例如，DRAM 514可以如所示圖解隱含的那樣被布置在芯片外，或DRAM 514可以以集成方式被布置在芯片內(nèi)。
PU 504可以是例如能獨(dú)立處理數(shù)據(jù)和應(yīng)用的標(biāo)準(zhǔn)處理器。在操作中，PU 504最好安排和協(xié)調(diào)子處理單元對(duì)數(shù)據(jù)和應(yīng)用的處理。子處理單元最好是單指令，多數(shù)據(jù)(SIMD)處理器。在PU 504的控制下，子處理單元以并行和獨(dú)立的方式執(zhí)行這些數(shù)據(jù)和應(yīng)用的處理。最好使用PowerPC核心實(shí)現(xiàn)PU 504，其中PowerPC核心是使用縮減指令集計(jì)算(RISC)技術(shù)的微處理器體系結(jié)構(gòu)。RISC使用簡(jiǎn)單指令的組合執(zhí)行更多復(fù)雜指令。因而，處理器的時(shí)序可以基于更簡(jiǎn)單和更快速的操作，從而允許微處理器以指定時(shí)鐘速度執(zhí)行更多指令。
應(yīng)當(dāng)注意，PU 504可以通過(guò)子處理單元508之一實(shí)現(xiàn)，其作為安排和協(xié)調(diào)子處理單元508對(duì)數(shù)據(jù)和應(yīng)用的處理的主處理單元。此外，在處理器單元500內(nèi)可以有不止一個(gè)PU被實(shí)現(xiàn)。
根據(jù)這個(gè)模塊化結(jié)構(gòu)，特定計(jì)算機(jī)系統(tǒng)使用的PE 500的數(shù)量基于該系統(tǒng)所需的處理能力。例如，服務(wù)器可以使用四個(gè)PE 500，工作站可以使用兩個(gè)PE 500，并且PDA可以使用一個(gè)PE 500。分配處理特定軟件單元的PE 500的子處理單元的數(shù)量取決于單元內(nèi)程序和數(shù)據(jù)的復(fù)雜度和量。
圖13說(shuō)明子處理單元(SPU)508的優(yōu)選結(jié)構(gòu)和功能。SPU 508體系結(jié)構(gòu)優(yōu)選地填補(bǔ)通用處理器(其被設(shè)計(jì)為在大量應(yīng)用上實(shí)現(xiàn)高平均性能)和專用處理器(其被設(shè)計(jì)為在單個(gè)應(yīng)用上實(shí)現(xiàn)高性能)之間的空白。SPU 508被設(shè)計(jì)為實(shí)現(xiàn)游戲應(yīng)用，媒體應(yīng)用，寬帶系統(tǒng)等等的高性能，并且為實(shí)時(shí)應(yīng)用的程序員提供高度控制。SPU 508的某些性能包含圖形幾何流水線(graphics geometry pipelines)，表面子劃分，快速富立葉變換，圖像處理關(guān)鍵字，流處理，MPEG編碼/解碼，加密，解密，設(shè)備驅(qū)動(dòng)程序擴(kuò)展，模擬，游戲物理，內(nèi)容建立及音頻合成和處理。
子處理單元508包含兩個(gè)基本功能單元，即SPU核心510A和存儲(chǔ)流控制器(MFC)510B。SPU核心510A執(zhí)行程序處理，數(shù)據(jù)操作等等，而MFC 510B執(zhí)行涉及系統(tǒng)的SPU核心510A和DRAM 514之間的數(shù)據(jù)傳送的功能。
SPU核心510A包含本地存儲(chǔ)器，指令單元(IU)552，寄存器554，一個(gè)或多個(gè)浮點(diǎn)執(zhí)行級(jí)段556和一或多個(gè)定點(diǎn)執(zhí)行級(jí)段558。本地存儲(chǔ)器550最好使用例如SRAM的單端口隨機(jī)訪問(wèn)存儲(chǔ)器實(shí)現(xiàn)。鑒于多數(shù)處理器通過(guò)使用高速緩存減少對(duì)存儲(chǔ)器的等待時(shí)間，SPU核心510A實(shí)現(xiàn)相對(duì)較小的本地存儲(chǔ)器550而不是高速緩存。實(shí)際上，為了給實(shí)時(shí)應(yīng)用(和其它這里提及的應(yīng)用程序)的程序員提供一致和可預(yù)測(cè)的存儲(chǔ)器訪問(wèn)等待時(shí)間，SPU 508A內(nèi)的高速緩沖存儲(chǔ)器體系結(jié)構(gòu)不是優(yōu)選的。高速緩沖存儲(chǔ)器的高速緩存命中/命中失誤特性導(dǎo)致從少數(shù)周期到數(shù)百周期的易變存儲(chǔ)器訪問(wèn)時(shí)間。這種易變性削弱了例如實(shí)時(shí)應(yīng)用編程中期望的訪問(wèn)定時(shí)可預(yù)測(cè)性。可以通過(guò)把DMA傳送與數(shù)據(jù)計(jì)算重疊在本地存儲(chǔ)器SRAM 550中實(shí)現(xiàn)等待時(shí)間隱藏。這提供了實(shí)時(shí)應(yīng)用編程的高度控制。由于與DMA傳送相關(guān)的等待時(shí)間和指令開(kāi)銷超出服務(wù)于高速緩存命中失誤的等待時(shí)間的開(kāi)銷時(shí)，當(dāng)DMA傳送大小足夠大并且充分可預(yù)測(cè)時(shí)，SRAM本地存儲(chǔ)器方案得到優(yōu)勢(shì)(例如，DMA命令可以在需要數(shù)據(jù)之前發(fā)出)。
在一個(gè)指定子處理單元508上運(yùn)行的程序使用本地地址參考相關(guān)的本地存儲(chǔ)器550，然而，本地存儲(chǔ)器550的每個(gè)位置還在總的系統(tǒng)的存儲(chǔ)器映射內(nèi)被分配一個(gè)實(shí)地址(RA)。這允許特權(quán)軟件把本地存儲(chǔ)器550映射到進(jìn)程的有效地址(EA)以利于一個(gè)本地存儲(chǔ)器550和另一個(gè)本地存儲(chǔ)器550之間的DMA傳送。PU 504也可以使用有效地址直接訪問(wèn)本地存儲(chǔ)器550。在一個(gè)最優(yōu)實(shí)施例中，本地存儲(chǔ)器550包含556千字節(jié)的存儲(chǔ)，并且寄存器552的容量是128X128位。
SPU核心504A最好使用處理流水線實(shí)現(xiàn)，其中邏輯指令以流水線方式處理。盡管流水線可以被分成處理指令的任何數(shù)量的級(jí)段，但是流水線通常包括獲取一或多個(gè)指令，解碼指令，檢查指令間的相關(guān)性，發(fā)出指令及執(zhí)行指令。在這點(diǎn)上，IU 552包含指令緩沖器，指令解碼電路，相關(guān)性檢查電路，和指令發(fā)出電路。
指令緩沖器最好包含連接到本地存儲(chǔ)器550并且在其被獲取時(shí)臨時(shí)存儲(chǔ)指令的多個(gè)寄存器。指令緩沖器最好進(jìn)行操作，使得全部指令成組，即基本上同時(shí)離開(kāi)寄存器。盡管指令緩沖器可以具有任何大小，但是優(yōu)選的是它具有不大于大約兩個(gè)或三個(gè)寄存器的大小。
通常，解碼電路分解指令并且產(chǎn)生執(zhí)行相應(yīng)指令功能的邏輯微操作。例如，邏輯微操作可以指定算術(shù)和邏輯操作，本地存儲(chǔ)器550的加載和存儲(chǔ)操作，寄存器源操作數(shù)和/或立即數(shù)據(jù)操作數(shù)。解碼電路也可以指示指令使用哪些資源，例如目標(biāo)寄存器地址，結(jié)構(gòu)資源，功能單元和/或總線。解碼電路也可以提供指示需要資源的指令流水線級(jí)段的信息。指令解碼電路最好基本同時(shí)地解碼等于指令緩沖器的寄存器的數(shù)量的若干指令。
相關(guān)性檢查電路包含執(zhí)行測(cè)試以確定指定指令的操作數(shù)是否取決于流水線中其它指令的操作數(shù)的數(shù)字邏輯。如果是，則指定指令將不會(huì)被執(zhí)行，直到這些其它操作數(shù)被更新(例如，通過(guò)允許其它指令完成處理)。優(yōu)選地，相關(guān)性檢查電路同時(shí)確定解碼器電路112分配的多個(gè)指令的相關(guān)性。
指令發(fā)出電路可以向浮點(diǎn)執(zhí)行級(jí)段556和/或定點(diǎn)執(zhí)行級(jí)段558發(fā)出指令。
寄存器554最好被實(shí)現(xiàn)為相對(duì)較大的統(tǒng)一寄存器堆，例如128個(gè)條目的寄存器堆。這允許深流水線化高頻實(shí)現(xiàn)，而無(wú)需要寄存器重命名以避免寄存器資源缺乏。重命名硬件通常消耗處理系統(tǒng)的大量面積和功率。因此，在通過(guò)軟件循環(huán)展開(kāi)或其它交錯(cuò)技術(shù)覆蓋等待時(shí)間時(shí)，可實(shí)現(xiàn)有利操作。
最好，SPU核心510A具有超標(biāo)量體系結(jié)構(gòu)，使得每個(gè)時(shí)鐘周期發(fā)出不止一個(gè)指令。SPU核心510A最好超標(biāo)量化到對(duì)應(yīng)于來(lái)自指令緩沖器的同時(shí)指令分派數(shù)量，例如2和3之間的程度(意味著每個(gè)時(shí)鐘周期發(fā)出兩個(gè)或3個(gè)指令)。取決于所需的處理能力，可以使用更大或更小數(shù)量的浮點(diǎn)執(zhí)行級(jí)段556和定點(diǎn)執(zhí)行級(jí)段558。在一個(gè)最優(yōu)實(shí)施例中，浮點(diǎn)執(zhí)行級(jí)段556以每秒32兆兆浮點(diǎn)操作(32GFLOPS)的速度進(jìn)行操作，并且定點(diǎn)執(zhí)行級(jí)段558以每秒32兆兆操作(32GOPS)的速度進(jìn)行操作。
MFC 510B最好包含總線接口單元(BIU)564，存儲(chǔ)器管理單元(MMU)562，和直接存儲(chǔ)器存取控制器(DMAC)560。除了DMAC 560，與SPU核心510A和總線512相比，MFC 510B最好以半頻(半速)運(yùn)行以滿足低功耗設(shè)計(jì)目標(biāo)。MFC 510B處理從總線512進(jìn)入SPU 508的數(shù)據(jù)和指令，為DMAC提供地址轉(zhuǎn)換，及數(shù)據(jù)一致性的探聽(tīng)操作。BIU 564提供總線512及MMU 562和DMAC 560之間的接口。因而，SPU508(包含SPU核心510A和MFC 510B)和DMAC 560被物理和/或邏輯地連接到總線512。
MMU 562最好把有效地址(取自DMA命令)轉(zhuǎn)換成用于存儲(chǔ)器訪問(wèn)的實(shí)地址。例如，MMU 562可以把有效地址的高階位轉(zhuǎn)換成實(shí)地址位。然而，低階地址位最好不可翻譯，并且被認(rèn)為是邏輯和物理的，用于形成針對(duì)存儲(chǔ)器的實(shí)地址和請(qǐng)求訪問(wèn)。在一或多個(gè)實(shí)施例中，MMU 562可以基于64位存儲(chǔ)器管理模型實(shí)現(xiàn)，并且可以提供具有4K，64K，1M和16M字節(jié)頁(yè)面尺寸的264字節(jié)有效地址空間和256MB區(qū)段尺寸。優(yōu)選地，MMU 562支持高達(dá)265字節(jié)的虛擬存儲(chǔ)器，和242字節(jié)(4兆兆字節(jié))的物理存儲(chǔ)器，以用于DMA命令。MMU 562的硬件可以包含8條目完全關(guān)聯(lián)SLB，256條目4向組關(guān)聯(lián)TLB，和用于硬件TLB命中失誤處理的TLB的4x4替換管理表(RMT)。
DMAC 560優(yōu)選地管理來(lái)自SPU核心510A和例如PU 504和/或其它SPU的一或多個(gè)其它設(shè)備的DMA命令?？梢杂腥怐MA命令放置命令，其把數(shù)據(jù)從本地存儲(chǔ)器550移動(dòng)到共享存儲(chǔ)器514；獲取命令，其把數(shù)據(jù)從共享存儲(chǔ)器514移動(dòng)到本地存儲(chǔ)器550；及存儲(chǔ)控制命令，其包含SLI命令和同步命令。同步命令可以包含原子命令，發(fā)送信號(hào)命令，及專用屏蔽命令。響應(yīng)DMA命令，MMU 562把有效地址轉(zhuǎn)換成實(shí)地址并且實(shí)地址被傳遞到BIU 564。
SPU核心510A最好使用通道接口和數(shù)據(jù)接口與DMAC 560內(nèi)的接口通信(發(fā)送DMA命令，狀態(tài)等等)。SPU核心510A通過(guò)通道接口向DMAC 560中的DMA隊(duì)列分配DMA命令。一旦DMA命令處于DMA隊(duì)列中，通過(guò)DMAC 560內(nèi)的發(fā)出和完成邏輯來(lái)處理它。當(dāng)DMA命令的全部總線事務(wù)處理結(jié)束時(shí)，完成信號(hào)通過(guò)通道接口被回送到SPU核心510A。
圖14說(shuō)明PU 504的優(yōu)選結(jié)構(gòu)和功能。PU 504包含兩個(gè)基本功能單元，PU核心504A和存儲(chǔ)流控制器(MFC)504B。PU核心504A執(zhí)行程序處理，數(shù)據(jù)操作，多處理器管理功能等等，MFC 504B執(zhí)行涉及系統(tǒng)100的PU核心504A和存儲(chǔ)器空間之間的數(shù)據(jù)傳送的功能。
PU核心504A可以包含L1高速緩存570，指令單元572，寄存器574，一或多個(gè)浮點(diǎn)執(zhí)行級(jí)段576和一或多個(gè)定點(diǎn)執(zhí)行級(jí)段578。L1高速緩存提供對(duì)通過(guò)MFC 504B從共享存儲(chǔ)器106，處理器102，或存儲(chǔ)器空間的其它部分接收的數(shù)據(jù)的數(shù)據(jù)高速緩存功能。由于PU核心504A最好被實(shí)現(xiàn)為超流水線，指令單元572最好被實(shí)現(xiàn)為具有包含獲取，解碼，相關(guān)性檢查，發(fā)出等等的多個(gè)級(jí)段的指令流水線。為了實(shí)現(xiàn)高處理能力，浮點(diǎn)執(zhí)行級(jí)段576和定點(diǎn)執(zhí)行級(jí)段578包含流水線結(jié)構(gòu)的多個(gè)級(jí)段。取決于所需的處理能力，可以使用更大或更小數(shù)量的浮點(diǎn)執(zhí)行級(jí)段576和定點(diǎn)執(zhí)行級(jí)段578。
MFC 504B包含總線接口單元(BIU)，L2高速緩沖存儲(chǔ)器，非高速緩存單元(NCU)584，核心接口單元(CIU)586和存儲(chǔ)器管理單元(MMU)588。與PU核心504A和總線108相比，大部分MFC 504B以半頻(半速)運(yùn)行以滿足低功耗設(shè)計(jì)目標(biāo)。
BIU 580提供總線108和L2高速緩存582及NCU 584邏輯塊之間的接口。因此，BIU 580可以充當(dāng)總線108上的主以及從設(shè)備以便執(zhí)行完全相干的存儲(chǔ)器操作。作為主設(shè)備，它可以代表L2高速緩存582和NCU 584發(fā)起載入/存儲(chǔ)請(qǐng)求到總線108以得到服務(wù)。BIU 580也可以實(shí)現(xiàn)限制能夠被發(fā)送到總線108的命令的總數(shù)的命令流控制機(jī)構(gòu)?？偩€108上的數(shù)據(jù)操作可以被設(shè)計(jì)為采取8拍，并且因此最好圍繞128字節(jié)高速緩存線設(shè)計(jì)BIU 580，并且一致性和同步粒度是128KB。
L2高速緩沖存儲(chǔ)器582(和支持硬件邏輯)最好被設(shè)計(jì)成高速緩存512KB數(shù)據(jù)。例如，L2高速緩存582可以處理可高速緩存的載入/存儲(chǔ)，數(shù)據(jù)預(yù)取，指令獲取，指令預(yù)取，高速緩存操作和屏蔽操作。L2高速緩存582最好是一個(gè)8向組關(guān)聯(lián)系統(tǒng)。L2高速緩存582可以包含與六(6)個(gè)逐出隊(duì)列(例如，6個(gè)RC機(jī)器)匹配的6個(gè)重新加載隊(duì)列和8個(gè)(64字節(jié)寬)存儲(chǔ)隊(duì)列。L2高速緩存582可以提供L1高速緩存570中的某些或所有數(shù)據(jù)的備份復(fù)制。有利的是，這在處理節(jié)點(diǎn)被熱切換時(shí)用于恢復(fù)狀態(tài)。這個(gè)結(jié)構(gòu)還允許L1高速緩存570以較少端口更快速操作，并且允許更快速的高速緩存到高速緩存的傳送(由于請(qǐng)求可以在L2高速緩存582終止)。這個(gè)結(jié)構(gòu)還提供傳遞高速緩存一致性管理到L2高速緩沖存儲(chǔ)器582的機(jī)構(gòu)。
NCU 584與CIU 586，L2高速緩存存儲(chǔ)器582和BIU 580接口，并且通常充當(dāng)PU核心504A和存儲(chǔ)器系統(tǒng)之間非可高速緩存操作的隊(duì)列/緩沖電路。NCU 584最好處理L2高速緩存582不處理的與PU核心504A的全部通信，例如禁止高速緩存的載入/存儲(chǔ)，屏蔽操作和高速緩存一致性操作。NCU 584最好以半速運(yùn)行以滿足上述功耗目標(biāo)。
CIU 586被布置在MFC 504B和PU核心504A的邊界上，并且充當(dāng)針對(duì)來(lái)自執(zhí)行級(jí)段576，578，指令單元572和MMU單元588并且到L2高速緩存582和NCU 584的請(qǐng)求的路由，仲裁和流控制點(diǎn)。在L2高速緩存582和NCU 584以2∶1速度比操作時(shí)，PU核心504A和MMU 588最好以全速運(yùn)行。因而，頻率邊界存在于CIU 586，并且當(dāng)它在兩個(gè)頻域之間傳遞請(qǐng)求和重新加載數(shù)據(jù)時(shí)，其功能中的一個(gè)是正確處理頻率交叉。
CIU 586包括三個(gè)功能模塊加載單元，存儲(chǔ)單元和重新加載單元。另外，數(shù)據(jù)預(yù)取功能由CIU 586執(zhí)行，并且最好是加載單元的功能部分。CIU 586最好(i)從PU核心504A和MMU 588接受加載和存儲(chǔ)請(qǐng)求；(ii)把請(qǐng)求從全速時(shí)鐘頻率轉(zhuǎn)換到半速(2∶1時(shí)鐘頻率轉(zhuǎn)換)；(iii)路由可高速緩存請(qǐng)求到L2高速緩存582，并且路由非可高速緩存請(qǐng)求到NCU 584；(iv)在針對(duì)L2高速緩存582和NCU 584的請(qǐng)求之間公平仲裁；(v)對(duì)到L2高速緩存582和NCU 584的分派提供流控制，使得在目標(biāo)窗口接收請(qǐng)求并且避免溢出；(vi)接受加載返回?cái)?shù)據(jù)并且將其路由到執(zhí)行級(jí)段576，578，指令單元572或MMU 588；(viii)傳遞探聽(tīng)請(qǐng)求到執(zhí)行級(jí)段576，578，指令單元572，或MMU 588；(viii)把加載返回?cái)?shù)據(jù)和探聽(tīng)傳輸從半速轉(zhuǎn)換到全速。
MMU 588最好提供PU核心540A的地址轉(zhuǎn)換，例如通過(guò)第二級(jí)地址轉(zhuǎn)換設(shè)施。通過(guò)可比MMU 588小得多和更快速的分立指令和數(shù)據(jù)ERAT(用于實(shí)地址轉(zhuǎn)換)陣列，在PU核心504A中優(yōu)選提供第一級(jí)轉(zhuǎn)換。
在一個(gè)最優(yōu)實(shí)施例中，PU 504工作在4-6GHz，10F04，具有64位實(shí)現(xiàn)。寄存器最好是64位長(zhǎng)(盡管一或多個(gè)專用寄存器可更小)并且有效地址是64位長(zhǎng)。指令單元570，寄存器572和執(zhí)行級(jí)段574最好使用實(shí)現(xiàn)(RISC)計(jì)算技術(shù)的PowerPC技術(shù)來(lái)實(shí)現(xiàn)。
涉及該計(jì)算機(jī)系統(tǒng)的模塊化結(jié)構(gòu)的其它詳細(xì)資料可以在美國(guó)專利No.6,526,491中找到，其中這里參考引用了整個(gè)公開(kāi)。
根據(jù)本發(fā)明的至少一個(gè)其它方面，如上所述的方法和設(shè)備可以使用例如附圖中說(shuō)明的適當(dāng)硬件實(shí)現(xiàn)。這些硬件可以使用任何已知技術(shù)實(shí)現(xiàn)，例如標(biāo)準(zhǔn)數(shù)字電路，任何可以執(zhí)行軟件和/或固件程序的已知處理器，一或多個(gè)可編程數(shù)字設(shè)備或系統(tǒng)，例如可編程只讀存儲(chǔ)器(PROM)，可編程陣列邏輯設(shè)備(PAL)等等。此外，盡管附圖中說(shuō)明的設(shè)備被表示為被分成某些功能模塊，這些塊可以通過(guò)分立電路實(shí)現(xiàn)，和/或合并成一或多個(gè)功能單元。此外，本發(fā)明的不同方面可以通過(guò)可被存儲(chǔ)在適當(dāng)存儲(chǔ)介質(zhì)(例如軟盤，存儲(chǔ)器芯片等等)的軟件和/或固件程序?qū)崿F(xiàn)，以進(jìn)行傳送和/或發(fā)布。
盡管這里已經(jīng)參照特定實(shí)施例描述了本發(fā)明，但是應(yīng)當(dāng)理解，這些實(shí)施例僅僅是本發(fā)明的原理和應(yīng)用程序的圖解。因此，應(yīng)當(dāng)理解，可以在不偏離如所附權(quán)利要求限定的本發(fā)明的宗旨和范圍的前提下，對(duì)圖解的實(shí)施例進(jìn)行許多修改。
權(quán)利要求
1.一種設(shè)備，包括具有組織成切片和級(jí)段的矩陣的多個(gè)數(shù)據(jù)路徑處理電路的SIMD處理流水線，其中至少一些處理電路用以在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志至少部分地禁止操作。
2.如權(quán)利要求1所述的設(shè)備，其中處理電路用以響應(yīng)使能標(biāo)志中的相應(yīng)標(biāo)志而獨(dú)立地禁止操作。
3.如權(quán)利要求1所述的設(shè)備，還包括通過(guò)中斷相應(yīng)處理電路的時(shí)鐘信號(hào)來(lái)響應(yīng)使能標(biāo)志的狀態(tài)的時(shí)鐘中斷電路。
4.如權(quán)利要求1所述的設(shè)備，還包括一或多個(gè)控制電路，用以以下中的至少之一(i)根據(jù)使能標(biāo)志禁止來(lái)自相應(yīng)處理電路的相應(yīng)數(shù)據(jù)結(jié)果被寫入到一或多個(gè)目的寄存器；和(ii)使能來(lái)自處理電路的結(jié)果到流水線的一或多個(gè)源操作數(shù)的傳遞。
5.如權(quán)利要求4所述的設(shè)備，其中以下中的至少之一一或多個(gè)控制電路用以禁止來(lái)自處理電路的結(jié)果中的未使用切片字被寫入到目的寄存器；一或多個(gè)控制電路用以使能來(lái)自處理電路的結(jié)果中的使用切片字到一或多個(gè)源操作數(shù)的傳遞；及一或多個(gè)控制電路用以逐個(gè)周期地執(zhí)行禁止和/或使能功能。
6.如權(quán)利要求4所述的設(shè)備，還包括相關(guān)性檢查電路，用以確定仍進(jìn)入流水線的切片的指令的任何操作數(shù)是否依賴處理電路的任何數(shù)據(jù)結(jié)果，其中一或多個(gè)控制電路用以基于相關(guān)性檢查電路的確定結(jié)果和使能標(biāo)志禁止或使能相應(yīng)處理電路的傳遞功能。
7.如權(quán)利要求1所述的設(shè)備，還包括存儲(chǔ)電路，用以存儲(chǔ)各組使能標(biāo)志，每個(gè)組對(duì)于相應(yīng)一個(gè)級(jí)段中的每個(gè)處理電路具有相應(yīng)使能標(biāo)志。
8.如權(quán)利要求7所述的設(shè)備，其中存儲(chǔ)電路用以每個(gè)周期傳送來(lái)自一個(gè)級(jí)段、用于下一個(gè)級(jí)段的處理電路的使能標(biāo)志組。
9.如權(quán)利要求7所述的設(shè)備，其中每組使能標(biāo)志與相應(yīng)SIMD指令相關(guān)。
10.如權(quán)利要求7所述的設(shè)備，其中各組使能標(biāo)志被進(jìn)行以下處理中的至少之一包含在每個(gè)SIMD指令內(nèi)并且被提取和傳送到存儲(chǔ)電路；包含在相應(yīng)SIMD控制指令內(nèi)，每個(gè)控制指令與相應(yīng)SIMD指令相關(guān)，并且由SIMD控制指令產(chǎn)生使能標(biāo)志并且傳送到存儲(chǔ)電路；通過(guò)選擇預(yù)定位組，響應(yīng)于SIMD指令內(nèi)不存在使能標(biāo)志和SIMD控制指令不存在中的至少一種情況而被產(chǎn)生；及響應(yīng)于從SIMD控制指令和SIMD指令的至少一個(gè)解碼出的信息而被產(chǎn)生，并且用于選擇使能標(biāo)志的預(yù)定組。
11.如權(quán)利要求10所述的設(shè)備，其中在以下時(shí)機(jī)的至少一個(gè)處理SIMD控制指令在SIMD指令之前，期間和之后。
12.如權(quán)利要求10所述的設(shè)備，還包括存儲(chǔ)電路，用以存儲(chǔ)使能標(biāo)志的多個(gè)預(yù)定組，從SIMD控制指令和SIMD指令的至少一個(gè)解碼出的信息被用于選擇使能標(biāo)志的一個(gè)預(yù)定組。
13.一種方法，包括在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志而禁止其中處理電路被組織成切片和級(jí)段的矩陣的SIMD處理流水線的至少一些數(shù)據(jù)路徑處理電路。
14.如權(quán)利要求13所述的方法，其中禁止步驟包含響應(yīng)使能標(biāo)志中的相應(yīng)標(biāo)志而獨(dú)立地禁止操作。
15.如權(quán)利要求13所述的方法，其中禁止步驟包含響應(yīng)使能標(biāo)志的狀態(tài)而中斷相應(yīng)處理電路的時(shí)鐘信號(hào)。
16.如權(quán)利要求13所述的方法，其中以下中的至少之一禁止步驟根據(jù)使能標(biāo)志防止來(lái)自相應(yīng)處理電路的相應(yīng)數(shù)據(jù)結(jié)果被寫入到一或多個(gè)目的寄存器；并且該方法還包括使能來(lái)自處理電路的結(jié)果到流水線的一或多個(gè)源操作數(shù)的傳遞。
17.如權(quán)利要求16所述的方法，其中以下中的至少之一禁止步驟包含禁止來(lái)自處理電路的結(jié)果中的未使用切片字被寫入到目的寄存器；傳遞步驟包含使能來(lái)自處理電路的結(jié)果中的使用切片字到一或多個(gè)源操作數(shù)的傳遞；及逐個(gè)周期地執(zhí)行禁止和/或使能的步驟。
18.如權(quán)利要求16所述的方法，其中禁止和/或使能的步驟基于相關(guān)性檢查電路的確定和使能標(biāo)志，相關(guān)性檢查電路用以確定仍進(jìn)入流水線的切片的指令的任何操作數(shù)是否依賴處理電路的任何數(shù)據(jù)結(jié)果。
19.如權(quán)利要求13所述的方法，還包括存儲(chǔ)各組使能標(biāo)志，每個(gè)組對(duì)于相應(yīng)一個(gè)級(jí)段中的每個(gè)處理電路具有相應(yīng)使能標(biāo)志。
20.如權(quán)利要求19所述的方法，還包括每個(gè)周期傳送來(lái)自一個(gè)級(jí)段、用于下一個(gè)級(jí)段的處理電路的使能標(biāo)志組。
21.如權(quán)利要求20所述的方法，其中每組使能標(biāo)志與相應(yīng)SIMD指令相關(guān)。
22.如權(quán)利要求20所述的方法，還包括以下中的至少之一在相應(yīng)SIMD指令內(nèi)提供各組使能標(biāo)志，并且提取使能標(biāo)志以供存儲(chǔ)；在相應(yīng)SIMD控制指令內(nèi)提供各組使能標(biāo)志，使每個(gè)控制指令與相應(yīng)一個(gè)SIMD指令相關(guān)，并且從SIMD控制指令產(chǎn)生使能標(biāo)志以供存儲(chǔ)；當(dāng)指定SIMD指令不包含使能標(biāo)志和不存在SIMD控制指令中的至少一個(gè)情況時(shí)，解碼相應(yīng)SIMD指令并且選擇預(yù)定位組以產(chǎn)生各組使能標(biāo)志；及從SIMD控制指令和SIMD指令的至少一個(gè)解碼出信息，并且使用該信息選擇使能標(biāo)志的預(yù)定組。
23.一種存儲(chǔ)介質(zhì)，包含可執(zhí)行程序，該可執(zhí)行程序用以使得處理系統(tǒng)執(zhí)行包含如下的操作在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志而禁止其中處理電路被組織成切片和級(jí)段的矩陣的SIMD處理流水線的至少一些數(shù)據(jù)路徑處理電路。
24.如權(quán)利要求23所述的存儲(chǔ)介質(zhì)，其中禁止步驟包含響應(yīng)使能標(biāo)志中的相應(yīng)標(biāo)志而獨(dú)立地禁止處理電路。
25.如權(quán)利要求23所述的存儲(chǔ)介質(zhì)，其中禁止步驟包含響應(yīng)使能標(biāo)志的狀態(tài)而中斷相應(yīng)處理電路的時(shí)鐘信號(hào)。
26.如權(quán)利要求23所述的存儲(chǔ)介質(zhì)，其中以下中的至少之一禁止步驟根據(jù)使能標(biāo)志防止來(lái)自相應(yīng)處理電路的相應(yīng)數(shù)據(jù)結(jié)果被寫入到一或多個(gè)目的寄存器；并且該方法還包括使能來(lái)自處理電路的結(jié)果到流水線的一或多個(gè)源操作數(shù)的傳遞。
27.如權(quán)利要求26所述的存儲(chǔ)介質(zhì)，其中以下中的至少之一禁止步驟包含禁止來(lái)自處理電路的結(jié)果中的未使用切片字被寫入到目的寄存器；傳遞步驟包含使能來(lái)自處理電路的結(jié)果中的使用切片字到一或多個(gè)源操作數(shù)的傳遞；及逐個(gè)周期地執(zhí)行禁止和/或使能的步驟。
28.一種設(shè)備，包括具有被組織成切片和級(jí)段的矩陣的多個(gè)數(shù)據(jù)路徑處理電路的SIMD處理流水線；和傳遞電路，用以在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志而使能或禁止結(jié)果從處理電路到流水線的一或多個(gè)源操作數(shù)的傳遞。
29.如權(quán)利要求28所述的設(shè)備，其中以下中的至少之一傳遞電路用以使能來(lái)自處理電路的結(jié)果中的使用切片字到一或多個(gè)源操作數(shù)的傳遞；傳遞電路用以禁止來(lái)自處理電路的結(jié)果中的未使用切片字到一或多個(gè)源操作數(shù)的傳遞；傳遞電路用以逐個(gè)周期地執(zhí)行禁止和/或使能功能；傳遞電路用以逐個(gè)周期基地行禁止和/或使能功能。
30.如權(quán)利要求28所述的設(shè)備，還包括相關(guān)性檢查電路，用以確定仍進(jìn)入流水線的切片的指令的任何操作數(shù)是否依賴處理電路的任何數(shù)據(jù)結(jié)果，其中傳遞電路用以基于相關(guān)性檢查電路的確定結(jié)果和使能標(biāo)志禁止或使能相應(yīng)處理電路的傳遞功能。
31.如權(quán)利要求28所述的設(shè)備，其中每組使能標(biāo)志與相應(yīng)SIMD指令相關(guān)。
32.如權(quán)利要求31所述的設(shè)備，其中各組使能標(biāo)志被進(jìn)行以下處理中的至少之一包含在每個(gè)SIMD指令內(nèi)并且被提取和傳送到存儲(chǔ)電路；包含在相應(yīng)SIMD控制指令內(nèi)，每個(gè)控制指令與相應(yīng)SIMD指令相關(guān)，并且由SIMD控制指令產(chǎn)生使能標(biāo)志并且傳送到存儲(chǔ)電路；通過(guò)選擇預(yù)定位組，響應(yīng)于SIMD指令內(nèi)不存在使能標(biāo)志和SIMD控制指令不存在中的至少一種情況而被產(chǎn)生；及響應(yīng)于從SIMD控制指令和SIMD指令的至少一個(gè)解碼出的信息而被產(chǎn)生，并且用于選擇使能標(biāo)志的預(yù)定組。
全文摘要
方法和設(shè)備設(shè)置為在指定周期內(nèi)響應(yīng)一或多個(gè)使能標(biāo)志而禁止其中處理電路被組織成切片和級(jí)段的矩陣的SIMD處理流水線的至少一些數(shù)據(jù)路徑處理電路。
文檔編號(hào)G06F15/80GK1811745SQ20061000513
公開(kāi)日2006年8月2日申請(qǐng)日期2006年1月12日優(yōu)先權(quán)日2005年1月13日
發(fā)明者戶塚米太郎申請(qǐng)人:索尼計(jì)算機(jī)娛樂(lè)公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：戶塚米太郎
技術(shù)所有人：索尼計(jì)算機(jī)娛樂(lè)公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無(wú)損檢測(cè)
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺(jué) 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢(shì)感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

微處理器和微控制器相關(guān)技術(shù)

控制器和處理器相關(guān)技術(shù)

xta處理器控制軟件相關(guān)技術(shù)

微處理器信號(hào)控制機(jī)相關(guān)技術(shù)

p2020處理器ddr控制器相關(guān)技術(shù)

微控制器與微處理器相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

使能/禁止控制simd處理器切片的方法和設(shè)備的制作方法