GPU是什么意思？

Infocode藍(lán)暢 2年前互聯(lián)網(wǎng)開發(fā) 1927

GPU是什么意思？

圖形處理器（英語：graphics processing unit，縮寫：GPU），又稱顯示核心、視覺處理器、顯示芯片，是一種專門在個(gè)人電腦、工作站、游戲機(jī)和一些移動(dòng)設(shè)備（如平板電腦、智能手機(jī)等）上做圖像和圖形相關(guān)運(yùn)算工作的微處理器。

GPU是圖形處理器，一般GPU就是焊接在顯卡上的，大部分情況下，我們所說GPU就等于指顯卡，但是實(shí)際情況是GPU是顯示卡的“心臟”，是顯卡的一個(gè)核心零部件，核心組成部分。它們是“寄生與被寄生”關(guān)系。GPU本身并不能單獨(dú)工作，只有配合上附屬電路和接口，才能工作。這時(shí)候，它就變成了顯卡。

理器”。(圖像處理單元)GPU是相對(duì)于CPU的一個(gè)概念，由于在現(xiàn)代的計(jì)算機(jī)中(特別是家用系統(tǒng)，游戲的發(fā)燒友)圖形的處理變得越來越重要，需要一個(gè)專門的圖形的核心處理器。

GPU工作原理

簡單說GPU就是能夠從硬件上支持T&L（Transform and Lighting，多邊形轉(zhuǎn)換和光源處理）的顯示芯片，由于T&L是3D渲染中的一個(gè)重要部分，其作用是計(jì)算多邊形的3D位置與處理動(dòng)態(tài)光線效果，也能稱為“幾何處理”。

一個(gè)好的T&L單元，能提供細(xì)致的3D物體和高級(jí)的光線特效；只不過大多數(shù)PC中，T&L的大部分運(yùn)算是交由CPU處理的(這就也就是所謂軟件T&L)，因?yàn)镃PU的任務(wù)繁多，除了T&L之外，還要做內(nèi)存管理和輸入響應(yīng)等非3D圖形處理工作，所以在實(shí)際運(yùn)算的時(shí)候性能會(huì)大打折扣。

			驗(yàn)證碼 姓名 手機(jī)號(hào)
			
姓名 *請(qǐng)輸入姓名或昵稱
手機(jī)號(hào) *
需要咨詢的內(nèi)容 *如果您有任何疑問、需要更多信息或希望與我們建立合作請(qǐng)留言
驗(yàn)證碼 *
				
											=

回復(fù)

共1條回復(fù) 我來回復(fù)

Infocode藍(lán)暢評(píng)論

與CPU相比，專用圖形硬件唯一的計(jì)算優(yōu)勢(shì)是速度，但速度卻至關(guān)重要。

這里首先介紹一下GPU中的數(shù)據(jù)并行處理通用策略，不同的處理器體系結(jié)構(gòu)使用了不同的策略來避免延遲。CPU通常采用存取速度較快的本地緩存來避免延遲問題，還可以通過使用諸如分支預(yù)測(cè)、指令重新排序、寄存器重命名和緩存預(yù)取技術(shù)來避免延遲。

而GPU采用不同的策略，GPU芯片上的大部分區(qū)域都集成的shader core。shader core是由一大組（通常上千個(gè)）處理器（processors）構(gòu)成的并行處理單元。GPU是一個(gè)流處理器，依次處理有序的相似數(shù)據(jù)集。比如一組頂點(diǎn)或片元就是相似的數(shù)據(jù)集。因此GPU可以以大規(guī)模并行的方式處理這些數(shù)據(jù)。另一個(gè)重要的因素是，數(shù)據(jù)處理是盡可能獨(dú)立的，因此它們不需要來自鄰近的（頂點(diǎn)，片元）信息，也不共享可寫的內(nèi)存位置。這個(gè)規(guī)則有時(shí)會(huì)被打破，但會(huì)帶來多余的延遲。

GPU對(duì)數(shù)據(jù)處理速度做了單獨(dú)的優(yōu)化，但是也有其自己的弊端。由于高速緩存（cache memory）和控制邏輯（control logic）的芯片面積更少。每個(gè)著色核心（shader core）的延遲通常比CPU處理器遇到的延遲要高得多。

這里以GPU運(yùn)行時(shí)由于讀取紋理時(shí)遇到的延遲來舉例。這是最常見的發(fā)生延遲的情況，因?yàn)榧y理通常存儲(chǔ)在外部內(nèi)存（顯存）上而不是靠近shader core 的cache。讀取通常需要成百上千個(gè)時(shí)鐘周期。假如現(xiàn)在有100個(gè)片元等待計(jì)算。處理器正在執(zhí)行第一個(gè)片元著色器，并按以下步驟執(zhí)行：1.做一個(gè)簡單的代數(shù)計(jì)算。2.讀取紋理。為了隱藏第二步讀取紋理時(shí)的延遲，處理器會(huì)在等待數(shù)據(jù)傳輸時(shí)先切換到第二個(gè)片元著色器，并執(zhí)行第二個(gè)片元著色器的第一步1.做一個(gè)簡單的代數(shù)計(jì)算。然后第二個(gè)片元著色器會(huì)讀取紋理，接著切換到第三個(gè)……一直到100個(gè)片元著色器的第一步都執(zhí)行完畢。然后第一個(gè)片元著色器的紋理讀取此時(shí)已經(jīng)完成，開始執(zhí)行第一個(gè)片元著色器的后續(xù)步驟。

在上述例子中，GPU通過切換片元來保持繁忙來隱藏延遲。更進(jìn)一步，gpu通過將指令執(zhí)行邏輯與數(shù)據(jù)分離來使得這個(gè)設(shè)計(jì)更進(jìn)一步。稱為single instruction, multiple data(SIMD)。顧名思義，這種設(shè)計(jì)使一組固定數(shù)量著色程序同步執(zhí)行相同的指令，雖然計(jì)算時(shí)它們各自的數(shù)據(jù)可能有所不同。相比起單個(gè)邏輯和調(diào)度單元來運(yùn)行每個(gè)程序，這樣會(huì)節(jié)省大量功耗以及減少用以處理，交換數(shù)據(jù)的芯片。

現(xiàn)在把上述的例子轉(zhuǎn)換成GPU中常用術(shù)語。對(duì)每個(gè)片元著色器的調(diào)用稱為線程（thread）。與cpu的線程稍微有點(diǎn)不用的是，GPU的線程需要為著色器程序的輸入準(zhǔn)備少量的內(nèi)存資源，同時(shí)還有執(zhí)行期間的寄存器資源。使用相同著色器程序的線程被打包成組（比如一組內(nèi)都是片元著色器或者頂點(diǎn)著色器）。這樣的一組被稱為warps（NVIDIA）或者wavefronts （AMD）。warp會(huì)由一些數(shù)量的shader core使用SIMD方案執(zhí)行（sahder core的數(shù)量8到64不等）。warp中的每一個(gè)線程（tread）對(duì)應(yīng)了一個(gè)SIMD lane（可以理解為一個(gè)待執(zhí)行線程對(duì)應(yīng)著SIMD并行處理架構(gòu)中的一個(gè)處理通道。）

現(xiàn)在用一個(gè)新的例子，這里有2000個(gè)片元著色器待處理。也就是2000個(gè)線程（thread）。nividia通常把32個(gè)線程綁定為一個(gè)warp。也就是分成了 2000/32 = 62.5 個(gè)warp。這里取整數(shù)也就是63個(gè)warp，第63個(gè)warp中少放點(diǎn)線程就行。warp中的32個(gè)線程會(huì)以在32個(gè)處理器上同步執(zhí)行。當(dāng)warp執(zhí)行到內(nèi)存讀取這種延遲較高的步驟時(shí)，此時(shí)warp中的32個(gè)線程因?yàn)橥?，都在?zhí)行當(dāng)前內(nèi)存讀取的指令。為了減少延遲，這32個(gè)處理器會(huì)切換到下一個(gè)warp執(zhí)行。和上文提到的單個(gè)處理器例子類似，只是處理器的數(shù)量和對(duì)應(yīng)的線程數(shù)量變成了原來的32倍。但是切換時(shí)的速度還是和單核的一樣快。

2年前 0條評(píng)論

已關(guān)閉回復(fù)。

欧美 日韩 国产 亚洲 色,麻豆国产精品久久人妻,内射视频←www夜,内射精品无码中文字幕,蜜臀av在线观看

GPU是什么意思？