GeForce GTX 1070首發(fā)評(píng)測 極致性價(jià)比(4)
前不久,我們?yōu)榇蠹規(guī)砹薔VIDIAGeForceGTX1080顯卡的評(píng)測,作為Pascal架構(gòu)的首款產(chǎn)品,GTX1080的性能確實(shí)沒有令我們失望,其綜合性能大幅領(lǐng)先上代旗艦GTXTitanX,成為了NVIDIA游戲顯卡的新標(biāo)桿。然而這款顯卡高。...
第四代delta色彩壓縮技術(shù)
顯存壓縮技術(shù)對(duì)于提高顯卡性能是很有幫助的。同之前的NVIDIAGPU一樣,全新的GTX1070也采用了這樣一種無損壓縮技術(shù)。這種技術(shù)有以下幾點(diǎn)好處:減少顯存數(shù)據(jù)寫入量;減少數(shù)據(jù)從顯存到GPU二級(jí)緩存的數(shù)據(jù)傳輸量,有效增加了GPU二級(jí)緩存的容量以及降低紋理單元和幀緩存間的數(shù)據(jù)傳輸量。
第四代delta色彩壓縮技術(shù)
顯存壓縮技術(shù)中最重要的一種就是“delta色彩壓縮技術(shù)”,這種技術(shù)讓GPU計(jì)算每一個(gè)塊中像素的差異,然后將相同色彩的像素信息進(jìn)行壓縮,在極端狀況下,壓縮儲(chǔ)存后的參考像素還不及未經(jīng)壓縮像素一半的大小,這無疑大大減小了數(shù)據(jù)傳輸量。
異步運(yùn)算技術(shù)
從傳統(tǒng)角度上看,GPU主要承擔(dān)的任務(wù)是圖形渲染,系統(tǒng)會(huì)將待處理的工作按照指定流程傳遞給GPU,以便讓圖像能夠以正確的順序顯示出來,這點(diǎn)對(duì)于圖形渲染來說非常重要。而現(xiàn)如今隨著GPU功能的不斷挖掘以及架構(gòu)的不斷升級(jí),許多計(jì)算、復(fù)制的工作也會(huì)交由GPU來做,如果仍然只有一條序列的話,渲染、計(jì)算、復(fù)制三項(xiàng)任務(wù)將會(huì)互相搶占,造成“交通擁堵”,運(yùn)行效率自然大打折扣。因此多條序列分別處理渲染、計(jì)算、復(fù)制等工作才能大大提升GPU效率,這種技術(shù)就是異步運(yùn)算技術(shù)。
說起異步運(yùn)算技術(shù),大家可能會(huì)首先想到AMD的GCN架構(gòu),GCN的異步著色器技術(shù)讓GCN架構(gòu)的A卡在DX12中擁有了出色的性能表現(xiàn)。隨著DX12時(shí)代的全面到來,NVIDIA的全新GTX1070自然也是在異步運(yùn)算上狠下功夫。官方宣稱,GTX1070有著完全的異構(gòu)計(jì)算能力,借助異構(gòu)著色器,GPU可以并行處理多任務(wù),而非按優(yōu)先級(jí)進(jìn)行候選或者搶占。
動(dòng)態(tài)負(fù)載平衡技術(shù)
首先為大家介紹的是Pascal架構(gòu)引入的全新技術(shù)――動(dòng)態(tài)負(fù)載平衡。為了讓大家能夠更直觀地了解這項(xiàng)技術(shù),我們看上面這張圖:橫坐標(biāo)是時(shí)間,縱坐標(biāo)是GPU資源分配百分比,淺綠色是圖形工作量,深綠色部分是計(jì)算工作量,而灰色斜紋部分為空閑。首先看上半部分的靜態(tài)平衡,如果計(jì)算工作量所需的時(shí)間比圖形工作量的時(shí)間長,而兩個(gè)工作需要同時(shí)完成才能進(jìn)行新的工作,那么進(jìn)行圖形工作的GPU就會(huì)有一部分閑置出來,這就浪費(fèi)了GPU的性能;接著我們看下圖的動(dòng)態(tài)平衡,當(dāng)計(jì)算工作量先完成時(shí),負(fù)責(zé)計(jì)算工作的GPU資源就會(huì)去幫助完成剩余的圖形工作,這樣就不會(huì)有閑置的GPU資源,并且大大降低了工作所需的時(shí)間,這就是Pascal的動(dòng)態(tài)負(fù)載平衡技術(shù)。
Pascal架構(gòu)的搶占技術(shù)
然后是有關(guān)GPU搶占的技術(shù)。了解VR的朋友們一定聽說過“異步時(shí)間扭曲”技術(shù),異步時(shí)間扭曲是指在一個(gè)線程(稱為ATW線程)中進(jìn)行處理,這個(gè)線程和渲染線程平行運(yùn)行(異步),在每次同步之前,ATW線程根據(jù)渲染線程的最后一幀生成一個(gè)新的幀。(有關(guān)異步時(shí)間扭曲的知識(shí)請(qǐng)參見《小菜硬件雜談?wù)f說VR里的異步時(shí)間扭曲》)實(shí)現(xiàn)異步時(shí)間扭曲需要GPU支持合理的搶占粒度,那么搶占指的是什么意思呢?所謂搶占,就是指為了使重要工作得以快速運(yùn)行,GPU會(huì)選擇性關(guān)閉不太重要的工作,從而提高重要工作的運(yùn)行效率。Pascal架構(gòu)是史上首個(gè)支持像素級(jí)搶占的GPU架構(gòu),當(dāng)接收搶占請(qǐng)求時(shí),Pascal的圖形單元會(huì)記錄下那些優(yōu)先級(jí)較低的工作被中斷時(shí)的位置,優(yōu)先處理那些重要的工作;當(dāng)搶占結(jié)束后,其余的工作從之前被中斷的位置開始繼續(xù)執(zhí)行。
搶占在VR中的應(yīng)用――異步時(shí)間扭曲(ATW)技術(shù)
Pascal的搶占不僅作用于圖形工作中,在計(jì)算工作中也可以實(shí)現(xiàn)。線程級(jí)的搶占和像素級(jí)搶占的實(shí)現(xiàn)方式類似,都是停下當(dāng)前優(yōu)先級(jí)較低的線程塊的工作,去支援優(yōu)先級(jí)較高的SMs運(yùn)算線程,當(dāng)搶占結(jié)束后,從之前中斷的地方開始繼續(xù)計(jì)算工作。對(duì)于游戲來說,像素級(jí)搶占和線程級(jí)搶占相結(jié)合讓Pascal架構(gòu)GPU可以以極快的速度和最小的性能開銷實(shí)現(xiàn)搶占,同時(shí)對(duì)于CUDA計(jì)算任務(wù),Pascal也可以以最好的搶占粒度去實(shí)現(xiàn)搶占。
FastSync技術(shù)
FastSync是一種替代傳統(tǒng)垂直同步的防止畫面撕裂的技術(shù)。同V-Sync不同的是,開啟FastSync后,在做到防止畫面撕裂的同時(shí)能夠不降低顯卡的性能,也就是說FastSync能夠?qū)崿F(xiàn)V-Sync開啟時(shí)的流暢畫面,并且有著如同未開啟V-Sync一樣的低延遲。從下圖可以看出,F(xiàn)astSync的延遲僅比關(guān)閉V-Sync時(shí)的延遲多了8ms,這點(diǎn)差距還是十分令人滿意的。最后,F(xiàn)astSync技術(shù)可以搭配G-Sync技術(shù)一起使用,為玩家?guī)砀玫囊曈X效果。
FastSync和V-Sync延遲對(duì)比
GPUBoost3.0
GPUBoost是NVIDIA推出的GPU動(dòng)態(tài)提速技術(shù),能夠在TDP允許的范圍內(nèi),盡可能地提高GPU運(yùn)行頻率,進(jìn)而提升GPU工作效率。全新的GTX1070為我們帶來了這個(gè)技術(shù)的最新升級(jí)版――GPUBoost3.0。GPUBoost3.0可以設(shè)置各個(gè)電壓點(diǎn)的頻率偏移。GPUBoost2.0及以前的版本只能實(shí)現(xiàn)固定的頻率偏移,也就是說頻率的提升只能呈線性的方式,提升后的頻率無法達(dá)到此電壓下對(duì)應(yīng)的最大頻率。
GPUBoost2.0與3.0之間的區(qū)別
GPUBoost3.0就很好地解決了這個(gè)問題,頻率偏移可以對(duì)應(yīng)到單個(gè)電壓點(diǎn),而不是像之前的線性相關(guān),這樣就可以使得GPU的頻率達(dá)到該電壓下所能實(shí)現(xiàn)的最大值,大大提升了GPUBoost的效果。全新的GPUBoost3.0還能與超頻軟件相結(jié)合,讓玩家可以手動(dòng)調(diào)整頻率偏移曲線,來達(dá)到理想的GPU頻率。
-
無相關(guān)信息