seria Nvidia geforce 9600 gt. Determinați seria de produse de plăci video Nvidia

A noua generație de plăci video Nvidia a fost lansată la începutul anului 2008. Centrul atenției va fi chipsetul mid-range categorie de pret- GeForce 9600 GT. Caracteristici, rezultatele testelor, impresie generala din stabilitatea muncii - toate acestea le găsiți mai jos. Drept urmare, puteți alege

Istoria apariției

În 2008, când AMD era ocupat cu lansarea plăcilor grafice de buget, Nvidia avea doar copii ale variantei de top. Astfel, s-au lipsit de cel mai mare segment de consumatori. A apărut întrebarea despre crearea unui concurent pentru seria Radeon 3800. În primul rând, am încercat să ocupăm această nișă cu o versiune mai slabă a plăcii video de top GeForce 8800. A fost redusă la 256 MB ridicoli. Și placa a fost scoasă la vânzare. Cu toate acestea, printre utilizatorii de PC, această modificare a plăcii video nu a câștigat popularitate.

Profitul din vânzări a fost neglijabil. Acest lucru se datorează faptului că costul unui astfel de cip de top este suficient de mare pentru a-i reduce performanța și a se vinde la un preț scăzut. Drept urmare, a noua serie a ieșit în prim-plan. Inițial, producția era programată să înceapă nu mai devreme de un an mai târziu. În special, acest lucru se aplică primului GT. Caracteristicile plăcii video sunt la nivel mediu: între 8600 și 8800 GTS. Din gama de modele Concurentul AMD este seria 3800.

Sloganul de vânzări al lui 9600 GT a fost: performanță bună pentru bani puțini. Din recenzie veți afla dacă afirmația a fost confirmată sau nu despre placa video Nvidia 9600 GT, ale cărei caracteristici sunt impresionante. Acest cip grafic a devenit adevăratul fondator al unei întregi generații de noi chipset-uri, care au adus și mai multă popularitate companiei și s-au extins semnificativ. baza de clienti atât în ​​rândul cumpărătorilor de fier de călcat de calitate superioară, cât și în segmentul de preț mediu.

Specificații Nvidia 9600 GT

Deci, să ne dăm seama ce este această placă video. Baza a fost chipsetul 8800 GTS. Doar tăiate în parametri. Deoarece 8800 GTS a fost doar o dezvoltare intermediară, ale cărei tehnologii au fost aplicate mai târziu în 9800. Baza pentru card a fost chipset-ul G94, la fel ca în seria 8800. Vă întrebați: de ce, atunci, costă mult mai puțin și pe ce economisește producătorul? Răspunsul este destul de simplu. 9600 GT a redus la jumătate numărul de procese de streaming în comparație cu modelul mai vechi. Acest lucru ne-a permis să reducem semnificativ prețul. Dar câștigul de performanță a fost obținut prin utilizarea acelorași magistrale pe 256 de biți. Acest lucru a făcut posibilă atingerea unor rate mai mari de frecvență a procesorului și procesare shader.

Potrivit modelului 9600 GT, ale cărui caracteristici au fost reduse, este mai productiv decât seria 8800 cu până la 15%. Este o descoperire în tehnologie! Puțin mai târziu, vom stabili prin teste practice dacă acest lucru este adevărat sau nu. De asemenea, placa video este echipată cu 512 MB de memorie internă, suport pentru modul SLI ( conexiune simultană la un sistem de până la trei plăci video identice care funcționează în paralel). Are o interfață DirectX 10 și toți conectorii necesari pentru conectarea monitoarelor, afișarea imaginilor pe un televizor și așa mai departe.

Vedere externă a plăcii video

Placa a devenit ceva mai mică decât predecesorul său, în principal datorită simplificării tehnologiei. Acest lucru vă permite să-l instalați în cazuri cu buget destul de redus. La urma urmei, 9600 GT (caracteristicile nivelului mediu) ar trebui să corespundă clasei sale, orice s-ar spune. În întreaga zonă a plăcii există multe găuri care sunt concepute pentru a îmbunătăți disiparea căldurii. De sus se inchide cu o carcasa din plastic cu un radiator si un cooler. Acest lucru este suficient pentru a menține o temperatură scăzută stabilă chiar și la sarcini mari.

Rezultatele testului

Pentru a efectua teste în jocuri, a fost instalat următorul stand. Proces de la Intel - Core 2 Duo, dual-core cu o frecvență de 3 Hz pentru fiecare nucleu. În plus, erau disponibile 4 GB de RAM, HDD cu o capacitate de 750 GB și o sursă de alimentare Acbel de 500 W. Testarea a fost efectuată în acele jocuri care erau relevante la momentul lansării plăcii video 9600 GT. Caracteristicile calculatorului de bancă corespund, de asemenea, acelei perioade.

Pe baza indicatorilor din jocurile Crysis, Call of Duty 4, Bioshock, Lost Planet. Toate au rulat cu suport DirectX 10 și la setări maxime la rezoluție Full-HD. Primul joc (Crysis) s-a comportat foarte prost - doar 10 cadre pe secundă. Afectează modelul bugetar al plăcii video. În Call of Duty 4 și Bioshock, jocul produce 40 de cadre pe secundă stabil la setările maxime. Acest lucru este deja bun pentru segmentul de preț mediu al cipurilor video. Lost Planet a fost confortabil de jucat la setări medii sau scăzute cu rezoluția maximă a ecranului.

Consumul de energie și overclockarea

Să trecem la consumul de energie. Inginerii Nvidia au reușit să reducă consumul de energie cu până la 15%. Creatorii arată în toate felurile apartenența la clasa de mijloc placi grafice Nvidia 9600 GT: caracteristicile, consumul de energie, performanța sunt la un nivel bun pentru prețul său. Creatorii plăcii video nu au uitat de cei cărora le place să experimenteze cu hardware-ul lor. Capacitățile de overclock au decis să nu atingă. Prin urmare, pe riscul și riscul lor, proprietarii pot încerca să creeze un adevărat monstru și cuceritor al jocurilor moderne dintr-o tablă cu o performanță medie.

Recent, AMD și-a intensificat semnificativ activitățile pe piața plăcilor grafice mid-range și superioare mid-range. gama de prețuri- cea mai cumpărată clasă de plăci grafice discrete. Desigur, NVIDIA nu a putut ignora acest fapt, dar sincer să fiu, „răspunsul simetric” este impresionant.

Introducere

Totul a început destul de prozaic - cu o actualizare a liniei grafice de nivel mediu Chipset-uri NVIDIA. Cu toate acestea, în ciuda aceluiași „număr de serie” al plăcii video ca și cel al liniei emblematice, adaptorul bazat pe noul GPU, care a primit indexul G92, este încă poziționat de dezvoltator ca o soluție de vârf.

În primul rând, G92 este fabricat conform unei noi tehnologii de proces de 65 nm, care a făcut posibilă creșterea frecvențelor la 600-650 MHz per cip (standardul pentru G80 este de 575 MHz) și, în același timp, reducerea puterii. consum. Pe lângă frecvență, a crescut și numărul de procesoare unificate - până la 112 unități față de 96 pentru GeForce 8800 GTS 640/320 MB (nu are sens să ne amintim deloc de GeForce 8600). O comparație cu 128 de procesoare din cipul GeForce 8800 GTX/Ultra ar fi incorectă, deoarece acestea sunt plăci video de top, care diferă foarte mult ca preț de 8800 GT 512 MB, deși noul middle-end ajunge uneori la flagship-ul companiei în termenii de performanță.

Mai mult, NVIDIA a abandonat experimentele cu magistralele de memorie pe 320 și 384 de biți, momentan 256 de biți este suficient pentru un procesor de această putere și pentru preț. produs final acest parametru are un efect foarte semnificativ. Rămâne de adăugat că frecvența de memorie standard pentru GeForce 8800 GT 512 MB este considerată a fi de 1800 MHz (eficientă), iar ca interfață este folosită PCI Express 2.0, care, după cum știm deja, se dezvăluie în toată gloria atunci când folosind „tandem” de plăci video (în cazul modului NVIDIA - SLI).

Dar după introducerea plăcilor video scumpe (relativ) mid-range bazate pe G92, a apărut un gol între GeForce 8800 GT și GeForce 8600 GTS, care trebuiau umplute cu ceva. Și în aceste scopuri, noul procesor grafic G94 este pe măsură, destinat inițial acceleratoarelor de nivel mediu cu prețuri de până la 200 USD, în care ATI Radeon 3870/3850 se potrivește deja bine.

NVIDIA GeForce 9600 GT

Deci, ce este GeForce 9600 GT bazat pe G94, prezentat pe 21 februarie a acestui an? Primul lucru care atrage atenția este noua serie linii GeForce. După cum ne amintim, NVIDIA a prezentat mai întâi un chipset de clasă high-end, iar abia mai târziu - soluții mai accesibile. LA acest caz seria GeForce 9xxx și-a început numărătoarea inversă cu o soluție mid-range, în plus, cu un preț foarte atractiv. Urmează apariția GPU-ului - cristalul este rotit cu 45 °.

Și, în sfârșit, specificații, care nu sunt foarte diferite de cele ale lui G92 cunoscute nouă. De fapt, G94 poate fi numit un derivat al GPU-ului mai vechi: aceeași tehnologie de proces de 65 nm, datorită căreia a fost posibilă creșterea frecvenței de bază la 650 MHz; o arhitectură care împrumută tot ce este mai bun de la G80 și G84; interfață de memorie pe 256 de biți; Suport magistrală PCI Express 2.0; noul procesor video PureVideo HD responsabil pentru procesarea video de înaltă definiție.

placa video GeForce 9600 GT GeForce 8800 GTX GeForce 8800 GT GeForce 8600 GTS
Nucleu G94 G80 G92 G84
Număr de tranzistori, mln. 505 681 754 289
Tehnologia proceselor, nm 65 90 65 80
Numărul de procesoare de flux 64 128 112 32
Numărul de TMU 32* 32 56* 16*
Numărul de POR 16 24 16 8
Frecvența nucleului/procesorului, MHz 650/1650 575/1350 600/1500 675/1450
Tipul memoriei GDDR3 GDDR3 GDDR3 GDDR3
Frecvență memorie DDR, MHz 1800 1800 1800 2000
Bus de memorie, bit 256 384 256 128
Dimensiunea memoriei, MB 512 768 512 256
Lățimea de bandă a memoriei, GB/s 57,6 86,4 57,6 32
Interfață PCI Express 2.0 PCI Express PCI Express 2.0 PCI Express
Versiune acceptată de DirectX 10 10 10 10
Consumul de energie, W 95 177 115 71

* - Datele TMU diferă de cele din G80

O diferență semnificativă este numărul redus de procesoare de flux și, prin urmare, tranzistori - în G94 există doar 64 de procesoare de flux (în G92 - 112) și funcționează la o frecvență de 1625 MHz, tranzistori - aproximativ 505 milioane. de unități a fost, de asemenea, redusă la 32 (există 56 dintre ele în G92), dar din cauza caracteristicilor arhitecturale, acestea nu vor putea rula mai repede de 32 de TMU în G80. Mai degrabă, viteza TMU în noul cip poate fi echivalată cu 16 unități de textură ale flagship-ului companiei, dar numai condiționat. Numărul de ROP-uri a rămas neschimbat în comparație cu G92 - aceleași 16 piese. După cum puteți vedea din specificații, noua soluție accesibilă de gamă medie are de două ori mai multe unități funcționale și o magistrală de memorie, spre deosebire de GeForce 8600 GTS, care, desigur, ar trebui să coboare în curând la nivelul de „cuiva peste 100 de ani, dar nu încă 150”, desigur. Acum referitor la memorie. La fel ca GeForce 8800 GT, noile acceleratoare suportă 512 MB GDDR3 la 1800 MHz, care, cu o magistrală de 256 de biți, poate transfera date până la 57,6 GB pe secundă - o viteză nemaivăzută până acum pentru astfel de soluții.

Designul PCB al plăcilor de referință bazate pe GeForce 9600 GT este ușor simplificat în comparație cu GeForce 8800 GT, dar aspectul memoriei rămâne același. Cablul de alimentare a scăzut și el puțin în greutate - consumul de energie declarat este de doar 95 W, dar, în ciuda suportului pentru PCI-E 2.0, plăcile sunt echipate cu un conector de alimentare suplimentar. Sistemul de răcire de referință este același cooler cu un singur slot care acoperă întreaga placă, cu un ventilator de diametru mare, ca pe SS-ul celei de-a doua revizii de la GeForce 8800 GT. Găurile de montare sunt compatibile cu cele de pe GeForce 7900, așa că, dacă este necesar, nu va fi dificil să înlocuiți sistemul de răcire cu unul alternativ.

De asemenea, merită remarcat suportul pentru noul GPU interfețe HDMIși DisplayPort, acesta din urmă fiind implementat în cipul propriu-zis, spre deosebire de G92. Porturile în sine pot fi realizate fie pe carduri cu un design special, fie prin intermediul unui adaptor conectat la unul dintre cele două DVI Dual Link. Pentru a transmite sunetul în tranzit, cardurile au un conector special.

Acum este momentul să ne consolidăm partea teoretică cu una practică, folosind exemplul unei plăci video de la Zotac.

Zotac GeForce 9600 GT AMP!

Compania Zotac a apărut pe piață relativ recent și nu este cunoscută de toată lumea din Ucraina. Cu toate acestea, faptul că Zotac este membru al grupului PC Partner, care, la rândul său, ar trebui să vă fie cunoscut de marca Sapphire, care este specializată în produse cu cipuri AMD ca „motor de foc”, înlătură o parte semnificativă a temerile. În consecință, Zotac este aproximativ același, dar cu accent pe produsele NVIDIA.

Placa Zotac GeForce 9600 GT venită la noi pentru testare aparține seriei AMP!, a cărei diferență principală o reprezintă frecvențele de operare mai mari față de cele de referință. În cazul nostru, formula frecvenței arăta ca 725/1750/2000 MHz (cip, unitate de shader și respectiv memorie) față de 650/1650/1800 MHz pentru frecvențele recomandate de dezvoltator. Sistemul de răcire al acceleratorului video este o copie a eșantionului de referință, doar un autocolant de marcă distinge coolerul de concurenți. Nivelul de zgomot s-a dovedit a fi nesemnificativ, totuși, la pornirea sistemului, ventilatorul se învârte la maxim. Ceea ce ne-a încântat cu adevărat a fost temperatura probei testate - placa era mult mai rece decât soluțiile convenționale bazate pe GeForce 8800 GT.

Ambalajul plăcii video Zotac GeForce 9600 GT AMP! ascetic, dar cu o „cutie” de carton fiabilă, care vă permite să nu vă faceți griji pentru siguranța acceleratorului atunci când transportați.

Setul de livrare nu se poate lăuda cu nimic special, dar cumpărătorul primește un cablu TV, adaptoare DVI / D-Sub și DVI / HDMI, un conector pentru conectarea la ieșirea digitală a unei plăci audio și atributele necesare: un disc de driver și un manual.

În plus, există și un adaptor pentru alimentare de la două Molex la un PCI-E cu șase pini. Testați configurația

Pentru teste, a fost folosit un sistem bazat pe placa de bază ECS P35T-A (chipset Intel P35), procesor Core 2 Extreme QX6700 și două stick-uri DDR2-800 de 1 GB de la Hynix. Toată această bunătate a fost gestionată de sistemul de operare Windows Vista Enterprise cu toate actualizările de până acum. Adversarii au fost Zotac GeForce 8800 GT AMP! (frecvențe de operare 700/1675/2000 MHz) și ECS N8800GTS-640MX cu caracteristici de referință.

După cum puteți vedea în imaginea de mai sus, GeForce 9600 GT și GeForce 8800 GT au dimensiuni identice, la fel ca și sistemele de răcire.

Următoarele programe au fost luate ca repere:

  • 3Dmark "06. Un pachet de testare tradițional, fără de care, ca fără mâini. Testarea a fost efectuată în două moduri: 1280x1024 fără opțiuni suplimentare iar la 1600x1200 cu 8x anti-aliasing și 16x anizotropie, maximul pe care 3Dmark"06 îl permite;
  • Gears of War. Jocul este de la Epic, creatorii lui Unreal Engine 3 și, de fapt, se bazează pe acest motor. Utilizarea abundentă a post-efectelor, bump mapping și utilizarea pe scară largă a hărților de deplasare pentru desenarea caracterelor. În general, acestea vor fi următoarele shootere portate de pe Xbox 360 și sunt multe dintre ele pregătite pentru lansare. Setări - maxim maxim la o rezoluție de 1280x1024, numai sincronizarea verticală este dezactivată;
  • Lost Planet: Condiții extreme. Deși jocul în sine nu s-a ridicat la înălțimea tuturor așteptărilor, revolta efectelor meteorologice și a umbrelor de la DirectX 10 este respectată. Setarile, ca si in cazul precedent, sunt maxime, rezolutia este 1280x768 (widescreen);
  • Comandant suprem. Pentru benchmark, este important ca în SC pe o hartă scalabilă liber, cu dimensiunea de până la 80x80 km, să încapă câteva mii de unități, nu foarte lipsite de poligoane. Totul este condimentat umbre realisteși zeci de explozii diferite (din fericire, există ceva de aruncat în aer în acest joc). La o rezoluție de 1280x1024 și anti-aliasing de 8x, SC este capabil să facă orice placă video „să se gândească la asta”. O sarcină echitabilă cade și pe procesor, dar ne descurcăm mai mult sau mai puțin cu asta;
  • Criză. Nici un comentariu, poate. Singurul shooter „pur” DirectX 10 pe PC nu are nevoie de comentarii. Setări înalte.

Doar „din interes” a fost efectuat un test de performanță cu dispozitivul încorporat instrument Windows Vista, dar a dat tuturor cărților 5,9 puncte, așa că nu e nimic de discutat.

rezultate

Rezultate curioase, includ în Testarea GeForce 8600 GTS - ar fi ceva de râs. Și aici, după cum puteți vedea, pur și simplu nu este nimic de vorbit - DirectX 10 productiv preț rezonabil(Să sperăm că hype-ul nu va ridica prețurile la cer). Desigur, nu trebuie să uităm că „punctul culminant al programului” este overclockat din fabrică, la fel ca reprezentantul GeForce 8800 GT. Da, testarea este preliminară. Dar chiar și cu astfel de indicatori, devine deja interesant cine va ieși învingător pe piața soluțiilor de nivel mediu.

concluzii

Este clar că rezultatul va fi dezamăgitor, în primul rând, pentru generația anterioară de plăci video NVIDIA. Când există un GeForce 8800 GT 512 MB, care este mai ieftin (conform macar, așa că a fost intenționat) și mai rapid decât GeForce 8800 GTS 640 MB, atunci nu este nimic de gândit - alegerea este evidentă. Dar apoi, ca diavolul din snuffbox, apare GeForce 9600 GT, care, se pare, ar trebui să fie o placă video „de clasă de mijloc”, dar în același timp este foarte aproape de „elite”. Da, începătorul nu va ajunge la GeForce 8800 Ultra nici cu un overclock bun, dar această placă video este de aproape trei ori mai ieftină și mult mai economică (și deci mai silentioasă)! Întrebarea „dacă să asamblați SLI acasă” devine și mai relevantă.

GeForce 8600 GTS/GT este uitat ca un vis urât, acum avem un nou middle-end cu un preț de până la 200 USD, care vă va permite să vă bucurați gameplay-ul fără frâne la setări mai agresive. De fapt, așa cum era pe vremea lui GeForce 7600.

Nu putem decât să menționăm marca Zotac. Aproape tuturor le-au plăcut produsele companiei - atât în ​​calitate, cât și în pachet, și ușurința instalării driverelor și aspect. În același timp - nimic evident de prisos, dar tot ce aveți nevoie este la locul său. În general, dacă prețul Zotac 9600 GT AMP! nu va depăși cu mult costul ofertelor similare, atunci acest card va fi o alegere excelentă pentru un utilizator pretențios.

La momentul vânzării de la începutul lui 2008, acceleratorul grafic al modelului GeForce 9600 de la NVidia aparținea soluțiilor de clasă de mijloc și permitea rezolvarea majorității sarcinilor. În același timp, utilizarea celui mai avansat proces tehnologic a redus semnificativ consumul de energie al acestuia. Ei bine, costul unor astfel de adaptoare a fost destul de accesibil și le-a permis să fie utilizate ca parte a sistemelor de calcul medii.

Accelerator Nișă

Acceleratoarele grafice NVidia la începutul anului 2008 au fost distribuite după cum urmează:

    Soluțiile entry-level au inclus 8600 GT. Caracteristici foarte modeste și viteze foarte mici de ceas au asigurat nivelul minim acceptabil de performanță. În același timp, costul unor astfel de plăci video a variat între 100 și 120 de dolari.

    Soluțiile pentru clasa de mijloc au inclus 8800GT, 8800GTS și GeForce 9600 cu prefixul GT. Aceste adaptoare aveau caracteristici și costuri destul de asemănătoare, dar utilizarea unei tehnologii de fabricație îmbunătățite și viteze crescute de ceas au permis soluției în cauză să-și depășească concurenții fără probleme.

    Acceleratorul emblematic a fost 8800 Ultra. Deciziile clasei de mijloc nu puteau fi demne de concurență pentru el, dar costul său a fost semnificativ mai mare.

Echipamente

În acest caz, NVidia a inclus următoarele în pachet:

    adaptor grafic.

    Card de garantie.

    Un CD care conține tot software-ul și documentația necesară în formă electronică.

    Manualul utilizatorului.

    Adaptor DVI LA HDMI.

    Un adaptor special pentru alimentarea acceleratorului printr-un conector suplimentar cu 6 pini.

Specificații chip

G94 este numele de cod pentru cipul grafic care a stat la baza GeForce 9600. Specificațiile sale indică faptul că includea 505 milioane de componente de tranzistor. Frecvența de ceas a acestui element semiconductor a fost de 650 MHz și a fost fabricat conform tehnologiei de proces de 65 nm. Predecesorii săi din seria 8XXX, la rândul lor, au fost produși conform standardelor de 80 nm și au avut performanțe mai slabe în ceea ce privește eficiența energetică. Numărul de unități de procesare shader a fost de 64, iar frecvența lor în modul nominal a fost de 1625 MHz. În adaptor au fost incluse doar 16 module de rasterizare, iar numărul de TMU pentru fiecare conductă a fost de 32.

Memorie

Singurul tip de memorie cu care ar putea funcționa acceleratorul grafic în cauză este GDDR3. Evaluat frecvența efectivă cipurile a fost egală cu 1800 MHz. Dimensiunea memoriei tampon video poate fi de 512 MB sau 1 GB. Lățimea magistralei pentru conectarea memoriei RAM la GPU a fost de 256 de biți. Toate cele de mai sus au făcut posibilă obținerea unui throughput de 57,6 Gb/s.

Comunicatii

Adaptorul GeForce 9600 este instalat în slotul de extensie 16X PCI Express. În versiunea de bază, un astfel de adaptor ar trebui să fie echipat cu două porturi DVI digitale. Dar și unii producători le-ar putea completa cu VGA analogic sau HDMI digital. Prin urmare, echipamentul în ceea ce privește porturile depinde de modelul specific, iar această nuanță trebuie luată în considerare înainte de cumpărare.

Consumul de energie. Regimul de temperatură

Aplicație tehnologie avansata producția bazei semiconductoare a procesorului a redus semnificativ nivelul de consum de energie. placa video NVIDIA GeForce 9600 GT are un TDP de 95 W. Desigur, acest număr nu se încadrează în cei 75 W recomandati, ceea ce este suficient pentru funcționarea subsistemului video fără alimentare suplimentară, dar pentru solutii grafice din această clasă, un astfel de catering este tipic. Temperatura maxima pt acest produs setată de producător la 105 0 C. În modul normal, această valoare nu depășește 60 0 C, în timp ce în modul de overclock și la rezolvarea celor mai solicitante sarcini, se poate ridica la 75 0 C.

Teste. Comparație cu analogii

Placa video GeForce 9600 este o soluție de gamă medie și este cel mai rezonabil să o comparăm cu soluții similare. Deoarece concurenții direcți ai AMD au fost fabricați conform unui proces tehnic învechit la acea vreme, nu este rezonabil să îi comparăm cu 9600 GT, deoarece consumul lor de energie va fi mult mai mare cu performanțe comparabile. Din lista NVidia, acest adaptor poate fi comparat doar cu 8800 GTS și 8800 GT. Bancul de testare a fost bazat pe un set logica sistemului R35, Berbec era standardul DDR2 cu o frecvență de 800 MHz, iar volumul acestuia era egal cu 2 GB (2 module a câte 1 GB fiecare pentru ca controlerul RAM să funcționeze în modul dual canal, din aceasta cauza s-a asigurat o crestere a vitezei de circa 10-15%. În testul sintetic 3DMark06, adaptoarele au obținut următoarele scoruri condiționate în modul 1600X1200:

Cel mai probabil, la momentul acestui test nu a fost efectuat optimizare completă drivere, iar performanța unei plăci video ulterioare a fost ușor subestimată din această cauză. Pe de altă parte, diferența nu este atât de mare între ele. Alinierea forțelor în Gears Of War se schimbă dramatic. În acest caz, obținem următorul număr de fps la 1280X1024:

Desigur, diferența de un cadru pe secundă nu este atât de mare, dar face totuși acceleratorul mai recent un lider în acest test. Rezultatele anterioare indică faptul că în spatele lui 9600 GT se află un 8800 GT ușor modificat, care este fabricat folosind o nouă tehnologie de proces. Diferența dintre aceste plăci video este minimă. Mai mult, în unele cazuri, un reprezentant al unei generații anterioare ocolește modificarea actualizată.

Preț

Chiar la începutul vânzărilor, NVidia GeForce 9600 putea fi achiziționată la un preț de 150-170 de dolari. Având în vedere poziționarea și specificațiile tehnice, această abordare a prețurilor a fost justificată. Acum, un astfel de accelerator poate fi achiziționat la prețuri cuprinse între 1.500 (soluții folosite) și 3.000 (acceleratoare complet noi). Achiziționarea unui astfel de adaptor pentru un computer nou este acum imposibilă. Noile acceleratoare video integrate au un nivel egal de performanță și nu este nevoie să le achiziționați suplimentar. Dar pentru a repara un computer vechi, puteți cumpăra în continuare un astfel de accelerator.

tehnologie (nm)90 80 65/55 tranzistoare (M)681 289 210 754 505 314 procesoare universale 128 32 16 128 64 32 blocuri de textură32 16 8 64 32 16 amestecarea blocurilor24 8 16 8 magistrala de memorie384 (64x6)128 (64x2)256 (64x4)128 (64x2) tipuri de memorieDDR, GDDR2, GDDR3, GDDR4 magistrală de sistem cu cipPCI Express 16xPCI-Express 2.0 16x RAMDAC2 x 400MHz interfețeIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTVIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMIIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMI
portul de afișare umbritoare de vârfuri4.0 pixel shaders4.0 precizia pixelilorFP32 precizia calculului vârfurilorFP32 formate de texturăFP32)
FP16
I8
DXTC, S3TC
3Dc formate de randareFP32
FP16
I8
10
alte MRTexistă AntialiasingTAA (poligoane transparente AA)
CSAA 2x-16x
generația Z2x în modul incolor tampon de modelbilateral tehnologia umbreihărți umbre hardware
optimizarea geometrică a umbrei

Specificații pentru cardurile de referință bazate pe familia G8X

Hartăcip
obosi
ALU/TMU-urifrecvența centrală (MHz)frecvența memoriei (MHz)dimensiunea memoriei (MB)PSP (GB)rata de texel (Mtex)completati
rata (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16x
96/24 500 800(1600) 320GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16x
96/24 500 800(1600) 640GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16x
112/56 600 900(1800) 512GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16x
128/64 650 1000(2000) 512GDDR364.0
(256)
41600 10400
GeForce 8800GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
Hartăcip
obosi
ALU/TMU-urifrecvența centrală (MHz)frecvența memoriei (MHz)dimensiunea memoriei (MB)PSP (GB)rata de texel (Mtex)completati
rata (Mpix)

Detalii: G80, familia GeForce 8800

Specificații G80

  • Numele oficial al cipului GeForce 8800
  • Nume de cod G80
  • tehnologie 90 nm
  • 681 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare comune pentru fluxul de vertex și pixeli și alte tipuri de date posibile
  • Suport hardware pentru cele mai recente inovații DirectX 10, inclusiv un nou model de shader - Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 384 de biți, 6 controlere independente cu o lățime de 64 de biți, suport GDDR4
  • Ceas de bază 575 GHz (GeForce 8800 GTX)
  • 128 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP pentru precizie de 32 de biți în Standardul IEEE 754, MAD+MUL fără pierdere de ceas)
  • ALU-urile rulează la o frecvență mai mult decât dublă (1,35 GHz pentru 8800 GTX)
  • 32 de unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 64 de unități de filtrare biliniară (adică este posibilă filtrarea triliniară gratuită, precum și filtrarea anizotropă, care este de două ori mai rapidă ca viteză)
  • - dimensiunea blocului de planificare - 8x4 (32) pixeli.
  • 6 ROP-uri largi (24 pixeli) cu suport pentru moduri de anti-aliasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32 (adică HDR + AA sunt posibile). Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA, blending. Performanță maximă a întregului subsistem până la 96 de mostre MSAA (+ 96 Z) per ceas, în modul incolor (numai Z) - 192 de mostre pe ceas.
  • Toate interfețele sunt plasate pe un cip NVIO extern suplimentar (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Scalabilitate foarte bună a arhitecturii, puteți bloca sau elimina controlere de memorie și ROP-uri unul câte unul (6 în total), unități shader (8 TMU + ALU în total)

Specificațiile plăcii de referință GeForce 8800 GTX

  • Ceas de bază 575 MHz
  • Frecvența procesoarelor universale 1350 MHz
  • Număr de unități de textură - 32, unități de amestecare - 24
  • Capacitate de memorie 768 megabytes
  • Lățimea de bandă a memoriei 86,4 gigaocteți pe secundă.
  • teoretic viteza maxima umple 13,8 gigapixeli pe secundă.
  • Rata teoretică de preluare a texturii este de 18,4 gigatexeli pe secundă.
  • conector SLI
  • Autobuz PCI-Express 16x
  • MSRP 599 USD

Specificațiile cardului de referință GeForce 8800 GTS

  • Frecvența miezului 500 MHz
  • Frecvența procesoarelor universale 1200 MHz
  • Număr de procesoare universale 96
  • Număr de blocuri de textură - 24, blocuri de amestecare - 20
  • Tip de memorie GDDR3, 1,1 ns (frecvență standard 2*900 MHz)
  • Capacitate de memorie 640 megaocteți
  • Rata maximă de umplere teoretică este de 10,0 gigapixeli pe secundă.
  • Rata teoretică de preluare a texturii este de 12,0 gigatexeli pe secundă.
  • Doi conectori DVI-I (Dual Link, ieșire de până la 2560x1600 acceptată)
  • conector SLI
  • Autobuz PCI-Express 16x
  • Ieșire TV, Ieșire HDTV, suport HDCP
  • MSRP 449 USD

Arhitectură

Așteptăm de multă vreme trecerea la arhitecturi grafice unificate. Acum putem afirma un fapt - odată cu apariția GeForce 8800, această tranziție a avut loc, iar vârful critic a fost deja depășit. Aceasta va fi urmată de o coborâre treptată a unor astfel de arhitecturi în segmentele de mijloc și buget și de dezvoltarea lor ulterioară, până la fuziunea cu arhitecturile de procesoare multi-core pe termen lung. Deci, haideți să facem cunoștință cu prima arhitectură unificată de la NVIDIA:

În fața noastră este întreaga diagramă a cipului. Cipul este format din 8 unități de calcul universale (procesoare shader) și deși NVIDIA vorbește despre 128 de procesoare, afirmând că fiecare ALU este astfel, acest lucru este oarecum incorect - unitatea de execuție a instrucțiunilor este o astfel de unitate de procesor în care sunt grupate 4 TMU-uri și 16 ALU-uri. . În total, așadar, avem 128 de ALU și 32 de TMU, dar granularitatea de execuție este de 8 blocuri, fiecare dintre ele își poate face treaba la un moment dat, de exemplu, executa o parte dintr-un vertex, sau pixel sau geometrie shader peste un bloc de 32 de pixeli (sau un bloc cu numărul corespunzător de vârfuri și alte primitive). Toate ramurile, tranzițiile, condițiile etc. sunt aplicate în întregime unui bloc și, prin urmare, este cel mai logic să-l numim procesor shader, deși unul foarte larg.

Fiecare astfel de procesor are propriul cache de prim nivel, care acum stochează nu doar texturi, ci și alte date care pot fi solicitate de procesorul shader. Este important să înțelegeți că fluxul de date principal, de exemplu, pixelii sau vârfurile, care sunt procesați, mișcându-se într-un cerc sub controlul cardinalului gri (blocul marcat pe diagrama Procesorului de fir) nu sunt stocați în cache, ci flux , care este farmecul principal al arhitecturilor grafice de astăzi - absența unui acces complet aleatoriu la nivelul primitivelor procesate.

Pe lângă blocul de control și 8 procesoare compute shader, există 6 ROP-uri care efectuează detectarea vizibilității, scrierea framebuffer și MSAA (albastru, lângă blocurile cache L2) grupate cu controlere de memorie, cozi de scriere și cache de nivel al doilea.

Astfel, am obținut o arhitectură foarte largă (8 blocuri care procesează porțiuni de 32 de pixeli fiecare) care se poate scala fără probleme în ambele direcții. Adăugarea sau eliminarea controlerelor de memorie și a procesoarelor shader va scala în mod corespunzător debitul întregului sistem fără a rupe echilibrul sau a crea blocaje. Aceasta este o soluție logică și frumoasă care implementează principalul avantaj al unei arhitecturi unificate - echilibrul automat și eficiența ridicată a utilizării resurselor disponibile.

Pe lângă blocurile shader și ROP, există un set de blocuri de control și administrative:

  • Blocurile care execută date de diferite formate (Vertex, Geometry and Pixel Thread Issue) sunt un fel de gatekeepers care pregătesc date pentru zdrobitorul de numere din procesoarele shader în conformitate cu formatul de date, shader-ul curent și starea acestuia, condițiile de ramificare etc.
  • Setup/Raster/ZCull - un bloc care transformă vârfurile în pixeli - aici se realizează setarea, rasterizarea triunghiului în blocuri de 32 de pixeli, bloc preliminar HSR.
  • Input Assembler - un bloc care selectează date geometrice și alte date sursă din memoria sistemului sau memoria locală, colectează structuri de date sursă din fluxuri care vor merge din exterior la intrarea "caruselului" nostru. Și la ieșire, după multe cercuri sub controlul setărilor de vârf, geometrie, pixel shader și blending, vom pregăti (și neteziți, dacă este necesar) pixeli din blocurile ROP.

Apropo, o mică digresiune: este clar că în viitor aceste blocuri vor deveni mai generale și nu vor fi atât de legate de anumite tipuri de shadere. Acestea. se va transforma doar în blocuri universale, care lansează date pentru calcularea și conversia formatelor - de exemplu, de la un shader la altul, de la vertex la pixel etc. Acest lucru nu va aduce modificări fundamentale arhitecturii, diagrama va arăta și va funcționa aproape la fel, cu excepția unui număr mai mic de blocuri speciale „gri”. Deja, toate cele trei blocuri Thread Issue sunt cel mai probabil (într-adevăr) un bloc cu funcționalități comune și adăugiri contextuale:

Procesorul Shader și TMU/ALU

Deci, în fiecare dintre cele 8 unități shader, există 16 ALU scalare. Ceea ce, din nou, ne oferă potențiala oportunitate de a crește eficiența încărcării lor până la 100%, indiferent de codul shader. ALU-urile rulează la o frecvență dublă și astfel se potrivesc sau depășesc (în funcție de operațiunile din shader) 8 ALU-uri cu vector quad de stil vechi (G70) la același ceas de bază de bază. NVIDIA oferă acest calcul de performanță maximă:

Este valabil însă pentru cazul cel mai nefavorabil pentru celelalte, când au loc două înmulțiri. În viața reală, merită să împărțiți acest avantaj la o dată și jumătate sau cam așa ceva. Dar, în orice caz, aceste ALU scalare, datorită frecvenței de ceas mai mare și numărului lor, vor depăși toate cipurile existente anterior. Cu excepția, poate, a configurației SLI G71, în cazul shaderelor care nu sunt cele mai benefice pentru noua arhitectură.

Interesant este că toate ALU-urile sunt precise FP32 și având în vedere noua arhitectură, nu prevedem niciun avantaj pentru shaderele FP16 cu precizie redusă. O alta punct interesant- suport pentru calcule în format întreg. Acest articol este necesar pentru implementarea SM4. La implementarea aritmeticii, se respectă standardul IEEE 754, ceea ce îl face potrivit pentru calcule serioase non-game - științifice, statistice, economice etc.

Acum despre interacțiunea unităților de textură și ALU-urilor într-o singură unitate de umbrire:

Operația de eșantionare și filtrare a texturii nu necesită resurse ALU și acum poate fi efectuată complet în paralel cu calculele matematice. Generarea coordonatelor texturii (în diagramă - DAR) încă ocupă ceva timp ALU. Acest lucru este logic dacă dorim să folosim tranzistorii cipului la 100%, deoarece generarea coordonatelor texturii necesită operații standard flotante și nu ar fi prudent să porniți ALU-uri separate pentru aceasta.

Modulele de textură în sine au următoarea configurație:

Există 4 module pentru adresarea texturii TA (determinate prin coordonatele adresei exacte pentru eșantionare) și de două ori mai multe module pentru filtrarea biliniară TF. De ce este asta? Acest lucru permite un consum moderat de tranzistori pentru a oferi o filtrare triliniară cinstită sau pentru a reduce la jumătate scăderea vitezei cu filtrarea anizotropă. Viteza la rezoluții normale, la filtrare normală și fără AA a fost mult timp lipsită de sens - iar generația anterioară de acceleratoare se descurcă bine în astfel de condiții. Noul cip acceptă și formatele de textură FP16/FP32, precum și corecția gamma SRGB la intrare (TMU) și la ieșire (ROP).

Iată specificațiile modelului shader al noilor procesoare care îndeplinesc cerințele SM4:

Există schimbări cantitative și calitative semnificative - din ce în ce mai puține restricții pentru shadere, tot mai multe în comun cu CPU-ul. Până acum, fără prea mult acces aleatoriu (o astfel de operație a apărut în SM4 - elementul Load Op de pe diagramă, dar eficiența sa în scopuri generale este încă îndoielnică, mai ales în primele implementări), dar nu există nicio îndoială că acest aspect va fi în curând să fie dezvoltat, deoarece suportul pentru formatele FP a fost dezvoltat în acești 5 ani - de la primele mostre din NV30 până la conducta totală, de la capăt la cap la FP32, în toate modurile de acum - în G80.

După cum ne amintim, pe lângă cele 8 blocuri shader, există 6 blocuri ROP disponibile:

Diagrama arată două căi separate pentru Z și C, dar în realitate este doar un set de ALU care sunt împărțite în două grupuri atunci când procesează pixeli cu culoare sau acționează ca un singur grup atunci când sunt procesate în modul Z-Only, dublând astfel debitul. . În zilele noastre, nu are sens să numărăm pixeli individuali - sunt deja destui, este mai important să calculăm câte mostre MSAA pot fi procesate pe ceas. În consecință, la MSAA 16x, cipul poate produce 6 pixeli cu drepturi depline pe ceas, la 8x - 12 etc. Interesant este că scalabilitatea lucrului cu frame-buffer este cea mai bună - după cum ne amintim, fiecare unitate ROP funcționează cu propriul controler de memorie și nu interferează cu vecinii săi.

Și, în sfârșit, există suport deplin pentru formatele de buffer de cadre FP32 și FP16, împreună cu anti-aliasing, acum nu există restricții asupra imaginației dezvoltatorilor, iar HDR în întreaga conductă nu necesită modificarea secvenței generale de construcție a cadrelor chiar și în modul AA. .

CSAA

A apărut și noua metoda netezire - CSAA. Un studiu detaliat al acestuia va fi în curând pe site, dar deocamdată remarcăm că această metodă este în multe privințe similară cu abordarea ATI și se ocupă, de asemenea, de modele pseudo-stochastice și de distribuția eșantioanelor în zonele geometrice învecinate (pixel smearing). apare, pixelii nu au o margine ascuțită, dar, parcă, trec unul în celălalt cu tz AA, acoperind o anumită zonă). Mai mult, culorile mostrelor și adâncimea sunt stocate separat de informațiile despre locația lor și, astfel, pot exista 16 mostre pe pixel, dar, de exemplu, doar 8 valori de adâncime calculate - ceea ce economisește suplimentar lățimea de bandă și ciclurile.

Se știe că MSAA clasic în moduri mai mari de 4x devine foarte solicitant din punct de vedere al memoriei, în timp ce calitatea crește din ce în ce mai puțin. Noua metodă corectează acest lucru, permițând un mod anti-aliasing de 16x care este vizibil mai bun decât MSAA 16x, cu un cost de calcul comparabil cu MSAA 4x.

NVIO

O altă inovație a lui G80 o reprezintă interfețele plasate în afara cipului principal al acceleratorului. Un cip separat numit NVIO este acum responsabil pentru ele:

Acest cip are:

  • 2*400MHz RAMDAC
  • 2 * Dual Link DVI (sau LVDS)
  • Ieșire HDTV

Subsistemul de ieșire arată astfel:

Precizia este întotdeauna de 10 biți pe componentă. Desigur, în segmentul de mijloc, și cu atât mai mult în soluțiile bugetare, un cip extern separat poate să nu fie păstrat, dar pentru cardurile scumpe într-o astfel de soluție există mai multe plusuri decât minusuri. Interfețele ocupă o zonă semnificativă a cipului, depind foarte mult de interferență și necesită o putere specială. Prin eliminarea tuturor acestor probleme cu un cip extern, puteți câștiga în calitatea semnalelor de ieșire și flexibilitatea configurației și, de asemenea, nu complicați dezvoltarea unui cip deja complex, ținând cont de modurile optime pentru RAMDAC-ul încorporat.

Detalii: familiile G84/G86, GeForce 8600 și 8500

Specificații G84

  • Numele oficial al cipului GeForce 8600
  • Nume de cod G84
  • tehnologie 80 nm
  • 289 de milioane de tranzistori
  • Ceas de bază de până la 675 MHz (GeForce 8600 GTS)
  • ALU-urile rulează la o frecvență mai mult decât dublă (1,45 GHz pentru GeForce 8600 GTS)
  • 16 unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 16 unități de filtrare biliniare (comparativ cu G80, nu există posibilitatea de filtrare triliniară gratuită și filtrare anizotropă mai rapidă)
  • Posibilitatea de ramificare dinamică în pixeli și vertex shaders
  • Scrieți rezultatele în 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 8600 GTS

  • Ceas de bază 675 MHz
  • Frecvența procesoarelor universale 1450 MHz
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 32,0 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 5,4 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii este de 10,8 gigatexeli pe secundă.
  • Consum de energie de până la 71 W
  • conector SLI
  • Autobuz PCI-Express 16x
  • Ieșire TV, Ieșire HDTV, suport HDCP
  • Preț recomandat 199-229 USD

Specificațiile cardului de referință GeForce 8600 GT

  • Ceas de bază 540 MHz
  • Frecvența procesoarelor universale 1180 MHz
  • Număr de procesoare universale 32
  • Numărul de unități de textură 16 (vezi sintetice), unități de amestecare 8
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 22,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,3 gigapixeli pe secundă.
  • Rata teoretică de preluare a texturii este de 8,6 gigatexeli pe secundă.
  • Consum de energie de până la 43 W
  • conector SLI
  • Autobuz PCI-Express 16x
  • Preț recomandat 149-159 USD

Specificatii G86

  • Numele oficial al cipului GeForce 8500
  • Nume de cod G86
  • tehnologie 80 nm
  • 210 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare comune pentru fluxul de vertex și pixeli și alte tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv noul model de shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Ceas de bază de până la 450 MHz (GeForce 8500 GT)
  • ALU-urile rulează la frecvență dublă (900 MHz pentru GeForce 8500 GT)
  • 16 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP pentru precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 8 unități de textură, suport pentru componente FP16 și FP32 în texturi
  • 8 unități de filtrare biliniare (comparativ cu G80, fără filtrare triliniară gratuită și filtrare anizotropă mai eficientă)
  • Posibilitatea de ramificare dinamică în pixeli și vertex shaders
  • 2 ROP-uri largi (8 pixeli) cu suport pentru moduri anti-aliasing de până la 16 mostre per pixel, inclusiv cu formatul framebuffer FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA, blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) pe ceas, în modul incolor (numai Z) 64 de mostre pe ceas
  • Scrieți rezultatele în 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de GeForce 8800 NVIO, care este plasat pe un cip extern suplimentar)

Specificațiile cardului de referință GeForce 8500 GT

  • Ceas de bază 450 MHz
  • Frecvența procesoarelor universale 900 MHz
  • Frecvența efectivă a memoriei 800 MHz (2*400 MHz)
  • Tip de memorie DDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 12,8 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 3,6 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii este de 3,6 gigatexeli pe secundă.
  • Consum de energie până la 40 W
  • Doi conectori DVI-I Dual Link, ieșirea în rezoluții de până la 2560x1600 este acceptată)
  • conector SLI
  • Autobuz PCI-Express 16x
  • Ieșire TV, ieșire HDTV, suport opțional HDCP
  • Preț recomandat 89-129 USD

Arhitectura G84 si G86

Deja din specificații, este clar că G84 este ceva între un sfert și o treime din flagship-ul liniei G80. În ceea ce privește numărul de procesoare universale, acesta este un sfert, iar în ceea ce privește numărul de ROP-uri și un controler de memorie, o treime. Cu texturi este mai greu, pare să fie nici un sfert, dar nici jumătate, despre asta vom vorbi mai jos. G86, la rândul său, este ceva interesant în general în ceea ce privește puterea de calcul este doar 1/8 din G80, dar în ceea ce privește ROP este tot același 1/3. În mod clar, NVIDIA nu se grăbește să lanseze cipuri de calcul rapide în gama joasă.

Întrebarea principală aici este va fi suficient acest trimestru și 1/8 pentru a concura cu soluțiile actuale și cu viitoarele cipuri AMD? NVIDIA nu a redus prea mult numărul de blocuri? Mai mult, ca să nu spun că ambele cipuri erau prea mici ca număr de tranzistori... În G84, aproape jumătate dintre tranzistori în G80, în G86, aproape o treime. Se pare că decizia este un compromis, dacă ar lăsa jumătate din blocurile G80, atunci cipul ar fi prea scump de fabricat și ar fi un concurent de succes pentru propriul GeForce 8800 GTS.

În viitorul apropiat, cel mai probabil, pe baza tehnologiei de 65 nm, se va putea realiza cipuri mai eficiente pentru intervalele de preț medii și inferioare, dar deocamdată a ieșit așa. Vom lua în considerare problema performanței noilor cipuri în testele sintetice și de jocuri, dar deja acum putem spune că G84 și G86 ar putea să nu fie prea rapide din cauza numărului mic de ALU-uri, cel mai probabil vor fi aproximativ la egalitate cu soluțiile actuale. de un pret similar.

Nu ne vom opri prea mult asupra arhitecturilor G84 și G86, sunt puține modificări față de G80, tot ce s-a spus în recenzia GeForce 8800 rămâne valabil, ajustat pentru caracteristicile cantitative. Dar totuși, să descriem principalele puncte care merită atenția noastră și să prezentăm câteva diapozitive dedicate specificațiilor arhitecturale ale noilor cipuri.

G80 este format din opt unități de calcul universale (procesoare shader), NVIDIA preferă să vorbească despre 128 de procesoare. Unitatea de execuție a instrucțiunilor, aparent, este o unitate de procesor atât de întreagă, în care sunt grupate 4 TMU-uri și 16 ALU-uri. Fiecare dintre blocuri la un moment dat poate executa o parte dintr-un vertex, pixel sau geometrie shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și calcule fizice. Fiecare procesor are propriul cache de prim nivel, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele compute shader, există șase ROP-uri care efectuează detectarea vizibilității, scrierea framebuffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Această arhitectură este capabilă să se scaleze în ambele direcții, ceea ce a fost făcut în noile soluții. Am menționat deja această soluție frumoasă care implementează principalul avantaj al echilibrului automat al arhitecturii unificate și eficiența ridicată a utilizării resurselor disponibile în articolul despre GeForce 8800. De asemenea, acolo se presupunea că soluția de gamă medie ar consta din jumătate din unități de calcul, iar soluția bazată pe două procesoare shader și un ROP va deveni bugetară. Din păcate, dacă GeForce 8800 avea opt procesoare, alcătuind 32 de TMU-uri și 128 de ALU-uri, numărul lor s-a redus mai mult în noile cipuri decât am crezut inițial. Aparent, circuitul G84 arată astfel:

Adică totul a rămas neschimbat, cu excepția numărului de blocuri și controlere de memorie. Există câteva mici modificări ale blocurilor de textură vizibile în această imagine, dar despre asta vom vorbi mai târziu. Curios, unde s-au dus atâtea tranzistoare, dacă în G84 au mai rămas doar 32 de procesoare? G84 are aproape jumătate din tranzistori în comparație cu G80, cu un număr semnificativ redus de canale de memorie, ROP-uri și procesoare shader. Iar G86 are o mulțime de tranzistori, cu doar 16 procesoare...

De asemenea, este interesant cât de înaltă calitate aplicații reale sarcina va fi echilibrată între execuția vertex-urilor, pixelilor și geometry shaders, deoarece numărul de unități de execuție universale a devenit acum mult mai mic. Mai mult decât atât, arhitectura unificată în sine pune noi provocări pentru dezvoltatori, atunci când o utilizați, va trebui să vă gândiți cum să utilizați eficient puterea totală dintre vertex, pixeli și geometrie shaders. Să dăm un exemplu simplu de accent pe calculele pixelilor. În acest caz, o creștere a încărcării blocurilor de vârf în arhitectura tradițională nu va duce la o scădere a performanței, dar în cea unificată va schimba echilibrul și va reduce cantitatea de resurse pentru calculele pixelilor. Cu siguranță vom lua în considerare problema performanței, iar acum vom continua să studiem schimbările în arhitectura G84 și G86.

Procesor Shader și TMU/ALU

Schema unităților shader și evaluarea performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător, pentru G84 și G86 schema nu s-a schimbat, iar performanța lor este ușor de recalculat. ALU-urile din cipuri funcționează, de asemenea, la o frecvență dublă și sunt scalare, ceea ce face posibilă realizarea Eficiență ridicată. Nu există nici diferențe de funcționalitate, acuratețea tuturor ALU-urilor este FP32, există suport pentru calcule în format întreg, iar implementarea respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și altele.

Dar modulele de textură s-au schimbat în comparație cu cele folosite în G80, NVIDIA asigură că s-au făcut modificări arhitecturale la noile cipuri pentru a crește performanța procesoarelor unificate. În G80, fiecare unitate de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ceas. Se pretinde că primul număr a fost dublat în noile jetoane și este capabil să dubleze numărul de texturi. Adică, modulele de textură G84 și G86 au următoarea configurație (pentru comparație, diagrama blocului G80 este afișată în stânga):

Potrivit NVIDIA, acum fiecare dintre blocuri are opt module de adresare a texturii (determinate de coordonatele adresei exacte pentru eșantionare) TA și exact același număr de module de filtrare biliniară (TF). G80 avea patru module TA și opt module TF, ceea ce a făcut posibilă furnizarea de filtrare triliniară „gratuită” cu un consum redus de tranzistori sau reducerea la jumătate a scăderii vitezei în timpul filtrării anizotrope, ceea ce este util în special pentru acceleratoare. nivel superior unde filtrarea anizotropă este aproape întotdeauna folosită de utilizatori. Vom verifica corectitudinea acestor informații în partea practică, asigurați-vă că vă uitați la analiza testelor sintetice relevante, deoarece acestea contrazic aceste date.

Toate celelalte funcționalități ale unităților de textură sunt aceleași, sunt acceptate formatele de textură FP16/FP32 etc. Numai dacă pe G80 FP16 filtrarea texturii a fost și la viteză maximă din cauza numărului dublat de unități de filtrare, acest lucru nu mai este cazul în soluții ale nivelurilor mijlocii și inferioare (din nou, cu condiția ca modificările de mai sus să existe efectiv).

Blocuri ROP, scriere framebuffer, anti-aliasing

Blocurile ROP, care erau șase în G80 și două în noile cipuri, nu s-au schimbat:

Fiecare dintre blocuri procesează patru pixeli (16 subpixeli), pentru un total de 8 pixeli pe ceas pentru culoare și Z. În modul numai Z, sunt procesate de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ceas, la 4x 8 etc. Ca și în cazul G80, există suport complet pentru formatele de buffer de cadre FP32 și FP16 împreună cu anti-aliasing.

Este acceptată noua metodă de anti-aliasing cunoscută din GeForce 8800 Coverage Sampled Antialiasing (CSAA), care a fost descrisă în detaliu în articolul corespunzător:

Pe scurt, esența metodei este că culorile mostrelor și adâncimea sunt stocate separat de informațiile despre locația lor, pot exista 16 mostre pe pixel și doar 8 valori de adâncime calculate, ceea ce economisește lățime de bandă și cicluri. CSAA reușește să transmită și să stocheze o singură culoare sau o valoare Z per sub-pixel, rafinând valoarea medie a pixelilor ecranului cu mai multe detalii despre modul în care acel pixel se suprapune marginile triunghiurilor. Ca rezultat, noua metodă face posibilă obținerea unui mod anti-aliasing de 16x, care este vizibil mai bun decât MSAA 4x, cu costuri de calcul comparabile cu acesta. Și în cazuri rare, în care metoda CSAA nu funcționează, obțineți MSAA obișnuit de un grad mai mic, și nu absența completă a anti-aliasing.

Video pur HD

Să trecem la cele mai interesante schimbări. Se dovedește că G84 și G86 au inovații care le deosebesc chiar și de G80! Aceasta se referă la procesorul video încorporat, care a primit suport extins pentru PureVideo HD în noile cipuri. Se afirmă că aceste cipuri descarcă complet procesorul central al sistemului atunci când decodifică toate tipurile de date video comune, inclusiv cel mai „greu” format H.264.

G84 și G86 folosesc model nou procesor video programabil PureVideo HD, mai puternic decât cel folosit la G80 și care include așa-numitul motor BSP. Procesor nou acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluție de până la 1920x1080 și rata de biți de până la 30-40 Mbps, face toată munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să redați toate unitățile HD-DVD și Blu-ray existente chiar și pe computerele medii cu un singur nucleu.

Procesorul video din G84/G86 este format din mai multe părți: a doua generație de procesor video (VP2) în sine, care îndeplinește sarcinile de IDCT, compensarea mișcării și eliminarea artefactelor de blocare pentru formatele MPEG2, VC-1 și H.264, suport hardware. decodificarea celui de-al doilea flux; un procesor de flux (BSP) care realizează sarcinile de decodare statistică CABAC și CAVLC pentru formatul H.264 și acesta este unul dintre calculele care consumă cel mai mult timp; Motor de decodare a datelor protejat AES128, al cărui scop este clar din numele său, decriptează datele video utilizate în protecția împotriva copierii pe Blu-ray și HD- discuri DVD. Iată diferențele în gradul de suport hardware pentru decodarea video pe diferite cipuri video:

Sarcinile efectuate de cipul video sunt evidențiate cu albastru, iar sarcinile efectuate de procesorul central sunt evidențiate cu verde. După cum puteți vedea, dacă generația anterioară a ajutat procesorul doar în parte din sarcini, atunci noul procesor video folosit în ultimele cipuri face toate sarcinile în sine. Vom verifica eficacitatea soluțiilor în materiale viitoare cu privire la studiul eficienței decodării video hardware, în timp ce NVIDIA oferă următoarele cifre în materiale: atunci când se utilizează un modern procesor dual-coreși decodarea software a datelor, redarea discurilor Blu-ray și HD-DVD consumă până la 90-100% din timpul procesorului, cu decodarea hardware pe cip video din generația anterioară pe același sistem până la 60-70% și cu noul motor pe care l-au dezvoltat pentru G84 și G86 doar 20%. Aceasta, desigur, nu arată ca decodarea complet hardware declarată, dar totuși foarte, foarte eficientă.

La momentul anunțului, noile funcții introduse în PureVideo HD funcționează doar pe 32 de biți versiuni Windows Vista și suportul pentru PureVideo HD în Windows XP vor apărea doar în vară. În ceea ce privește calitatea redării video, post-procesare, deinterlacing etc., performanța NVIDIA s-a îmbunătățit chiar și la GeForce 8800, iar noile cipuri nu sunt diferite în acest sens.

CUDA, non-gaming și calcule fizice

Un articol despre GeForce 8800 a menționat că performanța de vârf crescută a aritmeticii flotante în noile acceleratoare și flexibilitatea arhitecturii unificate shader au devenit suficiente pentru calcularea fizicii în aplicații de jocuri și sarcini chiar mai serioase: modelare matematică și fizică, modele economice și statistice și calcule, recunoaștere a modelelor, procesare imagini, grafica stiintificași mult mai mult. Pentru aceasta, a fost lansat un API special orientat spre calcul, care este convenabil pentru adaptarea și dezvoltarea programelor care transferă calculele la GPU CUDA (Compute Unified Device Architecture).

Mai multe despre CUDA sunt scrise în articolul despre G80, ne vom concentra pe o direcție mai la modă, recent suport pentru calcule fizice pe GPU. NVIDIA numește tehnologia sa Quantum Effects. Se declară că toate cipurile video din noua generație, inclusiv G84 și G86 considerate astăzi, sunt potrivite pentru calcule. acest fel, permițându-vă să transferați o parte din încărcare de la CPU la GPU. Simulări de fum, foc, explozii, dinamica părului și hainelor, lânii și lichide și multe altele sunt date ca exemple specifice. Dar deocamdată vreau să scriu mai multe despre altceva. Faptul că până acum ni se arată doar imagini din aplicații de testare cu un număr mare de obiecte fizice calculate prin cipuri video, iar jocurile cu astfel de suport nici măcar nu miros încă.

Suport pentru interfețe externe

După cum ne amintim, la GeForce 8800 am fost oarecum surprinși de o altă inovație neașteptată - un cip suplimentar care suportă interfețe externe plasate în afara celei principale. Când plăci video de top aceste sarcini sunt gestionate de un cip separat numit NVIO, care integrează: două RAMDAC-uri de 400 MHz, două Dual Link DVI (sau LVDS), HDTV-Out. Chiar și atunci, am presupus că un cip extern separat va rămâne cu greu în segmentele mijlocii și inferioare, iar acest lucru s-a întâmplat de fapt. În G84 și G86, suportul pentru toate aceste interfețe este încorporat în cipul însuși.

GeForce 8600 GTS are două ieșiri Dual Link DVI-I cu suport HDCP, este prima placă video de pe piață cu astfel de capabilități (HDCP și Dual Link împreună). În ceea ce privește HDMI, suportul pentru acest conector este implementat integral în hardware și poate fi implementat de producători pe carduri cu un design special. Dar pentru GeForce 8600 GT și 8500 GT, suportul pentru HDCP și HDMI este opțional, dar ele pot fi implementate de producători individuali în produsele lor.

Detalii: G92, familia GeForce 8800

Specificații G92

  • Nume de cod al cipului G92
  • tehnologie 65 nm
  • 754 milioane de tranzistori (mai mult de G80)
  • Arhitectură unificată cu o serie de procesoare comune pentru fluxul de vertex și pixeli și alte tipuri de date
  • Ceas de bază 600 MHz (GeForce 8800 GT)
  • ALU-urile rulează la o frecvență mai mult decât dublă (1,5 GHz pentru GeForce 8800 GT)
  • 112 (acesta este pentru GeForce 8800 GT, probabil 128 în total) ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP pentru precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 56 (64) unități de adrese de texturi cu suport pentru componente FP16 și FP32 în texturi (vezi explicațiile de mai jos)
  • 56 (64) blocuri de filtrare biliniare (ca și în G84 și G86, fără filtrare triliniară gratuită și filtrare anizotropă mai eficientă)
  • Posibilitatea de ramificare dinamică în pixeli și vertex shaders
  • Scrieți rezultatele în 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de GeForce 8800 NVIO, care este plasat pe un cip extern suplimentar)

Specificațiile plăcii de referință GeForce 8800 GT 512MB

  • Frecvența miezului 600 MHz
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Ieșire TV, Ieșire HDTV, suport HDCP
  • MSRP 249 USD

Specificațiile cardului de referință GeForce 8800 GT 256MB

  • Frecvența miezului 600 MHz
  • Frecvența procesoarelor universale 1500 MHz
  • Număr de procesoare universale 112
  • Număr de unități de textură 56, unități de amestecare 16
  • Frecvența efectivă a memoriei 1,4 GHz (2*700 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 44,8 gigaocteți pe secundă.
  • Rata de umplere maximă teoretică este de 9,6 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii de până la 33,6 gigatexeli pe secundă.
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Ieșire TV, Ieșire HDTV, suport HDCP
  • Preț recomandat 199 USD

Specificațiile cardului de referință GeForce 8800 GTS 512MB

  • Ceas de bază 650 MHz
  • Număr de procesoare universale 128
  • Frecvența efectivă a memoriei 2,0 GHz (2*1000 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 64,0 gigaocteți pe secundă.
  • Rata teoretică de eșantionare a texturii de până la 41,6 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Ieșire TV, Ieșire HDTV, suport HDCP
  • Preț recomandat 349-399 USD

Arhitectura chip G92

Din punct de vedere arhitectural, G92 nu diferă mult de G80. Din câte știm, putem spune că G92 este flagship-ul liniei (G80), transferat la o nouă tehnologie de proces, cu mici modificări. NVIDIA indică în materialele sale că cipul are 7 unități de shader mari și, în consecință, 56 de unități de textură, precum și patru ROP-uri largi, numărul de tranzistori din cip ridică suspiciuni că nu spun ceva. Soluțiile anunțate inițial nu implică toate blocurile care există fizic în cip, numărul lor în G92 este mai mare decât numărul celor active din GeForce 8800 GT. Deși complexitatea crescută a cipului se datorează includerii unui cip NVIO anterior separat, precum și a unui procesor video de nouă generație. În plus, numărul de tranzistori a fost afectat și de TMU-urile complicate. De asemenea, este probabil ca cache-urile să fi crescut pentru a crește eficiența utilizării magistralei de memorie pe 256 de biți.

De data aceasta, pentru a concura cu cipurile AMD corespunzătoare, NVIDIA a decis să lase un număr destul de mare de blocuri în cipul mid-end. A fost confirmată ipoteza noastră din revizuirea G84 și G86, că, pe baza tehnologiei de 65 nm, vor elibera cipuri mult mai eficiente pentru gama de prețuri medii. Există puține modificări arhitecturale în cipul G92 și nu ne vom opri asupra lui în detaliu. Toate cele de mai sus despre soluții de la Seria GeForce 8 rămâne valabil, vom repeta doar câteva dintre punctele principale ale specificațiilor arhitecturale ale noului cip.

Pentru noua soluție, NVIDIA în documentele sale oferă următoarea schemă:

Adică, dintre toate modificările, doar un număr redus de blocuri și unele modificări în TMU, care sunt descrise mai jos. După cum am menționat mai sus, există îndoieli că acest lucru este fizic, dar oferim o descriere bazată pe ceea ce scrie NVIDIA. G92 este format din șapte unități de calcul universale (procesoare shader), NVIDIA vorbește în mod tradițional de 112 procesoare (cel puțin în primele soluții GeForce 8800 GT). Fiecare dintre blocuri, în care sunt grupate 8 TMU-uri și 16 ALU-uri, poate executa o parte dintr-un vertex, pixel sau geometry shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și alte calcule (negrafice). Fiecare procesor are propriul cache de prim nivel, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele compute shader, există patru ROP-uri care efectuează detectarea vizibilității, scrierea framebuffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Procesoare de uz general și TMU

Schema unităților shader și evaluarea performanței lor de calcul de vârf a G80 a fost dată în articolul corespunzător, pentru G92 nu s-a schimbat, nu este dificil să recalculăm performanța lor pe baza modificărilor frecvenței de ceas. ALU din cipuri funcționează la o frecvență mai mare decât dublă, sunt scalare, ceea ce permite o eficiență ridicată. În ceea ce privește diferențele funcționale, încă nu se știe dacă acuratețea calculelor FP64 este disponibilă în acest cip sau nu. Cu siguranță există suport pentru calcule în format întreg, iar implementarea tuturor calculelor respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Unitățile de textura din G92 nu sunt aceleași ca la G80, ele repetă soluția TMU în G84 și G86, în care s-au făcut modificări arhitecturale pentru a crește performanța. Amintiți-vă că în G80 fiecare unitate de textură ar putea calcula patru adrese de textură și poate efectua opt operațiuni de filtrare a texturii pe ceas, în timp ce în G84/G86 TMU-urile sunt capabile de două ori mai multe preluări de textură. Adică, fiecare dintre blocuri are opt module de adresare a texturii (determinate de coordonatele adresei exacte pentru eșantionare) TA și exact același număr de module de filtrare biliniare (TF):

Nu ar trebui să vă gândiți că 56 de blocuri GeForce 8800 GT în aplicațiile reale vor fi mai puternice decât 32 de blocuri în GeForce 8800 GTX. Cu filtrarea triliniară și/sau anizotropă activată, acestea din urmă vor fi mai rapide, deoarece pot face puțin mai multă muncă de filtrare a probelor de textură. Vom verifica aceste informații în partea practică prin analiza rezultatelor testelor sintetice corespunzătoare. Toate celelalte funcționalități ale unităților de textură nu s-au schimbat, sunt acceptate formatele de textură FP16, FP32 și altele.

Blocuri ROP, scriere framebuffer, anti-aliasing

Nici blocurile POR în sine nu s-au schimbat, dar numărul lor s-a schimbat. G80 avea șase ROP-uri, iar noua soluție are patru dintre ele, pentru a reduce costul de producție al cipurilor și plăcilor video PCB. De asemenea, această tăiere se poate datora faptului că nu creează prea multă concurență. solutii existente nivel superior.

Fiecare dintre blocuri procesează patru pixeli sau 16 subpixeli, pentru un total de 16 pixeli pe ceas pentru culoare și Z. În modul numai Z, sunt procesate de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ceas, la 4x 8 etc. Ca și în cazul modelului G80, formatele cadru tampon FP32 și FP16 sunt pe deplin acceptate împreună cu anti-aliasing.

Este acceptată o nouă metodă de anti-aliasing cunoscută din cipurile anterioare din serie, Coverage Sampled Antialiasing (CSAA). O altă inovație este că GeForce 8800 GT a actualizat algoritmul de antialiasing al transparenței. Utilizatorului i s-au oferit două opțiuni din care să aleagă: multisampling (TRMS) și supersampling (TRSS), prima a avut performanțe foarte bune, dar nu a funcționat eficient în toate jocurile, iar a doua a fost de înaltă calitate, dar lent. GeForce 8800 GT declară o nouă metodă de multisampling a suprafețelor translucide, care îi îmbunătățește calitatea și performanța. Acest algoritm oferă aproape aceeași îmbunătățire a calității ca și supraeșantionarea, dar are o performanță ridicată cu doar câteva procente mai slabă pentru modul fără anti-aliasing de suprafață translucidă activat.

Video pur HD

Una dintre schimbările așteptate la G92 a fost procesorul video integrat de a doua generație, cunoscut de la G84 și G86, care a primit suport îmbunătățit pentru PureVideo HD. Se știe deja că această versiune a procesorului video descarcă aproape complet CPU atunci când decodifică toate tipurile de date video, inclusiv formatele „grele” H.264 și VC-1.

La fel ca G84/G86, G92 folosește un nou procesor video PureVideo HD programabil care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, făcând munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să jucați toate unitățile HD-DVD și Blu-ray existente chiar și pe computerele medii cu un singur nucleu. Decodarea VC-1 nu este la fel de eficientă ca H.264, dar este suportată în continuare de noul procesor.

Puteți citi mai multe despre procesorul video de a doua generație în partea dedicată cipurilor G84 și G86. Lucrarea soluțiilor video moderne a fost parțial testată în cel mai recent material privind studiul eficienței decodării video hardware.

PCI Express 2.0

Una dintre adevăratele inovații din G92 este suportul pentru magistrala PCI Express 2.0. A doua versiune de PCI Express dublează lățimea de bandă standard de la 2,5 Gb/s la 5 Gb/s, rezultând sloturi x16 capabile să transfere date cu până la 8 Gb/s în fiecare direcție, spre deosebire de 4 Gb/s pentru versiunea 1 .X. În același timp, este foarte important ca PCI Express 2.0 să fie compatibil cu PCI Express 1.1, iar plăcile video vechi vor funcționa pe plăci de bază noi, iar plăcile video noi cu suport pentru a doua versiune vor rămâne operaționale în plăci fără suport. Sub rezerva suficienței alimentare externăși fără mărire lățime de bandă interfata, desigur.

Pentru a asigura compatibilitatea cu soluțiile existente PCI Express 1.0 și 1.1, specificația 2.0 acceptă rate de transfer de 2,5 Gb/s și 5 Gb/s. Verso Compatibil PCI Express 2.0 permite soluțiilor vechi de 2,5 Gb/s în sloturi de 5,0 Gb/s să ruleze la viteze mai mici, în timp ce un dispozitiv proiectat conform specificațiilor 2.0 poate suporta atât viteze de 2,5 Gb/s, cât și 5 Gb/s. În teorie, compatibilitatea este bună, dar în practică, unele combinații de plăci de bază și plăci de expansiune pot cauza probleme.

Suport pentru interfețe externe

Așa cum era de așteptat, cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care suportă interfețe externe plasate în afara celei principale (două RAMDAC de 400 MHz, două DVI Dual Link (sau LVDS), HDTV-Out), în acest caz a fost inclus în cipul în sine, suportul pentru toate aceste interfețe este încorporat în G92 însuși.

Plăcile video GeForce 8800 GT au de obicei două ieșiri Dual Link DVI-I cu suport HDCP. În ceea ce privește HDMI, suportul pentru acest conector este implementat pe deplin, acesta putând fi implementat de producători pe carduri cu design special, care pot fi lansate puțin mai târziu. Deși prezența unui conector HDMI pe o placă video este complet opțională, acesta va fi înlocuit cu succes de un adaptor de la DVI la HDMI, care este inclus cu majoritatea plăcilor video moderne.

Spre deosebire de plăcile video din seria RADEON HD 2000 de la AMD, GeForce 8800 GT nu conține un cip audio încorporat necesar pentru a suporta transmisia audio prin DVI folosind un adaptor HDMI. O astfel de posibilitate de transmitere a semnalelor video și audio printr-un singur conector este solicitată, în primul rând, pe carduri de mediu și niveluri inferioare, care sunt instalate în carcase mici de centre media, iar GeForce 8800 GT este cu greu potrivită pentru acest rol.

Detalii: G94, familia GeForce 9600

Specificatii G94

  • Nume de cod al cipului G94
  • tehnologie 65 nm
  • 505 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare comune pentru fluxul de vertex și pixeli și alte tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 256 de biți, patru controlere independente de 64 de biți
  • Ceas de bază 650 MHz (GeForce 9600 GT)
  • ALU-urile rulează la o frecvență mai mult decât dublă (1,625 GHz pentru GeForce 9600 GT)
  • 64 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP pentru precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 32 de unități de adrese de texturi cu suport pentru componente FP16 și FP32 în texturi
  • 32 de blocuri de filtrare biliniare (ca și în G84 și G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrare triliniară gratuită și filtrare anizotropă eficientă)
  • Posibilitatea de ramificare dinamică în pixeli și vertex shaders
  • 4 ROP-uri largi (16 pixeli) cu suport pentru moduri anti-aliasing de până la 16 mostre per pixel, inclusiv cu formatul framebuffer FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA, blending. Performanță maximă a întregului subsistem până la 64 de mostre MSAA (+ 64 Z) per ceas, în modul incolor (numai Z) 128 de mostre pe ceas
  • Scrieți rezultatele în 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 9600 GT

  • Ceas de bază 650 MHz
  • Frecvența procesoarelor universale 1625 MHz
  • Număr de procesoare universale 64
  • Număr de unități de textură 32, unități de amestecare 16
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 57,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 10,4 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii de până la 20,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Consum de energie de până la 95 W
  • Preț recomandat 169-189 USD

Arhitectura G94

Din punct de vedere arhitectural, G94 se deosebește de G92 doar prin caracteristici cantitative, are un număr mai mic de unități de execuție: ALU și TMU. Și nu există atât de multe diferențe față de G8x. Așa cum a fost scris în materialele anterioare, linia de cipuri G9x este o linie G8x ușor modificată, transferată la o nouă tehnologie de proces cu modificări arhitecturale minore. Noul cip mid-end are 4 unități mari de shader (64 ALU-uri în total) și 32 de unități de textură, precum și patru ROP-uri largi.

Deci, există puține modificări arhitecturale în cip, aproape toate sunt descrise mai sus și tot ce s-a spus anterior pentru decizii anterioare rămâne valabil. Și aici oferim doar diagrama principală a cipului G94:

Blocurile de textură din G94 sunt exact aceleași ca și în G84/G86 și G92, ele pot selecta de două ori mai multe mostre de textură filtrate biliniar în comparație cu G80. Dar 32 de unități de textură ale GeForce 9600 GT în aplicații reale nu vor funcționa mai repede decât 32 de unități ale GeForce 8800 GTX doar din cauza frecvenței GPU mai mari. Acest lucru poate fi observat numai atunci când filtrarea triliniară și anizotropă este dezactivată, ceea ce este extrem de rar, numai în acei algoritmi în care sunt utilizate probe nefiltrate, de exemplu, în maparea paralaxă.

Un alt avantaj al G9x și al GeForce 9600 GT în special este Compania NVIDIA are în vedere o nouă tehnologie de compresie implementată în blocurile ROP, care, potrivit acestora, funcționează cu 15% mai eficient decât cea folosită în cipurile anterioare. Aparent, acestea sunt doar aceleași modificări arhitecturale la G9x, concepute pentru a asigura o eficiență mai mare a magistralei de memorie pe 256 de biți în comparație cu cea pe 320/384 de biți, despre care am scris mai devreme. Desigur, în aplicațiile reale nu va exista o diferență atât de mare, chiar și conform NVIDIA în sine, creșterea de la inovații în POR este cel mai adesea de doar aproximativ 5%.

În ciuda tuturor modificărilor din arhitectura G9x care adaugă complexitate cipului, despre care vom discuta mai jos, numărul de tranzistori din cip este destul de mare. Probabil, o astfel de complexitate a GPU-ului se explică prin includerea unui cip NVIO separat, a unui procesor video de nouă generație, a complicațiilor unităților TMU și ROP, precum și a altor modificări ascunse: modificarea dimensiunilor cache-ului etc.

Video pur HD

Același procesor video de a doua generație cunoscut de la G84/G86 și G92 este încorporat în G94, oferind suport îmbunătățit pentru PureVideo HD. Descarcă aproape complet CPU atunci când decodifică cele mai comune tipuri de date video, inclusiv H.264, VC-1 și MPEG-2, la rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, făcând munca de decodare în întregime în hardware. . Și deși decodificarea VC-1 soluții NVIDIA nu la fel de eficient ca H.264, o mică parte a procesului utilizează puterea procesorului, dar vă permite totuși să redați toate discurile HD DVD și Blu-Ray existente chiar și pe computerele medii. Puteți citi mai multe despre procesorul video de a doua generație în recenziile noastre G84/G86 și G92, link-uri către care sunt oferite la începutul articolului.

Ei bine, am dori să remarcăm îmbunătățirile software ale PureVideo HD, care au fost programate să coincidă cu lansarea GeForce 9600 GT. Cele mai recente inovații ale PureVideo HD includ decodarea dual-stream, schimbarea dinamică a contrastului și saturația culorilor. Aceste modificări nu sunt exclusive pentru GeForce 9600 GT, iar în noile versiuni de drivere, începând cu ForceWare 174, sunt introduse pentru toate cipurile care acceptă complet accelerare hardware cu PureVideo HD. Pe lângă placa video considerată astăzi, această listă include: GeForce 8600 GT/GTS, GeForce 8800 GT și GeForce 8800 GTS 512.

Îmbunătățirea dinamică a contrastului este destul de frecvent utilizată în aparatele de uz casnic, televizoare și playere video și poate îmbunătăți imaginile cu o expunere suboptimă (combinație între viteza obturatorului și diafragma). Pentru a face acest lucru, după decodificarea fiecărui cadru, histograma acestuia este analizată, iar dacă cadrul are un contrast slab, histograma este recalculată și aplicată imaginii. Iată un exemplu (în stânga este imaginea inițială, în dreapta este imaginea procesată):

Aproximativ același lucru este valabil și pentru a apărut în PureVideo HD îmbunătățire dinamică saturația culorii. Electrocasnicele folosesc, de asemenea, niște algoritmi de îmbunătățire a imaginii de foarte mult timp, spre deosebire de monitoarele de computer, care reproduc totul așa cum este, ceea ce în multe cazuri poate face ca imaginea să fie prea plictisitoare și lipsită de viață. Echilibrul automat al componentelor de culoare din datele video, care este calculat și pentru fiecare cadru nou, îmbunătățește percepția umană a imaginii prin ajustarea ușoară a saturației culorilor sale:

Decodificarea dual-stream accelerează decodarea și post-procesarea a două fluxuri video diferite simultan. Acest lucru poate fi util la ieșire în moduri precum imagine în imagine, care sunt utilizate în unele discuri Blu-Ray și HD DVD (de exemplu, a doua imagine poate arăta regizorul filmului dând comentarii cu privire la scenele prezentate în fereastra principală). ), edițiile filmelor RĂZBOI și Resident Evil: Extinction sunt echipate cu astfel de caracteristici.

O altă inovație utilă ultima versiune PureVideo HD a devenit o oportunitate funcţionare simultană Obuze aero în sala de operație sistem Windows Vista în timpul redării video accelerat hardware în modul ferestre, ceea ce nu era posibil înainte. Ca să nu spun că acest lucru i-a îngrijorat foarte mult pe utilizatori, dar oportunitatea este plăcută.

Suport pentru interfețe externe

Suportul pentru interfețele externe în GeForce 9600 GT este similar cu GeForce 8800 GT, cu excepția suportului DisplayPort integrat, probabil. Cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe plasate în afara celei principale în G94, a fost și el inclus în cipul în sine.

Cardurile de referință GeForce 9600 GT au două legături duble Ieșire DVI cu suport HDCP. Suportul pentru HDMI și DisplayPort este implementat în hardware pe cip, iar aceste porturi pot fi implementate de partenerii NVIDIA pe carduri special concepute. Mai mult, așa cum asigură NVIDIA, spre deosebire de G92, suportul DisplayPort este acum încorporat în cip și nu sunt necesare transmițătoare externe. În general, conectorii HDMI și DisplayPort de pe o placă video sunt opționali; aceștia pot fi înlocuiți cu adaptoare simple de la DVI la HDMI sau DisplayPort, care sunt uneori incluse cu plăcile video moderne.

Detalii: familiile G96, GeForce 9400 și 9500

Specificatii G96

  • Nume de cod al cipului G96
  • tehnologie 65 nm
  • 314 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare comune pentru fluxul de vertex și pixeli și alte tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Ceas de bază 550 MHz
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,4 GHz)
  • 32 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP pentru precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 16 unități de adrese de texturi cu suport pentru componente FP16 și FP32 în texturi
  • 16 blocuri de filtrare biliniare (ca și pentru G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrare triliniară gratuită și filtrare anizotropă eficientă)
  • Posibilitatea de ramificare dinamică în pixeli și vertex shaders
  • 2 ROP-uri largi (8 pixeli) cu suport pentru moduri anti-aliasing de până la 16 mostre per pixel, inclusiv cu formatul framebuffer FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA, blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) pe ceas, în modul incolor (numai Z) 64 de mostre pe ceas
  • Scrieți rezultatele în 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, DisplayPort) sunt integrate pe cip

Specificații cardului de referință GeForce 9500 GT

  • Ceas de bază 550 MHz
  • Număr de procesoare universale 32
  • Număr de unități de textură 16, unități de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2/GDDR3
  • Capacitate memorie 256/512/1024 megabytes
  • Rata teoretică de eșantionare a texturii de până la 8,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Specificațiile cardului de referință GeForce 9400 GT

  • Ceas de bază 550 MHz
  • Frecvența procesoarelor universale 1400 MHz
  • Numărul de procesoare universale 16
  • Număr de unități de textură 8, unități de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 25,6 gigaocteți pe secundă.
  • Rata de umplere maximă teoretică este de 4,4 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii de până la 4,4 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Arhitectura G96

Din punct de vedere arhitectural, G96 este exact jumătate din cipul G94, care, la rândul său, diferă de G92 doar prin caracteristicile cantitative. G96 are jumătate din numărul tuturor unităților de execuție: ALU, TMU și ROP. Noul cip video este conceput pentru soluții cu cea mai mică gamă de preț și are două unități mari de shader (32 ALU în total) și 16 unități de textură, precum și opt ROP-uri. De asemenea, are o magistrală de memorie redusă, de la 256 de biți la 128 de biți, în comparație cu G94 și G92. Toate caracteristicile hardware rămân neschimbate, singura diferență este performanța.

Detalii: G92b, familia GeForce GTS 200

Specificații grafice de referință GeForce GTS 250

  • Ceas de bază 738 MHz
  • Frecvența procesoarelor universale 1836 MHz
  • Număr de procesoare universale 128
  • Număr de unități de textură 64, unități de amestecare 16
  • Frecvența efectivă a memoriei 2200 (2*1100) MHz
  • Tip de memorie GDDR3
  • Dimensiunea memoriei 512/1024/2048 megaocteți
  • Lățimea de bandă a memoriei 70,4 GB/s
  • Rata maximă de umplere teoretică este de 11,8 gigapixeli pe secundă.
  • Rata teoretică de eșantionare a texturii de până la 47,2 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă ieșire la rezoluții de până la 2560x1600
  • Conector SLI dual
  • Bus PCI Express 2.0
  • Ieșire TV, Ieșire HDTV, suport HDCP, HDMI, DisplayPort
  • Consum de energie de până la 150 W (un conector cu 6 pini)
  • Design cu două sloturi
  • MSRP 129 USD/149 USD/169 USD

În general, această „nouă” placă video bazată pe cipul G92 de 55 nm nu diferă în niciun fel de GeForce 9800 GTX+. Lansarea noului model poate fi parțial justificată prin instalarea nu a 512 MB de memorie video pe el, ca în 9800 GTX +, ci a unui gigabyte, care afectează foarte mult performanța în modurile grele cu setări maxime calitate, rezoluții înalte cu anti-aliasing pe ecran complet activat. Și există și opțiuni de doi gigabyte, dar acesta este deja mai mult un avantaj de marketing decât unul real.

În astfel de condiții, versiunile mai vechi ale GeForce GTS 250 ar trebui să fie într-adevăr vizibil mai rapide decât GeForce 9800 GTX + datorită memoriei crescute. Și unele dintre cele mai moderne jocuri vor obține un avantaj chiar și în cele mai multe rezoluții înalte. Totul ar fi bine, dar unii producători de carduri au lansat GeForce 9800 GTX+ cu un gigaoctet de memorie chiar mai devreme...

Producția de cipuri video G92b conform standardelor tehnologice de 55 nm și o simplificare vizibilă a designului PCB-ului au permis NVIDIA să realizeze o soluție similară GeForce 9800 GTX din punct de vedere al caracteristicilor, dar cu un preț mai mic și consum redus de energie și disipare a căldurii. Și acum, pentru a furniza energie GeForce GTS 250, placa are doar un singur 6-pini conector PCI-E nutriție. Acestea sunt toate diferențele principale față de 9800 GTX+.

  • Serghei Savenkov

    un fel de recenzie „rare”... parcă s-ar grăbi undeva