Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Stránky
Na konec jsme si nechali aspekty GeForce GTX 480, v nichž by měla podle všeho vynikat úplně nejvíce. Dlouho dopředu nám nVidia z Fermi ukázala právě její GPGPU část, přeměnu v cache architekturu a výhody v podobě rychlého přepínání kontextu atd. To všechno by se mělo projevit i na výkonnosti s GPU PhysX, neboť právě pro grafické čipy přepsaná PhysX je jednou z GPGPU aplikací.
Než se pustíte to praktických tesů, určitě byste se měli vrátit alespoň k popisu GPGPU architektury GF100:
Z grafik se stávají procesory: GPGPU část architektury GF100

Přečtěte si také
- Test GeForce GTX 480 III. – DirectX 11 a anti-aliasing
- Test GeForce GTX 480 II. – průběhy fps a minima
- Kvalita obrazu s GeForce GTX 400 a Radeon HD 5800
- Test GeForce GTX 480 (Fermi) I. – DirectX 11 od nVidie
Možná si ještě vzpomenete na graf, kterým v loni v srpnu nVidia lákala na fantastický výkon Fermi s PhysX:

Jednalo se zřejmě o ideální případ (a Fermi s 512 stream procesory), ale pokud vezmeme ještě v úvahu fakt, že u Fermi má být výrazně rychlejší přepínání kontextů, očekávali jsme od her, kde dosud bylo optimem mít silnou grafickou kartu pro grafiku a GeForce typicky alespoň 9600 GT pro fyziku, výrazné zlepšení situace a snad i násobný výkon. Anebo jinými slovy minimální propady oproti výkonu bez efektů PhysX.
První hrou, kterou jsem pro test GPU PhysX zvolil, je Mirror's Edge. Dnešní nejrychlejší karty zde i ve 2560 × 1600 px s 4× MSAA bez vylepšené PhysX dosahují průměrně klidně kolem 140 fps, naopak ani procesor Core i7-920 na 4 GHz nedokáže Enhanced PhysX v této hře počítat dost rychle na to, aby třeba efekt tříštění skla byl plynulý.

Všimněte si, že GeForce GTX 480 s vypnutou akcelerací PhysX běží o něco rychleji než s ní (samozřejmě jen dokud nedojde na první efekt využívající rozšířenou a tedy náročnou PhysX), GTX 480 v této hře není výrazně rychlejší než dvoučipová GTX 295 (SLI zapnuto).

Batman: Arkham Asylum je vůbec nejlépe hodnocenou hrou s GeForce PhysX (metascore 91) a současně také předmětem sporu nVidie a ATI/AMD. Hra patří do programu TWIMTBP a kromě pokročilé PhysX umožní GeForce hráčům podporu anti-aliasingu přímo ve hře, kdežto s Radeony je třeba vynucovat skrze CCC a to je samozřejmě pomalejší. O kauze jsme toho na EHW napsali hodně, nyní se raději podívejme na srovnání GeForce mezi sebou a i u nejrychlejší karet Radeon HD 5000 konstatujme, že Advanced PhysX bude třeba nechat vypnutou.

Jelikož 94sekundový benchmark neměří stále jen v lokacích s náročnou PhysX, ilustruje vše lépe graf průběhu. Místo s proudy páry v grafu určitě poznáte.

Jakási "Advanced PhysX" je i v Metro 2033, jestli jsou díky ní všude možně poletující particles počítány realističtěji anebo jich je více, to netuším. Rozdíl ve výkonu je i při počítání na procesoru minimální, zřejmě by to chtělo jinou lokaci než tunel v chase03 (speciálně jsem se na to v nVidii ptal a pro test byl doporučen stejný level). V Metro 2033 určitě ale platí, že s GeForce nemáte žádnou výraznější výhodu.



Raging Rapids Ride je jedno z dem vytvořených přímo pro ukázku schopností Fermi. Využívá simulaci kapalin a šatů (branky) a jestliže na screenshotu vypadá nevábně, pak v pohybu je tomu naopak.




Testovací konfigurace
- monitor: HP LP3065 (30", 2560 × 1600 px, S-IPS)
- procesor: Intel Core i7-920 (20× 200 MHz = 4,00 GHz, Turbo Boost a HyperThreading vypnuty)
- základní deska: Gigabyte GA-X58A-UD5 (Intel X58, ICH10R, BIOS F3)
- paměti: 6 GB Kingston DDR3-1866 (1200 MHz, 7-7-7-20-2T, 1,66 V)
- pevný disk: Western Digital VelociRaptor VR150 (WD3000GLFS)
- optická mechanika: Lite-On DH-4O1S (Blu-ray, DVD-ROM)
- zdroj: Gigabyte Odin GT 800W (GE-S800A-D1)
- skříň: Cooler Master Centurion 534
- chladič CPU: Scythe Mugen 2 (1300 rpm) + Noctua NT-H1
- systémové větráky: Arctic Fan12 PWM + Cooler Master 12 cm @ 1000 rpm
- Microsoft Windows 7 Ultimate (64bitová verze)
- vypnuta automatické defragmentace, aktualizace i swap file na všech jednotkách
- DirectX redist February 2010
- Intel INF 9.1.1.1
- ATI Catalyst 10.3 WHQL pro Radeon HD 5870/5970
- nVidia GeForce 197.25 pro GeForce GTX 285/295 (197.45 WHQL pro GPGPU)
- nVidia GeForce 197.17 a 197.41 WHQL pro GeForce GTX 480/470



![Google chce odstranit YouTube pro WP, zabíjí otevřenost [komentář]](http://extrahardware.cnews.cz/sites/default/files/styles/novinkyepc/public/ikonky/2013/03/google-blue.png)





























Komentáře
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Tak to je super, asi nejkladnější díl z četné recenze o GF100. Osobně mě to překvapilo a jsem rád. Jsem taky rád že jede CUDA skrz druhou výpočetní kartu, já to tušil :).
JC2 jedu na FHD vše na hight (nebo nejvišší, už nevím smazal jsem to) plynule i na mojí GTS250, s zaplím CUDA se to občas( hlavně výbuchy a voda) začně trhat ale nic hroznýho), takže jsem se trochu lekl těch "jen" 40 FPS u GTX 480.
K tomu testu na Raytracing, doslova úžas, defaultní Veyron v barvách nVi je super, ale to červený autíčko je jako fotka, opravdu úžas až mi vytekla slina.
Takže super a těším se na GTX 470 test, pro mě rozhodně zajímavější.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Není to k článku. "nejvišší" a "zaplím" je opravdu hnus.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
OpenCL testy 5870 chybaju ?
http://www.extrahardware.cz/files/images/clanky/2010/04duben/geforce_gtx...
Mate nainstalovany ATI STREAM SDK 2.01 ?
http://developer.amd.com/gpu/ATIStreamSDK/Pages/default.aspx
CUDA SDK 3.0 ?
Microsoft Windows 7 Ultimate (64bitová verze)
vypnuta automatické defragmentace, aktualizace i swap file na všech jednotkách
DirectX redist February 2010
Intel INF 9.1.1.1
ATI Catalyst 10.3 WHQL pro Radeon HD 5870/5970
nVidia GeForce 197.25 pro GeForce GTX 285/295 (197.45 WHQL pro GPGPU)
nVidia GeForce 197.17 a 197.41 WHQL pro GeForce GTX 480/470
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
V téže kapitole je hned nahoře text: Srovnání je možné i pro OpenCL, ale neměl jsem čas instalovat pro Radeony jiný ovladač s podporou tohoto rozhraní (podpora OpenCL není součástí standardních Catalystů).
Folding@Home
GTX480 dostala výprask od GTX285. Hmm už chápu proč jsou hoši z Folding@Home co se na herní fermi nejvíc těšili, nakonec asi nejvíc zklamaní. Ono totiž kdo z nadšenců do těhle výpočtů má doma Tesla kartu. Nvidia tak dlouho osekávala až se sekla - starší generace je lepší než novější...
Re: Folding@Home
Pod osou x je popisek: čas [sekundy] - menší je lepší.
Re: Folding@Home
spis si se sekl ty :)
edit: aha Mirek byl rychlejsi
Re: Folding@Home
Áááááá....tak nic.
No stejně když čtu o tom přiškrcení double precision a vidím výsledky 5870 http://wcl.cs.rpi.edu/papers/ppam2009.pdf...
GTX285 je 17x rychlejší než Phenom X4 940, ale 5870 je rychlejší hned 109x. HD5870 má 544 GigaFLOPS, GTX480 má asi 168 GigaFLOPS. Z toho se dá mnohé odvodit....tak asi proto byly někteří "počtáři" zklamáni.
PS: Už byla nvidia tak milosrdná aby nám sdělila přesnou velikost jádra? Né že bych kupoval karty podle velikosti jádra, jen nesnáším uvádění technický parametrů stylem "menší než 530mm^2" a podobně. Nechápu co je na tom tak "top secret".
Re: Folding@Home
Top secret na tom nie je nic, len nemozu na plnu hubu zakricat, ze je lepsie ist cestou mensich multi-GPU ako slepou cestou mega-monolitu, ktoru si oni obhajovali. Buducnost je jednoznacne vo viacjadrovych rieseniach, snad im to uz raz dojde :-).
Re: Folding@Home
Tohle prostě nepochopím. Každý ví, že má přes 500 mm^2, ale méně než měla jejich rekordmanka co měla 576mm^2. Pořád se všude psalo něco o cca 530mm^2, tak za co se sakra může nvidia stydět? Čeho se bojí? Prostě rozptýlý dohady a řekne např. jádro má plochu 536mm^2. Já už začínám mít pocit, že tuhle základní informaci neví snad ani Igor Staněk.
Re: Folding@Home
Asi nemaj na posuvku... chtělo by to veřejnou zbírku....
Re: Folding@Home
Pro GPGPU určitě, ale pro herní grafiku to není tak jednoznačné. Kolik let už tu SLI existuje a pořád není nic lepšího než AFR/SFR (nebo naprostá nefunkčnost). A to nemluvím ani o stále ještě podle mě o něco méně vychytaném CrossFire. Ona to asi až taková legrace nebude. Hydra aspoň staví na správné myšlence, ale i kdyby ji začala podporovat nVidia i AMD, tak zabere dost času, než to bude řešení na všechny hry bez výjimky (a bez input lagu a bez úzkých hrdel... premisa bohužel ale logicky navíc nebude splněna, takže Hydru čeká delší trnitá cesta, nebo zapomnění)
Re: Folding@Home
Podla poslednych testov SLI vs CrossFire je uz v prevahe CF a to vdaka lepsiemu skalovaniu vykonu ako SLI. SLI ma ale zase naopak vyhodu vyssich minimalnych FPS a takisto pre niekoho asi aj pocit plynulejsieho hrania (zaver clanku z Hardwarecanucks.com - NVIDIA GeForce GTX 470 SLI Review). Ja si myslim, ze dnes uz dualna grafika nie je macka vo vreci a generaciu po generacii sa to moze len zlepsovat. Ved HD 5970 je s prehladom najvykonnejsia grafika na trhu a ked nema problemy s ovladacmi (samozrejme ze existuju), tak funguje absolutne perfektne.
EDIT: osobne by som si ale dualku nikdy nekupil, nie preto, ze neverim tomu rieseniu, ale preto, ze testy dokazuju, ze dve single karty zapojene do SLI alebo CF dosahuju vyssi vykon.
Re: Folding@Home
Škálování ve chvíli, kdy Multi-GPU ATI/NV funguje, musí být zhruba stejné. Oba používají AFR (v snazším a rychlejším případě), na tom není co nějak vylaborovat. Pak už jde jen o vhodnost každé zúčastněné karty pro danou hru. Ze zkušenosti jen vím, že stačí zařadit vícero ne úplně typicky testovacích her a zatímco SLI většinou profil ještě má, CrossFire méně často a je třeba častěji laborovat. Jinak je to prašť, jak uhoď.
Re: Folding@Home
Ano, co sa tyka profilov pre CrossFire tak to zaviedli az pri poslednych ovladacoch ak si dobre pamatam. Jednoznacne mala v tomto ohlade Nvidia vzdy navrch. Snaha o zdokonalovanie tu ale je a preto si myslim, ze mozno o nejake dve, tri generacie uz taketo problemy existovat nebudu a dualne riesenie, ci uz SLI alebo CF nebude pre ludi prekazkou pri kupe grafiky.
Re: Folding@Home
Jenže tam je problém v samotném jádru SLI/CF, v AFR. Viz třeba článek o Hydře: http://www.extrahardware.cz/prvni-test-lucid-hydra-v-cr-multi-gpu-pro-masy
Re: Folding@Home
Snad nieco vymyslia, som zvedavy (nejaky pridavny cip ktory bude spracovavat udaje v realnom case - myslim, ze sa kedysi davnejsie aj nieco ako Lucid cip na dualkach spominalo/spekulovalo). O par mesiacov tu bude nova hybridna generacia grafik od ATI, tak uvidime ako CF bude fungovat tam.
Re: Folding@Home
zapomeni ceka myslim vsechny 3 varinty multi GPU reseni, stale vice budou silit konzole a jejich vliv, cim vic bude studii co budou tlacit hlavne na konzole, tim min bude pro multi GPU reseni uplatneni
Re: Folding@Home
To je podla mna utopia, napriklad FPS na konzolach su frustrujuce co sa tyka hratelnosti, nepozeratelne co sa tyka grafiky (tento aspekt je velmi subjektivny, to uznavam) a primitivne jednoduche co sa tyka ovladania. Ostatne zanry hier si zahras na PC tiez, staci pripojit gamepad a pohodlne hrat hopsacky a ine konzoloidne hry. Neverim tomu, ze konzole niekedy nahradia a vobec dorovnaju dopyt po vykonnych hernych pocitacoch.
Re: Folding@Home
A takové strategie...no radši PC only a když se budu hodně nudit a budu chtít vyhazovat prachy tak možná to Wii.
Re: Folding@Home
GTX480 - architektura super
ale
Vykon 64bit FMAD - schvalne znizeny 8x /kvoli quadro/
Malo TMU a nizke frekvencie /kvoli vyrobe/
vysledok
zly GPGPU vykon oproti 5870
malo vykonu na HDR textury - zaklad AAA hier
teploty
spotreba.......
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Takze marketing Nvidie opat za jedna. Ten 2.5 nasobny vykon GTX 480 oproti GTX 285 v PhysX dosiahli iba v syntetickom teste Raging Rapid Ride a prinos v hrach absolutne nezodpoveda slubom - podla mna bieda. Tu su nejake grafy, zdroj je Nvidia pozitiv, to len aby sme sa vyhli naznakom mojej zaujatosti. Takze zdroj: http://physxinfo.com/news/2519/nvidia-gtx-480-up-to-2-5x-performance-in-...
EDIT: dik za test.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Koukám, že autor má asi Google Alerts, protože v článku na konci už je graf z tohoto článku na EHW.
Jinak nemám pocit, že by PhysXInfo byl NV+, myšleno ve smyslu nějaké čišící zaujatosti a demagogických článků. Ten web velmi seriózně informuje o veškerém dění kolem PhysX, dozvíte se z něj přesně, které hry jsou s CPU a které i s GPU PhysX, objevují se tam pravidelně tipy na zprovoznění PhysX s Radeonem jako kartou pro grafiku a to, že cituje slajdy nVidie s referenčními výsledky PhysX v aplikacích přece automaticky neznamená zaujatost (také je citujeme a některé se později podaří ověřit v recenzi/testu).
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Tak som to presne myslel. Slo mi o to, ze to nie je nejaky Nvidiu nenavidiaci web alebo podobne, ale web venujuci sa cisto PhysX. Preto ho povazujem za objektivny. A samozrejme aj preto, ze tam maju vysledky z mnohych webov.
hip hip raytracing
hip hip raytracing, nastesti jsem posun v tehle pro me dulezite oblasti tusil mesice dopredu diky cloveku ktery na Design Garage pracoval, takze objednani GTX470 nic nebranilo
nektera casti teto casti prinesli GTX480 trosku min nez bych ocekaval, ale bohuzel je to strategie nVidie ktera se snazi prodavat i profi karty a tlacit donich pracujici, nastesti to vynahrazuje i oproti mynulosti nizsima cenama a doufam ze Quadro na Fermi v teto cenove polotice bude pokracovat
ale super ze prisla pro me nejvic ocekavana 4 cast testu a davam zani thumbs-up :)
Re: (úterý 27.4. totiž patří šestijádrovým procesorů AMD Thuban)
Trochu mimo..
Ked budete zajtra testovat AMD Thuban vedeli by ste tam zaradit aj test na 7zip 64bit 6 a 12 vlakien a test na TrueCrypt. Hlavne test na TrueCrypt nerobi skoro nikto.
Rad by som vedel rozdiel oproti AMD PIV 965.
Dik.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
...očekávali jsme od her, kde dosud bylo optimem mít silnou grafickou kartu pro grafiku a GeForce typicky alespoň 9600 GT pro fyziku, výrazné zlepšení situace a snad i násobný výkon. Anebo jinými slovy minimální propady oproti výkonu bez efektů PhysX.
To opravdu nevím proč. Ve chvíli kdy si uvědomíte, že physx výpočty nemůžou zabírat ve hrách víc než cca 25% času tak je předem jasné, že nemůže přijít větší relativní zrychlení mezi physx on/off než o těch 33%(jiný základ), ani kdyby v samotném physx byl 1000000x rychlejší...klasický amdahlův zákon.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Má úvaha nebyla pochopena celá. A já naopak při jejím formulování fakt, že velou část zdrojů pořád ještě spotřebuje výpočet 3D, na zřetel bral. Vysvětlím: například v Mirror's Edge lze pozorovat poklesy na jedné GeForce GTX 285 z 90 či 100 fps (v jednoduchých interiérech i více) na 40 fps i méně (u GTX 480 bez PhysX začínáme někde na 140 a více fps v interiérech). Právě při předpokladu, že PhysX@GPU by měla chtít méně zdrojů než 3D grafika, je tu něco špatně. Něco možná dělá právě problém sdílení a přepínání na jediném GPU (přepínání kontextu?) a vyřešení jsem čekal. Jinými slovy, třeba konkrétně v Mirrors Edge bych čekal zlepšení worst case GTX 285 oproti GTX 480 ještě lepší než 39:62 nebo v Batmanovi 18:28. Ale když jsou čteny grafy správně, tak to zase rozhodně není zklamání, jako psal kousek výše Maltra, s jehož příspěvkem taky nemůžu plně souhlasit (nečekám naprostou abstrakci od vlivu a limity dáné počítáním grafiky, ale na násobky se opravdu můžeme dostat).
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Hmmm...myslím, že jsem pochopil, co chcete říct. Otázka je jestli propady při scénách s intenzivním použitím physx nejsou dány i tím, že v nich je více objektů a proto jsou i náročnější na grafiku.
Možná by chtělo porovnat průběhy ve stejné scéně s physx zapnutým i vypnutým na staré a nové gf a porovnat procentuelní propady. Jen kdyby jste se nudili...
Jinak děkuji za opravdu podrobný test GF100 snad ze všech možných pohledů.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Je to asi tezko resitelne dilema. Pri snizeni rozliseni/AA s rustem FPS naroste rezie CPU/IO a samo by se tak mohlo stat limitem (vysledne zkresleni pomeru sil GK).
Na porovnani hrube GPGPU sily dvou karet jsou asi optimalni aplikace s velmi vyznamnym podilem GPGPU vypoctu (napr. NBody simulace).
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Možná je správný říct že se sníží režíe GPU než zvíší režie CPU, nebo to tak opravdu je?
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Snizeni vytizeni GPU (mensim rozlisenim/kvalitou) povede k vetsimu poctu dosazenych rund(fps) benchmarku, jejich narust je mozne zajistit pouze pokud CPU bude stihat ulohy/frames zpracovat/pripravit.
Napriklad 2560 4xAA versus 640x480 noAA je 30x mensi pocet vykreslenych pixelu bez AA. Pokud bychom pro zjednoduseni uvazovali vysledne 30-ti nasobne navyseni FPS tak z napr. 40fps to predstavuje ze strany CPU/IO pripravit 1200 frame/sec. Zatez CPU/IO v puvodnim pripade (2560AA) by tak musela byt velmi mala.
Zalezi samozrejme na podilu narocnosti 3D/GPGPU uloh na GK.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Poznate niekto postup na vynutenie pocitania CUDA efektov v Just Cause 2 cez druhu GPU? Ja mam 8800GT na grafiku a GT240 ako sekundarnu na PhysX. Podla toho, co ste pisali tak na hybridnom systeme ide v pohode pocitanie grafiky a CUDy na roznych GPU. Len sa mi nepodarilo doteraz zistit ako to iste rozbehat na mojej konfiguracii.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Mozna by pomohlo spusteni hry s parametrem
/dxadapter=1
http://forum.beyond3d.com/showpost.php?p=1412439&postcount=329
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Ok. Dik. Vyskusam.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Tak asi to ucinek mit nebude. Vypada to pouze na zmenu defaultni 3D GK. :-(
- Improved default video card selection in multi-GPU systems (override with command line option /dxadapter=)
http://forums.eidosgames.com/showthread.php?t=103648
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
JJ. Uz som to skusal a nefunguje to. Pomaly sa vzdavam. Pozrel som uz viacero for, ale nikde nebolo napisane ani to, ci je nieco podobne vobec mozne. Ked som si napriklad pustil Design garage, tak som hned videl, ze 8800GT sa pouziva iba na grafiku a na vypocty si automaticky aplikacia zobrala GT240, ktora isla uplne naplno. Preto som myslel, ze by nieco podobne mohlo zafungovat aj u Just Cause 2, ale je mozne, ze hra vobec nie je na taku moznost pripravena a nepodporuje ju.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Že by si autor toho videa vymýšlel? Možná by stálo za to ho kontaktovat (na YouTube lze zasílat SZ), třeba by poradil.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Otazne je, ci si to automaticky nenastavuje hra a ci to nedava vzdy na tu istu kartu, ktora renderuje aj obraz. V kombinacii ATI + NV to moze zafungovat tak ako tvrdi autor videa, ale NV + NV moze byt iny pripad. Kazdopadne som napisal komentar pod uvedene video. Uvidime co na to autor.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
To video je na kombinaci Radeon+Geforce? Tam by to bylo vcelku logicke, prvni vyzitelne CUDA device (id=0) je az Geforce. V pripade Geforce+Geforce bude prvni CUDA device karta vyuzita jiz pro 3D.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Ide o kombinaciu HD4850 + 9800GT.
Re: Test GeForce GTX 480 IV. – PhysX a GPGPU (CUDA)
Celkom by ma zaujimal vykon karty v MD5 crackery BarsWF (http://tinyurl.cz/o3s) a v IGHASHGPU (http://tinyurl.cz/o3t). Ak mate niekto moznost odtestovat, prosim linknite mi screeny.