Nové střípky o Radeonech HD 4800
Do vydání Radeonů HD 4800 stále zbývá více než 14 dní. Bouřlivé spekulace stále neutichají: objevují se teorie, které vypadají věrohodně, ale i zprávy, které jsou (téměř) jasné fámy. Co nového tedy víme od doby, kdy vyšlo Spekulativní preview?
Když jsem 15. května sepisoval Spekulativní preview Radeonů HD 4800, mnoho informací o nových kartách bylo ještě velmi mlhavých a v některých ohledech byl tedy článek poněkud neurčitý, přestože jsem nyní při jeho letmém pročtení našel pouze jedno tvrzení, ve kterém jsem se zřejmě mýlil. Ale je spousta toho, co nyní mohu upřesnit.
480, nebo 800?
Počet stream processorů je jedna z nejdůležitějších specifikací grafického čipu a v případě RV770 velká záhada. O těchto číslech se mluvilo už od počátku, jako pravděpodobnější se dlouho jevilo číslo první. Do dnešního dne ale vykrystalizovaly dvě teorie, obě zakládající se na střípku, že teoretický výpočetní výkon RV770 dosáhne hranice 1 TFLOPS. O těchto dvou variantách jsem se stručně zmínil už v diskuzi pod spekulativním preview GeForce GTX 260/280.

První teorie se drží 96 5D jednotek a tedy 480 stream processorů, které by ale běžely na vyšším taktu, než zbytek čipu, konkrétně 1050 MHz. 480 × 1050 × 2 = 1008 GFLOPS. Tuto verzi podpírá dokument od AMD, který zveřejnil server Hardware-Infos.de a který vidíte výše. Také Vijay Pande, hlavní vývojář Folding@home, na fóru projektu napsal, že se při vývoji myslí i na nové hardware a zmínil 480 stream processorů. O taktech sice pomlčel, ale teorii o 480 SPs přidala na věrohodnosti i skutečnost, že jakmile si jeho příspěvku všimlo více lidí, část týkající se specifikací byla odstraněna.
Proti dokumentu z Hardware-Infos naopak mluví tvrzení znalých uživatelů Beyond3D fóra, podle nichž architektura R6xx (ze které vychází i RV770) neumožňuje, aby shadery běžely asynchronně vůči zbytku jádra. A nově také další dokument s logem AMD.

Tento zveřejnil server NordicHardware a de facto způsobil přelom v obecném povědomí o RV770. Teorie o 800 stream processorech a nižším taktu, kterou na Beyond3D fóru tvrdohlavě prosazoval Arun Demeure (nutno poznamenat, že prakticky zcela sám), najednou začala vypadat věrohodně. Výpočet, jakým by se v tomto případě došlo k 1 TFLOPS, vidíte v tabulce: 800 × 625 × 2 = 1000 GFLOPS, a to prosím u pomalejší varianty.
Byli bychom však bláhoví, kdybychom přehlíželi nedostatky, které tato verze má. Za prvé, aby takový čip nebyl pomalejší, než RV670, je potřeba zvýšit počet texturovacích jednotek, hezké číslo by v tomto případě bylo 32. Byl by tak zachován trend zvyšujícího se podílu shaderů ku texturovacím jednotkám, ten by oproti RV670 vzrostl ze 4:1 na 5:1. Texturovací jednotky ale zabírají daleko více tranzistorů, než výpočetní jednotky (ALUs) a naskýtá se tak otázka, zdali je možné, aby se takto velký čip (o 150 % více ALUs, o 100 % více TUs) vešel do plochy jen o 30 % větší, než zabírá RV670. Ostatně, plocha 250-255 mm2 je u RV770 prakticky jistá – fotky přece nelžou.
Doplněno: Fotky nelžou, ale lidé se mohou mýlit. Wirmish z Beyond3D fóra, který ve Photoshopu vytvořil srovnání ploch čipů, si napoprvé neuvědomil, že RV670 nemá čtvercový půdorys. Nově odhadnutá velikost RV770 je tedy 276 mm2.

Další argument proti teorii o čipu s 800 SPs a 32 TUs je pravidlo, kterého se ATi dlouhá léta držela: žádný high-endový čip nebyl taktován pomaleji, než jeho předchůdce. Ale pravidla se mohou měnit a ani další výše popsané problémy nejsou neřešitelné.
Cnews.cz
Novinky
-
24.05.2012 - 08:00
-
24.05.2012 - 07:00
-
23.05.2012 - 14:00
-
23.05.2012 - 10:00
-
23.05.2012 - 00:00
-
22.05.2012 - 18:52
-
22.05.2012 - 11:14
-
22.05.2012 - 08:00
-
22.05.2012 - 07:00
-
21.05.2012 - 14:00
-
21.05.2012 - 11:06
-
21.05.2012 - 09:46
-
20.05.2012 - 17:11
-
18.05.2012 - 22:13
-
18.05.2012 - 18:30
-
18.05.2012 - 17:30
-
18.05.2012 - 11:47
-
17.05.2012 - 19:33
-
17.05.2012 - 15:35
-
17.05.2012 - 07:00
Diskuzní fórum
Tiskové zprávy
Oblíbené články
Nejčtenější články
Nejdiskutovanější články
Poslední komentáře
- Re: Intel Celeron G440: může mít dnes jednojádro smysl?
0 sekund zpět - Re: RunCore Xapear: autodestrukce dat na dálku pomocí SMS
5 hodin 28 min zpět - Re: Test Sapphire HD 7770 OC: rychlý, úsporný a tichý
5 hodin 40 min zpět - Re: Gigabyte GTX 680 Windforce 3X: 6+8 pinů pro lepší OC
6 hodin 2 min zpět - Re: RunCore Xapear: autodestrukce dat na dálku pomocí SMS
6 hodin 14 min zpět - Re: AMD to s Trinity zkusí i na průmyslovém trhu
6 hodin 1 min zpět - Re: AMD to s Trinity zkusí i na průmyslovém trhu
6 hodin 29 min zpět - Re: Minitest MSI Z77A-GD80: první deska s Thunderboltem
6 hodin 1 min zpět - Re: VIA APC: počítač pro systém Android za 50 dolarů
7 hodin 20 min zpět - Re: AMD to s Trinity zkusí i na průmyslovém trhu
9 hodin 1 min zpět


Komentáře
supr
a ted mi rekni.. jak to mam do toho 25. vydrzet????? :D
natoz nez bude X2.. po ktery pasu.
800SP a 1TFLOP
1TFLOP bych možná nebral zase tak jako dogma.
Osobně si myslím, že RV770 bude mít 480SP (nejspíše taktovaných asynchronně k jádru), Lukáš mě svými argumenty zrovna nepřesvědčil.
800SP beru jako příliš fantastický výsledek cucání z prstu a Photoshopu někoho neurčitého.
Re: 800SP a 1TFLOP
no ja bych tomu aji veril..sp ati jsou 5D takze realne cislo 160 uz se nezda tak neuveritelne velke. a vsechno kolem vyssi hustoty tranzistoru a nizsich taktu take odpovida. stejne jak pokracovani v trendu zvysovani pomeru sp:tmu. podle me to do te skladanky najednou krasne zapada..mozna az moc krasne ale to se jeste uvidi:)
a ty teraflopy jsou jenom cislo co o realnem vykonu ve hrach nerekne vubec nic. zvlast u ati kdy se ve hrach 5d sp nevyuziji uplne. u nvidie k plnemu vytizeni sp dojde vzdycky.
Re: 800SP a 1TFLOP
Swamp: Zdá se ti jednodušší stáhnout celý vývojový tým z mnohem podstatnějšího projektu, jako je R8xx, odložit jeho vydání a místo toho od základu překopat architekturu refresh-čipu (na jehož vývoj bylo věnováno minimum finančních prostředků), který stejně jako všechny čipy z generace R6xx a R5xx používá jedno register-array pro TMUs i ALUs (což znamená, že musejí být taktovány synchronně), nebo nechat vše při starém, udělat čip o nějakých 25-30 mm2 větší a integrovat do něj 800 SPs, což je přesně ten způsob škálování, pro který byla architektura čipu navržena?
Re: 800SP a 1TFLOP
a proc by tech jednotek nemohlo byt 640? cili dvojnasobek :)
RV770 / RV670 = 1,5 ?
Ze vsech tech informaci okolo HD4850/70 verim v tuto chvili jedinemu. A to, ze puvodni informace od ATI, ze RV770 bude cca 1,5x rychlejsi nez RV670 bylo pouze vypustenim klamneho balonku na zmateni protivnika. Jak vsichni dobre vime podceneni sil protivnika je prvni krok k porazce. ;-)
SP 480/320 = 1,5 (640/320) = 2
TMU 32/16 = 2
MEM 4000/2250 = 1,8
Re: RV770 / RV670 = 1,5 ?
Jenže ono to dost možná bude odpovídat. Máme informaci, že Radeon HD 4850 přímo soupeří s GeForce 8800 GTS a 9800 GTX, HD 4870 bude cca o 25 % rychlejší než HD 4850 (o 20 % rychleji taktované jádro + nebude limitován propustností pamětí)
Re: RV770 / RV670 = 1,5 ?
Ale počet a architekturu texturovacích jednotek přeci neznáme, nebo ano? :-) Navíc RV670 běžela na 825MHz, přičemž RV770 je o 200MHz pomalejší (HD4870 "jen" o 75MHz, ale kdo ví, kdy reálně bude).
Re: RV770 / RV670 = 1,5 ?
tak ja teda neviem, DD má NDA s AMD a osobne si myslím, že má asi najpresnejšie informácie, ale ptázne je, či to iba nekamufluje, možno sa nam len ATi pekne smeje, ake flejmarnu sú po celom svete, možno má svet úplne presné informacie, ale no neviem, mne osobne sa verzia 800sp moc nepozdáva ... ale ...
Re: RV770 / RV670 = 1,5 ?
Ta rychlost byla tehdy uvadena k puvodni RV670 (775MHz). 825MHz ma RV670 az na HD3870X2.
Drive se vyskytovali informace o frekvencich RV770 v rozsahu 850->1050MHz GPU. Prece pokud neco pridam paralelne (tj. neprodlouzim dalsimi kroky zpusob zpracovani) pak k nizsim frekvencim neni duvod (velikost chipu a delky tras se meni jen minimalne). Jestli puvodni chip mel 190mm2 a novy ma mit 276mm2 tak to pridava na velikosti tak o 3mm (prodlouzeni stredni delky o 2mm).
Re: RV770 / RV670 = 1,5 ?
Jenže ty nižší takty nesouvisí se zvýšením počtu jednotek, ale s vyšší hustotou tranzistorů.
Re: RV770 / RV670 = 1,5 ?
Hustota predpokladam zustava stejna (55nm), ale meni se jejich jejich pocet (umerne 320 -> XYZ). Pokud se mi podari zachovat vzdalenosti uvnitr chipu, pak k nizsim frekvencim snad neni duvod.
Re: RV770 / RV670 = 1,5 ?
No právě že se jim možná povedlo hustotu tranzistorů zvýšit. Takže jsou ted blíž u sebe a nemůžou dosahovat takových frekvencí, za to jich je tam víc při podobný ploše.
Re: RV770 / RV670 = 1,5 ?
Odkdy zvysovani hustoty tranzistoru vede k nizsim frekvenci? :-)
Proc vsichni vyrobci usiluji o prechod na pokrocilejsi vyrobni proces? Prece pro schopnost dosahnout vetsiho poctu tranzistoru na stejne plose, vyssich frekvenci pri zachovani poctu tranzistoru, zvyseni poctu chipu na waferu, snizeni napajeciho napeti/spotreby,... .
Re: RV770 / RV670 = 1,5 ?
Já to pochopil tak, že 55nm proces zůstává, podařilo se jim však tranzistory naládovat blíž k sobě(jsou mezi nimi menší mezery), tudíž se jich na stejnou plochu při zachovaném 55nm procesu vejde více. Tím že jsou blíž však nemohou běžet na vysokých taktech.
Re: RV770 / RV670 = 1,5 ?
Jedine vysvetleni co mne napada je, ze zustaly zachovany uniky proudu a spotreba pri prepinani stavu. Vzhledem k nutnemu odvodu tepla bylo nutne snizit frekvenci pro dosazeni nizsich celkovych tepelnych ztrat (uchladitelnost).
Ale, ze by zvetseni hustoty vedlo primo principialne k nizsim frekvencim to se mi nezda. :-(
Re: RV770 / RV670 = 1,5 ?
Já to myslel tak, jak píšete. Frekvence asi přímo závislá na vzdálenosti mezi tranzistory nebude, spíš jde o ty parazitní jevy
Re: RV770 / RV670 = 1,5 ?
Ale je to tak, sice nevím, proč přesně, ale to přehřívání se jeví jako dobré vysvětlení. Čím menší je totiž plocha tepelného zdroje, tím hůř se teplo odvádí, to už je obyčejná fyzika. A předpokládám, že 55nm tranzistor na učitém taktu s určitým napětím vytvoří stejné množství odpadního tepla nezávisle na hustotě tranzistorů.
Re: RV770 / RV670 = 1,5 ?
Nevim jestli to podam uplne presne, treba to uz/nikdy neplatilo.
Co si vzpominam tak vetsina spotrebovane energie jde prave na ukor okamziku prepnuti, kdy tranzistor prechazi ze stavu velmi vysoke impedance do nizke a naopak. Vzato do extremu pri velmi vysoke impedanci (odporu) proud netece a tudiz ztratovy vykon R*I*I = 0 (jelikoz je proud blizky 0 vysledne ztraty take blizke 0). Pro opacny pripad je R blizke 0 a ztratovy vykon taktez. V okamziku prepinani neni R nulovy ani nekonecny (zjednodusene receno) a tak ztratovy vykon je take ruzny od nuly.
Tyto hodnoty budou pro konkretni provedeni tranzistoru (treba technologii 55nm) dane. Jediny zpusob jak snizit spotrebu je omezit pocet prepnuti/frekvenci kdy dochazi k hlavnim ztratam.
Prosim o pripadnou opravu ci uplne popreni. Preci jen pro strojare je to okrajovou zalezitosti. ;-)
Re: RV770 / RV670 = 1,5 ?
Zní to celkem logicky, že při vyšší frekvenci spínání bude proud téct častěji, tudíž bude více ztrát/tepla (hodně laicky řečeno)
Re: RV770 / RV670 = 1,5 ?
Stačí si vzpomenout na NV40, která byla stejně velký čip, jako R420, přičemž nesla >50 mil. tranzistorů více, důsledkem čehož nezvládala dobře vysoké frekvence. Krom vyššího lokálního přehřívání tu jde i o výtěžnost - čím je hustota větší, tím je pravděpodobnější, že jakýkoli defekt v materiálu způsobí citelnější chybu. Dalším důvodem pro snížení frekvencí mohla být celková spotřeba - velkým žroutem jsou texturovací jednotky a pokud se jejich počet výrazně zvýšil, mohla spotřeba a množství odpadního tepla přesáhnout úroveň akceptovatelnou pro daný cenový segment (ceny a rozměry chladičů)...
Re: RV770 / RV670 = 1,5 ?
peteb: denzita není daná výrobním procesem...