Jak na APU zrychlit GPGPU výpočty o 20 % bez přetaktování?
Zkratka APU se stala synonymem pro procesory s integrovaným grafickým jádrem z dílen AMD vhodné na nenáročné kancelářské úlohy či občasné hraní. Slovo Accelerated, které se skrývá pod prvním písmenem, ale mělo původně označovat něco trochu jiného. APU, Fusion, Heterogenous System Architecture… ať už tomu říkáte jakkoliv, měly to být procesory, které si k vysokému výkonu v paralelizovatelných úlohách dopomohou výpočetní silou grafického jádra.

Aplikace využívající rozhraní CUDA nebo OpenCL existují už dnes, ale vlastně není rozdíl v tom, jestli je grafické jádro v jednom čipu s procesorem, nebo má podobu karty do slotu PCI Express. To se ale konečně může změnit. Vědci z North Carolina State University údajně přišli na to, jak zužitkovat přítomnost CPU i GPU v jednom čipu a zvýšit tak výkon v GPGPU aplikacích o 20 %. Výzkum byl sponzorován společností AMD a jako spoluautor výsledného článku je uveden i Mike Mantor, senior fellow architect u AMD. Poznatky lze ale aplikovat na jakýkoliv čip, třeba i od Intelu, za předpokladu, že bude mít sdílenou L3 cache, do které budou mít přístup procesorová jádra i grafický akcelerátor.
„Jádra CPU a GPU stále zpracovávají téměř výhradně oddělené funkce. Jen výjimečně spolupracují na zpracování jakéhokoliv programu a proto nejsou tak účinná, jak by mohla být. To je problém, který se snažíme vyřešit,“ prohlásil Huiyang Zhou, jeden ze spoluautorů výzkumu.

Řešení, které vědci navrhují, je nechat GPU provádět výpočty a CPU použít k nahrávání dat (prefetch) z hlavní paměti. „Tento přístup je efektivnější, protože používá CPU i GPU k tomu, v čem jsou dobrá. GPU je dobré na zpracování výpočtů, CPU je dobré na rozhodování a flexibilní nalezení potřebných dat“, vysvětluje Zhou.
V praxi to vypadá tak, že CPU provádí „předzpracovací“ program, který běží vůči GPU napřed a obsahuje pouze instrukce nahrávání z operační paměti (fetch). Vlákna běžící na pomalejších výpočetních jednotkách GPU se pak s hledáním dat v RAM nemusí tolik zdržovat, protože většinu potřebného naleznou ve společné cache. Předzpracovací program vytváří upravený kompilátor, řadový vývojář se jím tedy nemusí zaobírat. Logicky z toho ale vyplývá, že vylepšení nelze použít retroaktivně na již existující programy.
Výzkumníci tvrdí, že v testech dosáhli zrychlení v průměru o 21,4 %, některé úlohy byly ale urychleny až o 113 %, tedy na více než dvojnásobek. Testy však neprobíhaly na existujícím APU, vědci museli používat simulované dosud neexistující APU se sdílenou L3 cache.
Výsledkům výzkumu by zajisté měl věnovat pozornost Intel, který vyvíjí vlastní kompilátory a také nabízí výkonné procesory s (často nevyužitým) iGPU. A také vlastní Havok, který se před akvizicí zajímal o možnost akcelerace herní fyziky grafickým čipem. To je jen taková kacířská myšlenka.
Zdroj: X-bit labs, bit-tech.net
Cnews.cz
Novinky
-
23.05.2012 - 00:00
-
22.05.2012 - 18:52
-
22.05.2012 - 11:14
-
22.05.2012 - 08:00
-
22.05.2012 - 07:00
-
21.05.2012 - 14:00
-
21.05.2012 - 11:06
-
21.05.2012 - 09:46
-
20.05.2012 - 17:11
-
18.05.2012 - 22:13
-
18.05.2012 - 18:30
-
18.05.2012 - 17:30
-
18.05.2012 - 11:47
-
17.05.2012 - 19:33
-
17.05.2012 - 15:35
-
17.05.2012 - 07:00
-
17.05.2012 - 00:00
-
16.05.2012 - 21:40
-
16.05.2012 - 19:35
-
16.05.2012 - 08:00
Diskuzní fórum
Tiskové zprávy
Oblíbené články
Nejčtenější články
Nejdiskutovanější články
Poslední komentáře
- Re: Horký den a potící se ruka? Zachrání vás myš s ventilátorem
3 min 19 sek zpět - Re: Scythe Mugen 3 rev.B: keď lacnejší chladič nestačí
1 hodina 1 min zpět - Re: Scythe Mugen 3 rev.B: keď lacnejší chladič nestačí
2 hodiny 27 min zpět - Re: Horký den a potící se ruka? Zachrání vás myš s ventilátorem
2 hodiny 29 min zpět - Re: Horký den a potící se ruka? Zachrání vás myš s ventilátorem
2 hodiny 40 min zpět - Re: Koolance má vodní blok pro GTX 690
2 hodiny 45 min zpět - Re: Scythe Mugen 3 rev.B: keď lacnejší chladič nestačí
2 hodiny 46 min zpět - Re: Scythe Mugen 3 rev.B: keď lacnejší chladič nestačí
2 hodiny 52 min zpět - Re: Scythe Mugen 3 rev.B: keď lacnejší chladič nestačí
3 hodiny 10 min zpět - Re: Asus PA248Q v redakci: nadupaný 24" IPS s 1920 × 1200 px ...
3 hodiny 18 min zpět


Komentáře
Re: Jak na APU zrychlit GPGPU výpočty o 20 % bez přetaktování?
"vlastně není rozdíl v tom, jestli je grafické jádro v jednom čipu s procesorem, nebo má podobu karty do slotu PCI Express."
Markantni rozdil tvori vhodnot pro ruzne velikosti uloh. Presuny dat po PCIe se nedaji zanedbat.