10. Harmadik generációs (SIMD) szuperskalár processzorok Flashcards
Utasításon belüli párhuzamosság fejlődése (evolúciós irány)
- SIMD
a. Két típus:
i. FX (MMX)
ii. FP (SSE)
b. logikai architektúra kiterjesztése új utasításokkal
c. egy utasításon belül, több adattal ugyanaz a művelet!
(pl. : 4 db. 16 bites összeadás 64 bites regiszterben) 8 operandus, 1 utasítás - Duális műveletes utasítások
a. több, különböző, független utasítás végrehajtása egy utasításon belül!
(pl. : SHIFT ADD, x = b * c +a)
Utasításon belüli párhuzamosság fejlődése (revolúciós irány)
- VLIW
a. Két típus:
i. széles (korai)
ii. keskeny (késői)
b. teljesen új logikai architektúra
c. teljesen új utasításkészlet
Harmadik generációs szuperskalárok jellemzők
A fő újdonság az utasításon belüli párhuzamosság
SIMD irány (multimédia kiterjesztés)
Nagyobb memória sávszélesség
Az L2 cache a memória lapkára kerül
AGP megjelenése (új grafikus busz, ami nagyobb sávszélességet biztosít)
FX SIMD utasítások (’97)
Pixeles-képfeldolgozás, hangfeldolgozás, multimédia alkalmazások
2-8 operandus
FP SIMD utasítások (’99)
Vektoros-képfeldolgozás (3D-képfeldolgozás gyorsítása)
2-4 operandus
FX (pixeles) képfeldolgozás jellemzői
A képet pixelekre bontjuk és úgy dolgozzuk fel Minden pixelnek van o színe, ennek tárolása lehetséges: - 1 biten: monokróm - 16 biten: 64 ezer szín, high color - 24 biten: 224 szín, true color - 32 biten: 224 szín + 8 bites alfa csatorna az átlátszóság tárolásához (3D). o fényessége
FX (pixeles) képfeldolgozás problémája
Nagyon nagy mennyiségű adat tárolása és feldolgozása
FX (pixeles) képfeldolgozás problémájának megoldása
(multimédiás kártya,) multimédiás CPU-bővítés: Tipikus műveletek: o bit blokk átvitel o ablakkezelés Új adattípus bevezetése: pakolt byte » egy utasítás, több operandus Új multimédiás utasítások o alapműveletekhez (+, -, *, /) o logikai műveletekhez Fizikai architektúra változásai: o 64 bites belső busz o FP regiszterek (80 bit) Pl.: Pentium II-ben 2 db MMX futószalag. Minden adat előre rendelkezésre áll, a gyorsítás valós és érzékelhető.
FP (vektoros) képfeldolgozás
Egyenesekkel és görbékkel határolt objektumok geometriai jellemzőkkel írhatóak le, ezért egy képet sokszögek sokaságára bontunk (2D-ben), általában háromszögekre.
FP (vektoros) képfeldolgozás jellemzői
A számítógép a geometriai alakzatokat tárolja, és ezekkel számol
o bár többet kell számolni (nagyon bonyolultan!), nagyságrendekkel gyorsabb a
megjelenítés, mert kevesebb adatot kell beolvasni (igy is sokat!) a memóriából,
amely egy nagyon lassú művelet
Az FP a megfelelő pontosság beállításához kell
Textúrák segítségével lesz valósághű a kép
o éles a sokszögek közötti határ, de a textúrákkal ezt elmossuk
2D-s ábrázolás jellemzői
Textúrák: fények, árnyékhatások, éles határok elmosása
3D-s ábrázolás jellemzői
Térhatás (3. dimenzió használata)
Párhuzamosok végtelenben való találkozásának biztosítása
Közelebbi objektumok nagyobbak, távolabbiak kisebbek
Atmoszferikus hatás (távolabbi objektumok kékebbek, homályosabbak)
3D-s filmfeldolgozás jellemzői
Min. 15, manapság 20-30 FPS
Egy kép kb. 20-30 ezer sokszögből áll, vagyis kb. 500.000 sokszög / másodperc
SSE (Streaming SIMD Extensions) utasításkészlet
(első CPU, amelyik használta: Intel Pentium III)
kb. 70 db. új utasítás
128 bites szóhossz (pakoltan)
o 4 * 32 bit, egyszeres pontosság o 2 * 64 bit, kétszeres pontosság