7.Tétel:Az utasítások időben párhuzamos feldolgozásának alapvető lehetőségei Flashcards
Időbeli párhuzamos feldolgozás (futószalag architektúra)
Elméletileg 2 fokozat esetén 2x-es gyorsítás érhető el vele. (n fokozat esetén n-szeres), de!
lassít az adatfüggőség, vezérlésfüggőség, erőforrásfüggőség
Kellően nagyszámú utasítás esetén két fokozat mellett elvben megdupláztuk a feldolgozási sebességet.
Ezt a függőségek meggátolják a gyakorlatban.
kép9
Futószalag feldolgozás előfeltételei (2 fokozat
esetén)
• A számítógép (CPU) két egymástól független hardver egységgel rendelkezzen Mindkét fokozat
pontosan ugyanannyi időt igényel.
• Az egyik fokozat kimenete a másik fokozat bemenete.
• A fokozatok szinkronizáltak, órajelre működnek.
• Mindkét fokozat órajelre fogadja az inputot és egyetlen óraciklus alatt elvégzi a kívánt műveletet.
• Órajelenként 2 utasítást tud értelmezni.
kép10
Futószalag fokozatok sorrendjének meghatározása
Újrafeldolgozás:
• Hátránya: a futószalag sebessége lecsökken.
• Általában szorzás, osztás esetén.
A fixpontos szorzás/osztásnál igen hosszú lenne, ha a
részeredményeket műveletenként kimentenénk a regiszterekbe.
Helyette a részeredményeket az E fokozat végéről visszavezetik az
E fokozat bemenetére.
• FX, FP futószalagok is használják.
kép11
A futószalagok alkalmazási területei
- Overlapping (előrehozás) ->1 óraciklus spórolás.
Az előző utasítás visszaírási fázisát és az
aktuális utasítás lehívási
fázisát párhuzamosítjuk. Elvben
maximum 1 óraciklus nyereség
utasításonként, de ezt a függőségek mérséklik
kép12 - Vektor CPU:
Csak a végrehajtó egységek működnek futószalag szerűen.
Végrehajtási fázisok átfedése.
kép12 - A teljes utasítás feldolgozási folyamat futószalag elvű megvalósítása:
Elvben óraciklusonként tudunk utasítást lehívni.
kép13
Futószalag logikai felépítése
Cél: funkcionális kialakítás. Minden utasítás kategóriában célszerű kialakítani egy futószalagot: FX
(egyszerű/összetett), FP, L/S, B (ugrási branch), MMX.
Aritmetikai: F D/SO E WB
Branch: F E
Elemi utasítások szintjén az ugrási futószalag:
kép15
Első szint: A futószalagok funkcionális kialakítása
Második szint: Egyes fokozatok által végrehajtandó elemi műveletek specifikálása
A futószalag megvalósítása
Fizikai megvalósítás (implementáció) 60-as
80-as évek: kép16
Elválasztó regiszter = rejtett regiszter = kosárka
Szuperskalárok:
kép17
Cél: Több dedikált futószalagos kialakítás, de vannak univerzális futószalagok is
Power PC 604
kép18 Párhuzamos utasítás kibocsátás: Egyes fokozatok hossza eltérő lehet kép19 8046 Pentium – 2 utasítás futószalag: - dedikált - univerzális