ágensek, környezetek, racionalitás Flashcards
Sorolja fel a környezetet meghatározó tényezőket és ezek alapján definiálja a lehetséges környezeteket!
- Teljesen megismerhetőség: ha a szenzor lehetővé teszi a teljes környezet megismerését minden időpillanatban pl. passziánsz-igen, robot taxi-nem
- Determinisztikus: ha az állapot meghatározza a következő állapotot
pl. passziánsz-igen, robot taxi-nem - Epizódszerű: következő epizód független az előzőtől
pl. passziánsz-nem, robot taxi-nem - Statikus/dinamikus: amíg az ágens gondolkodik a környezet változhat akkor dinamikus, ha környezet nem de az ágens teljesítménye akkor szemidinamukus
pl. passziánsz-statikus, robot taxi-dinamikus - Diszkrét/folytonos: diszkrét ha le lehet írni a környezetet csak egészekkel, ha valós is kell akkor folytonos
pl. passziánsz-diszkrét, robot taxi-folytonos - Egy/többágenses: hány ágens van a környezetben
pl. passziánsz-egyágenses, robot taxi-többágenses
Mitől függ egy ágens racionalitása (adott pillanatban)?
Egy rögzített teljesítményérték, mely környezeti sorozatot értékeli. A racionális ágens azt a műveletet választja, mely maximalizálja a várható teljesítménymértéket adott érzékeléssorozathoz. Az ágens eddigi tudása a környezetről. A cselekvésektől amit az ágens végre tud hajtani. Az érzékelés sorozata adott pillanatig.
Felfedezés, tanulás, autonómia
Mi a racionális ágens (és mi nem)?
Az ideális racionális ágens minden egyes észlelési sorozathoz a benne található tények és a beépített tudása alapján minden elvárható dolgot megtesz a teljesítménymérték maximalizálásáért. Egy racionális ágens olyan, amely helyesen cselekszik – elméletileg megfogalmazva az ágensfüggvény táblázatában minden bejegyzés helyesen van kitöltve. Első közelítésben azt mondjuk, hogy a helyes cselekedet az, amely az ágenst a legsikeresebbé teszi.
Fontos : A racionális ágens azt a műveletet választja, mely maximalizálja a várható teljesítménymértéket adott érzékeléssorozathoz Annak megfigyelése, hogy egyes ágensek jobban viselkednek, mint mások, a racionális ágens ötletéhez vezet majd – olyan ágenshez, amelyik olyan jól viselkedik, amennyire csak lehet. Az, hogy mennyire viselkedhet jól egy ágens, a környezet természetén múlik; bizonyos környezetek sokkal nehezebbek, mint mások
Mi a különbség és a hasonlóság az ágensprogram és ágensfüggvény között?
Minden lehetséges körülmény esetén megadja az ágens cselekvéseit, az ágensprogram implementálja az ágensfüggvényt.
Az ágens működését matematikailag egy függvénnyel lehet modellezni, ezen megfigyelések sorozata megad egy cselekvést. Ez lesz az ágensfüggvény.
Ezt egy véges programban utánozzuk, megközelítjük. Ez az ágensprogram.
Különbség, hogy az ágensfüggvény adhat végtelen lépést, a program nem.
Mi a specialitása az egyszerű reflex ágensek?
Legegyszerűbb ha-akkor, if-then, szabályai vannak. Van egy feltétel és egy hozzá tartozó cselekvés. Ha teljesül a feltétel, a cselekvést végre kell hajtani.
Mi a specialitása a modellalapú reflexszerű ágensek?
Ha-akkor, if-then szabályok alapján ha teljesül akkor cselekszik, viszont képes az állapot tárolására. Felépíti a memóriájában a környezete modelljét. Ha az általa felállított modell és az aktuális észlelés adja meg a környezete állapotát, ez alapján cselekszik.
Mi a specialitása a célorientált ágensnek?
Nem elegendő kizárólag a környezet aktuális állapotának ismerete. Ha van egyértelmű cél, akkor meg lehet vizsgálni, hogy az egyes lehetséges cselekvéseknek mi is lesz az eredménye és ezek közül melyik segít a cél elérésében. A cselekedetek kiválasztását segítő szabályokat magának kell kialakítania. Ha változik a környezet nem kell újraprogramozni.
Mi a specialitása a hasznosságorientált ágensnek?
Vannak a szabályok között ellentmondások, vagy a célt több úton is el lehet érni. A különböző utakhoz különböznek a teljesítményértékek is tartoznak. Minden állapothoz egy jósági értéket rendelünk, a következő cselekvések kiválasztása esetén nézzük, hogy milyen boldogsági szintet tudunk elérni.
Mi a specialitása a tanuló ágensnek?
Minden típusú ágens kiegészíthető tanuló ágenssé. Kívülről figyeljük az ágens viselkedését. Kívülről érkező inputot összeveti a teljesítményszabvánnyal és tanuló elemnek továbbítja. A tanuló elem, probléma generátor és végrehajtó elem között van egy ciklus, mellyel lehet a szabályok, célok, hasznosságfüggvények módosítására. Ha a tanuló elem úgy látja, hogy jobb irányba sikerült elmozdulni, akkor ezeket rögzíti és továbbiakban ez kerül alkalmazásra.