Matek V. tétel Flashcards

1
Q

Mátrix fogalma

A

Egy kétdimenziós adattábla, ahol az elemeket sorok és oszlopok határozzák meg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Mátrix összeadás

A

A mátrixok összeadására azonos méretű mátrixokat használnak, és az összeadás minden egyes elemre vonatkozik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Mátrix szorzás

A

Két mátrix szorzása csak akkor érvényes, ha az első mátrix oszlopainak száma megegyezik a második mátrix sorainak számával.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Determináns

A

Egy mátrix numerikus értéke, amely kiszámítható a mátrix elemei alapján, és a mátrix invertálhatóságát is jelzi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Rang

A

A mátrix rangja azoknak a nemnulla sorainak száma, amelyeket nem lehet más sorok lineáris kombinációjaként kifejezni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Egységmátrix

A

Négyzet alakú mátrix, amelynek főátlóján minden elem 1, a többi helyen pedig 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nullmátrix

A

Minden eleme 0.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Inverz mátrix

A

Csak négyzet alakú mátrixoknál értelmezett. Az A mátrix inverze (A^(-1)) olyan mátrix, amelyre A * A^(-1) = A^(-1) * A = Egységmátrix

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Mátrix, mint lineáris transzformáció:

A

A mátrixokat gyakran használják lineáris transzformációk reprezentációjára, különféle alkalmazásokban, beleértve a geometriai transzformációkat és a lineáris egyenletek rendszereinek megoldását.

Lineáris transzformáció:
Egy lineáris transzformáció olyan matematikai művelet, amely az egyik vektortér elemeit egy másik vektortér elemeibe képezi le, miközben megőrzi a vektorok skaláris összeadását és szorzatát.
Egy függvény lineáris transzformáció, ha f(x + y) = f(x) + f(y) és f(c * x) = c * f(x), ahol x és y vektorok, c pedig egy konstans.

Mátrix, mint lineáris transzformáció:
Adott egy m x n méretű mátrix (A) és egy n dimenziós vektor (X), a mátrix-vektor szorzás eredménye egy m dimenziós vektor (Y).
Y=AX

Mátrix szorzás példa:
Legyen A a következő 2x3-as mátrix:
[1 2 3
4 5 6 ]
Legyen X a következő 3 dimenziós vektor:
[x
y
z
]
Akkor a mátrix-vektor szorzás eredménye Y lesz:
[1x+2y+3z
4x+5y+6z]

Lineáris transzformáció tulajdonságai:
Az A mátrix szorzása a vektorral egy lineáris transzformációt eredményez.
A mátrix oszlopai a transzformáció során a bázisvektorok új helyzeteit határozzák meg.

Annyi dimenziós, ahány sor van:
Az A mátrix dimenziója azonos a transzformált vektor dimenziójával.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Sajátérték és sajátvektor

A

Ha egy vektortérben van egy vektor, amely csak egy skálával változik, amikor egy adott mátrixszal szorozzák meg, akkor az a vektor a mátrix sajátvektora, és a skálafaktor a sajátérték.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Intelligens ágens

A

Olyan entitás, amely képes érzékelni környezetét, döntéseket hozni, és cselekedni annak érdekében, hogy valamilyen célt elérjen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mi a specialitása az egyszerű reflex ágensek?

A

Legegyszerűbb ha-akkor, if-then, szabályai vannak. Van egy feltétel és egy hozzá tartozó cselekvés. Ha teljesül a feltétel, a cselekvést végre kell hajtani.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Mi a specialitása a modellalapú reflexszerű ágensek?

A

Ha-akkor, if-then szabályok alapján ha teljesül akkor cselekszik, viszont képes az állapot tárolására. Felépíti a memóriájában a környezete modelljét. Ha az általa felállított modell és az aktuális észlelés adja meg a környezete állapotát, ez alapján cselekszik.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Mi a specialitása a célorientált ágensnek?

A

Nem elegendő kizárólag a környezet aktuális állapotának ismerete. Ha van egyértelmű cél, akkor meg lehet vizsgálni, hogy az egyes lehetséges cselekvéseknek mi is lesz az eredménye és ezek közül melyik segít a cél elérésében. A cselekedetek kiválasztását segítő szabályokat magának kell kialakítania. Ha változik a környezet nem kell újraprogramozni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Mi a specialitása a hasznosságorientált ágensnek?

A

Vannak a szabályok között ellentmondások, vagy a célt több úton is el lehet érni. A különböző utakhoz különböznek a teljesítményértékek is tartoznak. Minden állapothoz egy jósági értéket rendelünk, a következő cselekvések kiválasztása esetén nézzük, hogy milyen boldogsági szintet tudunk elérni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Mi a specialitása a tanuló ágensnek?

A

Minden típusú ágens kiegészíthető tanuló ágenssé. Kívülről figyeljük az ágens viselkedését. Kívülről érkező inputot összeveti a teljesítményszabvánnyal és tanuló elemnek továbbítja. A tanuló elem, probléma generátor és végrehajtó elem között van egy ciklus, mellyel lehet a szabályok, célok, hasznosságfüggvények módosítására. Ha a tanuló elem úgy látja, hogy jobb irányba sikerült elmozdulni, akkor ezeket rögzíti és továbbiakban ez kerül alkalmazásra.

17
Q

Környezetét leíró tulajdonságok

A

Teljesen megismerhetőség: ha a szenzor lehetővé teszi a teljes környezet megismerését minden időpillanatban pl. passziánsz-igen, robot taxi-nem

Determinisztikus: ha az állapot meghatározza a következő állapotot
pl. passziánsz-igen, robot taxi-nem

Epizódszerű: következő epizód független az előzőtől
pl. passziánsz-nem, robot taxi-nem

Statikus/dinamikus: amíg az ágens gondolkodik a környezet változhat akkor dinamikus, ha környezet nem de az ágens teljesítménye akkor szemidinamukus
pl. passziánsz-statikus, robot taxi-dinamikus

Diszkrét/folytonos: diszkrét ha le lehet írni a környezetet csak egészekkel, ha valós is kell akkor folytonos
pl. passziánsz-diszkrét, robot taxi-folytonos

Egy/többágenses: hány ágens van a környezetben
pl. passziánsz-egyágenses, robot taxi-többágenses

18
Q

Markov döntési folyamatok

A

A Markov döntési folyamatok (MDP) egy olyan matematikai keretet alkotnak, amelyet a megerősítéses tanulásban alkalmaznak. Ezek a folyamatok olyan rendszereket modelleznek, ahol egy döntéshozó (ágens) olyan környezettel interaktív, amelyben bizonytalan, és a környezet válasza a döntéseire befolyásolja a jövőbeni helyzeteket.

Fő jellemzők:

Állapotok (States):
Az időben változó rendszer pillanatnyi állapotai. Állapotok halmazát jelöljük S-vel.

Cselekvések (Actions):
Az ágens által elvégezhető műveletek vagy döntések. Cselekvések halmazát jelöljük A-vel.

Jutalom (Rewards):
A cselekvésekért kapott pozitív vagy negatív visszajelzések.
A jutalom egy adott időpillanatban történő bekövetkezése függhet az állapottól és a választott cselekvéstől.

Átmeneti valószínűség (Transition Probabilities):
Az állapotok közötti átmenetek valószínűségekkel vannak súlyozva.
Ezek a valószínűségek azt mutatják, hogy milyen valószínűséggel lépünk egyik állapotból a másikba egy adott cselekvés hatására.

Diszkontáció (Discount Factor):
Egy 0 és 1 közötti szám, ami azt mutatja, mennyire különbséget teszünk a közeljövő és a távoli jövő jutalmai között.
Azért használják, hogy hangsúlyozzuk a közeljövő döntések jelentőségét.

MDP Leírása:
Egy MDP-t öt elem határoz meg:
(S,A,P,R,γ)
S: Állapotok halmaza.
A: Cselekvések halmaza.
P: Az állapotátmenetek valószínűségei.
R: Az azonnali jutalmak függvénye.
γ: Diszkontáció faktora.

Cél:
A MDP célja egy olyan politika megtalálása, amely maximalizálja a várható összértéket. A politika egy olyan stratégia, amely meghatározza, hogy az ágens milyen cselekvéseket választ az egyes állapotokban.

Algoritmusok:
A MDP-kre számos algoritmus létezik, amelyek segítenek az optimális politika megtalálásában. Ezek közé tartozik a Policy Iteration, Value Iteration, Q-learning és más algoritmusok.

19
Q

Adaptív dinamikus programozás alapú ágens

A

Az ágens megpróbálja optimalizálni a megerősítéses tanulás problémáját adaptív dinamikus programozás segítségével.

20
Q

Időbeli különbség (TD) alapú hasznosságot tanuló ágens

A

Az ágens az időbeli különbség (a jelenlegi becslés és a következő lépésen kapott jutalom vagy észlelés különbsége) alapján frissíti hasznossági értékeit.

21
Q

Aktív megerősítéses tanuló ágens

A

Az ágens próbálja felfedezni az ismeretlen részeket a környezetében.

22
Q

Felfedezés és kihasználás módszere

A

Az ágensnek egyensúlyt kell találnia a környezet felfedezése és a már ismert, jutalmazott cselekvések kihasználása között.

23
Q

Q-tanuló ágens

A

Az ágens egy Q-táblát tanul, amely tárolja az összes lehetséges állapot-cselekvés páros érték