Ricerca con Avversari Flashcards

1
Q

Giochi a Somma zero a due giocatori

A

Sono giochi deterministici, a due giocatori, a turni, con:
* Informazione perfetta: completamente osservabile
* Somma zero: ciò che va a vantaggio di un giocatore, danneggia l’altro

Stato Iniziale ci fornisce la configurazione del gioco
AZIONI: mosse legali nello stato s
RISULTATO: modello di transizione dopo un azione
Stato Terminale: se fa concludere la partita
Utilità: valore che determina l’utilità dello stato terminale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Come fare scelte ottimali in un gioco

A

Lo stato iniziale, la funzione AZIONI e la funzione RISULTATO definiscono il grafo dello spazio degli stati, un grafo in cui i vertici sono stati, gli archi sono mosse e uno stato può essere raggiunto da più cammini
Su parte di tale grafo possiamo sovrapporre un albero di ricerca per determinare quale mossa effettuare.
(albero di gioco)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Algoritmo di ricerca minmax

A

Algoritmo di ricerca che trova la mossa migliore per MAX provando tutte le azioni e scegliendo quella per cui lo stato di arrivo ha il valore MINIMAX più alto

Caratteristiche:
*Completo, se lo spazio degli stati è finito
*Ottimo
*Per la complessità, si nota che è un algoritmo di ricerca in profondità

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Potatura alpha-beta

A

Con l’algoritmo minimax, il numero di stati del gioco cresce esponenzialmente!
Il processo di potatura alpha-beta ci permette di ridurre il numero di stati da esplorare.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Ricerca alpha-beta euristica

A

Per sfruttare al meglio il nostro tempo di calcolo, che è limitato, possiamo interrompere la ricerca in anticipo e applicare una funzione di valutazione euristica agli stati, considerando i nodi non terminali come se lo fossero (sostituiamo la funzione UTILITA’ con EVAL).

Inoltre sostituiamo il test di terminazione con un test di taglio (cutoff test) che deve restituire vero per gli stati terminali, ma per il resto è libero di decidere quando interrompere la ricerca in base alla profondità della stessa e a qualsiasi proprietà dello stato che sceglie di considerare.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Potatura in avanti

A

La potatura in avanti taglia quelle che appaiono cattive mosse, ma potrebbero invece essere buone. La strategia, quindi, fa risparmiare tempo di calcolo ma introduce il rischio di commettere un errore.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Giochi stocastici

A

I giochi stocastici ci portano un po’ più vicino all’imprevedibilità della vita reale includendo un elemento casuale, come il lancio di un dado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly