Agenti Intelligenti Flashcards
Qual è la relazione tra un agente e un ambiente
Un agente è qualsiasi cosa possa essere vista come un sistema che percepisce il suo ambiente attraverso dei sensori e agisce su di esso mediante attuatori.
Cosa sono le percezioni e la sequenza percettiva
Percezione (percept): dati che i sensori di un agente percepiscono
Sequenza percettiva (percept sequence): la storia completa di tutto ciò che esso ha percepito nella sua esistenza.
Da cosa è descritto il comportamento di un agente
La scelta dell’azione di un agente in un qualsiasi istante può dipendere dalla conoscenza integrata in esso e dall’intera sequenza percettiva osservata fino a quel momento.
La funzione agente (o programma agente) descrive la corrispondenza tra una qualsiasi sequenza percettiva e una specifica azione
Cosa definisce la razionalità di un’azione
-la misurazione di prestazione che definisce il criterio di successo
-la conoscenza pregressa dell’ambiente da parte dell’agente
-le azioni che l’agente può effettuare
-la sequenza percettiva dell’agente fino a quell’isante
Definizione formale di agente razionale
Per ogni possibile sequenza di percezioni, un agente razionale dovrebbe scegliere un’azione che massimizzi il valore atteso della sua misura di prestazione, date le informazioni fornite dalla sequenza percettiva e da ogni ulteriore conoscenza dell’agente.
La definizione richiede che un agente razionale non si limiti a raccogliere informazioni, ma sia anche in grado di apprendere il più possibile sulla base delle proprie percezioni.
Quali sono le proprietà degli ambienti operativi
Completamente osservabile/parzialmente osservabile: se i sensori di un agente gli danno accesso allo stato completo dell’ambiente (o parziale a causa di sensori inaccurati o per la presenza di rumore). Se l’agente non dispone di sensori, l’ambiente è inosservabile
Agente singolo/multiagente: Dipende dalle entità coinvolte e come cooperano (ambiente competitivo e cooperativo)
Deterministico/non deterministico: se lo stato successivo dell’ambiente è completamente determinato dallo stato corrente e dall’azione eseguita dall’agente
Episodico/Sequenziale: in un ambiente operativo episodico, l’esperienza dell’agente è divisa in episodi atomici. In ogni episodio l’agente riceve una percezione e poi esegue una singola azione. L’aspetto fondamentale è che un episodio non dipende dalle azioni intraprese in quelli precedenti.
Statico/dinamico: se l’ambiente può cambiare mentre un agente sta decidendo come agire
Discreto/continuo: la distinzione tra discreto e continuo si applica allo stato dell’ambiente, al modo in cui è gestito il tempo, alle percezioni e azioni dell’agente
Noto/ignoto: in termini rigorosi, questa distinzione non si riferisce all’ambiente in sé, ma allo stato di conoscenza dell’agente (o del progettista) circa le “leggi fisiche” dell’ambiente stesso. In un ambiente noto, sono conosciuti i risultati (o le corrispondenti probabilità, se l’ambiente è stocastico) per tutte le azioni. Ovviamente, se l’ambiente è ignoto, l’agente dovrà apprendere come funziona per poter prendere buone decisioni
Come sono strutturati gli agenti
Agente = architettura + programma agente
Architettura: dispositivo computazionale dotato di sensori e attuatori fisici
Programma Agente: Implementa funzione agente
I programmi agente prendono come input la percezione corrente dei sensori e restituiscono un’azione agli attuatori
Agenti reattivi semplici e reattivi basati sul modello
Agenti reattivi semplici: scelgono le azioni sulla base della percezione corrente, ignorando la storia percettiva precedente, quindi non memorizzano lo stato e operano in ambienti completamente osservabili
Agenti reattivi basati sul modello: in questo caso l’azione viene presa in base a come evolve l’ambiente (transazione del mondo) e da come le mie azioni precedenti influenzano il mondo stesso (modello sensoriale)
In entrambi i casi vanno rispettate le regole esterne dettate dall’ambiente in cui si opera
Agenti basati su obiettivi e basati sull’utilità
Agenti basati su obiettivi: non si basa più sulle regole/leggi dell’ambiente ma le sue azioni sono dettate dal raggiungimento di un obiettivo
Agenti basati sull’utilità: viene aggiunta un informazione di utilità riguardo l’obiettivo raggiunto per rappresentare un grado di performance, quindi se il risultato raggiunto è quello sperato
Agenti capaci di apprendere
Agenti capaci di apprendere dall’ambiente in cui operano. Elementi che operano al suo interno:
-L’elemento di apprendimento è responsabile del miglioramento interno
-L’elemento esecutivo si occupa della selezione delle azioni esterne
-Elemento critico è il feedback sul comportamento
-Il generatore di problemi suggerisce azoni che portano a nuove esperienze