Si los sensores de un agente le permiten tener accesos al estado total del ambiente se dice que este es accesible a tal agente. Un agente es realmente accesible si los sensores detectan todos los aspectos relevantes a la elección de una acción.

Si el estado siguiente de un ambiente se determina completamente mediante el estado actual, así mismo como las acciones escogidas por el agente, nos encontramos ante un ambiente determinista.

En este ambiente la experiencia del agente se divide en "episodios". Cada episodio consta de un agente que percibe y actúa. La calidad de su actuación dependerá del episodio mismo dado que los episodios subsecuentes no dependerán de las acciones producidas en episodios anteriores.

Si existe la posibilidad de que el ambiente sufra modificaciones mientras que el agente se encuentra deliberando, se dice que tal ambiente se comporta en forma dinámica en relación con el agente.

Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se dice que el ambiente es discreto caso contrario es continuo.

 

PROGRAMAS DE AMBIENTES

procedimiento PROBAR-AMBIENTE(estado, FUNCION-ACTUALIZACION, agentes,

terminación)

entradas: estado, el estado Inicial del Ambiente

FUNCION-ACTUALIZAR, función para realizar el ambiente

agentes, un conjunto de agentes

terminación, un predicado para probar cuando se concluya.

repetir

por cada agente dentro los agentes responden

PERCEPCIÓN [agente] ¬ OBTENER–PERCEPCION (agente, estado)

terminar

por cada agente dentro de los agentes responden

ACCION [agente]¬ PROGRAMA[agente] (PERCEPCIÓN [agente])

terminar

estado¬ FUNCION-ACTUALIZAR (acciones, agentes, estado)

hasta terminación (estado)

PROBAR-AMBIENTE es un programa básico del simulador de ambiente. Da a cada agente su percepción, obtiene una acción de cada uno de los agentes y procede a actualizar el ambiente.

 

function RUN-EVAL-ENVIRONMENT (state, UPDATE-EN, agents, termination,

PERFORMANCE-EN) returns scores

función EJECUCIÓN-EVALUACION (estado, FUNCION–ACTUALIZAR agentes, terminación,

FUNCION-DESEMPEÑO) responde con calificaciones

variables locales: calificaciones, un vector del mismo tamaño que los agentes, todos 0

repetir

por cada agente dentro de los agentes responden

PERCEPCION [agente]¬ HA-OBTENER-PERCEPCION (agente, estado)

fin

por cada agente dentro de los agentes responden

ACCION [agente]¬ PROGRAMA[agente] (PERCEPCIÓN[agente]))

fin

estado ¬ FUNCION-ACTUALIZAR (acciones, agentes, estado)

calificaciones ¬ FUNCION-DESEMPEÑO (calificaciones, agentes, estado)

hasta terminación (estado)

responde con calificaciones

Este procedimiento evalúa la acción. El programa de un simulador de ambiente que se mantiene al tanto de las medidas de desempeño obtenidas por cada uno de los agentes.