
![]()
Accesibles y no accesibles
Si los sensores de un agente le permiten tener accesos al estado total del ambiente se dice que este es accesible a tal agente. Un agente es realmente accesible si los sensores detectan todos los aspectos relevantes a la elección de una acción.
Deterministas y no deterministas
Si el estado siguiente de un ambiente se determina completamente mediante el estado actual, así mismo como las acciones escogidas por el agente, nos encontramos ante un ambiente determinista.
Episódicos y no episódicos
En este ambiente la experiencia del agente se divide en "episodios". Cada episodio consta de un agente que percibe y actúa. La calidad de su actuación dependerá del episodio mismo dado que los episodios subsecuentes no dependerán de las acciones producidas en episodios anteriores.
Estáticos y dinámicos
Si existe la posibilidad de que el ambiente sufra modificaciones mientras que el agente se encuentra deliberando, se dice que tal ambiente se comporta en forma dinámica en relación con el agente.
Discretos y continuos
Si existe una cantidad limitada de percepciones y acciones distintas y claramente discernibles, se dice que el ambiente es discreto caso contrario es continuo.

PROGRAMAS DE AMBIENTES
procedimiento PROBAR-AMBIENTE(estado, FUNCION-ACTUALIZACION, agentes,
terminación)
entradas: estado, el estado Inicial del Ambiente
FUNCION-ACTUALIZAR, función para realizar el ambiente
agentes, un conjunto de agentes
terminación, un predicado para probar cuando se concluya.
repetir
por cada agente dentro los agentes responden
PERCEPCIÓN [agente] ¬ OBTENER–PERCEPCION (agente, estado)
terminar
por cada agente dentro de los agentes responden
ACCION [agente]¬ PROGRAMA[agente] (PERCEPCIÓN [agente])
terminar
estado¬ FUNCION-ACTUALIZAR (acciones, agentes, estado)
hasta terminación (estado)
PROBAR-AMBIENTE es un programa básico del simulador de ambiente. Da a cada agente su percepción, obtiene una acción de cada uno de los agentes y procede a actualizar el ambiente.
function RUN-EVAL-ENVIRONMENT (state, UPDATE-EN, agents, termination,
PERFORMANCE-EN) returns scores
función EJECUCIÓN-EVALUACION (estado, FUNCION–ACTUALIZAR agentes, terminación,
FUNCION-DESEMPEÑO) responde con calificaciones
variables locales: calificaciones, un vector del mismo tamaño que los agentes, todos 0
repetir
por cada agente dentro de los agentes responden
PERCEPCION [agente]¬ HA-OBTENER-PERCEPCION (agente, estado)
fin
por cada agente dentro de los agentes responden
ACCION [agente]¬ PROGRAMA[agente] (PERCEPCIÓN[agente]))
fin
estado ¬ FUNCION-ACTUALIZAR (acciones, agentes, estado)
calificaciones ¬ FUNCION-DESEMPEÑO (calificaciones, agentes, estado)
hasta terminación (estado)
responde con calificaciones
Este procedimiento evalúa la acción. El programa de un simulador de ambiente que se mantiene al tanto de las medidas de desempeño obtenidas por cada uno de los agentes.