
![]()
El objetivo de la búsqueda en el árbol de juego debe ser encontrar un buen primer movimiento, haciendo dicho movimiento en mente sin que el contrincante de la réplica y buscar de nuevo un buen primer movimiento desde esta nueva situación, para cada una de esta búsquedas se puede utilizar cualquiera de los procedimientos ya vistos como profundidad, amplitud o escalada, teniendo en cuenta que ahora las condiciones de finalización deben ser modificadas. Por otra parte es habitual no concluir por ejemplo: en el ajedrez si cualquiera de los nodos se encuentre en una posición en la cual no vislumbra una ventaja inmediata de algunos de los antagonistas.
Una vez concluido el árbol de búsqueda se debe extraer un estimado del mejor primer movimiento. Este estimado puede obtenerse aplicando una función de evaluación o estática a las hojas del árbol de búsqueda. La función de evaluación mide el valor de la posición del nodo terminal y se basa en ciertas características que racionalmente se presume que unfluye en dicho valor. Es habitual convenir que las situaciones favorables a A tengan un valor positivo de la función de evaluación. Mientras que las situaciones favorables a B, tengan un valor negativo. Una vez dicho lo anterior un buen primer movimiento puede obtenerse por el método de minimax. Se expande el árbol de búsqueda hasta llegar a los nodos que estén en una profundidad fijada como máxima (P+) en ese momento se evalúan todos los nodos hojas de ese árbol si se supone que A quien elige entre los nodos terminales se inclinará ante varias alternativas por el nodo mejor para él, Es decir aquel que tenga mejor evaluación. Por lo tanto el nodo antecedente de las hojas se le asignaría un valor igual al mayor valor de las evaluaciones de las hojas. Si fue B el que eligió entre los terminales y se supone que el contrario eligirá su mejor movimiento, este será el de menor evaluación por consiguiente al nodo antecedente de nodos terminales se le asignaría un valor igual al mínimo de las evaluaciones de las terminales.

Una vez que ha todos los predecesores de los nodos terminales se le ha asignado esos valores de retroceso se continúa hacia la raíz del árbol. Dando valores de retroceso a otro nivel poniendo que A eligirá el nodo con menor valor y así sucesivamente nivel a nivel hasta que llegue finalmente al nodo inicial. A eligirá como el mejor primer movimiento al correspondiente, al sucesor de mayor valor. El adversario de números positivos que hemos llamado A, se denomina maximizante o max, su contrincante el de números negativos minimizante o min.
El maximizante buscará caminos que nos lleve a números positivos altos sabiendo que sus adversarios intentarán forjar el juego, la situaciones con evaluaciones estáticas muy negativas.

Figura No. 1
En la figura 1 el maximizante intentaría alcanzar una posición con un valor estático del 8, pero el maximizador sabe que el minimizador no se lo permitirá, ya que el minimizador puede escoger un movimiento que desvíe su acción hacia la posición con un valor de 1, por lo general la posición del maximizador debe tener en cuenta la actitud del minimizador, en el nivel siguiente si se adelanta la búsqueda un paso mas, el minimizador actúa entonces con toda la seguridad de acuerdo don las opciones del maximizador en el nivel siguiente, esto continúa hasta que se alcanza el límite de la exploración y el evaluador estático provee una base directa para seleccionar entre las distintas alternativas. En el gráfico las evaluaciones estáticas en la parte inferior determinan que las opciones disponibles para el jugador minimizante conducen a valores efectivos en el nivel justo encima.

Figura No. 2
Conociendo estos valores efectivos el maximizador puede determinar la mejor acción en el siguiente nivel superior, claramente el maximizador se mueve hacia el nodo desde el cual el minimizador no puede hacer nada mejor que mantener el valor esperado de dos

Figura No. 3