CvdB

    Sentado, Herbert Simon y de pié Allen Newell, en un tablero de ajedrez de 4x4

    AJEDREZ SIMPLIFICADO.

    C.H.von der Becke (1993)

    1. TOMA DE DECISIONES BAJO INCERTIDUMBRE.

    En el ajedrez simplificado buscamos sacar el máximo provecho de una dada situación en presencia de incertidumbre. El máximo provecho es volcar el juego a nuestro favor con la juqada que elijamos. La dada situación son las req1as del ajedrez y la posición de las cuales partimos. La incertiduabre se refiere a nuestra ignorancia acerca de cómo nos va a replicar el adversario, lo cual éste tampoco sabe porque no lo pensé todavía. Sería bajo certidumbre si el oponente juega lo mejor posible, porque en ese caso yo (con ayuda computacional) sabría lo que va a jugar. El problema del mejor movimiento de las negras, que aparece en el artículo de Waltz referido al ajedrez siaplificado, en tablero de 4x4 en lugar de 8x8, con la posicion inicial que se resume así:


    1000 x -1000 x
    x x x 3
    1 x x x
    x x x -5

    Notas: 
    * El tablero de 4x4 es el del ajedrez simplificado 
    * Las cifras de esta lista son los puntajes al hacer el inventario
             1000 significa rey negro (nuestro)
            -1000 significa rey blanco 
                3 significa caballo negro
                1 peón negro a punto de ser coronado
               -5 torre blanca
               10 dama negra
                x casillero vacío de tablero 4x4
               PUNTAJE                 -2,5 (posición perderdora)
               SENTIDO DE AVANCE Negras hacia abajo,
        

    Se puede analizar en forma tipificada mediante una matriz decisional donde las cinco acciones que pueden encarar las fichas negras (nosotros) aparecen como columnas al a a5, donde la letra a simboliza la palabra acción, las filas son por lo menos dos. La primera corresponde a la solución trivial en que las blancas (el opositor) juegan lo peor posible (nivel de juego pésimo) y la segunda a la solución singular en que las blancas juegan lo mejor posible (nivel de juego óptimo), jugadas medidas a través del sistema de puntaje (la función de evaluación) explicado en el artículo, después de la respuesta de las blancas a nuestra jugada. En casos prácticos las blancas pueden jugar con un nivel intermedio entre el peor y el mejor, lo cual se aplica a otras filas (a otros niveles de juego diferentes de los dos anteriores) que aquí no analizamos.


    MATRIZ DECISIONAL DESPUES DE LA RESPUESTA DE BLANCAS A NUESTRA JUGADA al...a5
    suce-
    sores
    a1- caballo negro al centro a2- caballo negro abajo a3- caballo negro arriba a4- rey negro abajo a5- peón coronado
    Hº blancas juegan pésimo
    1000 x x x
    x x -1000 x
    1 3 x x
    x x x -5
    1000 x -1000 -5
    x x x x
    1 x x x
    x x 3 x
    1000 3 x x
    x x -1000 x
    1 x x x
    x x x -5
    x x -1000 x
    1000 x x 3
    1 x x x
    x x -5 x
    1000 x -1000 x
    x x x -5
    x x x x
    10 x x x
    puntaje 1000-1000+1+3-5 -1,5+2,5=
    0
    1000-1000-5+1+3=
    -1
    1000+3-1000+1-5=
    -1
    -1000+1000+3+1-5 -1.5=
    -2,5
    1000-1000-5 +10=
    5
    H1 blancas juegan óptimo
    1000 x x x
    x x -1000 x
    1 3 x x
    x x x -5
    1000 x -1000 x
    x x x x
    1 x x x
    x x -5 x
    1000 3 -1000 x
    x x x x
    1 x x x
    -5 x x x
    x x -1000 x
    1000 x x -5
    1 x x x
    x x x x
    1000 x -1000 x
    x x x 3
    x x x x
    -5 x x x
    puntaje 1000-1000+1+3-5 -1,5+2,5=
    0
    1000-1000+1-5=
    -4
    1000-1000+3+1-5 -0,5 =
    -1,5
    1000-1000+1-5 -10=
    -14
    1000-1000+3-5-10-1,5=
    -13,5
    Hº -
    Máximo de puntaje
    no no no no
    elegir a5,opt
    H1 -
    Máximo de puntaje
    elegir a1,opt
    no no no no


  • Hº significa la hipótesis nula o trivial "las blancas juegan pésimo";
  • H1 es la hipótesis alternativa "las blancas juegan óptimo".

    El puntaje es el explicado en el artículo de Waltz y abarca el inventario con los signos y las amenazas, preguntándole una sola vez a cada pieza de ajedrez, si está amenazada. Si así fuera el puntaje de la amenaza, con su signo adecuado, será la mitad del valor de inventario de la pieza amenazada. La excepción es la amenaza al rey (jaque) que vale 10 puntos y no 500.

    La acción nuestra aóptima dependerá de si el opositor juega en forma óptima para él o en forma pésima (o casos intermedios).

    Usaremos las palabras bonificación y penalidad para caracterizar con la primera lo que nos conviene (cifras altas son favorables) y con la segunda lo que nó (cifras muy negativas resultan así favorables).

    Hay una sola manera de juqar lo mejor posible, H1, y hay una sola manera de jugar lo peor posible, Hº, aunque hay muchas maneras de jugar mal.

    La teoría de la toma de decisiones enseña que bajo incertidumbre sobre cómo juega el opositor, conviene imaginar que dicho opositor lo hace de la mejor manera posible en su interés, lo cual está asociado con una escuela determinada de resolución de problemas bajo incertidumbre: la así llamada estrategia minimax.

    En la matriz decisional se anotan penalidades para nosotros, con signo positivo, Si se anotan bonificaciones para nosotros, la estrategia se invierte y se denomina maximin. En la tabla previa para los puntajes se aplican bonificaciones con signo positivo para nosotros y negativos para el oponente: la tabla es maximin.

    Maximin se denomina buscar cuál acción está asociada con el máximo de los mínimos por columna (columnas son acciones o decisiones). En la primera columna debemos seleccionar el mínimo, que corresponde a la fila del oponente jugando bien (filas son estados de la natura). Esto mismo se repite en cada una de las restantes cuatro columnas, con el mismo significado. Tenemos entonces cinco valores, de los cuales buscamos no solamente el valor máximo, sino tambien queremos identificar en qué columna está.

    La acción asociada con esa columna, acción que figura en el titulo que la encabeza, será la acción óptima, función de haber seleccionado maximín como estrategia a seguir.

    La solución Maximín es la del pesimista perfecto, pues imagina que el oponente jugará siempre bien, lo cual va en contra de los intereses de quien está tomando la decisión, pero simula una situación que bien puede ser real.

    Repetimos que esto es para bonificaciones desde nuestro punto de vista (las negras). En los textos habitualmente no se anotan las bonificaciones sino las penalidades. Cuando se hace esto último, corresponde decir que el pesimismo se asocia con la estrategia minimax.

    3. CRITERIO PARA MEDIR UN DADO ESTADO EN EL TABLERO DE AJEDREZ.

    Waltz nos explica que hay tres criterios que, combinados, ayudan a saber quien va ganando.

    1. Un inventario o suma algebraica de las fichas del tablero y de la suma algebraica de las amenazas que están sufriendo cada una de las fichas, en respuesta a la pregunta individual: ¿estás amenazado? La suma algebraica de sumandos con signo positivo se usa para lo que nos ayuda y negativo para lo que nos frena,

    2. Una evaluación de quién tiene el dominio del centro del tablero.

    3. Una consideración de la factibilidad que un peón pueda llegar a coronarse.

    Como hace Waltz, solamente nos fijamos en 1. Sin embargo privileqiasos con el orden de prioridad uno aquella jugada nuestra (nos toca jugar a nosotros, las negras) que mejore nuestro dominio del centro del tablero, criterio 2. Esto resultará muy importante para resolver con rapidez la mejor jugada.

    4. COMENTARIOS SOBRE LA DECISION OPTIMA CON LOS ESTADOS RESULTANTES CUANDO LAS BLANCAS HAN REPLICADO NUESTRA JUGADA, LA INDICADA CON al, a2, a3, a4 o a5.

    Como se ha visto, el puntaje corresponde a bonificaciones para las negras.

    Seleccionamos los mínimos de cada columna, lo cual está asociado con nuestra actitud pesimista con respecto a cómo ha de jugar el oponente, que buscará que nuestras bonificaciones sean mínimas. la tarea se explica en la antúltima fila o estado de la natura de la matriz decisional.

    Como resultado de esa tarea, tenemos cinco valores máximos, que volvemos a anotar en la última fila de la matriz. Con ellos debemos elegir nuestra nuestra jugada más racional, habida cuenta de nuestro pesimismo. Si fuesemos optimistas, la racionalidad nos lleva a a4 o a5. Nos damos cuenta que, contrastando entre sí las distintas escuelas, una la pesimista o Maximín para bonificaciones y otra la optimista o Maximax para bonificaciones, llevan a soluciones distintas. Esta falta de coherencia preocupa a muchos teóricos, que piden entonces que uno se esfuerce por cuantificar sus incertidumbres. Se dice que siempre sabemos algo, tenemos alguna pista, de cómo es la aparente incertidumbre que enfrentamos. Si cuantificamos aunque sea borrosamente esa incertidumbre, el problema pasa a ser de toma de decisiones bajo riesgo, soluble matematicamente, lo cual conforma a los teóricos. Se ha sugerido que el optimista es quien conoce más de la situación que lo que normalmente saben los demás, por lo cual cuando piensa que la suerte va a estar de su lado, lo hace basado en antecedentes que no pone sobre la mesa.

    Desde cierto punto de vista, nuestro conocimiento durante la partida de ajedrez es conocímiento borroso, "fuzzy knowledge'. No vemos claro qué hacer, sino a medias. No sabemos exactamente cómo jugarán las blancas despues de la jugada nuestra que estamos ponderando.

    La defensa habitual del pesimismo es bastante intuitíva, Si suponemos que el opositor juega bien, estamos preparando nuestra jugada de tal forma, que si juega bien ya lo habíamos previsto de antemano y si juega mal, alguna ventaja adicional vamos a poder sacarle a su falta de pericia.

    En cualquier caso, una mayor seguridad en el análisis deriva de tener más información valiosa, que en este caso es fácil de interpretar. Habrá que avanzar a un nivel más abajo, o sea calcular la contrarréplica nuestra a cada réplica opositora. Esto se vuelve en un árbol tan ramificado que en general no alcanza el tiempo si se sigue con la misma actitud, bajando más y más de nivel. Una partida de ajedrez tiene en promedio 52 niveles, como anota Waltz. Debemos conformarnos con un descenso de nivel lo suficientecente bueno para los fines prácticos (principio de racionalidad restringida de Herbert Simon).

    Nótese que aunque nosotros (las negras) no hemos ganado aún, hemos salido de una posición perdedora con puntaje -2,55, para remontar a una posición cuyo puntaje es 0, segun el método aquí explicado.

    Obsérvese que el programa consiste en un cierto manejo de listas y que la asignación de puntajes es de la forma de un polinomio lineal.

    A la asignación de puntajes ('para sacar el máximo provecho') la llamamos función de evaluación del criterio o de la función objetivo,

    S. El JUEGO DEL AJEDREZ COMO VECTORES Y MATRICES.

    Como en otros ejemplos, una secuencia de jugadas se puede descomponer en un estado inicial registrado en un vector fila, que premultiplica a un operador que es una matriz cuadrada, dando como resultado de nuevo un vector fila que simboliza al sucesor del estado inicial. Interesa pensar si no se puede hacer algo análogo con el ajedrez. Efectivamente, con un vector fila de 16 elementos se puede simbolizar el estado inicial, o sea, para el caso analizado,

    1000 x -1000 x x x x 3 1 x x x x x x -5
    que multiplicado por el operador caballo al centro origina
    1000 x -1000 x x x x x 1 3 x x x x x -5

    que seguido del operador rey blanco abajo, genera el vector resultado óptimo para las negras y las blancas (maximin)

    1000 x x x x x -1000 x 1 3 x x x x x -5
    La matriz cuadrada de 16 x 16 que simboliza caballo negro al centro y la del otro tipo que representa rey blanco abajo, se pueden despejar a partir de la observación que como al no haber ni disminución ni aumento del número de piezas, ambas deben ser estocásticas. La diagonal principal de las matrices cuadradas debe tener alta abundancia de 1.

    Combinando entre sí las dos matrices cuadradas individuales se obtiene otra tercera matriz cuadrada que permite saltar de la posición inicial a la posición final maximin. El significado de esa tercera matriz lineal, es el de mostrar esquematicamente el desarrollo de dos jugadas consecutivas como una sola operación conjunta, por aplicación del principio de superposición de matrices lineales. Se la compara con un macro.

    9. DOS COMPUTADORAS COMPITIENDO PARA AFINAR El CALCULO DE PUNTAJE.

    La aparente arbitrariedad de evaluar con 10 a un rey jaqueado o con un 3 a la presencia de un caballo, puede refinarse con un método bastante intuitivo, Basta poner a competir miles de veces a dos computadoras, programadas de manera que los parámetros o cifras de cada una de las máquinas difieran de las de la otra. La que gane más veces estará más cerca de la verdad. Así, los parámetros se ponen experimentalmente a prueba, quizás a través de un programa maestro de diseño de experimentos del cual son esclavas esas dos computadoras. Por supuesto, esta tarea no necesita de dos computadoras, ya que una sola, ingeniosamente programada, puede satisfacer muy bien la misma función.

    • ajedrez simplificado, introducción

    • búsqueda

    • búsqueda primero en profundidad

    • búsqueda minimax

    • teoría de juegos y comportamiento económico

    • podas alfa y beta

    • estructura de árbol

    • función de evaluación