La IA por dentro: conceptos básicos para no expertos

Por Javier Surasky

Dos personas conversan con claras marcas de hablar sobre IA

Para comprender los desafíos que presenta la IA, y algunas de sus oportunidades, solemos pensar en términos del usuario o de la sociedad afectada por su impacto. Esto es correcto, pero deja fuera a un actor clave: la propia IA.

Entender, al menos en conceptos básicos, qué hace una IA es una ventana de oportunidad para profundizar la comprensión de ventajas y peligros, y también para identificar posibles “puntos de entrada” en los que cada persona y cada profesión puede realizar un aporte.

Vamos, entonces, a hacer una primera “disección” de cómo opera una IA, cualquiera sea, para encontrar sus elementos principales.

El primer paso es entender que cualquier IA interactúa con la realidad no virtual en un intercambio recíproco que, en principio, va modificando a ambas: la “realidad real” (llamémosla RR) provee de tecnología y datos a la “realidad virtual” (RV) de la IA, que a su vez devuelve información (o realiza acciones) que tienen la capacidad de transformar la RR.

Esto nos da un primer paso, un tanto obvio pero que vale la pena mencionar: la IA se apoya y actúa en un ecosistema mayor que es la RR, y lo hace convirtiéndose en lo que llamamos un “agente” para reflejar que posee capacidad de acción. Tanto ChatGPT como un automóvil que se conduce solo son agentes. De hecho, Google define “agente” como “sistemas de software que usan la IA para alcanzar objetivos y completar tareas en nombre de los usuarios. Muestran razonamiento, planificación y memoria, y tienen un nivel de autonomía para tomar decisiones, aprender y adaptarse”. Esta definición es crucial ya que nos brinda varios de los elementos que veremos a continuación.

Antes, debemos incluir un asunto que la definición no incluye: la percepción, término que apunta a la capacidad del agente de recibir contexto para indicar que el agente puede recibir entradas (inputs) en cualquier momento, a partir de las cuales va conformando su propio historial de experiencia basado en el cual tomará sus decisiones. Tal como ocurre con una persona, las percepciones inmediatas cruzadas con su historial de experiencia darán una dirección a la acción del sistema de IA.

El puente entre lo que el agente percibe y lo que hace es lo que configura su función, es decir, aquello que ha sido capacitado para hacer (jugar al ajedrez, manejar un automóvil, traducir textos, etc.). La función, claro está, toma su forma del programa que crea al agente.

Es esperable que cualquier IA oriente sus acciones a acercarse a lo que considere bueno y se aleje tanto como pueda de lo que considere malo. Pero ¿Qué es bueno y qué es malo? Para una IA, lo bueno es lo que la acerca a los fines que se le han dado, lo malo es aquello que la aleja de estos. Si a una IA se le da la misión de estafar personas, para ello la bueno será estafar tantas personas como pueda, y lo malo no lograr hacerlo. Ya hablamos en un post anterior sobre la IA como un medio y no como un fin en sí misma. La intención de la IA siempre viene dada por humanos que la crean o la utilizan. Lograr sus fines es la medida del éxito de cualquier IA, y por ello requiere que los fines puedan ser mensurables como precondición. Para medir el éxito, lo más normal es diseñar medidas que partan de lo que se quiere lograr en la RR, y no sobre cómo debe comportarse el agente.

Uniendo lo que acabamos de ver, toda IA debe ser entendida como un agente racional con una racionalidad orientada al logro de los fines para los que se la crea, partiendo de sus percepciones y su historial de percepciones y buscando maximizar su medida de éxito.

Dada la importancia de sus percepciones para obtener resultados exitosos, la IA puede llevar a cabo acciones dirigidas a “afinar” sus percepciones futuras. Para ello recopila y busca información. En consecuencia, la utilidad de la información con que cuente dependerá de la racionalidad con que se haya dotado al agente. Aquí se encuentra uno de los elementos más importantes en el desarrollo de la IA: la capacidad del agente de aprender a partir de las nuevas percepciones, combinadas con su historial, transformando datos (crudos) en información útil para tomar sus decisiones racionalmente. Esta capacidad de aprender es lo que da a la IA el carácter de autónoma: no depende exclusivamente de la información que le dio el programador, y en parte ayuda a entender la existencia de “cajas negras” que no nos permiten saber cómo una IA llega a tomar una decisión.

Como resultado, cualquier agente racional de IA incluye cuatro componentes fundamentales:

  • El elemento de aprendizaje: para mejorarse a sí mismo.
  • El elemento de actuación: para establecer las acciones a realizar por la IA.
  • El elemento de crítica: para revisar la actuación del agente y establecer modificaciones, de ser necesarias, en el elemento de actuación a fin de mejorar la medida de éxito.
  • El generador de problemas: sugiere acciones que puedan llevar a la IA a explorar experiencias innovadoras, evitando que se cierre sobre las que ya ha alcanzado. Es quien convoca a la IA a no darse por satisfecha con la experiencia con que cuenta y seguir siempre explorando nuevos caminos.

Y es aquí donde juega un papel central la idea de “algoritmo”. Los algoritmos son simplemente ordenadores de procesos, secuenciales o iterativos. Una receta de cocina es un algoritmo que indica paso a paso al agente (el cocinero, en este caso) el proceso a seguir para alcanzar el resultado que es su medida de éxito (lo felices que estén los comensales por la comida preparada: recuerden que el éxito es mejor medirlo por los cambios en el entorno que por las actividades realizadas). Todos hemos lidiado con algoritmos a lo largo de nuestra vida ¿Estudió usted en la primaria el cálculo del máximo común divisor? Pues ese es uno de los primeros algoritmos “codificados” de la historia.

El algoritmo es la base (¿el alma?) de la IA, el gestor de los procesos que unen sus percepciones, historial, fines, medida de éxito y racionalidad con el logro del mejor resultado racional que pueda obtener. Esto es, el resultado puede no ser perfecto ni el mejor alcanzable, pero es el mejor que la IA puede presentar a partir de los elementos descriptos. La búsqueda y la planificación son subáreas de la IA focalizados en hallar secuencias de acciones que permitan a los agentes alcanzar sus objetivos asignados.

Pero los agentes no solo están integrados por datos y programación, sino que tienen un sustento físico (chips, cables, placas) al que llamamos arquitectura de la IA. Así, el trabajo de desarrollo de la IA puede describirse como el camino hacia programas que, teniendo en cuenta las actuales limitaciones de arquitectura, tengan un comportamiento racional minimizando el código y ampliando la capacidad de percibir, crear historiales y, a partir de ello, maximizar su éxito en base a su racionalidad.

Por supuesto estamos dejando fuera de nuestra consideración elementos, como los tipos de ambientes en que trabaja una IA, su capacidad de percibirlos en forma completa o semicompleta, la continuidad o cambio de sus condiciones, entre muchos otros. Tampoco entramos a analizar cómo estos elementos cambian, o pueden cambiar, cuando hablamos de IA débil, fuerte, generativa o agentiva, pero ahora conocemos un poco mejor “qué hace” una IA, y eso no es poco.