Por Javier Surasky
Para comprender los desafíos que presenta la IA, y algunas de sus oportunidades, solemos pensar en términos del usuario o de la sociedad afectada por su impacto. Esto es correcto, pero deja fuera a un actor clave: la propia IA.
Entender, al menos en conceptos básicos, qué hace una IA es
una ventana de oportunidad para profundizar la comprensión de ventajas y
peligros, y también para identificar posibles “puntos de entrada” en los que
cada persona y cada profesión puede realizar un aporte.
Vamos, entonces, a hacer una primera “disección” de cómo
opera una IA, cualquiera sea, para encontrar sus elementos principales.
El primer paso es entender que cualquier IA interactúa con
la realidad no virtual en un intercambio recíproco que, en principio, va
modificando a ambas: la “realidad real” (llamémosla RR) provee de tecnología y
datos a la “realidad virtual” (RV) de la IA, que a su vez devuelve información
(o realiza acciones) que tienen la capacidad de transformar la RR.
Esto nos da un primer paso, un tanto obvio pero que vale la
pena mencionar: la IA se apoya y actúa en un ecosistema mayor que es la RR, y
lo hace convirtiéndose en lo que llamamos un “agente” para reflejar que
posee capacidad de acción. Tanto ChatGPT como un automóvil que se conduce solo
son agentes. De hecho, Google
define “agente” como “sistemas de software que usan la IA para alcanzar
objetivos y completar tareas en nombre de los usuarios. Muestran razonamiento,
planificación y memoria, y tienen un nivel de autonomía para tomar decisiones,
aprender y adaptarse”. Esta definición es crucial ya que nos brinda varios de
los elementos que veremos a continuación.
Antes, debemos incluir un asunto que la definición no
incluye: la percepción, término que apunta a la capacidad del agente de
recibir contexto para indicar que el agente puede recibir entradas (inputs) en
cualquier momento, a partir de las cuales va conformando su propio historial
de experiencia basado en el cual tomará sus decisiones. Tal como ocurre con
una persona, las percepciones inmediatas cruzadas con su historial de
experiencia darán una dirección a la acción del sistema de IA.
El puente entre lo que el agente percibe y lo que hace es lo
que configura su función, es decir, aquello que ha sido capacitado para
hacer (jugar al ajedrez, manejar un automóvil, traducir textos, etc.). La
función, claro está, toma su forma del programa que crea al agente.
Es esperable que cualquier IA oriente sus acciones a
acercarse a lo que considere bueno y se aleje tanto como pueda de lo que
considere malo. Pero ¿Qué es bueno y qué es malo? Para una IA, lo bueno es lo
que la acerca a los fines que se le han dado, lo malo es aquello que la
aleja de estos. Si a una IA se le da la misión de estafar personas, para ello
la bueno será estafar tantas personas como pueda, y lo malo no lograr hacerlo.
Ya hablamos en un post anterior sobre la IA como un medio y no como un fin en
sí misma. La intención de la IA siempre viene dada por humanos que la crean o
la utilizan. Lograr sus fines es la medida del éxito de cualquier IA, y
por ello requiere que los fines puedan ser mensurables como precondición. Para
medir el éxito, lo más normal es diseñar medidas que partan de lo que se quiere
lograr en la RR, y no sobre cómo debe comportarse el agente.
Uniendo lo que acabamos de ver, toda IA debe ser entendida
como un agente racional con una racionalidad orientada al logro de los
fines para los que se la crea, partiendo de sus percepciones y su historial de
percepciones y buscando maximizar su medida de éxito.
Dada la importancia de sus percepciones para obtener
resultados exitosos, la IA puede llevar a cabo acciones dirigidas a “afinar”
sus percepciones futuras. Para ello recopila y busca información. En
consecuencia, la utilidad de la información con que cuente dependerá de la
racionalidad con que se haya dotado al agente. Aquí se encuentra uno de los
elementos más importantes en el desarrollo de la IA: la capacidad del agente de
aprender a partir de las nuevas percepciones, combinadas con su historial,
transformando datos (crudos) en información útil para tomar sus decisiones
racionalmente. Esta capacidad de aprender es lo que da a la IA el carácter de autónoma:
no depende exclusivamente de la información que le dio el programador, y en
parte ayuda a entender la existencia de “cajas negras” que no nos permiten
saber cómo una IA llega a tomar una decisión.
Como resultado, cualquier agente racional de IA incluye
cuatro componentes fundamentales:
- El elemento de aprendizaje: para mejorarse a sí mismo.
- El elemento de actuación: para establecer las acciones a realizar por la IA.
- El elemento de crítica: para revisar la actuación del agente y establecer modificaciones, de ser necesarias, en el elemento de actuación a fin de mejorar la medida de éxito.
- El generador de problemas: sugiere acciones que puedan llevar a la IA a explorar experiencias innovadoras, evitando que se cierre sobre las que ya ha alcanzado. Es quien convoca a la IA a no darse por satisfecha con la experiencia con que cuenta y seguir siempre explorando nuevos caminos.
Y es aquí donde juega un papel central la idea de “algoritmo”.
Los algoritmos son simplemente ordenadores de procesos, secuenciales o
iterativos. Una receta de cocina es un algoritmo que indica paso a paso al
agente (el cocinero, en este caso) el proceso a seguir para alcanzar el
resultado que es su medida de éxito (lo felices que estén los comensales por la
comida preparada: recuerden que el éxito es mejor medirlo por los cambios en el
entorno que por las actividades realizadas). Todos hemos lidiado con algoritmos
a lo largo de nuestra vida ¿Estudió usted en la primaria el cálculo del máximo
común divisor? Pues ese es uno de los primeros algoritmos “codificados” de la
historia.
El algoritmo es la base (¿el alma?) de la IA, el gestor de
los procesos que unen sus percepciones, historial, fines, medida de éxito y
racionalidad con el logro del mejor resultado racional que pueda obtener. Esto
es, el resultado puede no ser perfecto ni el mejor alcanzable, pero es el mejor
que la IA puede presentar a partir de los elementos descriptos. La búsqueda
y la planificación son subáreas de la IA focalizados en hallar
secuencias de acciones que permitan a los agentes alcanzar sus objetivos
asignados.
Pero los agentes no solo están integrados por datos y
programación, sino que tienen un sustento físico (chips, cables, placas) al que
llamamos arquitectura de la IA. Así, el trabajo de desarrollo de la IA
puede describirse como el camino hacia programas que, teniendo en cuenta las actuales limitaciones de arquitectura, tengan un comportamiento
racional minimizando el código y ampliando la capacidad de percibir, crear
historiales y, a partir de ello, maximizar su éxito en base a su racionalidad.
Por supuesto estamos dejando fuera de nuestra consideración
elementos, como los tipos de ambientes en que trabaja una IA, su capacidad de
percibirlos en forma completa o semicompleta, la continuidad o cambio de sus
condiciones, entre muchos otros. Tampoco entramos a analizar cómo estos
elementos cambian, o pueden cambiar, cuando hablamos de IA débil, fuerte,
generativa o agentiva, pero ahora conocemos un poco mejor “qué hace” una IA, y
eso no es poco.