sábado, 30 de enero de 2021

El asombroso funcionamiento de la inteligencia artificial

Es como armar un rompecabezas de millones de piezas.


¿Cómo funciona la inteligencia artificial?

Sabemos que la inteligencia artificial realmente funciona y muy bien porque la tenemos a la mano en televisores, teléfonos, asistentes personales, cámaras, drones (objetos inteligentes), motores de búsqueda, sistemas de recomendación, email, chatbots (servicios inteligentes), antivirus para nuestro PC y reconocimiento de caras o de voz (software inteligente).

¿Cómo funciona nuestra mente?, ¿Cómo funcionan las neuronas?, ¿Cómo aprende la inteligencia artificial?

Vamos a explorar una respuesta no técnica sino de sentido común a la pregunta de cómo funciona la inteligencia artificial.

Los sistemas de inteligencia artificial se utilizan para procesar cualquier tipo de información, de manera que partiendo de algo conocido (información de entrada) se llegue a una respuesta que se desconoce (información de salida).

Por ejemplo, cuando escuchamos una canción (información de entrada) pero no sabemos cómo se llama o quién la canta, nuestro asistente personal, o una aplicación que hayamos instalado en el teléfono inteligente, nos dice el nombre de la canción y del intérprete (información de salida)

De manera similar, cuando subimos una fotografía (información de entrada) a una red social, la plataforma nos sugiere el nombre de las personas (información de salida) que están en la foto.

Entonces, lo primero que tenemos que entender es que todos los sistemas de inteligencia artificial funcionan en tres etapas:
  1. Captura de datos (de la información de entrada): los datos de conforman una canción o la foto de una persona.
  2. Procesamiento de los datos
  3. Entrega de resultados (información de salida): nombre de la canción, del cantante o de la persona en la foto.

Como ya sabemos qué le tenemos que decir al sistema de inteligencia artificial para que “reconozca” la canción y sabemos que la red social automáticamente puede reconocer las caras de las personas en las fotos que subimos, sólo nos vamos a enfocar en la segunda etapa, la del procesamiento de los datos.

Tomemos el ejemplo de las caras de las personas en una fotografía que estamos subiendo a una red social.

Para nosotros, la información de entrada es una foto que estamos subiendo; en cambio, para la plataforma, esa misma foto es un gran conjunto de miles o millones de pixeles (cuadritos diminutos, prácticamente microscópicos), según la resolución con la que hayamos tomado la foto.


Entonces, diremos que el sistema de inteligencia artificial debe procesar miles o millones de pixeles que recibió como datos de entrada (input) para darnos un nombre que es la información (output) que desconocemos o que no queremos digitar manualmente.

Partiendo de los miles o millones de pixeles (información de entrada), el sistema de inteligencia artificial procesa la fotografía, es decir “vuelve a armar la imagen” como si se tratara de armar un rompecabezas.

Pero veamos cómo sucede el procesamiento o reconstrucción de la imagen para que el sistema de inteligencia artificial nos entregue el nombre de la persona o de cada una de las personas de la foto.

El sistema procesa así:
  • Agrupa un número pequeño de pixeles, supongamos un cuadrado pequeñísimo de 25 pixeles en total (5X5) y repite el proceso, hasta agrupar todos los pixeles de la foto.
  • Identifica si cada grupo de pixeles tiene algún patrón conocido, es decir, una organización o configuración que se parezca a algo: por ejemplo, algo oscuro, un brillo, un matiz, etc.
  • Identifica líneas, formas o colores muy propios de una cara, por ejemplo un óvalo con ojos y boca, y también otras formas: lo que parece un árbol, una calle, una señal de tránsito, un puente, etc.
  • Distingue las formas que están dentro de una cara: ojos, nariz, boca, color de la piel, forma de la cara o alrededor: cabello, orejas (la figura) de otras formas externas: por ejemplo, mesa, silla, copa de vino, flores, árbol, pared (el fondo), yendo desde los detalles más pequeños hasta los más grandes.
  • Compara cada cara con las caras de fotos anteriores que ya han sido identificadas (etiquetadas) con un nombre y calcula la probabilidad de que sean de la misma persona.
  • Indica el nombre de la persona o de cada persona que ha reconocido (output o información de salida) en la foto si la probabilidad de respuesta correcta es muy alta.

Nosotros sabemos que en la mayoría de las ocasiones, el reconocimiento de caras es correcto pero siempre hay la posibilidad de algunos errores; por ejemplo, cuando el sistema de inteligencia artificial identifica una cara con otro nombre sólo porque las dos personas se parecen mucho: la hija con a mamá, dos hermanos gemelos, etc.

“Armar” de nuevo las caras y compararlas con otras caras ya identificadas es un ejemplo de una funcionalidad que se denomina procesamiento de imágenes, una de las muchas disciplinas de la inteligencia artificial.

En este caso, dado que el procesamiento consiste en millones de pasos u operaciones, a partir de miles o millones de pixeles (input) de una fotografía para entregar el nombre (output) de una persona en unos pocos milisegundos, los sistemas de inteligencia artificial requieren procesadores muy potentes y consumen bastante energía.

Ahora que ya sabemos cómo funciona la inteligencia artificial, por lo menos en lo que se refiere a reconocimiento de caras, podemos suponer que el reconocimiento de imágenes diagnósticas, canciones, semáforos, señales de tránsito o maleza en un sembrado, funciona de manera algo similar: millones de operaciones en muy poco tiempo, casi un instante, gracias a procesadores muy potentes y alto consumo de energía.

Comparte esta publicación, haz un comentario y sigue este blog

1 comentario:

Tus comentarios son muy valiosos. Gracias.