Cómo entrenar a tu algoritmo de Inteligencia Artificial

Lo que hoy conocemos como Inteligencia Artificial en Medicina no es nuevo, sino que lleva alrededor de 55 años. Es básicamente, utilizar los datos que tenemos para que el computador pueda predecir algo y darnos una probabilidad.

3 fenómenos de los últimos años gestaron lo que estamos viviendo ahora.

  1. Disminución en los costos de almacenamiento de datos (hoy NADA se borra) y mejoras sustanciales en las velocidades de procesamiento (los teléfonos de hoy tienen capacidades de procesamiento sorprendentes)
  2. Explosión de datos digitales: como nada se borra, hay muchísimos datos. El valor de tus datos depende de cuán “limpios están” y qué cantidad tienes.
  3. Avances en los algoritmos: algunos nuevos algoritmos están dando que hablar, más los que procesan imágenes que los que utilizamos para datos (que llevan muchísimos años con nosotros)

¿Cómo hacer que el computador nos diga que una tomografía de cerebro tiene un ACV?

Vamos a explicar esto con el entrenamiento de perros para identificar drogas. En los aeropuertos uno ve a los perros que buscan drogas, frutas o dinero con su dueño oliendo las maletas de los pasajeros y su ropa. ¿cómo sabe el perro qué tiene que encontrar?

Sencillo. Se entrena para que encuentre, lo que se quiera buscar.

Para el entrenamiento de perros se utiliza una pelota o un juguete que al perro le guste y a ese juguete lo impregnan con olor de lo que quieran que identifique (puede ser olor a manzana, marihuana, dólares…). Después colocan la pelota con olor en una caja, y ponen varias cajas que no tienen nada al lado. Llevan al perro para que huela todas las cajas, y de una señal (mover la cola, ladrar…) si encuentra la pelota con olor. Si la encuentra, lo dejan jugar con la pelota como premio. Y así, siguen 5 horas por día.

El cerebro del perro, aprende: si identifica el olor, puede jugar con la pelota.

Ahora volvamos a los algoritmos de inteligencia artificial. A la mayoría de éstos, también hay que entrenarlos. Y para esto, es imprescindible contar con muy buenos datos. Si uno tiene los datos bien catalogados, o sea, por ejemplo, miles de tomografías que muestran un único diagnóstico (ACV isquémico), si se utilizan para entrenar a un algoritmo de análisis de imágenes, éste aprenderá, a predecir y dar una probabilidad de que la nueva imagen que le presentan sea “similar” con las que se entrenó. El resultado siempre es del tipo 98,5% de probabilidades que sea un “ACV”.

¿qué problemas pueden surgir si se entrena con datos malos?

Al igual que al perro, si lo queremos entrenar para que encuentre únicamente manzanas, pero lo entrenamos 2 días con manzanas y 1 día con peras, el perro nos moverá la cola cuando huela manzanas y cuando huela peras. Lo mismo pasa con un algoritmo de inteligencia artificial. Si los datos son malos y mezclan la información, la predicción será mala. Pero no sólo depende de la calidad, de los datos, sino también en la forma en la que se entrena el algoritmo.

Un ejemplo, de problemas de entrenamiento está en el siguiente trabajo publicando en https://arxiv.org/pdf/1803.03453.pdf. Los investigadores querían enseñarle a un algoritmo de red neuronal que aprenda a distinguir los hongos comestibles de los hongos venenosos. El problema fue que para entrenar al algoritmo, le pasaron una secuencia de 1 hongo comestible - 1 hongo venenoso. El algoritmo más que aprender a distinguir las imágenes que le presentaban, aprendió que siempre debía predecir 1 vez comestible y la siguiente venenoso, así que sus predicciones a nuevos datos eran una vez cada tipo. Se resolvió randominzando los casos de entrenamiento.

Quienes tengan un buen volumen de datos, bien codificados y que sean confiables, tienen oro en la era de la inteligencia artificial.

Este video muestra de forma muy sencilla cómo funciona lo que se conoce como Computer Vision (visión de computadora).

Primero se entrena un modelo con fotos de Wally-Waldo.

Un robot utiliza el modelo para “escanear” la página que se le muestra. Identifica la cara reconocida que tiene una probabilidad mayor de ser Wally y la marca.

Dura 1 minuto (está muy bueno)