¿Has escuchado que los algoritmos de Inteligencia Artificial son una “caja negra”? Esto se da porque hay algoritmos matemáticos que no presentan qué variable es la que le da más peso a la predicción. Uno le agrega 100 variables, y el sistema predice un valor, pero no se sabe qué variable tuvo “más peso”. Por eso, se requiere un balance entre PRECISIÓN y COMPRENSIÓN. Hay algoritmos muy precisos, que hoy están en boga, como REDES NEURONALES, ÁRBOLES DE REGRESIÓN, MÁQUINAS DE VECTORES DE SOPORTE y BOSQUES ALEATORIOS, pero son “caja negra” y no nos dejan comprender por qué entregaron tal predicción.
Alrededor del 50% de las muertes debido a causas respiratorias en Chile son provocadas por neumonía. En 2016, de las 104.026 personas fallecidas, 3.166 personas lo hicieron por neumonía.
¿Se puede hacer algo para disminuir estas muertes?
La neumonía es un buen ejemplo de optimización de hospitales. Muchos pacientes se pueden tratar ambulatoriamente y eso es más seguro (fuera del hospital), pero a otros, es necesario tratarlos en el hospital con terapias más “agresivas” y con “mayor soporte”. El problema es decidir a quién ambulatoriamente, y a quién de forma “más agresiva”
Si uno trata antes con antimicrobianos y da soporte a estos pacientes, puede prevenir que mueran debido a esta causa. ¿Y que tal si entrenamos a un algoritmo para que nos diga qué paciente tiene más riesgo de morir y los hospitalizamos y les damos tratamiento agresivo en el hospital?
El trabajo de Rich Caruana analiza este tema.
Link al trabajo
En este estudio, se analizaron 46 variables de 14.199 pacientes que murieron por neumonía. Los dividieron en 2 sets
- Set de entrenamiento (datos de 9847 pacientes)
- Set de test (datos de 4352 pacientes)
Hallazgos del historial del paciente
- enfermedad pulmonar crónica
- readmisión hospitalaria
- admitido a través de la sala de emergencias
- admitido desde un hogar de ancianos
- insuficiencia cardíaca congestiva
- cardiopatía isquémica
- enfermedad cerebrovascular
- enfermedad hepática crónica
- Antecedentes de dolor en el pecho
- edad
- sexo
- diabetes mellitus
- asma
- cáncer
- número de enfermedades
- antecedentes de convulsiones
- insuficiencia renal
Resultados del examen físico
- presión arterial diastólica
- sangrado gastrointestinal
- frecuencia respiratoria
- alteración del estado mental
- ritmo cardíaco
- respiración sibilante
- estridor
- soplo del corazón
- temperatura
Hallazgos de laboratorio
- Exámenes de la función hepática
- nivel de glucosa
- nivel de potasio
- hematocrito
- bandas porcentuales
- p02
- concentración de sodio
- Nivel de nitrógeno ureico plasmático
- nivel de creatinina
- nivel de albúmina
- Conteo de glóbulos blancos
- pH
- PC02
Hallazgos de la radiografía de tórax
- radiografía de tórax positiva
- derrame pleural
- cavitación/empiema
- colapso del lóbulo o de los pulmones
- infiltrado pulmonar
- neumotórax
- masa torácica
Utilizaron diferentes algoritmos matemáticos para predecir quién tiene más riesgo de morir para procesar el set de entrenamiento, y después lo validaron contra el set de test. Los resultados de los algoritmos son los siguientes
Algoritmo matemático | Predicción de Muerte por neumonía (AUC) |
Caja negra |
---|---|---|
Regresión Logística | 0,8432 | No |
Bosques aleatorios | 0,8460 | Si |
LogitBoost | 0,8493 | Si |
GAM | 0,8542 | No |
ga2m | 0,8576 | No |
¿Qué pasó cuando los clínicos analizaron los resultados?
Los clínicos indicaban que el algoritmo funcionaba bien, salvo para pacientes de alto riesgo (como los asmáticos), donde el algoritmo, por alguna razón, los ponía en el grupo de bajo riesgo, cuando todo clínico sabe que una neumonía en un paciente asmático puede ser riesgosa.
Los algoritmos de caja negra, no permiten identificar qué variable es la que generó más impacto en la predicción, pero los otros algoritmos si lo permitían. Ahí divisaron que los algoritmos no estaban considerando al ASMA como riesgoso.
¿Por qué el algoritmo no pondera esos antecedentes?
Esto se da porque generalmente, cuando en una urgencia o consulta ambulatoria un paciente asmático presenta una neumonía, rápidamente se lo hospitaliza y se le da tratamiento agresivo, por lo tanto, se mueren menos y aparecen menos en los datos para entrenamiento.
La información disponible en las Historias Clínicas Electrónicas tienen el sesgo de las decisiones clínicas debidas a la práctica, generando GAPs de datos que pueden no tenerse en cuenta y generar algoritmos que cometan errores que los clínicos no comenten. Esto sucede con muchas decisiones y muchos tipos de condiciones de salud. Lo mismo que pasó acá con los asmáticos, pasa con las embarazadas, o los pacientes con alguna condición de riesgo clásica. Los clínicos, siempre toman en cuenta esas condiciones en la toma de decisiones, y eso sesga la información que se registra.
Si se entrenan algoritmos con datos sesgados, tendremos predicciones sesgadas.
El autor indica que con los algoritmos matemáticos comprensibles, uno puede ver que una variable no pondera y cambiar su ponderación manualmente, y re-entrenar al modelo. Es muy importante que los clínicos sean PARTE esencial del desarrollo de sistemas de Inteligencia Artificial en Medicina.