Ante un traumatismo fuerte, las personas suelen ir a las urgencias. Ahí, los atenderá un médico urgenciólogo, un internista, un cirujano, médico de familia, pediatra o médico general. Generalmente pedirá una radiografía del lugar de la lesión y frecuentemente tendrá que interpretarla él para ver si hay una fractura (no todas las urgencias cuentan con radiólogo o traumatólogo para evaluar las radiografías).
Un porcentaje de los errores diagnósticos en las urgencias son debido al erróneo análisis de una radiografía que presentaba una fractura que el clínico de turno no pudo divisar.
Conociendo estos datos, investigadores realizaron el siguiente experimento. Crearon un algoritmo que analiza radiografías de muñeca y predice si tiene o no fractura y en qué lugar la tiene.
Link al estudio
¿Cómo lo hicieron?
Utilizaron 3.500 radiografías de muñeca y pusieron a expertos traumatólogos para que identifiquen en qué lugar específico de la muñeca se veía la fractura, y utilizaron estos datos para entrenar al algoritmo para que aprenda a identificar una fractura de muñeca. Después utilizaron 132.345 radiografías de diferentes partes del cuerpo para aumentar la sensibilidad y especificidad del algoritmo.
Desarrollaron un experimento con 3 médicos de urgencia. Les presentaron 300 radiografías de muñeca para que los clínicos indiquen si tenían o no fractura. Un sistema web, les presentaba la radiografía y el clínico tenía que decir si tenía o no fractura. Una vez que tomaba la decisión, el sistema le mostraba la predicción del algoritmo.
¿Cuál fue el resultado?
El algoritmo desarrollado tenía un área bajo la curva (AUC) excelente, de 0,97
AUC = Área bajo la curva (AREA UNDER THE CURVE)
Menos de 0,5: Es como lanzar una moneda.
Entre 0,5 y 0,6: Test malo.
Entre 0,6 y 0,75: Test regular.
Entre 0,75 y 0,9: Test bueno.
Entre 0.9 y 0.97: Test muy bueno.
Más de 0.97: Test excelente.
Los clínicos sin el algoritmo tuvieron una sensibilidad de 80,8% (en 2 pacientes de 10, erraban en el diagnóstico de la fractura) y una especificidad de 87,5%. Utilizando el algoritmo, o sea, tomando la decisión con su ayuda, la sensibilidad de los clínicos aumentaba a 91,5% y la especificidad a 93,9%