Predicción de alto riesgo de cáncer de mama analizando mamografías digitales

El cáncer de mama es la primera causa de muerte por cáncer en la mujer en Chile. Todos los días mueren 3 mujeres por cáncer de mama. 7 de cada 10 casos se da en mayores de 50 años, así que el riesgo de desarrollar cáncer de mama, aumenta con la edad.

Hasta ahora, los ginecólogos clasifican a las pacientes

  • de bajo riesgo para el desarrollo de cáncer de mama
  • de alto riesgo para el desarrollo de cáncer de mama

Analizando

  • Edad
  • Historia familiar de cáncer de mama y cáncer de ovario
  • Factores hormonales y reproductivos (menarquia, menopausia, embarazos…)
  • Densidad de la mama

Y ese alto/bajo riesgo modifica cada cuánto tiempo hay que hacer una mamografías, o a qué pacientes hay que hacerles además una resonancia magnética de la mama.

Investigadores del MIT tuvieron una idea. ¿Y si clasificamos el riesgo de las pacientes según sus mamografías?

Link al estudio
https://doi.org/10.1148/radiol.2019182716

El equipo de MIT/MGH entrenó un algoritmo de Redes Neuronales Convolucionales con 88.994 mamografías de 39.571 pacientes que habían sido estudiadas durante años, y se sabía cuál había desarrollado cáncer de mama y cuál no. Únicamente ingresaron al algoritmo imágenes de pacientes que tengan al menos 5 años de seguimiento.

De las 88.994 mamografías se utilizaron:

  • 71.689 para entrenar el algoritmo
  • 8.554 para validar el algoritmo
  • 8.751 para testear el algoritmo (3.937 mujeres)

Hicieron la comparación entre:

  • Un modelo de regresión logística analizando los datos de la Historia Clínica Electrónica HCE (edad, historia familiar…)
  • Un modelo donde la predicción únicamente la realizan las imágenes
  • Un modelo híbrido, donde se utiliza la predicción de las imágenes + la predicción de la regresión logística combinadas

El modelo híbrido desarrollado logra predecir qué pacientes son de algo riesgo, integrando la información de riesgo con las imágenes, y logra identificar correctamente al 31% de las mujeres de alto riesgo Vs. el 18% de los modelos tradicionales de categorización.

El Área Bajo la Curva (AUC) de comparación entre los métodos que mejor estimaban riesgo fue de = 0,70

AUC = Área bajo la curva (AREA UNDER THE CURVE)

  • Menos de 0,5: Es como lanzar una moneda.
  • Entre 0,5 y 0,6: Test malo.
  • Entre 0,6 y 0,75: Test regular.
  • Entre 0,75 y 0,9: Test bueno.
  • Entre 0.9 y 0.97: Test muy bueno.
  • Más de 0.97: Test excelente.

El test/algoritmo es regular, esto quiere decir que hay muchas mujeres que son de alto riesgo, pero que el test va a decir que son de bajo riesgo. No obstante, es bastante mejor que lo que sucede hoy en día, donde los médicos fallan más que el algoritmo en decir quién tiene alto riesgo.