Predicción de lesión maligna de la mama analizando ecografía mamaria

Hay un nuevo algoritmo que está siendo presentado en Chile en estos días. Se trata de KOIOS DS FOR BREAST, un algoritmo que permite analizar una ecografía mamaria y predecir el riesgo de malignidad y el grado de malignidad (conocido como categorías BI-RADS).

El Cáncer de Mama mata a 1500 chilenas por año y es la primera causa de muerte por cáncer en mujeres. La forma de screening habitual es con mamografía anual después de los 40 años, y con ecografía en mujeres jóvenes con mayor densidad mamaria. Cuando la mamografía presenta una imagen sospechosa, se realiza una ecografía mamaria.

La evaluación de la ecografía mamaria es muy difícil y requiere entrenados radiólogos o mastólogos que puedan decidir si hay que hacer una biopsia o no del tumor. Un profesional con menor destreza solicitará más biopsias de lo necesario (pedirá biopsias en tumores benignos)

Investigadores tuvieron una idea

¿Y si entrenamos un algoritmo con imágenes de Mama a las que se biopsió y se supo que efectivamente tenían un cáncer?

¿Cómo funciona?

Las imágenes DICOM de la ecografía mamaria son presentadas al médico radiólogo o mastólogo para que elija la región que encuentra “sospechosa”. El sistema presenta su predicción de malignidad y el grado (BI-RADS).

El producto está aprobado por la FDA, y compraró su eficacia contra el algoritmo QuantX y el ClearView eCAD

El sistema fue validado en un estudio clínico donde 15 radiólogos evaluaron 900 ecografías Mamarias y después el algoritmo también las analizó.

El AUC (Área Under the Curve) fue de 0,88% (test bueno)

Menos de 0,5: Es como lanzar una moneda.
Entre 0,5 y 0,6: Test malo.
Entre 0,6 y 0,75: Test regular.
Entre 0,75 y 0,9: Test bueno.
Entre 0,9 y 0,97: Test muy bueno.
Más de 0,97: Test excelente.

¿Para qué sirve?
Para hacer más rápida la evaluación de un radiólogo/mastólogo. Que se pueda apoyar en un sistema entrenado que le de feedback sobre la imagen que está viendo y lo ayude a tomar la decisión de hacer o no una biopsia.

¿Qué podría mejorar?
El sistema se basa en una imagen tomada desde el traductor de un ecógrafo. Esto implica que el radiólogo o mastólogo tuvo que elegir qué imagen tomar (lo que requiere expertiz). Lo ideal es que este tipo de acciones se realicen sobre un video, el radiólogo/mastólogo va “grabando” la ecografía, y el sistema va haciendo sus predicciones, indicando cuándo vio algo sospechoso. Esto daría un soporte durante el proceso de realización de la ecografía.

Video de la solución

Link

2 Me gusta

Lo importante es que se debe entrenar bien por varios años dados k la mala experiencia que tuvimos con Oftalmo nos llevo a sobrecargar a los tecnologos y comprar mas horas presenciales de oftalmologo, la poblacion chilena es añosa mas aun en el sistema publico por lo que no solo tiene una patologia sino varias.
Las mujeres menires de 40 son muy distintas en el sistema publico a las que se ven en el privado.Resumen aplique el algoritmo antes de hacer la eco.Debemos cuidar los recursos

El problema de DART que indicas aquí, ¿Es problema de la tecnología? ¿O problema en la implementación de ésta?

Hay que diferenciar bien estos temas. Cualquier tecnología médica puede ser muy buena o muy mala según como se implemente.

Alrededor del 50% de las tomografías son solicitadas sin fundamento y terminan irradiando y dañando a pacientes y aumentando los costos.

¿El problema es con la tomografía?

El problema es de implementación, dado que se implemento una tecnología capaz de pesquisar sospecha de una sola patología (Retinopatía Diabética), para reemplazar un examen de retina integral realizado por médico oftalmólogo que es capaz de sospechar/pesquisar/diagnosticar una serie de más de 100 patologías de retina, nervio óptico y medios transparente oculares.

Se pensó en forma administrativa la aplicación de una plataforma dedicada a lo que compete a GES por la presencia de retinopatía diabética, pero se dejo de lado patologías tan importantes como el glaucoma y la degeneración macular asociada a la edad que, pesquisadas en etapas tempranas, puede evitar o enlentecer el proceso hacia la ceguera. Se dejó de lado el glaucoma (pesquisa de nervio óptico que DART no hace),siendo que en un momento estuvo considerada para transformarse en patología GES.

Más aún, se implemento una tecnología incompleta (entrenamiento aun en curso, actualmente tomando datos de usuarios de la salud primaria), generando un gasto de millones de dolares por una tecnología que sólo sirve bajo el asidero de Tecnólogos Médicos de Oftalmología que debemos realizar trabajo extra, realizando contraloría de los resultados normales que entrega DART y que en realidad necesitan tratamientos por retinopatías diabéticas severas.

Debo decir que debes comprender la reticencia que existe en nuestro gremio al ver que se quiere implementar una inteligencia artificial que intervenga en la sospecha/pesquisa de una patología que es tan sensible como el cáncer mamario.

Por lo que leo, la implementación de la tecnología en su área se esta llevando en forma más ordenada y con mayor ductibilidad, por lo mismo, por la sensibilidad de la patología, porque la norma vigente permite mayor control sobre este tipo de exámenes.

Espero puedan dar una mirada crítica extensa a este software antes de siquiera comprarlo/implementarlo, que exista periodos de prueba con comparaciones en terreno por los profesionales que están involucrados en el examen (además de las pruebas que ya se realizaron).

1 me gusta

Sería muy bueno conocer casos concretos y reales donde el algoritmo indica “normal” y el tecnólogo médico lo evalúa como “retinopatía severa”. Los algoritmos de IA tienden a tener más falsos positivos que falsos negativos, por eso es interesante ver casos donde el algoritmo carece de sensibilidad.

Las tecnologías médicas (nuevos fármacos, nuevos procedimientos quirúrgicos, nuevos algoritmos de IA), son evaluadas a través de estudios clínicos. Estos son los que nos dicen si vale la pena o no su uso.

Y cuando uno ve que un algoritmo es útil, tiene que ver en qué contexto lo aplica. La mayoría de los algoritmos hoy en día son para DIAGNÓSTICO ASISTIDO POR COMPUTADORAS (CAD: Computer-aided diagnosis), que permiten a un profesional de la salud entrenado contar con nueva información que no es evidente para el ojo humano.

La implementación de DART puede tener 3 desenlaces para mí:

  1. La ceguera debido a cualquier causa prevenible en Chile se mantiene igual. La tecnología implementada no tuvo resultados.
  2. La ceguera debido a cualquier causa prevenible en Chile aumenta. La implementación de la tecnología es peligrosa, disminuyó las estrategias previas y generó un resultado clínico muy desfavorable.
  3. La ceguera debido a cualquier causa prevenible en Chile disminuye. Aquí, yo me quedaría con la boca abierta

Es importante, ante la implementación de cualquier tecnología médica, realizar estudios para evaluar el resultado. Se necesitan profesionales de la salud que puedan llevar adelante estudios de este tipo.

1 me gusta

El problema fue que usaron a los usuarios del sistema publico para entrenarlo

Por más que me gustaría por temas bioéticos aún no puedo mostrar casos concretos porque se esta realizando un estudio para mostrar estos casos.

El principal problema es la nula lectura que hace de todo el resto del abanico de lesiones que puede pesquisarse en una retinografía (fotografía de retina para analizar el fondo de ojo), debido a que solo fue entrenada para retinopatía diabética. Lo peor es que se implementó como reemplazante del análisis por médico oftalmólogo, porque todo lo que DART filtra como normal no pasa por manos de los oftalmólogos que tienen acceso al programa; aunque tenga nervio óptico alterado elemento que DART no lee (lo cual corresponde a una sospecha de glaucoma), aunque presente un evidente nevus coroideo lo cual DART tampoco lee (el cual debe ser analizado si requiere estudio patológico o no), o atrofias retinales de gran extensión en pcte. con alta miopia lo cual tampoco DART lee (pcte. que debe ser análizado por médico oftalmólogo con fondo de ojo completo en busqueda de factores predisponentes de desprendimiento de retina) o drusas reticulares maculares que DART tampoco lee (lo cual puede configurar una sospecha de Degeneración Macular Relacionada con al Edad), a pesar de afectar la mácula, zona de mayor importancia en la retina porque da la mayor agudeza visual.

Efectivamente, el algoritmo de DART, a diferencia de otros que están siendo implementados en China y USA, únicamente evalúa retinopatía diabética, siendo ciego a cualquier otra patología.

Para poner esto en contexto, en Chile hay 1 oftalmólogo cada 21.000 habitantes y la mayoría están en Santiago. Faltan oftalmólogos para atender a la población que requiere control anual y es plan del gobierno formar a más especialistas (incluyendo oftalmólogos). Lo ideal es que cada paciente sea visto anualmente por su oftalmólogo, pero esto está lejos de ser posible.

¿Qué hacemos en ese contexto?

La decisión es muy compleja porque no hay una solución mágica que tenga únicamente retornos positivos. El Ministerio de Salud arriesgó por una política para aumentar la cobertura (lograr evaluar a más diabéticos por año, hoy únicamente el 20% tiene su control anual). Aún no tenemos información sobre los resultados que pueden ser a) se mantuvo igual, b) empeoró, c) mejoró.

La implementación de DART podría tener mejoras, como por ejemplo, que los pacientes sean evaluados 1 año con DART y al siguiente año siempre presencialmente. Intercambiar Algoritmo/Oftalmólogo, permite mitigar los riesgos de un algoritmo entrenado para una única patología del ojo, mientras que un oftalmólogo ve más de 100.

1 me gusta

El entrenamiento de algoritmos está avanzando a pasos agigantados.
Pienso en que pronto viene la PSU y los estudiantes entusiasmados con hacer carrera en el área de salud puedan estar evaluando como esto podría significar un factor en el contexto de las especialidades. Esto es muy específico para un estudiante de esa edad, si él se desenvuelve en ambientes relacionados a la salud, como familiares o amigos, es muy posible que en una conversación haya cruzado el tema de los entrenamientos como herramientas de apoyo al diagnóstico y sea información relevante a considerar. Para mí, es sentir una incertidumbre en el desplazamiento del valorado criterio y raciocinio humano ¿es sólo cuestión de tiempo masterizar estas técnicas y superar el análisis y experiencia que solo años y clínica proveen a la mente humana? seremos capaces de replicar a lo mejor de cada especialista y potenciarlo y replicarlo tantas veces como sea necesario para mejorar nuestro pronóstico de vida poblacional…yo espero que sí y que esto no signifique un desplazamiento de este valor humano que a fin de cuentas se transmite de generación en generación por aulas que se completan y son quienes alimentan a los algoritmos para entrenar. Como una convivencia equilibrada, que el algoritmo haga ronda junto al equipo clínico.