Creación de motivos de consulta de urgencia de forma automática mediante algoritmo utilizando DeepLearning

Conseguir información clínica para hacer investigación, estudios o probar un desarrollo propio suele ser extremadamente compleja. Existen algunos datasets de datos estructurados que permiten hacer obtener historias clínicas electrónicas en formato FHIR o en CSV/XML, pero hasta ahora, no había como obtener textos libres.

La razón por la cuál en los datasets anónimos no hay textos libres, es porque la revisión debe ser manual, por un humano que diga que efectivamente en ese texto libre no hay información que identifica a la persona. Este trabajo es muy complejo y generalmente lleva a que los textos libres no son liberados.

Un paper de Nature muestra una nueva oportunidad en este tema

Utilizando algoritmos de DeepLearning los investigadores lograron crear motivos de consulta en la urgencia de forma automática, y éstos no contienen información identificatoria de personas.

¿cómo funciona?
Utilizan los siguientes datos para entrenar a su algoritmo:

  • Grupo etareo (0 - 5 años, 5 a 10 años…)
  • Sexo (M, F, I)
  • Código CIE-10 de diagnóstico principal al egreso
  • Modo de ingreso (ambulancia, caminando…)
  • Condición de egreso (alta a domicilio, hospitalización…)
  • Mes-año
  • Motivo de consulta en texto libre

El algoritmo aprendió a predecir los motivos de consulta en texto libre con el resto de los datos. Así que ahora, se puede utilizar el algoritmo para generar motivos de consulta coherentes con un diagnóstico de egreso, una edad, sexo…

El algoritmo se puede utilizar para crear los motivos de consulta de EMRbots.org o Synthea

Un método similar podría crearse para generar evoluciones en texto libre automáticas, lo que permitiría avanzar en varias líneas en informática biomédica.