Datasets gratuitos para entrenar algoritmos de Salud

¿Hiciste un curso de Machine Learning y buscas datos de salud para aplicarlos?

Aquí te pasamos los enlaces a los datasets abiertos para entrenamiento de algoritmos.

El lugar principal para buscar el KAGGLE, la iniciativa que promueve Machine Learning en múltiples áreas. Puedes usar los siguientes filtros para salud

  • health
  • healthcare
  • health conditions
  • public health
  • health insurance
  • mental health
  • womens health
  • reproductive health
  • health sciences
  • health foundations and medical research
  • health education and medical training
  • health news
  • mens health
  • health law
  • sexual health
  • diseases

Link

Algunos datasets de KAGGLE interesantes

Dataset Qué tiene
Medical Speech, Transcription, and Intent Frases médicas en inglés
Malarial Mosquito Database Localización y datos del mosquito
Medical Appointment No Shows Características de los pacientes de Medicare que no llegan a la cita
Predict Mortality/Death Rate Datos sobre defunciones en India
Heart Disease UCI 76 atributos de pacientes de la UCI de Cleveland Clinic
ECG Heartbeat Categorization Dataset Dataset de electrocardiogramas para entrenamiento en identificación de arritmias
MIAS Mammography Datos sobre mamografías para entrenamiento en detección de cáncer
MESSIDOR-2 DR Grades Fondos de ojo para entremiento de retinopatía diabética
Chest X-ray image Entrena un algoritmo para predecir neunomia
Skin Cancer ISIC Fotos de 9 tipos de cáncer de piel
Skin Cancer: Malignant vs. Benign Fotos de piel con cáncer y sin patología ver script de carga

Otros datasets interesantes
MIMIC-CXR Radiografías de Tórax
Dermatologists AI Fotos de enfermedades de la piel
OMI-DB Gran base de mamografías de Reino Unido

¿Conoces otros? Publícalos en el foro

3 Me gusta

En el Blog de Google apareció algo estupendo. Así como Google tiene BOOKS.GOOGLE.COM para buscar libros, o IMAGES.GOOGLE.COM para buscar imágenes, ahora salió de la BETA https://datasetsearch.research.google.com/

¡Sí! un buscador de DATASETS que tiene indexado 25.000.000 de datasets. Es algo increíble, puedes buscar datos sobre lo que quieras y llegar a un excel, CSV o base de datos con información sobre el tema.

Prueben cualquier cosa… yo acabo de probar por ejemplo la raza de mi perro que es un Basenji, y llegué a un modelo predictivo para ver de qué color sale la raza según la genética de los padres. Y puedes bajar todo el dataset de información.

4 Me gusta

Muchas gracias por el aporte…existen dataset de salud chilenos para elaborar o analizar modelos de machine learning?

wow, increible, soy estudiante de medicina y me inicio en todo esto de hacer machine learning, espero algún día poder aportar datos a la comunidad. :smiley:

Más fuentes de datasets para entrenar algoritmos

Awesome Public Datasets - Por dominio de conocimiento (incluido Salud)

https://github.com/awesomedata/awesome-public-datasets

Buscador con filtros y suscripción a lista de novedades

https://www.datasetlist.com

1 me gusta

Hola, buenas tardes, encontré este dataset para cáncer de mama: Curated Breast Imaging Subset of DDSM

CBIS-DDSM - The Cancer Imaging Archive (TCIA) Public Access - Cancer Imaging Archive Wiki

Para descargar hay que instalar un software, instrucciones en:
https://wiki.cancerimagingarchive.net/display/NBIA/Downloading+TCIA+Images

O también a través de requerimiento a un Web Services (RESTful): NBIA Data Retriever FAQ - TCIA Online Help - Cancer Imaging Archive Wiki

La licencia: Creative Commons — Attribution 3.0 Unported — CC BY 3.0

Saludos

1 me gusta