AI | Detección de COVID-19 en pulmones con aprendizaje profundo
"Animo a los padres a que hablen con sus médicos sobre cómo proteger a sus pequeños contra la enfermedad grave por VRS, utilizando una vacuna administrada durante el embarazo, o una inmunización contra el VRS administrada a su bebé después del nacimiento"
Director de los Centros para el Control y la Prevención de Enfermedades (CDC) y Administrador de la Agencia para Sustancias Tóxicas y el Registro de Enfermedades
En los últimos años, los investigadores han avanzado mucho en la aplicación del aprendizaje automático y la inteligencia artificial al diagnóstico médico por imagen. Un campo prometedor es el uso de redes neuronales profundas (DNN) para analizar imágenes de ecografía pulmonar y detectar signos de COVID-19. Sin embargo, el entrenamiento de estos complejos modelos requiere grandes cantidades de datos médicos de alta calidad con anotaciones precisas, que pueden ser difíciles de obtener. Sin embargo, el entrenamiento de estos complejos modelos requiere grandes cantidades de datos médicos de alta calidad con anotaciones precisas, que pueden ser difíciles de obtener.
Un equipo de investigadores de la Universidad Johns Hopkins dirigido por la Dra. Muyinatu Bell investigó distintas estrategias de entrenamiento de las DNN para detectar características de COVID-19 en ecografías pulmonares utilizando tanto datos reales de pacientes como imágenes de ecografía simuladas generadas con un software de modelado. Su objetivo era determinar el método de entrenamiento más eficaz cuando los datos del mundo real son limitados, como ocurrió a menudo al principio de la pandemia.
Sus hallazgos, publicados en la revista Communications Medicine, proporcionan información valiosa sobre cómo los datos médicos simulados pueden ayudar a abordar las limitaciones en el entrenamiento de modelos de aprendizaje profundo para aplicaciones sanitarias. Con la validación adecuada mediante ejemplos de pacientes reales, los datos simulados resultan prometedores como complemento o alternativa a los ejemplos del mundo real con anotaciones limitadas. Las estrategias exploradas pueden ayudar a avanzar en las aplicaciones de inteligencia artificial para interpretar exploraciones médicas y ayudar al diagnóstico.
Uno de los obstáculos a la aplicación de redes neuronales profundas al análisis de imágenes médicas es la gran cantidad de datos anotados de alta calidad necesarios para entrenar modelos complejos. Anotar y etiquetar manualmente miles de imágenes médicas lleva a los expertos un tiempo y un esfuerzo enormes. Incluso cuando se recopilan conjuntos de datos del mundo real, variables como la calidad de la imagen, los datos demográficos del paciente y el equipo pueden variar de forma que afecten a la capacidad de generalización de un modelo.
El equipo de Johns Hopkins exploró el uso tanto de clips de ecografía pulmonar del mundo real de pacientes con COVID-19 como de imágenes de ecografía simuladas generadas con software de modelado para entrenar sus modelos de aprendizaje profundo. Las simulaciones permitieron generar un número ilimitado de imágenes anotadas de forma eficiente, con verdades básicas conocidas. Sin embargo, en estudios anteriores se observó que los datos simulados por sí solos no se transferían necesariamente bien a ejemplos de pacientes reales debido a las diferencias de dominio entre las simulaciones y la realidad.
Los investigadores estudiaron siete estrategias distintas de entrenamiento de las DNN para segmentar y detectar patrones de líneas B, un signo distintivo de COVID-19 en las ecografías pulmonares, utilizando datos reales, simulados o combinados:
1. Sólo datos simulados
2. Sólo datos reales
3. Combinación de 1 y 2
4. 4. Conjunto de datos del mundo real dividido (entrenamiento en la mayoría, prueba en un subconjunto)
5. Combinación de 1 y 4
6. Combinación de 2 y 4 Combinación de 2 y 4
7. Combinación de 1, 2 y 4
Comprobaron la capacidad de cada estrategia para segmentar correctamente las líneas B en ecografías reales de pacientes con COVID-19. Otros experimentos exploraron el impacto de aumentos de la imagen como rotaciones y alteraciones del contraste/borrosidad.
El estudio arrojó varias conclusiones importantes sobre el entrenamiento eficaz de modelos de aprendizaje profundo cuando los datos médicos del mundo real son limitados:
- El aumento de datos durante el entrenamiento mejoró significativamente el rendimiento del modelo, especialmente para segmentar las líneas B. Esto ayudó a resolver las diferencias entre las distribuciones de datos de entrenamiento y de prueba.
- Cuando no se disponía de datos reales de la misma distribución que los casos de prueba, la combinación de conjuntos de datos simulados y reales de otros dominios (estrategia 3) funcionó mejor, superando a los enfoques basados únicamente en datos simulados o reales.
- Cuando se utilizaron datos reales de prueba/entrenamiento parcialmente solapados (Estrategias 4-7), la inclusión de ejemplos simulados mejoró aún más los resultados respecto a los reales, especialmente en las primeras fases de entrenamiento.
- La combinación de todas las fuentes de datos (estrategia 7) obtuvo los mejores resultados y requirió menos iteraciones de entrenamiento que los enfoques basados únicamente en datos reales.
- Basarse únicamente en datos reales de distribuciones distintas a las de los casos de prueba (estrategia 2) tuvo peores resultados que las combinaciones con simulaciones.
En general, la incorporación de datos simulados cuidadosamente elaborados parece ayudar a resolver las limitaciones de los ejemplos reales completamente anotados, probablemente al aumentar el tamaño y la diversidad de los conjuntos de datos de entrenamiento efectivos. La inclusión de simulaciones también mejoró la eficiencia del entrenamiento en algunos casos.
Los resultados proporcionan una valiosa orientación sobre la aplicación eficaz de datos de imágenes médicas reales y simuladas para entrenar modelos de aprendizaje profundo, un área crucial a medida que la inteligencia artificial amplía su papel en la atención sanitaria. Algunas conclusiones clave son:
- Los datos simulados resultan prometedores como complemento cuando los ejemplos del mundo real son limitados, ya que mejoran el rendimiento con respecto a los enfoques basados únicamente en datos reales.
- La combinación de datos simulados y reales procedentes de diversos ámbitos funciona mejor que la simulación por sí sola, probablemente debido al aumento de la diversidad.
- Incluir aumentos de datos durante el entrenamiento ayuda a reducir las diferencias entre los casos de entrenamiento disponibles y los casos de prueba previstos.
- Unos conjuntos de datos simulados más amplios y completos pueden permitir entrenar modelos sin necesidad de superponer completamente ejemplos reales.
En el futuro, simulaciones más realistas que capturen una mayor variabilidad clínica podrían ayudar a los modelos de aprendizaje profundo a generalizar aún mejor. También será importante la validación continua con casos de pacientes reales. A medida que surjan mejores herramientas para generar de manera eficiente ejemplos médicos anotados, el entrenamiento aumentado por simulación tiene potencial para abordar las limitaciones y acelerar el diagnóstico asistido por IA. En general, el estudio proporciona un marco valioso para aprovechar eficazmente los datos sanitarios reales y simulados con el aprendizaje profundo.
Referencia(s)
Pulse TAGS para ver artículos relacionados :
AI | COVID-19 | DIAGNÓSTICO | APRENDIZAJE AUTOMÁTICO | MEDICINA | SALUD PÚBLICA | RESPIRATORIO | SARS-COV2
- Millions of new solar system objects to be found...on June, 2025 at 1:34 am
Astronomers have revealed new research showing that millions of new solar system objects are likely to be detected by a brand-new facility, which is expected to come online later this year.
- Tea, berries, dark chocolate and apples could...on June, 2025 at 3:50 pm
New research has found that those who consume a diverse range of foods rich in flavonoids, such as tea, berries, dark chocolate, and apples, could lower their risk of developing serious health conditions and have the potential to live longer.
- Being in nature can help people with chronic back...on June, 2025 at 3:50 pm
Researchers asked patients, some of whom had experienced lower back pain for up to 40 years, if being in nature helped them coped better with their lower back pain. They found that people able to spend time in their own gardens saw some health and wellbeing benefits. However, those able to immerse […]
- Scientists say next few years vital to securing...on June, 2025 at 3:50 pm
Collapse of the West Antarctic Ice Sheet could be triggered with very little ocean warming above present-day, leading to a devastating four meters of global sea level rise to play out over hundreds of years according to a new study. However, the authors emphasize that immediate actions to reduce […]
- First direct observation of the trapped waves...on June, 2025 at 3:50 pm
A new study has finally confirmed the theory that the cause of extraordinary global tremors in September -- October 2023 was indeed two mega tsunamis in Greenland that became trapped standing waves. Using a brand-new type of satellite altimetry, the researchers provide the first observations to […]
- DNA floating in the air tracks wildlife, viruses...on June, 2025 at 3:48 pm
Environmental DNA from the air, captured with simple air filters, can track everything from illegal drugs to the wildlife it was originally designed to study.