AI | Erkennung von COVID-19 in der Lunge mit Deep Learning
"Ich ermutige Eltern, mit ihren Ärzten darüber zu sprechen, wie sie ihre Kleinen vor einer schweren RSV-Erkrankung schützen können, entweder durch eine Impfung während der Schwangerschaft oder durch eine RSV-Impfung, die das Baby nach der Geburt erhält.
Direktor der Centers for Disease Control and Prevention (CDC) und Administrator der Agency for Toxic Substances and Disease Registry
In den letzten Jahren haben Forscher große Fortschritte bei der Anwendung von maschinellem Lernen und künstlicher Intelligenz auf die medizinische Bildgebung gemacht. Ein vielversprechender Bereich ist die Verwendung von tiefen neuronalen Netzen (DNNs) zur Analyse von Ultraschallbildern der Lunge und zur Erkennung von Anzeichen von COVID-19. Für das Training dieser komplexen Modelle sind jedoch große Mengen hochwertiger medizinischer Daten mit genauen Anmerkungen erforderlich, die nur schwer zu beschaffen sind.
Ein Forscherteam der Johns Hopkins University unter der Leitung von Dr. Muyinatu Bell untersuchte verschiedene Strategien für das Training von DNNs zur Erkennung von COVID-19-Merkmalen in Lungen-Ultraschallbildern, wobei sowohl reale Patientendaten als auch simulierte, mit Modellierungssoftware erzeugte Ultraschallbilder verwendet wurden. Ihr Ziel war es, den effektivsten Trainingsansatz zu ermitteln, wenn die realen Daten begrenzt sind, wie es zu Beginn der Pandemie oft der Fall war.
Ihre in der Fachzeitschrift Communications Medicine veröffentlichten Ergebnisse liefern wertvolle Erkenntnisse darüber, wie simulierte medizinische Daten dazu beitragen können, die Einschränkungen beim Training von Deep-Learning-Modellen für Anwendungen im Gesundheitswesen zu überwinden. Mit einer angemessenen Validierung anhand von echten Patientenbeispielen sind simulierte Daten eine vielversprechende Ergänzung oder Alternative zu begrenzten, kommentierten Beispielen aus der realen Welt. Die untersuchten Strategien können dazu beitragen, Anwendungen der künstlichen Intelligenz zur Interpretation medizinischer Scans und zur Unterstützung der Diagnose voranzutreiben.
Ein Hindernis bei der Anwendung von tiefen neuronalen Netzen auf die medizinische Bildanalyse ist die große Menge an qualitativ hochwertigen annotierten Daten, die für das Training komplexer Modelle erforderlich sind. Die manuelle Beschriftung und Kennzeichnung tausender medizinischer Bilder erfordert von Experten einen enormen Zeit- und Arbeitsaufwand. Selbst wenn reale Datensätze gesammelt werden, können Variablen wie Bildqualität, Patientendemografie und Ausrüstung in einer Weise variieren, die die Fähigkeit eines Modells zur Verallgemeinerung beeinträchtigt.
Das Johns Hopkins-Team untersuchte sowohl reale Lungen-Ultraschall-Clips von COVID-19-Patienten als auch simulierte Ultraschallbilder, die mit einer Modellierungssoftware erstellt wurden, um ihre Deep-Learning-Modelle zu trainieren. Die Simulationen ermöglichten die effiziente Generierung einer unbegrenzten Anzahl kommentierter Bilder mit bekannten Grunddaten. Frühere Studien haben jedoch gezeigt, dass simulierte Daten allein aufgrund von Unterschieden zwischen Simulationen und der Realität nicht unbedingt gut auf echte Patientenbeispiele übertragbar sind.
Die Forscher untersuchten sieben verschiedene Strategien für das Training von DNNs zur Segmentierung und Erkennung von B-Linien-Mustern, einem charakteristischen Zeichen für COVID-19 im Lungenultraschall, entweder anhand von realen Daten, simulierten Daten oder Kombinationen:
1. Nur simulierte Daten
2. Nur Datensatz aus der realen Welt
3. Kombination aus 1 und 2
4. Aufteilung des realen Datensatzes (Training auf dem größten Teil, Testen auf einer Teilmenge)
5. Kombination aus 1 und 4
6. Kombination von 2 und 4
7. Kombination aus 1, 2 und 4
Sie testeten die Fähigkeit der einzelnen Strategien, B-Linien in echten Ultraschallclips von COVID-19-Patienten korrekt zu segmentieren. In weiteren Experimenten wurden die Auswirkungen von Bildverbesserungen wie Drehungen und Änderungen des Kontrasts/der Unschärfe untersucht.
Die Studie lieferte mehrere wichtige Erkenntnisse zum effektiven Training von Deep-Learning-Modellen, wenn die medizinischen Daten aus der Praxis begrenzt sind:
- Die Datenerweiterung während des Trainings verbesserte die Leistung des Modells erheblich, insbesondere bei der Segmentierung von B-Linien. Dies trug dazu bei, die Unterschiede zwischen den Verteilungen der Trainings- und der Testdaten auszugleichen.
- Wenn keine realen Daten aus der gleichen Verteilung wie die Testfälle verfügbar waren, funktionierte die Kombination von simulierten und realen Datensätzen aus anderen Bereichen (Strategie 3) am besten und übertraf die Ansätze, die nur auf Simulationen oder nur auf realen Daten basierten.
- Bei der Verwendung von teilweise überlappenden realen Test-/Trainingsdaten (Strategien 4-7) führte die Einbeziehung von simulierten Beispielen zu einer weiteren Verbesserung der Ergebnisse im Vergleich zu realen Beispielen, insbesondere in früheren Trainingsphasen.
- Die Kombination aller Datenquellen (Strategie 7) war am konsistentesten und erforderte weniger Trainingsiterationen als die reinen Ansätze.
- Die ausschließliche Verwendung von realen Daten aus anderen Verteilungen als den Testfällen (Strategie 2) schnitt im Vergleich zu Kombinationen mit Simulationen schlecht ab.
Insgesamt schien die Einbeziehung sorgfältig konstruierter simulierter Daten dazu beizutragen, die Einschränkungen bei vollständig kommentierten Beispielen aus der realen Welt zu beheben, wahrscheinlich durch die Erhöhung der effektiven Größe und Vielfalt der Trainingsdatensätze. Die Einbeziehung von Simulationen verbesserte in einigen Fällen auch die Trainingseffizienz.
Die Ergebnisse liefern wertvolle Hinweise für die effektive Anwendung von realen und simulierten medizinischen Bildgebungsdaten zum Trainieren von Deep-Learning-Modellen - ein wichtiger Bereich, da künstliche Intelligenz ihre Rolle im Gesundheitswesen ausweitet. Zu den wichtigsten Erkenntnissen gehören:
- Simulierte Daten sind eine vielversprechende Ergänzung, wenn nur wenige Beispiele aus der realen Welt zur Verfügung stehen, und verbessern die Leistung im Vergleich zu rein realen Ansätzen.
- Die Kombination von simulierten und realen Daten aus verschiedenen Bereichen funktioniert besser als simulierte Daten allein, was wahrscheinlich auf die größere Vielfalt zurückzuführen ist.
- Die Einbeziehung von Datenerweiterungen während des Trainings trägt dazu bei, die Unterschiede zwischen den verfügbaren Trainings- und den geplanten Testfällen zu verringern.
- Größere, umfassendere simulierte Datensätze können das Training von Modellen ermöglichen, ohne dass vollständig überlappende reale Beispiele benötigt werden.
Künftig könnten realistischere Simulationen, die eine größere klinische Variabilität erfassen, dazu beitragen, dass Deep-Learning-Modelle noch besser verallgemeinert werden können. Eine fortgesetzte Validierung anhand echter Patientenfälle wird ebenfalls wichtig sein. Mit der Entwicklung besserer Tools zur effizienten Generierung annotierter medizinischer Beispiele hat simulationsgestütztes Training das Potenzial, Einschränkungen zu beseitigen und die KI-gestützte Diagnose zu beschleunigen. Insgesamt bietet die Studie einen wertvollen Rahmen für die effektive Nutzung von realen und simulierten Gesundheitsdaten mit Deep Learning.
Hinweis(e)
Klicken Sie auf TAGS, um verwandte Artikel zu sehen:
AI | COVID-19 | DIAGNOSE | MASCHINELLES LERNEN | MEDIZIN | ÖFFENTLICHE GESUNDHEIT | ATEMWEGE | SARS-COV2
- Millions of new solar system objects to be found...on June, 2025 at 1:34 am
Astronomers have revealed new research showing that millions of new solar system objects are likely to be detected by a brand-new facility, which is expected to come online later this year.
- Tea, berries, dark chocolate and apples could...on June, 2025 at 3:50 pm
New research has found that those who consume a diverse range of foods rich in flavonoids, such as tea, berries, dark chocolate, and apples, could lower their risk of developing serious health conditions and have the potential to live longer.
- Being in nature can help people with chronic back...on June, 2025 at 3:50 pm
Researchers asked patients, some of whom had experienced lower back pain for up to 40 years, if being in nature helped them coped better with their lower back pain. They found that people able to spend time in their own gardens saw some health and wellbeing benefits. However, those able to immerse […]
- Scientists say next few years vital to securing...on June, 2025 at 3:50 pm
Collapse of the West Antarctic Ice Sheet could be triggered with very little ocean warming above present-day, leading to a devastating four meters of global sea level rise to play out over hundreds of years according to a new study. However, the authors emphasize that immediate actions to reduce […]
- First direct observation of the trapped waves...on June, 2025 at 3:50 pm
A new study has finally confirmed the theory that the cause of extraordinary global tremors in September -- October 2023 was indeed two mega tsunamis in Greenland that became trapped standing waves. Using a brand-new type of satellite altimetry, the researchers provide the first observations to […]
- DNA floating in the air tracks wildlife, viruses...on June, 2025 at 3:48 pm
Environmental DNA from the air, captured with simple air filters, can track everything from illegal drugs to the wildlife it was originally designed to study.