AI | Détection du COVID-19 dans les poumons grâce à l'apprentissage profond
"J'encourage les parents à consulter leur médecin pour savoir comment protéger leurs enfants contre une maladie grave due au VRS, en utilisant soit un vaccin administré pendant la grossesse, soit une vaccination contre le VRS administrée à votre bébé après la naissance.
Directeur des Centres de contrôle et de prévention des maladies (CDC) et administrateur de l'Agence pour les substances toxiques et le registre des maladies
Au cours des dernières années, les chercheurs ont fait de grands progrès dans l'application de l'apprentissage automatique et de l'intelligence artificielle à l'imagerie médicale. L'un des domaines prometteurs est l'utilisation de réseaux neuronaux profonds (RNP) pour analyser les images d'échographie pulmonaire et détecter les signes de COVID-19. Cependant, l'entraînement de ces modèles complexes nécessite de grandes quantités de données médicales de haute qualité avec des annotations précises, ce qui peut être difficile à obtenir.
Une équipe de chercheurs de l'université Johns Hopkins, dirigée par le Dr Muyinatu Bell, a étudié différentes stratégies d'entraînement des DNN pour détecter les caractéristiques du COVID-19 dans les échographies pulmonaires en utilisant à la fois des données de patients réels et des images d'échographie simulées générées avec un logiciel de modélisation. Leur objectif était de déterminer l'approche de formation la plus efficace lorsque les données réelles sont limitées, comme c'était souvent le cas au début de la pandémie.
Leurs conclusions, publiées dans la revue Communications Medicine, fournissent des indications précieuses sur la manière dont les données médicales simulées peuvent aider à remédier aux limites de la formation des modèles d'apprentissage profond pour les applications de soins de santé. Avec une validation appropriée à l'aide d'exemples de patients réels, les données simulées sont prometteuses en tant que complément ou alternative aux exemples réels annotés limités. Les stratégies explorées peuvent contribuer à faire progresser les applications de l'intelligence artificielle pour interpréter les scanners médicaux et aider au diagnostic.
L'un des obstacles à l'application des réseaux neuronaux profonds à l'analyse des images médicales est la grande quantité de données annotées de haute qualité nécessaires à l'entraînement de modèles complexes. L'annotation et l'étiquetage manuels de milliers d'images médicales demandent aux experts énormément de temps et d'efforts. Même lorsque des ensembles de données réelles sont collectés, des variables telles que la qualité de l'image, les caractéristiques démographiques du patient et l'équipement peuvent varier de telle sorte que la capacité de généralisation d'un modèle s'en trouve affectée.
L'équipe de Johns Hopkins a étudié la possibilité d'utiliser à la fois des clips d'échographie pulmonaire du monde réel provenant de patients COVID-19 et des images d'échographie simulées générées à l'aide d'un logiciel de modélisation pour entraîner leurs modèles d'apprentissage profond. Les simulations ont permis de générer efficacement un nombre illimité d'images annotées, avec des vérités de base connues. Cependant, des études antérieures ont montré que les données simulées seules n'étaient pas nécessairement bien transférées aux exemples de patients réels en raison des différences de domaine entre les simulations et la réalité.
Les chercheurs ont étudié sept stratégies différentes pour entraîner les DNN à segmenter et à détecter les lignes B, signe distinctif du COVID-19 dans les échographies pulmonaires, en utilisant des données réelles, des données simulées ou des combinaisons de données :
1. Données simulées uniquement
2. Ensemble de données réelles uniquement
3. Combinaison de 1 et 2
4. Fractionnement de l'ensemble de données réelles (formation sur la plus grande partie, test sur un sous-ensemble)
5. Combinaison de 1 et 4
6. Combinaison de 2 et 4
7. Combinaison de 1, 2 et 4
Ils ont testé la capacité de chaque stratégie à segmenter correctement les lignes B dans des clips échographiques réels provenant de patients atteints de la maladie COVID-19. Des expériences supplémentaires ont exploré l'impact des augmentations d'images telles que les rotations et les modifications du contraste/de l'effet de flou.
L'étude a produit plusieurs résultats importants sur la formation efficace des modèles d'apprentissage profond lorsque les données médicales du monde réel sont limitées :
- L'augmentation des données au cours de la formation a permis d'améliorer de manière significative les performances du modèle, en particulier pour la segmentation des lignes B. Cela a permis de remédier aux différences entre les distributions des données d'entraînement et des données de test.
- Lorsque des données réelles provenant de la même distribution que les cas de test n'étaient pas disponibles, la combinaison d'ensembles de données simulées et réelles provenant d'autres domaines (stratégie 3) a donné les meilleurs résultats, surpassant les approches simulées uniquement ou réelles uniquement.
- Lorsque des données réelles de test/formation se chevauchant partiellement ont été utilisées (stratégies 4 à 7), l'inclusion d'exemples simulés a encore amélioré les résultats par rapport aux données réelles uniquement, en particulier dans les premières étapes de la formation.
- La combinaison de toutes les sources de données (stratégie 7) a obtenu les meilleurs résultats tout en nécessitant moins d'itérations de formation que les approches basées uniquement sur des données réelles.
- Le fait de s'appuyer uniquement sur des données réelles provenant de distributions différentes de celles des cas de test (stratégie 2) a donné des résultats médiocres par rapport aux combinaisons avec des simulations.
Dans l'ensemble, l'intégration de données simulées soigneusement construites semble contribuer à remédier aux limites des exemples réels entièrement annotés, probablement en augmentant la taille et la diversité des ensembles de données d'entraînement. L'inclusion de simulations a également amélioré l'efficacité de la formation dans certains cas.
Les résultats fournissent des indications précieuses sur l'application efficace de données d'imagerie médicale réelles et simulées pour former des modèles d'apprentissage profond - un domaine crucial à mesure que l'intelligence artificielle étend son rôle dans les soins de santé. Parmi les principaux enseignements, citons :
- Les données simulées sont prometteuses en tant que complément lorsque les exemples réels sont limités, car elles améliorent les performances par rapport aux approches basées uniquement sur des données réelles.
- La combinaison de données simulées et réelles provenant de différents domaines donne de meilleurs résultats que la simulation seule, probablement en raison de la diversité croissante.
- L'inclusion de données supplémentaires pendant la formation permet de réduire les différences entre la formation disponible et les cas d'essai prévus.
- Des ensembles de données simulées plus importants et plus complets peuvent permettre d'entraîner des modèles sans avoir besoin d'exemples réels se chevauchant entièrement.
À l'avenir, des simulations plus réalistes qui tiennent compte d'une plus grande variabilité clinique pourraient aider les modèles d'apprentissage profond à se généraliser encore mieux. La poursuite de la validation à l'aide de cas de patients réels sera également importante. Alors que de meilleurs outils émergent pour générer efficacement des exemples médicaux annotés, la formation augmentée par simulation offre la possibilité de remédier aux limitations et d'accélérer le diagnostic assisté par l'IA. Dans l'ensemble, l'étude fournit un cadre précieux pour exploiter efficacement les données de santé réelles et simulées avec l'apprentissage profond.
Référence(s)
Cliquez sur TAGS pour voir les articles connexes :
AI | COVID-19 | DIAGNOSTIC | APPRENTISSAGE AUTOMATIQUE | MÉDECINE | SANTÉ PUBLIQUE | RESPIRATOIRE | SARS-COV2
- Millions of new solar system objects to be found...on June, 2025 at 1:34 am
Astronomers have revealed new research showing that millions of new solar system objects are likely to be detected by a brand-new facility, which is expected to come online later this year.
- Tea, berries, dark chocolate and apples could...on June, 2025 at 3:50 pm
New research has found that those who consume a diverse range of foods rich in flavonoids, such as tea, berries, dark chocolate, and apples, could lower their risk of developing serious health conditions and have the potential to live longer.
- Being in nature can help people with chronic back...on June, 2025 at 3:50 pm
Researchers asked patients, some of whom had experienced lower back pain for up to 40 years, if being in nature helped them coped better with their lower back pain. They found that people able to spend time in their own gardens saw some health and wellbeing benefits. However, those able to immerse […]
- Scientists say next few years vital to securing...on June, 2025 at 3:50 pm
Collapse of the West Antarctic Ice Sheet could be triggered with very little ocean warming above present-day, leading to a devastating four meters of global sea level rise to play out over hundreds of years according to a new study. However, the authors emphasize that immediate actions to reduce […]
- First direct observation of the trapped waves...on June, 2025 at 3:50 pm
A new study has finally confirmed the theory that the cause of extraordinary global tremors in September -- October 2023 was indeed two mega tsunamis in Greenland that became trapped standing waves. Using a brand-new type of satellite altimetry, the researchers provide the first observations to […]
- DNA floating in the air tracks wildlife, viruses...on June, 2025 at 3:48 pm
Environmental DNA from the air, captured with simple air filters, can track everything from illegal drugs to the wildlife it was originally designed to study.