Prédire le risque de cancer grâce aux dossiers médicaux numériques

mai 2024

Chaque jour, nous laissons des traces de notre vie dans les systèmes numériques. Qu'il s'agisse de recherches en ligne, de localisation, de dossiers médicaux ou de demandes d'indemnisation, de grandes quantités de données personnelles sont collectées et stockées. Si les préoccupations en matière de protection de la vie privée sont nombreuses, cette numérisation de la vie quotidienne offre également de nouvelles possibilités pour la recherche médicale. Les scientifiques puisent désormais dans les bases de données nationales des dossiers médicaux électroniques pour obtenir des informations qui étaient auparavant impossibles à obtenir. L'un des domaines prometteurs est la prédiction du risque de cancer, qui pourrait contribuer à améliorer la détection précoce et le dépistage ciblé. 
 
Le cancer reste l'une des principales causes de décès dans le monde. Si le dépistage et la détection précoce ont permis de réduire la mortalité pour certains cancers courants comme ceux du sein et du côlon, beaucoup d'autres passent encore inaperçus jusqu'à ce qu'ils aient atteint un stade avancé. Les nouveaux tests de biopsie liquide, qui peuvent potentiellement détecter plusieurs types de cancer à partir d'une simple prise de sang, promettent une approche de dépistage plus pratique. Toutefois, ces tests de dépistage de plusieurs types de cancer doivent être mis en œuvre avec précaution pour en tirer le meilleur parti. Un dépistage non sélectif de la population pourrait donner lieu à de nombreux résultats faussement positifs et à des suivis invasifs inutiles. Une approche plus ciblée, basée sur le risque individuel de cancer, pourrait rendre les programmes de dépistage plus rentables.
 
C'est là que les données numériques sur la santé entrent en jeu. À mesure que les informations médicales sont numérisées, l'historique de la santé de populations entières s'accumule dans des bases de données nationales. Les chercheurs exploitent désormais ces vastes ensembles de données sur les soins de routine afin de mieux comprendre les schémas de maladie et de développer des modèles prédictifs. Une récente étude à grande échelle menée par des chercheurs danois et allemands a adopté cette approche pour la prédiction du risque de cancer. Ils ont élaboré des modèles à partir des données des registres nationaux couvrant plus de 6,7 millions de Danois et de leurs antécédents médicaux remontant à plusieurs dizaines d'années. Les résultats suggèrent que les dossiers médicaux numériques sont prometteurs pour le dépistage personnalisé du cancer en fonction des profils de risque individuels.
 
Puissance des données
 
Les chercheurs ont exploité cinq bases de données sanitaires danoises contenant des informations sur les visites à l'hôpital, les diagnostics, les décès, les cancers et les dossiers médicaux en texte libre provenant des soins secondaires. Ensemble, ces bases de données couvrent 60 millions de visites à l'hôpital, 90 millions de diagnostics et 193 millions d'années de vie de suivi pour la population danoise entre 1978 et 2018.
 
À partir de cette mine de données réelles, l'équipe a distillé plus de 1 300 variables pour chaque individu, y compris les diagnostics, les antécédents familiaux de cancer et les données extraites du texte sur les facteurs liés au mode de vie. Elle a ensuite utilisé des techniques de modélisation statistique pour déterminer comment ces différents facteurs personnels et de santé interagissaient et influençaient les risques de 20 grands types de cancer. Les modèles ont été entraînés à partir des données des registres collectées jusqu'en 2014 et validés sur l'incidence du cancer au cours des années suivantes, ce qui permet de faire des prédictions prospectives.
 
Les résultats ont démontré que ces bases de données numériques sur la santé peuvent fournir une multitude d'informations sur les risques de cancer. Les modèles de prédiction ont permis une bonne discrimination, c'est-à-dire qu'ils ont généralement réussi à distinguer les personnes qui ont développé un cancer de celles qui n'en ont pas développé. Les performances étaient comparables à celles des modèles existants conçus pour les différents types de cancer. Les risques ont été associés non seulement aux antécédents familiaux et aux facteurs de risque connus, mais aussi à des schémas de diagnostics antérieurs, ce qui met en évidence les interconnexions entre les maladies.
 
Transfert des risques 
 
La validation des prédictions de cancer dans différents systèmes de soins de santé et populations est un test important. Pour déterminer si les profils de risque danois pouvaient être transférés au niveau international, les chercheurs ont évalué leurs modèles sur les données génétiques et sanitaires de la biobanque britannique, qui couvre plus de 377 000 personnes.
 
Il est remarquable que les prédictions de risque de cancer se soient bien généralisées entre les deux pays malgré les différences en matière de soins de santé et de caractéristiques de la population. La discrimination est restée élevée et l'étalonnage, c'est-à-dire le degré de concordance entre les risques prédits et les taux réels, a été similaire après prise en compte des changements démographiques. Cela suggère que les dossiers médicaux numériques contiennent des informations sur les risques transférables au-delà d'un système unique. Moyennant des validations appropriées, les modèles élaborés à partir d'une population pourraient potentiellement être appliqués à de nouveaux contextes.
 
L'un des principaux avantages est que les ensembles de données électroniques nationaux ont permis de quantifier les risques de cancer à l'échelle de la population sans s'appuyer sur des informations autodéclarées ou collectées de manière sélective. Les principaux facteurs d'influence identifiés - tels que la consommation d'alcool, les antécédents en matière de procréation, la taille et le poids - correspondent bien aux connaissances établies en matière de risque de cancer. Axée sur les données, cette approche permet également de mettre en évidence des liens inattendus qui méritent d'être étudiés, comme le rôle des affections liées au système immunitaire.
 
Améliorer le dépistage
 
Bien qu'une validation plus poussée soit encore nécessaire, ces modèles numériques de prédiction des risques pourraient à terme soutenir des approches ciblées de dépistage du cancer. À mesure que les tests sanguins multicancéreux passent du stade de la recherche à celui de l'utilisation dans le monde réel, leur application sélective en fonction des profils de risque personnels pourrait maximiser leurs avantages. Les personnes à haut risque pourraient être dépistées plus fréquemment ou à un âge plus jeune, tandis que les groupes à faible risque pourraient avoir besoin de tests moins fréquents pour équilibrer les coûts et le fardeau des patients.
 
Les modèles peuvent également renforcer les programmes de dépistage existants. Pour les cancers dont le dépistage est bien établi, comme le cancer du sein et du côlon, les scores de risque pourraient aider à déterminer les personnes qui auraient le plus intérêt à commencer le dépistage plus tôt ou à se faire tester plus souvent. Et pour les cancers actuellement non couverts, comme le cancer du pancréas ou de l'ovaire, ces modèles pourraient éventuellement aider à établir des priorités quant aux personnes à qui proposer les nouvelles modalités de dépistage dans un premier temps.
 
Bien entendu, un tel "dépistage de précision" s'accompagne de défis à relever. Il sera important de garantir un accès équitable à l'ensemble des populations, car tous les groupes ne sont pas représentés de manière égale dans les données sanitaires de routine. De plus, les prédictions de risque ne sont pas des diagnostics définitifs - les faux positifs doivent être gérés avec soin. Grâce à l'amélioration continue des modèles au fil du temps, les dossiers médicaux électroniques sont prometteurs en tant que source non invasive de renseignements sur les risques dans le "monde réel", en complément des informations génétiques et des informations sur le mode de vie. À mesure que la numérisation transforme les soins de santé, les approches fondées sur les données massives (big data) pourraient personnaliser le dépistage du cancer d'une manière qui n'était pas possible jusqu'à présent.
 

Référence(s)

  1. Alexander W Jung, Peter C Holm, Kumar Gaurav, Jessica Xin Hjaltelin, Davide Placido, Laust Hvas Mortensen, Ewan Birney, S⊘ren Brunak, Moritz Gerstung. Stratification des risques multicancéreux basée sur les données nationales de santé : une étude rétrospective de modélisation et de validation. The Lancet Digital Health, 2024 ; 6 (6) : e396 DOI : 10.1016/S2589-7500(24)00062-1.
  2.  

 

Cliquez sur TAGS pour voir les articles connexes :

DIAGNOSTIC | SANTÉ NUMÉRIQUE | MÉDECINE | ONCOLOGIE | SANTÉ PUBLIQUE

A propos de l'auteur

  • Dilruwan Herath

    Dilruwan Herath est un médecin britannique spécialisé dans les maladies infectieuses et un cadre médical dans l'industrie pharmaceutique, avec plus de 25 ans d'expérience. En tant que médecin, il s'est spécialisé dans les maladies infectieuses et l'immunologie, en mettant résolument l'accent sur l'impact sur la santé publique. Tout au long de sa carrière, le Dr Herath a occupé plusieurs postes de direction médicale dans de grandes entreprises pharmaceutiques mondiales, menant des changements cliniques transformateurs et garantissant l'accès à des médicaments innovants. Il est actuellement membre expert du comité des maladies infectieuses de la faculté de médecine pharmaceutique et continue de conseiller les entreprises du secteur des sciences de la vie. Lorsqu'il n'exerce pas la médecine, le Dr Herath aime peindre des paysages, les sports mécaniques, la programmation informatique et passer du temps avec sa jeune famille. Il s'intéresse de près à la science et à la technologie. Il est EIC et fondateur de DarkDrug.

L'épingler sur Pinterest

DarkDrug

GRATUIT
VIEW