Big data dans le domaine de la cancérologie

Dr A. Livartowski Institut Curie, Paris, France

Les entrepôts de données permettent de stocker des données structurées, des textes voire des images dans le but est de développer la recherche clinique et translationnelle et demain, peut-être, pour être utilisées comme outil d’aide à la décision en clinique. Le projet ConSoRe (pour Continuum – soins – recherche) des Centre de Lutte contre le Cancer, en cours de déploiement avec l’objectif de répondre à ces challenges dans le domaine du cancer.

Ces projets sont rendus possibles pour trois raisons : la première raison est que les hôpitaux ont amassé une masse considérable d’informations cliniques que ce soient des textes ou des images. A titre d’exemple, l’Institut Curie dispose des dossiers cliniques numériques (texte et image) depuis 2000 avec un suivi longitudinal de plus de 100.000 patients atteints de cancers totalisant plus de 10.000.000 de documents. La deuxième raison est liée aux progrès technologiques en informatique qui permet de disposer d’une puissance de calcul et d’outils permettant d’exploiter ces données. Enfin, les progrès en intelligence artificielle ouvrent des possibilités nouvelles dans le traitement automatique des textes et des images.

Les objectifs de ces entrepôts sont de pouvoir poser toute sorte de question de façon simple et intuitive avec la possibilité d’extraire des données structurées en vue de les partager entre structures hospitalières et de recherche. Surtout, ces grands volumes de données vont permettre de bénéficier de la révolution et des perspectives dites du Big data : les réseaux neuronaux profonds, les techniques dites de machine learning ou de deep learning. La question est de savoir comment générer de la connaissance à partir des données recueillies en « vie réelle ».

Il devient aisé de disposer d’une liste de patients ou de rechercher des spécimens biologiques cryo-conservés sur de multiples critères. Demain, on pense que ces outils permettront une aide au diagnostic, une meilleure prédiction statistique de l’évolution, pourront faciliter l’inclusion dans les essais, retrouver des cas identiques ou des cas similaires. Sur le plan de la santé publique, les retombées sont les alertes sanitaires, la pharmaco-vigilance et la matério-vigilance et des recherches en épidémiologie. Un des intérêts majeurs par rapport aux études cliniques est de disposer de données « en vie réelle », par exemple sur la consommation médicamenteuse pour étudier l’impact des co-médications.

Pour autant, tous les problèmes ne sont pas réglés. Par exemple, pour les techniques de de machine learning, il faut déterminer les bases d’apprentissage car les bases de données d’entraînement varient très vite : les nouveaux traitements changent l’histoire du cancer et la classification des cancers est évolutive. D’autres points de vigilance apparaissent : comment assurer l’appropriation par les médecins ? Comment assurer la visualisation des résultats ? Quelle confiance apportée aux prévisions ? Comment aborder les nombreuses questions éthiques et assurer la protection des personnes malades ? Quels rôles va jouer la puissance publique et comment les citoyens seront les partenaires pour que cela soit vécu comme un progrès et non un danger ?

Ces entrepôts multi-sources et multi-formats permettent la constitution de cohortes, la coopération inter-centres et l’utilisation de toutes les données de l’ensemble du système d’information hospitalier (SIH) pour identifier de nouvelles hypothèses. Les enseignements du projet ConSoRe d’UNICANCER ont montré qu’il était possible de créer un entrepôt sans modifier les SIH et d’interroger données structurées et non structurées. Les performances sont étonnantes, de l’ordre de la seconde, performances « à la Google » et permettent d’interroger à distance les autres CLCC.

Visionner la conférence

Forum de discussion

Le GERPAC met à disposition des adhérents à jour de leur cotisation un forum dédié spécifiquement aux discussions sur la PHARMACOTECHNIE

Aller au forum

GERPAC
Association Loi 1901
Siège social : Chez Jean-Yves Jomier / 8ter rue Léon Bussat, 64000 PAU
Immatriculation formation N° 72 64 035 30 64
Contacts Mentions légales - Gestion des données personnelles