Les causes de l’augmentation actuelle du nombre de cancers dans le monde peuvent être expliquées en partie par les modifications de nos comportements et de notre environnement. Dans l’objectif d’adapter les politiques de prévention et les moyens de santé, les données épidémiologiques sur la prévalence du cancer sont primordiales. Cependant, les registres épidémiologiques actuellement disponibles sont incomplets et pour de vastes régions, nous ne disposons d’aucune évaluation. Ce constat a été à l’origine d'un projet de recherche réalisé dans le laboratoire d’Intelligence Artificielle appliquée à la Médecine de l’Université de Stanford (Palo Alto, États-Unis). Nous avons utilisé une méthodologie d’analyse d’image satellitaire pour prédire la prévalence du cancer dans les 10 villes américaines les plus peuplées.

L'étude a récemment été reprise en une du Figaro dans un très bel article intitulé : "Quand la santé des hommes se devine depuis l’espace".

 

A gauche la carte du cancer à Los Angeles, à droite la carte telle que prédite par l'IA

 

En utilisant des images de Google Maps et les registres épidémiologiques du cancer du Center for Disease Control (CDC) américain, nous avons vérifié que le Deep Learning permettait d’obtenir une estimation précise de la prévalence du cancer. Nous avons utilisé une approche de transfer learning : un réseau neuronal profond, ResNet50, entraîné pour la reconnaissance d’objet sur la base d’images ImageNet, a été choisi pour extraire des variables numériques d’images satellitaires de 224x224 pixels, en récupérant le vecteur de l’avant-dernière couche du réseau (celle située avant la couche réalisant la classification). Nous avons ensuite créé un modèle de régression ElasticNet pour corréler ces variables à la prévalence. Le choix des hyperparamètres du modèle a été réalisé selon une méthodologie de GridSearch cross-validée. Nous avons vérifié que le modèle était capable de prédire correctement la prévalence sur une ville différente de celle sur laquelle il avait été entraîné. Au total, 170210 images ont été traitées, couvrant 14 millions d’habitants. Notre méthode permet de prédire jusqu’à 64,37% (+/- 6,05%) de la variation de la prévalence du cancer, avec une mean squared error de 0,96 (+/- 0,23). Notre étude est la première à démontrer que le Deep Learning peut être utilisé sur des images satellitaires non labellisées pour prédire la prévalence du cancer. Cette méthode pourrait également être utilisée en Europe afin de mieux caractériser la distribution spatiale du cancer. Enfin, ce type de méthode pourrait être appliqué à d’autres maladies dont l’épidémiologie est liée à l’environnement.

L'article scientifique publié dans Cancers est disponible en accès libre gratuit à cette adresse :

https://www.mdpi.com/2072-6694/12/12/3844

Pr Jean-Emmanuel Bibault
Oncologue radiothérapeute
twitter.com/jebibault
01 56 09 34 03


Service d'oncologie radiothérapie
Hôpital Européen Georges Pompidou
Assistance Publique - Hôpitaux de Paris
20 rue Leblanc
75015 Paris