Maladie de système, Médecine interne
Publié le 18 nov 2024Lecture 3 min
L’intelligence artificielle au service du diagnostic des sous-types de lupus cutané ?
François CHASSET, service de dermatologie et allergologie, Hôpital Tenon, Paris
L’évaluation des performances de l’intelligence artificielle en dermatologie est bien évidemment un sujet d’actualité. Une équipe chinoise vient de réaliser une étude qui a évalué un algorithme de deep learning dans l’aide au diagnostic de sous-types de lupus cutané. Analyse critique des résultats.
Le lupus cutané est une maladie auto-immune rare qui peut se présenter comme une maladie dermatologique isolée ou être associée à un lupus systémique. La prévalence est globalement de 3-4 pour 100 000 habitants. Le lupus cutané est divisé en plusieurs sous-types, la classification la plus utilisée reste celle de Gilliam et Sontheimer, qui divise le lupus cutané en aigu, subaigu et chronique ; le lupus chronique étant divisé en lupus discoïde, panniculite lupique, engelure et tumidus. Le sous-type de lupus conditionne l’atteinte systémique, le risque de progression d’un lupus cutané isolé, le risque de cicatrice et, bien sûr, les diagnostics différentiels en fonction de ces derniers. Aussi, le diagnostic précis des sous-types de lupus est un enjeu clinique difficile. L’utilisation de la biopsie cutanée est souvent nécessaire.
Il existe des avancées majeures dans le domaine de l’intelligence artificielle, et ces progrès ont permis le développement d’algorithmes par apprentissage profond (deep learning). Ils ont montré depuis plusieurs années des performances globalement équivalentes à celles des dermatologues pour le diagnostic de dermatoses fréquentes. Dans ce travail, les auteurs ont évalué la performance d’un algorithme de deep learning multifocal, c’est-à-dire utilisant les photographies, des données cliniques, biologiques, histologiques et immunohistochimiques. Il s’agit d’une étude chinoise, réalisée dans 25 services de dermatologie de Chine. Dans une première partie, 382 patients atteints de lupus cutané ou de diagnostics différentiels fréquents (eczéma, psoriasis, lichen plan, vascularite, érythème polymorphe, rosacée, dermatomyosite) ont été inclus dans un set d’entraînement (training set) et de validation (validation set). Puis une cohorte de validation de 64 cas (external validation set) a été utilisée pour permettre la généralisation des résultats. Les données incluses étaient les photographies cliniques, les données cliniques, biologiques, immunologiques, histologiques, et immunohistochimiques incluant un immunomarquage CD4+, CD8+, CD11b, CD19 et DAPI.
Au total, 446 patients incluant 800 photographies cliniques, et 3 786 images d’immunohistochimie ont été analysés. Différents algorithmes de deep learning ont été utilisés pour extraire les informations des photographies (ResNet-18 algorithm) et des données d’immunohistochimie (EfficientNet-B3 algorithm). Sur les 13 diagnostics, l’algorithme utilisant les photographies, les données cliniques et l’immunohistochimie obtenait les meilleures performances : sensibilité 83 %, spécificité 99 %, précision 85 %, aire sous la courbe de la courbe ROC 98 %.
Afin de montrer l’intérêt potentiel d’un tel outil, les 64 cas de validation externe ont été soumis à dix internes de dermatologie qui pouvaient dans un premier temps accéder aux images cliniques, aux données biologiques et au résultat du compte rendu anatomopathologique. Les internes devaient proposer un diagnostic parmi les 13 diagnostics proposés, puis dans un deuxième temps ils pouvaient avoir accès aux propositions de l’algorithme de deep learning multifocal et réviser leur conclusion. Dans cet exercice, la performance diagnostique augmentait de 67 % (écart type 7 %) à 81 % (écart type 4 %) soit une amélioration de la performance diagnostique de 14 % (p = 0,004).
CONCLUSION ET AVIS DES EXPERTS
Cette étude suggère qu’un algorithme de deep learning utilisant des données cliniques, biologiques et immunohistochimiques pourrait permettre d’améliorer les performances diagnostiques des sous-types de lupus cutané. Il est important de noter que les études précédentes de cette même équipe sur l’algorithme de deep learning utilisant uniquement les photographies avaient été critiquées avec un doute sur la validité des résultats (PMID : 33872714) en particulier compte tenu du faible nombre de patients inclus pour le set d’entraînement. Dans cette même étude, le nombre de patients inclus paraît également très faible compte tenu du nombre de diagnostics différentiels évalués.
À titre de comparaison, un article publié dans Nature Medicine en 2020 qui montrait qu’un algorithme de deep learning permettait d’obtenir des performances équivalentes à des dermatologues parmi 26 dermatoses inflammatoires fréquentes avait nécessité un entraînement sur 16 000 photographies (PMID : 32424212) contre seulement 800 dans ce travail pour 13 maladies rares de diagnostics difficiles. Par ailleurs, la nécessité d’inclure les données d’immunohistochimie semble cohérente avec la nécessité fréquente d’avoir recours à l’histologie pour le diagnostic de lupus cutané mais rend la généralisation de cet outil plus difficile. Des études de validations sur des cohortes externes internationales semblent nécessaires avant d’envisager l’utilisation de tels outils. Ces outils seront néanmoins probablement d’une aide précieuse dans un futur proche.
Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.
pour voir la suite, inscrivez-vous gratuitement.
Si vous êtes déjà inscrit,
connectez vous :
Si vous n'êtes pas encore inscrit au site,
inscrivez-vous gratuitement :