L'Intelligence Artificielle vs l'Humain dans le diagnostic des plaies
L’Intelligence Artificielle (IA) ouvre de nouvelles perspectives dans la détection des signes cliniques de complications de la cicatrisation. Mais l’IA est-elle réellement capable de surpasser l’humain ?
L’évaluation des plaies et la détection de leurs complications dépendent fortement de l’expertise humaine. Celle-ci varie selon la formation du professionnel de santé (PDS), son expérience, sa confiance dans son diagnostic ou encore selon qu’il ait ou non orienté sa pratique vers la prise en charge des plaies. Cette variabilité doit impérativement être prise en compte lorsqu’on compare les performances humaines à celles d’un modèle d’IA.
Cette étude est la première à comparer les performances d’un modèle d’IA à celles des PDS en fonction de leurs caractéristiques professionnelles pour l’établissement du diagnostic de la macération de plaies chroniques.
L’analyse a porté sur 30 images de plaies d’ulcères de jambe (15 avec macération, 15 sans), préalablement sélectionnées par un groupe d’experts.
481 PDS ont évalué ces images et leur expertise a été classée selon plusieurs critères :
- Parcours professionnel:
- Qualification pertinente : dermatologistes ou infirmiers certifiés en soins des plaies
- Qualification non pertinente : autres médecins/infirmiers sans formation spécialisée en soins des plaies
- Expérience professionnelle:
- Courte < 5 ans
- Longue > 5 ans
- Confiance dans son diagnostic:
- Evaluée à l’aide d’une échelle de 10 points, puis dichotomisée (faible vs élevée).
- Secteur de soins:
- Ambulatoire
- Hospitalier
Les performances du modèle d’IA ont été comparées à celles des PDS selon trois indicateurs : précision, sensibilité et spécificité.
- La précision reflète la performance globale (diagnostic correct de présence ou absence de macération)
- La sensibilité mesure la capacité à détecter correctement une macération
- La spécificité mesure la capacité à reconnaitre une absence de macération
Voici les résultats bruts :

D’un point de vue descriptif, le modèle d’IA surpasse les performances humaines.

Mais, les comparaisons statistiques montrent que les différences sont significatives uniquement dans certains sous-groupes.

Ainsi, les performances de l’IA se révèlent significativement supérieures à celles des PDS :
- Possédant une expérience professionnelle inférieur à 5 ans
- Sans qualification pertinente dans le soin des plaies
- Ayant une faible confiance dans son diagnostic
Une analyse de régression linéaire multiple a également été réalisée permettant d’identifier les facteurs influant la précision du diagnostic des PDS.
Deux variables apparaissent significativement associées à une meilleure performance :
- Une qualification pertinente dans le soin des plaies
- Une confiance élevée dans son diagnostic
Les autres facteurs étudiés n’ont pas montré d’effet significatif.
Ces résultats indiquent que la qualité de la formation et la confiance dans son diagnostic constituent les principaux déterminants de la performance du diagnostic des PDS.
Ces résultats suggèrent que l’IA n’a pas vocation à remplacer l’humain, mais à soutenir les PDS les moins expérimentés ou les moins spécialisés, pour améliorer la fiabilité du diagnostic.
Enfin, bien que les modèles d’IA puissent être entraînés sur des ensembles de données riches, il reste difficile d’y intégrer les informations contextuelles ou intuitives (état général du patient, comorbidité associée…) dont disposent les PDS.
Ainsi, l’IA doit être envisagée avant tout comme un outil d’aide à la décision clinique, complémentaire à l’expertise humaine.
Références
- Kücking, F., Hübner, U. H., & Busch, D. (2025). Diagnostic accuracy differences in detecting wound maceration between humans and artificial intelligence: The role of human expertise revisited. Journal of the American Medical Informatics Association, 32(9), 1425-1433. https://doi.org/10.1093/jamia/ocaf116