IMDRF : guide pour le cycle de vie d’un DM IA
Publication d’un guide IMDRF, version draft : Technical Framework for Artificial Intelligence Life Cycle Management, ce guide ne crée pas une nouvelle réglementation, il propose un cadre pour aider les fabricants de DM intégrant de l’IA (IA-DM).
Un document pensé pour le cycle de vie complet
Le texte s’adresse d’abord aux fabricants. Il couvre l’ensemble du cycle de vie de l’IA-DM : planification, données utilisées, construction du modèle, vérification et validation, déploiement, surveillance, performance en vie réelle et retrait du produit.
Son premier apport utile est de distinguer clairement le modèle et le dispositif médical intégrant ce modèle. Cette séparation est essentielle, un modèle peut afficher de bonnes performances sur un jeu de données sans que le dispositif complet soit démontré comme sûr et efficace dans un usage clinique réel.
Le document rappelle ainsi qu’il faut éviter de confondre :
- validation externe du modèle,
- vérification du logiciel ou du dispositif,
- évaluation clinique, et
- surveillance post-market.
Autre point fort : le texte replace l’IA dans le l’usage clinique réel. Il ne s’intéresse pas seulement à la performance technique, mais à la manière dont le dispositif est utilisé, compris, supervisé et intégré dans l’environnement de soin.
Les apports les plus distinctifs
Le document n’est pas révolutionnaire sur chaque sujet pris isolément. Les notions de biais, robustesse, traçabilité ou encore cybersécurité sont déjà connues. En revanche, il apporte une charpente cohérente pour piloter un DM intégrant de l’IA.
Premier apport distinctif : la place donnée aux concepts transverses sur tout le cycle de vie. Le texte met en avant 4 piliers continus :
- Système de Management de la Qualité
- Gestion des Risques
- Supervision Humaine
- Cybersécurité
Deuxième apport important : la prise en compte de la relation humain-IA. Le draft ne se contente pas de parler de supervision humaine en principe. Il relie cette supervision à des risques concrets : automation bias, sous-confiance, fatigue de vérification, surcharge informationnelle ou perte progressive de compétence.
Troisième apport utile : différencier le suivi opérationnel continu, souvent automatisé, d’une analyse plus structurée de la performance du dispositif en conditions réelles, avec ses implications en matière de sécurité, d’efficacité et d’utilité clinique.
Enfin, le document a le mérite de traduire des sujets complexes d’IA en objets pilotables via un QMS : traçabilité des données, gestion des versions, contrôle des modèles tiers, suivi des changements, surveillance des performances et gouvernance post-déploiement.
Les améliorations les plus prioritaires
Le draft est trop descriptif pour servir de guide vraiment opérationnel.
La priorité numéro un est de mieux clarifier la taxonomie des modèles visés. Le texte mentionne des modèles verrouillés, adaptatifs, génératifs, personnalisés, localisés ou tiers, mais sans toujours relier clairement ces catégories aux conséquences en matière de validation, de documentation, de surveillance ou de gestion des changements. Une taxonomie unifiée, associée à des attentes minimales par type de modèle, rendrait le document beaucoup plus exploitable.
Deuxième priorité : rendre la gestion des risques plus opérationnelle. Le draft identifie bien les grandes familles de risques propres à l’IA, mais il serait utile de structurer les attentes autour d’éléments concrets : source de danger, situation dangereuse, dommage, contrôle, méthode de détection et preuve d’efficacité.
Troisième priorité : mieux encadrer la gestion post-market. Le document distingue bien validation, monitoring et performance en vie réelle, mais il manque encore de critères explicites de passage et de décision. En pratique, les fabricants auraient besoin de repères plus clairs sur :
- les critères d’entrée et de sortie des étapes
- les indicateurs minimaux à suivre en post-market
- les seuils d’alerte déclenchant revue, recalibrage, rollback ou suspension
- la typologie des changements nécessitant une nouvelle évaluation
Enfin, la partie transparence et labelling gagnerait à être mieux structurée selon les publics visés : autorités, établissements de santé, utilisateurs professionnels, patients ou équipes IT.
En bref
La force du guide n’est pas d’inventer tous les concepts, mais de les organiser dans une logique de cycle de vie complète, beaucoup plus proche de la réalité fabricant.
Pour devenir pleinement actionnable, il doit maintenant aller plus loin sur la standardisation des pratiques.