Alors que l’IA générative en santé donne déjà lieu à des déploiements majeurs, notamment aux États-Unis, ces outils sont encore peu mobilisés dans les établissements de santé français.
Ainsi, dans la lignée des grands modèles de langue (LLM) type ChatGPT, le traitement automatique des langues (TAL) présente de nombreux cas d’usages stratégiques en santé : la transcription automatique des échanges en consultation, le résumé automatique des dossiers médicaux, voire l’assistance dans la décision clinique ou les tâches médico-administratives. De façon générale, ces nouveaux outils peuvent améliorer la qualité de travail du personnel médical ainsi que la relation patient–soignant, avec des bénéfices massifs à la clé pour le système de santé publique.
Fort de ces constats, le HDH et ses partenaires ont formulé une réponse à cet enjeu, dans le cadre de l’appel à projets « Communs numériques pour l’intelligence artificielle générative » de France 2030. Opéré pour le compte de l’Etat par Bpifrance, ce dispositif vise à accélérer la création et la mise en accessibilité de communs numériques sur l’ensemble de la chaîne de valeur de l’IA générative afin d’en assurer l’utilisation, par le plus grand nombre, et d’en favoriser l’émergence de produits et services innovants. L’approche particulière des communs qui a été choisie dans le cadre de ce dispositif permet à des secteurs critiques tels que la santé de bénéficier et de contribuer à la constitution d’un socle de technologies souveraines et sûres.
Ainsi, dans la lignée des grands modèles de langue (LLM) type ChatGPT, le traitement automatique des langues (TAL) présente de nombreux cas d’usages stratégiques en santé : la transcription automatique des échanges en consultation, le résumé automatique des dossiers médicaux, voire l’assistance dans la décision clinique ou les tâches médico-administratives. De façon générale, ces nouveaux outils peuvent améliorer la qualité de travail du personnel médical ainsi que la relation patient–soignant, avec des bénéfices massifs à la clé pour le système de santé publique.
Fort de ces constats, le HDH et ses partenaires ont formulé une réponse à cet enjeu, dans le cadre de l’appel à projets « Communs numériques pour l’intelligence artificielle générative » de France 2030. Opéré pour le compte de l’Etat par Bpifrance, ce dispositif vise à accélérer la création et la mise en accessibilité de communs numériques sur l’ensemble de la chaîne de valeur de l’IA générative afin d’en assurer l’utilisation, par le plus grand nombre, et d’en favoriser l’émergence de produits et services innovants. L’approche particulière des communs qui a été choisie dans le cadre de ce dispositif permet à des secteurs critiques tels que la santé de bénéficier et de contribuer à la constitution d’un socle de technologies souveraines et sûres.
Soignants, chercheurs, industriels, ... PARTAGES réunit les compétences nécessaires au développement de l’IA générative en santé.
Afin d’être au plus près des besoins des différents acteurs de terrain et de leurs organisations, le projet mobilise 32 acteurs de l’écosystème français, regroupant des expertises en IA et un large panel d'établissements de santé, représentatifs de la diversité du secteur. Parmi eux, des groupes hospitaliers publics tels que l’AP-HP et le GCS HOURAA (réunissant les 4 CHU de la région Auvergnes Rhônes-Alpes: le CHU de Clermont Ferrand, le CHU de Grenoble, les Hospices Civils de Lyon, le CHU de Saint-Étienne), des centres de lutte contre le cancer comme le Centre Léon Bérard, l’Institut Curie, ainsi que les CHU de Toulouse, Bordeaux, Amiens-Picardie, Brest, Lille, Nancy, Rouen et la Réunion. Les groupes d’établissements ELSAN et Ramsay Santé ainsi que deux hôpitaux privés (Foch, Saint-Joseph & Marie Lannelongue) font également partie des acteurs impliqués dans ce projet.
Cela permettra aux experts académiques et industriels en IA, en particulier du TAL, de développer des outils répondant aux besoins des professionnels de santé, qui pourront s’assurer de leur pertinence et de leur représentativité. Ainsi, les laboratoires LIA (Avignon), LIG (Grenoble), LIS (Aix-Marseille), LS2N (Nantes), BPH (Bordeaux) mais aussi les équipes de l’AP-HP et de la startup Mistral AI contribueront à la conception d’un grand modèle de langue adapté spécifiquement au secteur de la santé. Ce grand modèle de langue servira de base à une large gamme d’outils particulièrement innovants, dont la performance sera assurée par des experts de la fiabilisation des données et l’évaluation de modèles IA dont les laboratoires de recherche LIMICS (Laboratoire de recherche en informatique pour la santé - Inserm/Sorbonne Université/Université Sorbonne Paris-Nord), le LISN (Laboratoire interdisciplinaire des sciences du numérique - CNRS/Université Paris-Saclay) et le département de santé numérique du CHU de Rouen (DéSaN) ainsi que la startup reciTAL.
Ces outils à l’état de l’art seront conçus pour répondre à six cas d’usage stratégiques, dont le développement sera assuré par une collaboration entre les équipes du GreyC (Laboratoire de Recherche en sciences du numérique - Université de Caen Normandie/CNRS/Ecole Nationale Supérieure d’Ingénieurs de Caen), de l’AP-HP, du LIMICS, du Centre Léon Bérard, de l’UNESS (Université numérique en santé et sport) et du centre de recherche BPH Inserm/université de Bordeaux :
Cela permettra aux experts académiques et industriels en IA, en particulier du TAL, de développer des outils répondant aux besoins des professionnels de santé, qui pourront s’assurer de leur pertinence et de leur représentativité. Ainsi, les laboratoires LIA (Avignon), LIG (Grenoble), LIS (Aix-Marseille), LS2N (Nantes), BPH (Bordeaux) mais aussi les équipes de l’AP-HP et de la startup Mistral AI contribueront à la conception d’un grand modèle de langue adapté spécifiquement au secteur de la santé. Ce grand modèle de langue servira de base à une large gamme d’outils particulièrement innovants, dont la performance sera assurée par des experts de la fiabilisation des données et l’évaluation de modèles IA dont les laboratoires de recherche LIMICS (Laboratoire de recherche en informatique pour la santé - Inserm/Sorbonne Université/Université Sorbonne Paris-Nord), le LISN (Laboratoire interdisciplinaire des sciences du numérique - CNRS/Université Paris-Saclay) et le département de santé numérique du CHU de Rouen (DéSaN) ainsi que la startup reciTAL.
Ces outils à l’état de l’art seront conçus pour répondre à six cas d’usage stratégiques, dont le développement sera assuré par une collaboration entre les équipes du GreyC (Laboratoire de Recherche en sciences du numérique - Université de Caen Normandie/CNRS/Ecole Nationale Supérieure d’Ingénieurs de Caen), de l’AP-HP, du LIMICS, du Centre Léon Bérard, de l’UNESS (Université numérique en santé et sport) et du centre de recherche BPH Inserm/université de Bordeaux :
- Un outil de pseudonymisation automatique des données textuelles de santé, afin que l’ensemble de l’écosystème puisse bénéficier d’un outil standardisé pour cette étape préalable à toute utilisation secondaire des données de santé
- Deux outils visant à assister les praticiens de santé sur des tâches médico-administratives (codage DIM et résumé structuré de comptes-rendus) afin de libérer du temps médical
- Un cas d’usage permettant la génération de contenus pédagogiques pour tous les étudiants en médecine en France
- Deux outils facilitant l’analyse et la structuration automatique des informations médicales afin de soutenir la recherche clinique, en particulier en oncologie.
Une panoplie de communs numériques conçus pour enclencher une dynamique sur le développement du TAL en santé
La plateforme nationale d'évaluation fédérée, qui sera développée par le CNRS, permettra d'exécuter et d'évaluer tous les algorithmes développés sur des données réelles provenant de l'ensemble des établissements de santé partenaires.
Les modèles, comme la plateforme, seront mis en open source pour une utilisation la plus large possible. Ils constitueront ainsi des briques de base afin que l'écosystème pourra s’approprier pour développer une large gamme de cas d’usage d’IA générative en santé.
Les modèles, comme la plateforme, seront mis en open source pour une utilisation la plus large possible. Ils constitueront ainsi des briques de base afin que l'écosystème pourra s’approprier pour développer une large gamme de cas d’usage d’IA générative en santé.