Pourquoi rechercher l’interopérabilité sémantique ?
Brice de Behault : On peut facilement confondre structuration et standardisation des contenus médicaux. Encore aujourd’hui, beaucoup de contenus structurés dans les systèmes informatiques d'hôpitaux, par exemple les dossiers patients informatisés, ou DPI, sont liés à des référentiels variés. Parfois même, ces référentiels sont propres à une institution. Dans de telles circonstances, la donnée saisie est difficilement interprétable et un processus très coûteux de transformation de la donnée devient nécessaire. Vous le voyez en France, par exemple, avec les laboratoires. Pour résoudre ce problème, plusieurs référentiels internationaux sont promus. Leur but est d’assurer une représentation standardisée des contenus, rendant ceux-ci interprétables sans grande adaptation. Au-delà de l’interopérabilité technique, qui désigne la « tuyauterie » entre systèmes, l’interopérabilité sémantique cherche donc à assurer que les contenus soient eux-mêmes interopérables : les informations produites dans un système peuvent être directement utilisées par un autre système compatible. Cette notion d’interopérabilité des contenus est d’autant plus primordiale aujourd’hui que le virage numérique est pleinement engagé et que les établissements de santé doivent composer avec des données provenant d’une multitude de logiciels généralistes – à l’instar justement des DPI –, et de logiciels de spécialités – obstétrique, anesthésie, gestion du laboratoire, etc. Sans cela, l’ambition d’exploiter la donnée médicale pour accéder au quintuple aim* des soins de santé ne sera pas atteignable.
Existe-t-il une approche idéale pour assurer cette interopérabilité sémantique ?
L’interopérabilité sémantique est un domaine qui peut devenir très rapidement abstrait. Définir la bonne démarche pour aborder ce point est fondamental pour assurer un cadre viable à cet effort. Un fil conducteur habituel est de travailler sur des représentations de plus en plus complexes de l’information médicale, partant d’une vue atomique de l’information (une notion médicale) à une vue de plus en plus construite (le contexte de ce concept pour un patient donné). À terme, l’ambition est d’offrir une représentation standardisée et fidèle de la réalité, médicale ou non, du patient. Plusieurs standards internationaux, dont SNOMED CT pour les termes cliniques ou LOINC pour les résultats biologiques, permettent cette représentation atomique de l’information médicale. Ces standards sont poussés au niveau européen et sont déjà bien implémentés dans certains pays, dont la Belgique.
Est-il possible d’aller plus loin encore ?
Un simple concept médical standardisé représente déjà une avancée considérable par rapport à l’essentiel des dossiers patients. Mais il est effectivement possible d’aller plus loin et de représenter de manière standardisée une notion médicale, ainsi que son contexte pour un patient bien précis. Ce contexte est extrêmement important pour l’utilisabilité des contenus dans des applications métiers : il s’agit bien évidemment de l’identité du patient concerné mais aussi de la date de début ou de fin d’une condition, de sa sévérité, des observations liées, etc. Cet enjeu est de plus en plus adressé grâce au standard HL7 FHIR qui décrit – au-delà des messages techniques – des modèles de données standardisés. Ce standard est en cours de mise en œuvre en France, notamment pour assurer l’interopérabilité des applications référencées dans Mon Espace Santé, et en Belgique où son adoption généralisée s’accélère au travers des Care Sets.
Y a-t-il un troisième niveau ?
Bien sûr ! Dans l’idée d’offrir une représentation encore plus réaliste des données liées à un patient, deux évolutions peuvent être envisagées. D’une part, il est possible de regrouper les ressources FHIR (Fast Healthcare Interoperability Resources) pour décrire le patient dans son ensemble – antécédents médicaux et chirurgicaux, allergies, vaccins, etc. Ces ‘résumés patients’ s’appuient eux aussi sur des standards, dont l’International Patient Summary (HL7 IPS) et le European Electronic Health Records Exchange Format (EEHRxF). À nouveau, il s’agit d’un standard d’échange d’information. La deuxième évolution possible va au-delà de l’échange et cherche à offrir une représentation unifiée et encore plus fine de l’information. openEHR (prononcé « open air ») est un exemple remarquable d’une telle normalisation et est utilisé par de plus en plus de régions en Europe. Malheureusement, il ne s’agit pas d’un standard fort diffusé, et il est donc moins tangible que HL7 FHIR à ce stade.
Cette modélisation du stockage des données n’est-elle pas, aussi, adressée à travers les entrepôts de données de santé (EDS) ?
Les EDS sont encore très souvent des centralisations de contenus provenant de différentes sources. Ces outils permettent d’accéder à des données disparates, produites à de multiples endroits et pour des besoins bien précis. Et ces entrepôts ne sont pas destinés au partage d’information médicale, mais à une exploitation secondaire des données, en particulier pour les études cliniques. Tout au plus, des efforts sont mis en place pour en standardiser le format de stockage (OMOP, par exemple). En Belgique, de plus en plus d’hôpitaux souhaitent échanger des données standardisées entre eux ou ambitionnent d’utiliser des outils d’aides à la décision de manière efficace. Ces usages primaires de la donnée médicale, qui s’imposent comme un levier de valorisation des DPI, sont adressés au travers de Clinical Data Repositories (CDR). Ces derniers consistent en des espaces de stockage de données patients standardisées pouvant être échangés en temps réels entre, par exemple, hôpitaux d’un même réseau locorégional (l’équivalent de vos GHT en France) voire d’une même région (Flandre, Wallonie, Bruxelles chez nous). Les CDR sont des outils essentiels pour soutenir l’intégration des soins et les innovations orientées sur les données pour améliorer la prise en charge des patients, comme les systèmes d’aide à la décision clinique. Nous pourrions même envisager que les CDR nourrissent eux-mêmes les EDS avec des données médicales de haute qualité.
Observez-vous d’autres problématiques concernant l’interopérabilité sémantique des données stockées ?
Pour éviter tout traitement inutile, il est pertinent de s’assurer en priorité que les contenus saisis dans les systèmes soient standardisés à la source. Cet effort permet d’optimiser très efficacement la puissance des outils tels que les DPI. Il est également possible de standardiser des contenus repris en langage naturel à la volée ou a posteriori au travers de l’intelligence artificielle et en particulier d’outils de traitement automatique du langage naturel, ou NLP – plus précisément des applications d’IA générative ou d’extraction d’information plus classique des données. Cette réflexion, qui atteint désormais la France, a déjà été initiée en Belgique depuis un certain nombre d’années. Il est très fréquent de voir des dossiers patients informatisés basés sur SNOMED CT ou intégrant des fonctionnalités de NLP.
Comment expliquer cette avance ?
Il faut rappeler que, outre-Quiévrain, les réseaux de santé régionaux – équivalents belges du Dossier médical partagé (DMP) français – ont vu le jour il y a plus d’une dizaine d’années pour échanger des rapports relatifs à un patient. Tout comme dans le DMP, ces documents sont présentés sous la forme de listes de documents. Pour faciliter la prise en charge des patients, le gouvernement fédéral a également promu un résumé patient standardisé pour les médecins généralistes, le SUMEHR, similaire dans les grandes lignes à l’International Patient Summary décrit plus haut (HL7 IPS). Malgré les incitants, les contenus produits sont restés très pauvres et peu utilisables en pratique. C’est entre autres pour cette raison que la mobilisation des technologies de traitement automatique du langage s’est imposée comme une alternative intéressante.
Pour autant, l’idée initiale n’a pas été abandonnée…
Bien au contraire, l’idée d’échanger des données standardisées entre prestataires avance. Un projet appelé BIHR, pour Belgian Integrated Health Record, et qui s’inscrit véritablement dans une vision « parcours », est en cours de formalisation. Cette trajectoire s’inscrit in fine dans la continuité de la tendance que nous venons d’évoquer, c’est-à-dire le passage d’une vue documentaire à une vue « data » des DPI. À cet égard, le gouvernement fédéral a également lancé, en 2023, des projets dits de Data Capabilities pour justement tester la mise en place des briques permettant cette vue data, et de Data Innovations pour leur part orientés sur l’implication des utilisateurs. À l’inverse des projets nationaux français, leur ligne éditoriale est sensiblement moins contraignante. Il n’y a par exemple pas de cahier des charges, ni de prérequis identifiés. L’approche est ainsi transversale et concertée, un avantage possible dans un pays de la taille de la Belgique.
Toujours est-il que, comme vous l’avez laissé entendre, l’adoption des concepts d’interopérabilité sémantique par les producteurs de données est un enjeu critique…
Il s’agit effectivement d’un défi de taille, qui impose de combiner plusieurs leviers. L’incitation financière seule, par exemple, se heurte rapidement à un plafond de verre. L’obligation réglementaire est, elle, très complexe : comment définir un dossier patient de qualité ? Interrogés à ce sujet, les instituts normatifs ne prennent pas de positions, estimant que cet enjeu n’est pas de leur ressort car il touche aux usages. Pour soutenir l’adoption de bonnes pratiques, il convient selon nous de favoriser l’engagement de l’ensemble des parties prenantes et de sensibiliser aux nouveaux cas d’usage permis par les échanges multidirectionnels de données. Avec l’arrivée de l’Espace Européen de Données de Santé, les pays membres ont une responsabilité importante à jouer. L’Union européenne doit également soutenir une adoption homogène des standards d’interopérabilité et ainsi éviter le développement d’interprétations trop localisées de standards tels que HL7 FHIR (un défi appelé « profiliferation » dans le jargon).
Identifiez-vous d’autres défis ?
Avec le potentiel croissant de l’intelligence artificielle et plus largement des usages de la donnée médicale dans les soins de santé, la qualité de l’information devient un sujet clé. Produire et échanger des données en quantité importante n’est plus suffisant : il est essentiel que celles-ci soient les plus contextualisées (standardisées) et pertinentes possibles. Ce défi va de pair avec le besoin d’une gestion plus professionnelle et durable de l’information médicale. Certaines informations médicales essentielles sont utilisées dans de nombreux cas d’usage : bien adresser la qualité et la contextualisation de ces informations permet d’augmenter leur réutilisabilité, réduisant le coût d’implémentation de cas d’usage. Enfin, mon dernier point est un défi humain : trouver le bon équilibre entre une vision long terme saine et des ambitions pragmatiques dès le début. Les gains les plus évidents des données standardisées sont adressables avec l’état de l’art actuel des technologies et des standards. L’essentiel est de poser les bons choix dès le début. Sur ces points, des échanges entre les expériences nationales en Europe, soutenues par le cadre du European Health Data Space (EHDS) récemment voté, représentent sans aucun doute un catalyseur puissant d’innovation.
(*) Il s'agit de chercher à obtenir, avec le budget disponible pour les soins de santé, davantage de santé pour la population, une meilleure expérience de la qualité des soins, une diminution de la charge pour le personnel soignant et une réelle accessibilité des soins pour tout un chacun.
> Article paru dans Hospitalia #65, édition de mai 2024, à lire ici
Brice de Behault : On peut facilement confondre structuration et standardisation des contenus médicaux. Encore aujourd’hui, beaucoup de contenus structurés dans les systèmes informatiques d'hôpitaux, par exemple les dossiers patients informatisés, ou DPI, sont liés à des référentiels variés. Parfois même, ces référentiels sont propres à une institution. Dans de telles circonstances, la donnée saisie est difficilement interprétable et un processus très coûteux de transformation de la donnée devient nécessaire. Vous le voyez en France, par exemple, avec les laboratoires. Pour résoudre ce problème, plusieurs référentiels internationaux sont promus. Leur but est d’assurer une représentation standardisée des contenus, rendant ceux-ci interprétables sans grande adaptation. Au-delà de l’interopérabilité technique, qui désigne la « tuyauterie » entre systèmes, l’interopérabilité sémantique cherche donc à assurer que les contenus soient eux-mêmes interopérables : les informations produites dans un système peuvent être directement utilisées par un autre système compatible. Cette notion d’interopérabilité des contenus est d’autant plus primordiale aujourd’hui que le virage numérique est pleinement engagé et que les établissements de santé doivent composer avec des données provenant d’une multitude de logiciels généralistes – à l’instar justement des DPI –, et de logiciels de spécialités – obstétrique, anesthésie, gestion du laboratoire, etc. Sans cela, l’ambition d’exploiter la donnée médicale pour accéder au quintuple aim* des soins de santé ne sera pas atteignable.
Existe-t-il une approche idéale pour assurer cette interopérabilité sémantique ?
L’interopérabilité sémantique est un domaine qui peut devenir très rapidement abstrait. Définir la bonne démarche pour aborder ce point est fondamental pour assurer un cadre viable à cet effort. Un fil conducteur habituel est de travailler sur des représentations de plus en plus complexes de l’information médicale, partant d’une vue atomique de l’information (une notion médicale) à une vue de plus en plus construite (le contexte de ce concept pour un patient donné). À terme, l’ambition est d’offrir une représentation standardisée et fidèle de la réalité, médicale ou non, du patient. Plusieurs standards internationaux, dont SNOMED CT pour les termes cliniques ou LOINC pour les résultats biologiques, permettent cette représentation atomique de l’information médicale. Ces standards sont poussés au niveau européen et sont déjà bien implémentés dans certains pays, dont la Belgique.
Est-il possible d’aller plus loin encore ?
Un simple concept médical standardisé représente déjà une avancée considérable par rapport à l’essentiel des dossiers patients. Mais il est effectivement possible d’aller plus loin et de représenter de manière standardisée une notion médicale, ainsi que son contexte pour un patient bien précis. Ce contexte est extrêmement important pour l’utilisabilité des contenus dans des applications métiers : il s’agit bien évidemment de l’identité du patient concerné mais aussi de la date de début ou de fin d’une condition, de sa sévérité, des observations liées, etc. Cet enjeu est de plus en plus adressé grâce au standard HL7 FHIR qui décrit – au-delà des messages techniques – des modèles de données standardisés. Ce standard est en cours de mise en œuvre en France, notamment pour assurer l’interopérabilité des applications référencées dans Mon Espace Santé, et en Belgique où son adoption généralisée s’accélère au travers des Care Sets.
Y a-t-il un troisième niveau ?
Bien sûr ! Dans l’idée d’offrir une représentation encore plus réaliste des données liées à un patient, deux évolutions peuvent être envisagées. D’une part, il est possible de regrouper les ressources FHIR (Fast Healthcare Interoperability Resources) pour décrire le patient dans son ensemble – antécédents médicaux et chirurgicaux, allergies, vaccins, etc. Ces ‘résumés patients’ s’appuient eux aussi sur des standards, dont l’International Patient Summary (HL7 IPS) et le European Electronic Health Records Exchange Format (EEHRxF). À nouveau, il s’agit d’un standard d’échange d’information. La deuxième évolution possible va au-delà de l’échange et cherche à offrir une représentation unifiée et encore plus fine de l’information. openEHR (prononcé « open air ») est un exemple remarquable d’une telle normalisation et est utilisé par de plus en plus de régions en Europe. Malheureusement, il ne s’agit pas d’un standard fort diffusé, et il est donc moins tangible que HL7 FHIR à ce stade.
Cette modélisation du stockage des données n’est-elle pas, aussi, adressée à travers les entrepôts de données de santé (EDS) ?
Les EDS sont encore très souvent des centralisations de contenus provenant de différentes sources. Ces outils permettent d’accéder à des données disparates, produites à de multiples endroits et pour des besoins bien précis. Et ces entrepôts ne sont pas destinés au partage d’information médicale, mais à une exploitation secondaire des données, en particulier pour les études cliniques. Tout au plus, des efforts sont mis en place pour en standardiser le format de stockage (OMOP, par exemple). En Belgique, de plus en plus d’hôpitaux souhaitent échanger des données standardisées entre eux ou ambitionnent d’utiliser des outils d’aides à la décision de manière efficace. Ces usages primaires de la donnée médicale, qui s’imposent comme un levier de valorisation des DPI, sont adressés au travers de Clinical Data Repositories (CDR). Ces derniers consistent en des espaces de stockage de données patients standardisées pouvant être échangés en temps réels entre, par exemple, hôpitaux d’un même réseau locorégional (l’équivalent de vos GHT en France) voire d’une même région (Flandre, Wallonie, Bruxelles chez nous). Les CDR sont des outils essentiels pour soutenir l’intégration des soins et les innovations orientées sur les données pour améliorer la prise en charge des patients, comme les systèmes d’aide à la décision clinique. Nous pourrions même envisager que les CDR nourrissent eux-mêmes les EDS avec des données médicales de haute qualité.
Observez-vous d’autres problématiques concernant l’interopérabilité sémantique des données stockées ?
Pour éviter tout traitement inutile, il est pertinent de s’assurer en priorité que les contenus saisis dans les systèmes soient standardisés à la source. Cet effort permet d’optimiser très efficacement la puissance des outils tels que les DPI. Il est également possible de standardiser des contenus repris en langage naturel à la volée ou a posteriori au travers de l’intelligence artificielle et en particulier d’outils de traitement automatique du langage naturel, ou NLP – plus précisément des applications d’IA générative ou d’extraction d’information plus classique des données. Cette réflexion, qui atteint désormais la France, a déjà été initiée en Belgique depuis un certain nombre d’années. Il est très fréquent de voir des dossiers patients informatisés basés sur SNOMED CT ou intégrant des fonctionnalités de NLP.
Comment expliquer cette avance ?
Il faut rappeler que, outre-Quiévrain, les réseaux de santé régionaux – équivalents belges du Dossier médical partagé (DMP) français – ont vu le jour il y a plus d’une dizaine d’années pour échanger des rapports relatifs à un patient. Tout comme dans le DMP, ces documents sont présentés sous la forme de listes de documents. Pour faciliter la prise en charge des patients, le gouvernement fédéral a également promu un résumé patient standardisé pour les médecins généralistes, le SUMEHR, similaire dans les grandes lignes à l’International Patient Summary décrit plus haut (HL7 IPS). Malgré les incitants, les contenus produits sont restés très pauvres et peu utilisables en pratique. C’est entre autres pour cette raison que la mobilisation des technologies de traitement automatique du langage s’est imposée comme une alternative intéressante.
Pour autant, l’idée initiale n’a pas été abandonnée…
Bien au contraire, l’idée d’échanger des données standardisées entre prestataires avance. Un projet appelé BIHR, pour Belgian Integrated Health Record, et qui s’inscrit véritablement dans une vision « parcours », est en cours de formalisation. Cette trajectoire s’inscrit in fine dans la continuité de la tendance que nous venons d’évoquer, c’est-à-dire le passage d’une vue documentaire à une vue « data » des DPI. À cet égard, le gouvernement fédéral a également lancé, en 2023, des projets dits de Data Capabilities pour justement tester la mise en place des briques permettant cette vue data, et de Data Innovations pour leur part orientés sur l’implication des utilisateurs. À l’inverse des projets nationaux français, leur ligne éditoriale est sensiblement moins contraignante. Il n’y a par exemple pas de cahier des charges, ni de prérequis identifiés. L’approche est ainsi transversale et concertée, un avantage possible dans un pays de la taille de la Belgique.
Toujours est-il que, comme vous l’avez laissé entendre, l’adoption des concepts d’interopérabilité sémantique par les producteurs de données est un enjeu critique…
Il s’agit effectivement d’un défi de taille, qui impose de combiner plusieurs leviers. L’incitation financière seule, par exemple, se heurte rapidement à un plafond de verre. L’obligation réglementaire est, elle, très complexe : comment définir un dossier patient de qualité ? Interrogés à ce sujet, les instituts normatifs ne prennent pas de positions, estimant que cet enjeu n’est pas de leur ressort car il touche aux usages. Pour soutenir l’adoption de bonnes pratiques, il convient selon nous de favoriser l’engagement de l’ensemble des parties prenantes et de sensibiliser aux nouveaux cas d’usage permis par les échanges multidirectionnels de données. Avec l’arrivée de l’Espace Européen de Données de Santé, les pays membres ont une responsabilité importante à jouer. L’Union européenne doit également soutenir une adoption homogène des standards d’interopérabilité et ainsi éviter le développement d’interprétations trop localisées de standards tels que HL7 FHIR (un défi appelé « profiliferation » dans le jargon).
Identifiez-vous d’autres défis ?
Avec le potentiel croissant de l’intelligence artificielle et plus largement des usages de la donnée médicale dans les soins de santé, la qualité de l’information devient un sujet clé. Produire et échanger des données en quantité importante n’est plus suffisant : il est essentiel que celles-ci soient les plus contextualisées (standardisées) et pertinentes possibles. Ce défi va de pair avec le besoin d’une gestion plus professionnelle et durable de l’information médicale. Certaines informations médicales essentielles sont utilisées dans de nombreux cas d’usage : bien adresser la qualité et la contextualisation de ces informations permet d’augmenter leur réutilisabilité, réduisant le coût d’implémentation de cas d’usage. Enfin, mon dernier point est un défi humain : trouver le bon équilibre entre une vision long terme saine et des ambitions pragmatiques dès le début. Les gains les plus évidents des données standardisées sont adressables avec l’état de l’art actuel des technologies et des standards. L’essentiel est de poser les bons choix dès le début. Sur ces points, des échanges entre les expériences nationales en Europe, soutenues par le cadre du European Health Data Space (EHDS) récemment voté, représentent sans aucun doute un catalyseur puissant d’innovation.
(*) Il s'agit de chercher à obtenir, avec le budget disponible pour les soins de santé, davantage de santé pour la population, une meilleure expérience de la qualité des soins, une diminution de la charge pour le personnel soignant et une réelle accessibilité des soins pour tout un chacun.
> Article paru dans Hospitalia #65, édition de mai 2024, à lire ici