Utiliser pleinement le potentiel d’une nouvelle technologie requiert beaucoup de temps et il est parfois nécessaire de changer les politiques ainsi que les façons d’utiliser la technologie. C’est certainement le cas des données massives dans le secteur de la santé. Ce billet en deux parties explore les principaux éléments des politiques de santé et de l’utilisation des données pour lesquels les approches actuelles peuvent constituer des obstacles à la réalisation du plein potentiel des données massives.
Les outils de données massives regroupent de grandes quantités de données disponibles afin d’atteindre un objectif, que les données aient été recueillies précisément et exclusivement en fonction de cet objectif ou non. Dans le secteur de la santé, ces renseignements sont appelés « données secondaires » lorsqu’ils sont initialement consignés en vue de procurer des soins médicaux, mais sont ensuite utilisés à d’autres fins. Il s’agirait plutôt d’augmenter les quantités de données collectées plutôt que de recueillir uniquement les données précises dont vous pensez avoir besoin. Nous appelons cette nouvelle façon d’utiliser les données l’approche « observationnelle ».
Les outils de données massives sont très prometteurs. Ils proposent notamment de nouvelles approches pour la recherche sur la santé. Les organisations de soins de santé cherchent à élargir la base scientifique sur laquelle reposent les traitements et, au moment d’amorcer un travail d’efficacité comparative, elles ont besoin d’utiliser les données initialement accumulées pour les soins cliniques, les communications et autres. Elles doivent également réutiliser les données qui avaient été recueillies dans le cadre d’autres recherches pour faire des suivis, des analyses approfondies ou des mises à l’essai de nouvelles hypothèses. Grâce à l’analyse d’énormes quantités de données moins structurées et moins spécialisées issues des systèmes électroniques de soins cliniques, des « médias sociaux » et d’autres sources, les outils de données massives enrichissent les analyses de recherche « traditionnelle », qui est plutôt fondée sur des ensembles limités de données hautement spécialisées et extraites dans un but précis.
Bien sûr, lorsque possible, il est toujours intéressant d’accéder à des données hautement structurées et précises, mais utiliser uniquement cette approche ne semble pas suffisant en regard des problèmes de recherche auxquels nous sommes confrontés. De plus, les dépenses allouées à la recherche scientifique risquent de diminuer à la suite de la réduction du financement, au même titre que le reste du budget discrétionnaire national.
Les données massives peuvent potentiellement jouer plusieurs rôles dans le cadre de la recherche, mais le plus important réside dans l’exploitation de grandes quantités de données non structurées qui existent en tant que produits dérivés des soins cliniques et autres systèmes électroniques mis à contribution. De façon générale, il y a deux types d’approches en matière d’utilisation des données sur la santé qui proviennent d’un patient ou d’une personne identifiable. La première consiste à dépersonnaliser les données et l’autre à obtenir le consentement des individus pour l’utilisation de leurs données.
Aux États-Unis, « le consentement » selon la loi américaine HIPAA (« Health Insurance Portability and Accountability Act ») résiste à certains types d’utilisation des données massives. Le problème découle du fait que, d’une part, les nouvelles approches d’utilisation des données massives offrent un grand potentiel. L’accès à de larges ensembles de données permet de tirer un nombre inespéré d’observations inattendues et de conclusions secondaires et d’ainsi répondre à des questions supplémentaires et de procéder à des analyses ultérieures. Cependant, et malgré la mise à jour promulguée par le projet de loi omnibus, l’HIPAA exige que les patients renouvellent leur consentement si leurs données sont utilisées à des fins autres que celles initialement prévues.
L’ironie de cette situation est que les réserves de l’HIPAA concernent les activités qui sont « conçues pour développer ou contribuer aux connaissances généralisables », et ne s’appliquent pas à l’utilisation des renseignements utilisés localement pour les traitements, le paiement et les opérations. Plusieurs personnes peinent à comprendre pourquoi un objectif si louable lié à la santé des citoyens génère des contraintes accrues sur la façon d’utiliser les données.
Dans mon prochain billet, nous discuterons des problèmes liés à la « dépersonnalisation des données » telle que définie par l’HIPAA ainsi que d’autres défis liés aux données massives et à la santé des citoyens.