La Fabrique de l’Info

Santé, coronavirus et chiffres

Des données sanitaires indispensables à la gouvernance et à la transparence de l'information mais... limitées

- temps de lecture approximatif de 14 minutes 14 min - Modifié le 13/12/2021 par Entshukdigubg

Les crises, économiques, sanitaires, comme les conflits, s'accompagnent de leurs chiffres statistiques et les progrès de la technologie et de la diffusion de l'information en permettent une communication en temps réel. Ils font les Unes quotidiennes des médias, alimentent les propos des dirigeants et des citoyens, au détriment trop souvent des précisions indispensables pour les comprendre. Au-delà des biais d'analyse que les données comportent et aussi incomplètes et limitées soient elles, elles représentent un vecteur de connaissance essentiel en période d'incertitude.

@Pixabay
@Pixabay

Données ouvertes sur le Covid-19

Les représentations infographiques de l’épidémie de Covid-19 sont nombreuses, initiatives institutionnelles publiques ou privées, collectives ou individuelle et permises en particulier par la mise à disposition de données des agences étatiques. Les données officielles sont parfois discutables (la transparence des données chinoises est toujours très discutée) et donc variables d’un pays à l’autre, voire d’une territoire, d’une ville à l’autre. Cependant, ces données, et les infographies qui en découlent sont indispensables à l’appréhension voire à la compréhension par chacun du phénomène en cours.

Quelques sites de références accessibles à tous garantissent un accès à l’information en dehors des médias mainstream. Chaque site développe sa propre méthodologie, ce qui explique les différentes estimations et interprétations produites.

Au niveau international : 

En premier lieu, l’OMS (Organisation Mondiale de la Santé) collecte des données et des publications d’expert pour produire conseils et des informations sanitaires sur de nombreux pays : “L’échange rapide des données est le fondement de l’action pour la santé publique. Dans le rapport de sa réunion du 30 janvier 2020, le Comité d’urgence du Règlement sanitaire international (2005) concernant la flambée de nouveau coronavirus a souligné combien il est important de communiquer de façon continue l’ensemble des données à l’Organisation mondiale de la Santé (OMS). Les informations diffusées dans les revues à comité de lecture et les ensembles de données connexes disponibles en ligne sont de la plus haute importance pour les décideurs. ” (Bulletin de l’OMS du 3 mars 2020,  sur L’échange de données sur le nouveau coronavirus). L’OMS a mis à disposition des Autorités sanitaires des différents pays, des protocoles d’études permettant d’évaluer l’épidémiologie et les caractéristiques cliniques des cas dans différents contextes. Ces outils ont été conçus pour que les données puissent être collectées et partagées rapidement. L’OMS appelle donc tous les pays et centres d’études à contribuer à cet effort indépendamment du volume de cas confirmés.données OMS Covid-19

Eurosurveillance est un site de surveillance épidémiologique, de prévention et de contrôle. Il dépend d’ ECDC, une agence de l’ Union Européenne qui fournit les données clés du Coronavirus en Europe et dans le monde.

données Covid 19 Eurosurveillances

Eurosurveillance travaille actuellement sur le potentiel de diffusion du virus 2019-nCov en Europe en se basant sur les retours par voie aérienne. Avec la participation du côté français de chercheurs de l’Inserm, et du côté italien de la chercheuse Vittoria Colizza et de son équipe, ils se sont basés sur les flux aériens en provenance de Chine pour établir leur modèle. « Ce modèle ne constitue en aucun cas une prédiction du nombre de cas à venir sur le territoire français et européen, mais bien un outil théorique d’aide à la décision publique », précise l’Inserm. L’Allemagne et le Royaume-Uni étaient en janvier 2020, les pays les plus concernés dans les scénarios proposés. Dans cette publication, deux infographies permettent de comparer un scénario à risque faible et un autre à risque élevé.

Au niveau national : 

logo Santé Publique FranceSanté publique France est un établissement public français à caractère administratif, placé sous la tutelle du ministère chargé de la Santé. Il assure la surveillance épidémiologique du Covid-19 à partir de plusieurs sources de données (médecine de ville, laboratoires, hôpitaux…) comme nous l’indique le site : ” Les informations sont transmises aux Agences régionales de Santé et aux cellules régionales de Santé publique France qui les saisissent à l’aide d’un outil de surveillance dédié, élaboré par l’OMS(GoData). Les cellules régionales recueillent également auprès des laboratoires hospitaliers de biologie médicale, le nombre de tests réalisés chaque jour et le nombre de tests positifs. Les données sont ensuite analysées au niveau national par Santé publique France. »

De nombreuses informations sont donc aussi accessibles sur le site des Agences Régionales de la Santé. Les ARS sont chargées de la communication des cas recensés sur leur territoire mais comme le cite Médiacités : « Les comparaisons entre régions et départements ont leurs limites. Le chiffres doivent être rapportés à la population de leur région ». 

Les données de suivi de l’épidémie de COVID-19 de Santé Publique France sont également relayées par le site data.gouv.fr, pour les données par région, département, sexe et classe d’âge, mises à jour quotidiennement et arrêtées à 14h.

Créé en 1964, l’Inserm, Institut national de la santé et de la recherche médicale, est un établissement public à caractère scientifique et technologique, placé sous la double tutelle du ministère de la Santé et du ministère de la Recherche. Il est partenaire des institutions engagées dans les progrès scientifiques dans le domaine de la recherche en santé publique. A l’Inserm, les modélisations sur le SRAS se poursuivent encore alors que le COVID-19 s’étend sur la planète et que ses chercheurs s’investissent sur cette nouvelle pandémie. Pour les chercheurs et statisticiens, chaque donnée peut servir l’endiguement d’une prochaine épidémie. Des chercheurs de l’Inserm se sont par exemple récemment associés avec la société Orange pour étudier l’impact du confinement sur la mobilité des populations et explorer ainsi la manière dont l’usage des statistiques issues du réseau de téléphonies mobiles pourrait permettre de mieux prédire l’évolution de la pandémie de Covid-19.

Modélisations à partir de ces données ouvertes

Portées par des états ou organisations internationales

Geodes est le tableau de bord proposé par l’Agence nationale de santé publique (Santé Publique France). Il permet de restituer près de 300 indicateurs de la santé sous forme de cartes dynamiques, de tableaux et de graphiques. En un clic, on peut connaitre le nombre de personnes actuellement hospitalisées, en réanimation, décédées, retournées à domicile  et le nombre d’établissements ayant déclaré au moins un cas, le tout depuis le 1er mars 2020.

données Covid-19 Geodess

Esri , leader mondial du renseignement de localisation, est partenaire de la Division des statistiques du Département des affaires économiques et sociales des Nations Unies pour offrir sa technologie de cartographie et d’analyse aux états membres. Il a créé un réseau international de hubs permettant aux pays de maximiser la communication, la collaboration et le partage de données. Ces membres peuvent désormais utiliser les logiciels et les outils qui leur permettront d’appartenir au  réseau fédéré de hubs de données sur le COVID-19. Appliquées à la pandémie du Covid-19, on obtient un aperçu par date et à l’échelle du territoire de la prise en charge des patients et permet de suivre au jour le jour l’évolution de la situation (hospitalisations, décès, capacités de réanimation, évolution des cas confirmés, hospitalisation par tranches d’âge, répartition H/F dans les décès, tests de dépistage….).

données Covid-19 ESRI

Du public au privé

L’initiative américaine du Center for Systems Science and Engineering (CSSE) et de la Johns Hopkins University

“We are tracking the COVID-19 spread in real-time on our interactive dashboard with data available for download. We are also modeling the spread of the virus. Preliminary study results are discussed on our blog.”

Les chercheurs du centre CSSE (sciences et ingénierie des systèmes) de l’institut Johns Hopkins aux États-Unis travaillent depuis le début de l’épidémie à Wuhan à la récolte de données sur le coronavirus et à leur modélisation. Ils proposent depuis le 22 janvier, une cartographie interactive mondiale des cas recensés, en regroupant les données issues de sources officielles (rapports quotidiens de l’OMS, des centres de contrôle et de prévention des maladies (CDC) américains, européens et chinois,  données du ministère chinois de la santé et du site web DXY, pour des données plus locales sur la Chine).

L’initiative Gisaid (Global Initiative on Sharing Avian Influenza Data)

Connue à l’origine pour ses actions sur le partage des données sur la grippe, elle implique des partenariats public-privé entre l’Allemagne, les États-Unis d’Amérique, Singapour, l’Institut Pasteur et d’autres. Cet organisme produit des cartes et graphiques sur le COVID-19 (infectés, décès, guéris).

Une initiative privée française au service des acteurs acteurs engagés dans la lutte contre le Coronavirus.

Digdash, éditeur français de logiciel, a également mis à disposition une nouvelle solution de data visualisation sur la pandémie, construite à partir des données de Santé publique France pour le niveau national et de la John Hopkins University pour les données mondiales.

Les GAFAM au rdv

Afin de participer à l’effort de compréhension et de lutte contre la Covid-19, les GAFAM proposent également leur données, cartes et graphiques exploitant leurs données géolocalisées sur les déplacements, la fréquentation des parcs et faciliter le développement d’applications de traçage des contacts. Ainsi Apple et Google ont signé un accord historique de mise en commun de leurs compétences pour fournir aux autorités sanitaires qui développent des applications de traçage des contacts (comme StopCovid en France) une API (interface de programmation d’application) qui facilitera leur travail..  Concernant la géolocalisation, si Google a pris la tête en début de course, la proposition de Facebook semble bien plus complète…

Le site Décryptagéo  vous permettra de suivre l’évolution des propositions de datavisalisation sur le Coronavirus.

Les données : un matériau délicat au service de la gouvernance et de la démocratie

“Toutes les mesures politiques, tous nos discours, toutes nos réflexions sont orientées et conformées, à un degré rarement atteint, par des outils quantitatifs” ‘(Emmanuel Didier, AOC)

Les données chiffrées sont aujourd’hui indispensables à la gouvernance des états, à la conduite des politiques publiques et des entreprises, mais la transparence de leur élaboration et de leur utilisation reflète aussi l’état de santé de nos démocraties. Ceci est d’autant plus vrai en période d’incertitude et face à un ennemi aussi invisible et incontrôlable qu’est le Coronavirus.

Face au danger, le besoin de savoir et de comprendre est immense : ” L’immense succès de la carte en temps réel de l’épidémie proposée par l’université John-Hopkins en témoigne. Le besoin de quantifier et d’évaluer les effets du Covid-19 semble d’autant plus prégnant que l’ennemi est invisible et sa diffusion semble incontrôlable. Suivre la courbe de l’épidémie est une manière de reprendre la main : les statistiques sont devenues une valeur refuge.”  nous dit la journaliste Marie Coussin et les analystes du    Le sociologue Emmanuel Didier traduit ainsi cet attachement de nos dirigeants pour ces données annoncées quotidiennement : “chaque soir, ces chiffres permettent au public, et au gouvernement lui-même d’ailleurs, de juger si celui-ci a été capable de prendre la mesure de l’épidémie, s’il a mieux, ou moins bien, agi comparativement à d’autres pays d’Europe, s’il a mieux réussi à « aplanir la courbe » du nombre de personnes admises à l’hôpital évitant ainsi l’engorgement. Il serait inimaginable, ou du moins extrêmement difficile à justifier, pour un gouvernement, de laisser ce nombre sortir complètement des fourchettes établies par les autres pays comparables. Et le fait d’être resté en-dessous est évalué comme un succès. Ces chiffres sont donc les infrastructures qui permettent aux gouvernements et aux opinions publiques de s’engager dans une course dont les termes sont déterminés et délimités par ces indicateurs. ” (La politique du nombre de mort, AOC, 15/04/2020).

Les données au service de la gouvernance

Les données recueillies servent la prise de décision des autorités en situation de crise. En matière de pandémie, leur fonction première est de permettre la mise en oeuvre rapide de programmes et d’actions pour sauver des vies. Pour le suivi d’épidémies plus « classiques », comme la grippe, elles servent à prévoir, mettre en oeuvre les programmes nécessaires au contrôle et à l’endiguement de ces épidémies,  comme la vaccination saisonnière. Les ARS suivent en général un échantillon de population et, comme le virus est connu, peuvent en déduire, par statistique, l’ampleur de l’épidémie à un moment donné. « Mais là, nous sommes dans une situation particulière, explique l’ARS francilienne. D’un seul coup, il faut donner des chiffres en temps réel à la fois pour l’opinion et pour le décideur. » selon Médiapart. Cette nécessité impérieuse de publier rapidement et très régulièrement de la donnée impacte de fait son élaboration et son interprétation.

Une production indépendante de la donnée publique ?

Lorsque la presse relate un événement épidémique, elle assène quotidiennement le chiffre macabre des victimes. Les autorités sanitaires ont besoin d’en prévoir l’étendue pour prendre les mesures nécessaires. Parfois, la polémique enfle, les chiffres sont remis en question : “on s’interroge sur la validité des chiffres chinois publiés, qui ne veulent parfois rien dire. Les taux de mortalité évoqués par les scientifiques varient de 0,1 à 30%. La raison est très simple: il est trop tôt pour calculer ce fameux “taux de mortalité” (CFR, dans le jargon scientifique), qui était par exemple de 10% pour le Sras. Les chiffres actuels sont très approximatifs, explique au Huffington Post Jean-Stéphane Dhersin, directeur adjoint scientifique de l’Institut national des sciences Mathématiques ». Dans un article “leçons virales de la Chine” publié dans la revue en ligne AOC, l’économiste et l’anthropologue   montrent que la nature d’un régime politique conditionne, pour différentes raisons, la production des données publiques  : « Amartya Sen, prix Nobel d’économie en 1998, avait montré qu’en matière de réduction des inégalités et de maîtrise des famines, la nature du régime politique est décisive. Un régime qui contrôle l’information, soit pour provoquer la panique, soit pour occulter des éléments alarmants, aggrave au lieu d’améliorer la situation initiale. Or dès le début février, le freinage à la diffusion de  l’information correcte  sur l’épidémie, effectué par le Parti du premier janvier au 20 janvier, date de la mise en quarantaine de Wuhan et de toute la province du Hubei, est devenu un certitude et non une hypothèse mal intentionnée », d’ après AOC média .

@Pixabay

@Pixabay

Les biais d’interprétation des chiffres

Si la méthode adoptée pour la récolte des données n’est pas toujours totalement rigoureuse, l’utilisation de ces données et leur modélisation pour en permettre la compréhension peuvent être également sujettes à des biais d’interprétation. Ces biais d’interprétation des chiffres sont des procédés qui engendrent des erreurs dans les résultats d’ une étude. Ils tendent à produire une estimation différant systématiquement de la vraie valeur et pouvant entraîner une non validité des résultats. Les statistiques sont des matières très faillibles et en matière épidémiologique, les précautions d’usages requises pour leur manipulation font partie du b.a.-ba des cours sur le sujet en faculté (cf cours de l’Université de médecine de Grenoble Interprétation d’une enquête épidémiologique : Type d’enquête, notion de biais, causalité)

  • Le biais de sélection : erreur lors de la sélection des sujets. Les sujets observés ne constituent pas un échantillon représentatif.
  • Le biais de classement : par exemple une erreur de classement entre « malades/non malades » ou entre « exposés/non exposés
  • Le biais de confusion ou de mesure est une erreur pouvant s’introduire dans la mesure des phénomènes pris en compte chez les sujets qui entrent dans l’étude (par exemple subjectivité de l’enquêteur qui sait s’il interroge le cas ou le témoin). Cet article du Monde souligne la difficulté de mesurer les sujets malades parmi les enfants et adolescents car “la consigne est de de ne collecter que les cas qui ont été prélevés et les cas hospitalisés : il y a donc un biais lié aux indications de prélèvement”.

Cet article de Médiapart (Covid-19: à quels chiffres se vouer?), nous donne un autre exemple : « un autre biais pourrait se cacher ici : la fiabilité des tests. Interpellés par ce pourcentage de 27 % de positifs, plusieurs médecins ont alerté sur Twitter : il faudrait parfois pratiquer jusqu’à trois tests sur un même patient pour avoir un résultat positif. De même les seuls chiffres des hôpitaux pourraient prêter à caution. Car, comme l’explique l’ARS d’Île-de-France, il est tout à fait possible que des personnes décédées en raison de symptômes liés au Covid-19 mais non testées soient comptées. Il pourrait y avoir donc surdéclaration d’un côté et sous-déclaration de l’autre.” Le Figaro montre aussi la difficulté à qualifier un “sujet infecté” dans les résultats publiés :  « Une partie de la difficulté vient du virus lui-même : il n’atteint pas toutes les personnes de la même façon. Certains ne vont développer aucun symptôme, d’autres quelques symptômes qui s’estomperont naturellement, quand une proportion non négligeable va développer des troubles importants. Dès lors, comment qualifier une personne « infectée ».

Sans remettre en cause la qualité des auteurs de ces données et de leur modélisation, il faut donc aborder ces données rendues publiques ou en cours d’élaboration sur la crise du coronavirus avec beaucoup de précautions. Elles ont le mérite de donner des tendances, d’indiquer des variations et il faudra du temps pour les affiner, les interpréter et dresser un bilan.

Pour aller plus loin :

 

 

 

 

 

 

 

 

 

 

Partager cet article