Savoir interpréter les résultats d’une étude de données requiert beaucoup d’attention car il existe de nombreuses sources de biais.
Même en ayant pris le plus grand soin dans la collecte des données et leur analyse une erreur d’interprétation est encore possible.
Prenons par exemple une étude sur la mortalité. Des pics apparaissent dans les recensements journaliers. La grippe ou un épisode de chaleur peuvent en être la cause.
Avec la pandémie liée à la COVID 19 de nouveaux pics apparaissent. Sont-ils plus ou moins importants que les précédents ?
Avec 100 000 décès l’impact semble important, mais cela ne tient pas compte de la comorbidité des personnes fragiles dont beaucoup seraient probablement décédés sans la COVID.
Ainsi une analyse rigoureuse des données montrerait que la surmortalité constatée en 2020 n’est pas plus forte que celles constatées lors des pics précédents. Certains pourront alors légitimement s’interroger sur la pertinence des mesures mises en place.
C’est une erreur d’interprétation. En effet le contexte de l’année 2020 n’est pas comparable à ceux des années précédentes. Les gestes barrières et le confinement ont eu un effet sur la mortalité en ralentissant la diffusion du virus.
Comment alors comparer les effets de la COVID et ceux de la grippe. Un indicateur serait par exemple le rapport entre le nombre de décès et le nombre de contaminations. Mais ce n’est pas suffisant. Il faudrait aussi comparer leurs vitesses et leurs périodes de diffusion.
Faisons une estimation. En un an la COVID a contaminé près de 5 millions de personnes en France dont 100 mille sont décédées. Le risque de décès est donc de 2%. Sans geste barrière, le coefficient de diffusion (R) est estimé à 1,4. De plus ce virus est virulent en toute saison. En supposant un délai d’incubation d’une semaine. Il faudrait 1 an pour contaminer 70 millions de personnes. Le nombre de décès serait alors de 1,4 millions, plus de deux fois le nombre annuel de morts habituellement observés.