Surveiller la mortalité « toutes causes » en open source

Edit au 28/09/2021 : ajout des vues ajustées par tranches de population.

Introduction

La transparence est essentielle pour construire une société de confiance. Étant moi-même toujours en doute avec les informations que je rencontre, quelle que soit leur source, je me suis posé beaucoup de questions sur la mortalité depuis le début de l’épidémie de Covid. J’ai d’ailleurs posté des compte-rendus détaillés (et moins détaillés) de ce que je trouvais sur la Covid, ainsi que d’autres informations ici, , et et ailleurs.

L’un des principaux problèmes qu’un citoyen lambda rencontre très vite, c’est la difficulté à évaluer des données nationales qui sont par définition des agrégats, parfois des agrégats d’agrégats… sachant que tout le monde y va de ses propres interprétations. Il me fallait donc repartir de données brutes difficilement falsifiables ou manipulables.

Quelles données ?

Par ailleurs, la comptabilisation des « morts Covid » est toujours biaisée, car comme je l’indique dans cet autre billet, on meurt le plus souvent d’une multitude de facteurs, pas seulement de la Covid (ou d’une autre maladie).

Il ne nous reste donc plus, à nous autres citoyens lambda, la mortalité « toutes causes », qui représente une réalité non biaisée : telle personne est morte à telle endroit à telle date. Or, l’INSEE fournit exactement ces données détaillées. Les données ont toujours 1 mois et demi à 2 mois de retard. Cela permet tout de même de regarder rétrospectivement ce qui s’est passé pour pouvoir anticiper ce qui va arriver. Mais surtout, cela permet de juger du degré de fiabilité de diverses sources d’informations lors des événements passés, et ainsi de se construire un indice de confiance sur telle ou telle source.

J’ai donc développé un programme pour analyser ces données et calculer des courbes de mortalité à partir de ces données brutes. J’ai également mis en place un site pour afficher les résultats, que vous pouvez consulter (le site est chez moi, il est donc possible qu’il ne soit pas toujours disponible et qu’il donne une vue erronée au moment où je fais des mises à jour des données, une fois par mois).

Petit manuel de l’utilisateur

Quelques petites remarques sur le site :

  • les données proviennent directement des données brutes, filtrées (car il y a des doublons dans les fichiers de l’INSEE),
  • le graphe correspond à une année entière, donc les données les plus à gauche correspondent au début de l’année, et celles les plus à droite à la fin de l’année,
  • les différents types d’affichage sont :
    • absolu : c’est le nombre de morts chaque jour,
    • pondéré : le nombre de morts pour 1 million d’habitants, ce qui permet de comparer d’une année sur l’autre puisque la population varie d’une année sur l’autre,
    • étalé : c’est la moyenne glissante du nombre de morts pour 1 million d’habitants sur 10 jours, cela permet d’avoir une version « lissée » des courbes,
    • pondéré 70+ et étalé 70+ : mêmes vues que les précédentes, mais au lieu de pondérer par la population par année, ces vues sont pondérées par la mortalité moyenne de la population en fonction des tranches d’âges vivantes de l’année en cours, que l’on peut récupérer par exemple ici sur le site de l’INSEE.
  • on peut filtrer par département (ou par pays étranger) pour observer la mortalité dans une région donnée et ainsi cibler des événements locaux,
  • on peut également filtrer par tranches d’âges pour voir l’impact des événements en fonction des âges,
  • on peut filtrer avec un intervalle d’années et/ou de mois, afin de pouvoir comparer des années proches sans le « bruit » des autres années,
  • lorsqu’une seule année est sélectionnée (filtrage de l’année x vers la même année x), l’affichage bascule automatiquement en mortalité par tranche d’âges, pour analyser un événement en particulier de cette année-là, par exemple.

Transparence

Dans un souci de transparence et pour faire marcher l’intelligence collective, je publie les sources de mes programmes en open source. Ainsi, chacun peut vérifier mon code, et même l’installer chez soi, le modifier, l’améliorer, et se faire sa propre opinion en toute indépendance.

Le programme java de remplissage de la base de données : https://gitlab.com/jytou/country-death-observe-java

Le site web pour en faire des courbes : https://gitlab.com/jytou/country-death-observe-php

Le Covid-19 va-t-il changer les statistiques de mortalité ? (France, 2000-2019)

Introduction

Ces dernières semaines, suite à la pandémie de Covid-19 qui sévit partout sur la planète, on entend de plus en plus « mais, vous vous rendez-compte, le virus a fait tant de milliers de morts ». Le problème est qu’un nombre sans contexte ne signifie rien. Comme si je vous disais que, là où j’habite, il y a mille personnes sans emploi. Sans vous dire combien il y a d’habitants au total, c’est une information qui n’apporte rien.

Un manque de vision…

Mi-février 2020, le Pr. Didier Raoult, infectiologue de renom, expliquait avec agacement que le Covid-19 n’allait pas influer sur les statistiques de mortalité en France « à moins que les choses changent beaucoup ». Il s’appuyait alors sur le fait que l’épidémie semblait être maîtrisée en Chine (en fait, le confinement de Wuhan n’a pris fin que début avril). Par ailleurs, la « grippe » n’avait fait que très peu de morts en Iran et en Corée du Sud. Il a simplement « oublié » à l’époque que :

  • la progression de l’épidémie n’en était qu’au tout début de la progression exponentielle en Iran,
  • elle n’avait été enrayée par les Chinois qu’au prix d’un confinement drastique dans un pays où la surveillance permet de faire respecter une telle mesure (avec des peines de prison en cas d’infraction).

Par ailleurs, il juge le confinement totalement inutile. Comme si effectivement rester chez soi revenait totalement au même en terme de taux contamination que d’embrasser tous les passants.

… mais aussi de l’amateurisme…

Évidemment, il ne pouvait pas non plus prévoir la gestion calamiteuse du gouvernement français lors de cette crise (pas de masques, pas de tests, frontières restées ouvertes en particulier avec l’Italie, invitations à sortir, à voter et à travailler au moment où il était déjà trop tard et que le confinement aurait déjà été nécessaire, etc.). Il prévenait par ailleurs un mois avant dans une autre vidéo que les coronavirus sont particulièrement dangereux et devraient faire l’objet d’une surveillance accrue.

À noter que je ne suis ni « pour » ni « contre » Didier Raoult. C’est une assertion qui n’a pas plus de sens que d’être « pour » ou « contre » la pluie. Didier Raoult a d’évidentes connaissances dans certains domaines. Pour autant, il n’est pas infaillible, comme tout être humain. De mon point de vue, il a fait des erreurs sérieuses tant en vision à long terme qu’en communication. Malgré tout, il fait exactement ce qu’il faut faire dans sa région contre l’avis de toute sa hiérarchie, c’est déjà vraiment exemplaire et courageux. Mais ceci n’est pas un article sur lui… continuons !

Estimer l’impact d’une cause de mortalité

Comme je le rappelle dans cet autre article, estimer l’impact d’une cause de mortalité est un exercice de funambule.

Comment comptabiliser une personne qui avait de l’asthme, des problèmes cardiaques, de la tension, et qui est morte suite à une infection respiratoire non testée. Covid-19 ? Pas Covid-19 ? Et si elle a été testée, quelle a été la condition décisive du décès ?

La réalité est que c’est l’ensemble de ces facteurs qui ont causé le décès, pas un facteur seul. Il est relativement rare que quelqu’un meure d’une seule pathologie. C’est plutôt un ensemble de facteurs conjugués qui cause la mort. À l’exception des accidents et de quelques maladies comme certains cancers. La faim est également une cause « racine » de mortalité importante dans le monde.

L’impact en Chine

On voit de plus en plus des gens s’alarmant de dizaines de milliers de morts en Chine depuis le début de l’année. Ils estiment immédiatement que ces morts sont à mettre sur le compte du Covid-19.

Or la région de Wuhan, le Hubei épicentre de l’épidémie, compte pas moins de 59 millions d’âmes. C’est comparable à la France en terme de population. Or, en France, il y a plus de 1500 décès par jour hors période épidémique. Sur 2 mois de confinement, et si on considère que la région de Wuhan a le même taux de mortalité que la France, cela donne pas moins de 75.000 morts en temps normal. Pas étonnant donc qu’il y ait des dizaines de milliers de morts à Wuhan à la sortie de plus de deux mois de confinement. Il paraît évident que tous ces morts n’ont pu être pris en charge pendant le confinement.

Le Gouvernement chinois cache peut-être des choses. Je ne fais que donner des chiffres basiques, à chacun d’en faire ce qu’il en veut. Il est extrêmement difficile de mesurer l’impact de l’épidémie sur place sans avoir des chiffres détaillés. Des ordres de grandeur seuls ne peuvent donner aucune indication.

Une manipulation facile

Le comptage est donc très délicat lors d’une épidémie. Il est vraiment facile de manipuler les données quant aux causes de mortalité. Et ce, soit à la hausse, soit à la baisse. Certains clament par exemple que le diabète cause xxxxx morts par an. Seul ? Vraiment ? Là encore, ce n’est très souvent qu’une cause qui s’additionne à d’autres.

Le seul indicateur véritablement intéressant lorsque survient une épidémie avec un fort impact est la mortalité totale dans la population. On peut alors mesurer la portée globale d’un événement, que ce soit une épidémie ou autre chose d’ailleurs, en comparant avec les années précédentes (et suivantes si on a les données).

La question est tout de même se savoir : une épidémie de grippe fait-elle effectivement une grosse différence visible dans la mortalité ?

Perspectives

Mettons maintenant tout cela en perspective. Je suis persuadé que le Covid-19 a parfaitement le potentiel de changer les statistiques de mortalité – en fait il le fait déjà début avril 2020, puisque le Directeur Général de la santé précisait le 4 avril que la mortalité habituelle était déjà supérieure de 27 % par rapport à la normale en semaine 13, toutes causes confondues. Et il annonce le 9 avril qu’en semaine 14, d’après les premières estimations qui pourront être revues à la hausse, l’excédent de mortalité atteindrait 41 %. Si c’est réellement le cas, c’est déjà énorme. Et cela malgré le confinement mis en place plus de 2 semaines plus tôt.

Des sources fiables

Le site officiel des statistiques en France publie de manière transparente et publique les fichiers des décès. Cette publication arrive généralement avec un ou deux mois de retard, mais c’est mieux que rien.

C’est une excellente source de données pour mesurer la mortalité globale dans la population française. En effet, ces données étant publiques, il est extrêmement difficile de « tricher ». J’ai vérifié moi-même la présence de personnes décédées de mon entourage dans ces fichiers et je t’invite, lecteur, à faire de même. Ce sont des fichiers texte qui sont extrêmement faciles à lire et à analyser. Un simple [Ctrl-F] dans un éditeur texte basique permet de chercher le nom de quelqu’un.

Pour une analyse un peu poussée, il suffit d’introduire ces fichiers dans une base de données. On peut ensuite faire du filtrage et du comptage. On obtient alors directement toutes sortes d’informations, et ce pour chaque jour depuis des décennies. Par exemple la mortalité en fonction de l’âge. Ou encore le nombre de décès en fonction du département (et même de la commune).

Résultats

Voici le graphique final du nombre de morts en France sur les 20 dernières années :

Chaque courbe de couleur représente les données d’une année entière, chaque point correspondant à un jour donné, le premier janvier tout à gauche et le 31 décembre tout à droite, en ordonnée le nombre de morts par jour.

Il se dégage de ce graphique trois éléments majeurs :

  • la première anomalie qui saute aux yeux est un grand pic rouge au centre, ce n’est pas du tout une erreur, il correspond à… la canicule d’août 2003,
  • de manière plus générale, on constate que la mortalité est moins forte une fois le printemps arrivé et redémarre doucement en septembre, donnant aux courbes cet aspect de cloche inversée, ce qui montre que l’hiver est généralement plus mortel que l’été,
  • le dernier point est qu’on observe que certains hivers sont particulièrement plus meurtriers que d’autres, leurs courbes se détachent clairement au-dessus de celles des autres années.

La seule crise visible des années 2000-2019

Il se dégage donc des 20 dernières années une seule grande crise en terme de mortalité. On en a pas mal parlé à l’époque, mais c’est une période qui est aujourd’hui relativement oubliée.

Incontestablement, à l’échelle du pays, c’est la catastrophe sanitaire la plus grave et la plus fulgurante qui ait eu lieu dans les 20 dernières années. Lorsqu’on fait le total, cela fait plus de 17.000 morts de plus que la moyenne habituelle pour la saison, en l’espace de 2 semaines. Plus de 58.000 morts au mois d’août 2003 en France, contre environ 41.000 morts en 2002 et 2004.

Détaillons par tranches d’âges

Regardons l’impact de la canicule en fonction de l’âge en isolant seulement l’année 2003 :

Chaque courbe est ici le nombre de morts par tranche d’âge de 10 ans

Sans surprise, ce sont les plus de 70 ans qui ont le plus souffert. Ils correspondent aux trois courbes qui sont largement au-dessus des autres. Les 50-70 ans (les deux courbes en rose et gris) ne sont pas totalement épargnés non plus.

En revanche, les moins de 50 ans n’ont quasiment pas souffert en terme de mortalité. Ils apparaissent en bas, dans la courbe violette et celles en-dessous d’elle.

Détaillons par Département

On peut voir très rapidement des différences notables de l’impact de la canicule dans les différentes régions. Les graphiques suivants sont pondérés par la population totale. Par ailleurs, chaque point est une moyenne des dix jours précédents pour lisser les courbes. En effet, les variations sont trop grandes d’un jour à l’autre lorsqu’on regarde un département seul.

Les régions centrales et grandes villes

Beaucoup de grandes villes, Paris, Lyon, Bordeaux, et certaines régions ont été très fortement impactées par la canicule :

Les régions épargnées

Dans d’autres régions, en revanche, le pic est parfois à peine visible :

  • certaines régions épargnées comme le Cantal ou l’Aveyron, probablement favorisées par la campagne où la chaleur se fait moins sentir que dans les grandes villes,
  • les régions montagneuses où la chaleur s’est évidemment fait beaucoup moins sentir et où le pic d’août est beaucoup moins prononcé qu’ailleurs,
  • certains départements de Bretagne, grâce à son climat océanique.

On pourrait également comparer en terme de pyramide des âges dans chaque département. Les analyses possibles ne manquent pas…

La carte

Et, bien sûr, la carte que tout le monde attend. Plus c’est rouge, plus le taux de mortalité dépasse largement celui de 2002 et 2004 sur le mois d’août.

Différence de mortalité entre 2003 et les années adjacentes (2002 et 2004) – plus c’est rouge, plus la différence est importante (et donc la mortalité qu’on peut imputer à la canicule de 2003)

On voit que la Lozère (en blanc) a en fait moins de morts en août 2003 qu’en 2002 et 2004. Anomalie qui est facilement explicable : c’est le département le moins peuplé de France. Il n’y a en moyenne que deux décès par jour dans ce département en été. Il n’y a donc pas suffisamment de données pour qu’elles soient statistiquement pertinentes. Peut-être qu’il y a eu des morts de la chaleur dans ce département cette année-là, peut-être pas, difficile à dire avec les chiffres seuls.

Impact à court terme

L’impact à court terme de cette augmentation soudaine des décès en 2003 est assez intéressant à analyser.

Concentrons notre regard sur les courbes de mortalité de 2002 à 2005.

Courbes lissée du nombre de morts pour 1 million d’habitants

Pour commencer, on voit que la canicule s’est en fait déroulée en deux temps :

  • une première secousse mi juillet  qui a déjà fait son lot de victimes, en épuisant déjà probablement beaucoup d’autres personnes déjà fragiles,
  • une accalmie fin juillet qui semble laisser du répit,
  • finalement la grande vague principale en août.

Au-delà du pic d’août 2003, on voit que la fin de la même année est aussi plus mortelle que les autres (la courbe rouge dépasse très clairement les autres courbes à droite). Ce n’est plus là l’aspect canicule, évidemment, mais autre chose. La réponse se trouve sur le réseau sentinelle, qui indique une forte grippe ainsi qu’une forte incidence de diarrhée hivernale cette année-là. On peut dire que l’année 2003 a fait des ravages parmi les plus fragiles.

Or, on s’aperçoit que la courbe de 2004 (en vert) est sensiblement en-dessous de toutes les autres. Ce n’est pas une grosse surprise : les personnes les plus vulnérables n’ont pas passé le cap de 2003, autant de décès en moins en 2004 !

Vérification sur toute la période

Regardons le nombre de morts par an (pour 1 million d’habitants, pour prendre en compte l’augmentation de la population) :

L’année 2003 a clairement dépassé les précédentes, puis les années suivantes ont été plus « calmes ». Pour revenir une dizaine d’années plus tard au même niveau que 2003.

On voit bien là l’effet d’une épidémie ou d’une canicule qui balaye malheureusement les plus fragiles : ces épisodes ôtent quelques années de vie supplémentaires à ceux qui sont les plus faibles physiquement, mais qui n’auraient probablement pas vécu très longtemps de toute façon.

Grippes

Analyse

Lorsqu’on regarde le tout premier graphique de cet article, on peut voir que certains hivers « dépassent » les autres en terme de mortalité, très souvent dus à des grippes saisonnières. Ces épisodes peuvent faire 20.000 morts de plus que la normale dans l’année, étalé sur un ou deux mois, mais guère plus. Sur une semaine, on peut même exceptionnellement observer un quart de mortalité de plus qu’une « bonne année ».

En 2005 survient un épisode grippal particulièrement violent, comme le signale encore le réseau sentinelle. On le voit parfaitement dépasser toutes les autres courbes entre février et début mars dans la dernière courbe ci-dessus (le dos d’âne bleu à gauche). Malgré tout, l’impact sur la saison entière reste assez mineur par rapport à d’autres grippes plus récentes. Peut-être dû au choc de 2003, qui a fait que les personnes les plus fragiles n’étaient plus là en 2005.

Visualisation

Si on regarde la mortalité en hiver, de début novembre à fin mars, on voit qu’il y a une sur-mortalité certaines années dues en particulier aux épisodes gripaux. Malgré tout, cela ne fait pas plus de 10% de changement sur la saison, même pour les années les plus violentes que sont les hivers 2016-2017 et 2017-2018. On peut voir cela sur le graphe suivant, qui donne le nombre de morts par saison hivernale pour 1 million d’habitants.

Ce graphique peut faire peur, à cause du démarrage de l’axe des ordonnées à 6800. Si on regarde l’impact sur la mortalité totale avec un axe commençant à 0, l’effet est totalement différent. On peut alors voir l’impact de la grippe sur l’ensemble de la mortalité. Il n’est pas totalement négligeable, mais il reste faible.

Attention donc lorsqu’on regarde un graphique de prendre tout en compte, y compris les axes.

On peut en tout cas remarquer que la mortalité à l’échelle de la France est très stable sur les 20 dernières années en hiver, une véritable horloge !

L’impact psychologique

Il y a un phénomène que l’on sous-estime trop souvent : l’impact psychologique des décès sur les survivants.

Les morts naturelles prévues

Une personne âgée qui meurt avec des arrières-petits-enfants est toujours un événement triste pour les survivants. Malgré tout, la tristesse est souvent atténuée par le fait que cette personne « a eu une belle vie ». On se dit aussi que, « à son âge », l’inévitable allait arriver un jour ou l’autre, dans le court terme. Il y a eu un temps de « préparation » émotionnelle pour l’entourage, même si évidemment on n’est jamais réellement préparé au décès d’un proche.

Les accidents

Un accident soudain d’une personne dont on n’attendait pas qu’elle nous quitterait sous peu est totalement différent émotionnellement pour l’entourage. Et ce pour une multitude de raisons :

  • évidemment, c’est un choc émotionnel beaucoup plus fort puisque totalement inattendu, sans aucun avertissement préalable,
  • cela laisse sur le carreau des proches qui pensaient encore vivre de longues années voire décennies avec cette personne,
  • une mort accidentelle laisse un vide de responsabilités qui est à combler, tant psychologique que matériel, par exemple dans le cas du décès d’un parent laissant l’autre parent seul avec des enfants, ce qui en plus de la détresse psychologique liée au décès provoque des incertitudes matérielles qui renforcent encore l’angoisse,
  • il est souvent impossible de « faire ses adieux » lors d’une mort soudaine, ce qui rend le deuil encore plus difficile,
  • etc.

Une mort « inattendue » est donc beaucoup plus difficile à supporter. C’est le cas d’accidents, mais aussi de certaines maladies ou attaques foudroyantes.

De nombreux accidents visibles dans les données

En arpentant les données et les graphes obtenus grâce au site du Gouvernement, on retrouve les stigmates d’accidents survenus non seulement en France, mais aussi à l’étranger. Ainsi, le graphique de la Thaïlande est le suivant :

Une petite idée sur le grand pic bleu à droite ? Le tsunami de fin 2004. Quand au pic vert de septembre 2007, c’est le crash de Phuket. Et le petit pic noir à gauche, un accident de bus en avril 2000.

On y retrouve d’autres catastrophes comme l’accident d’avion de Charm el-Cheikh en Égypte au début de 2004. Et aussi sur le sol français loin de la métropole, bagay la, comme il est appelé localement, le tremblement de terre à Haïti en 2011. Autant d’accidents qui laissent des traces dans les chiffres, mais pas toujours autant que dans les mémoires.

Un exemple : le Bataclan (13 novembre 2015)

Dans le cas de phénomènes qui impactent plus que l’entourage proche, comme les attentats, l’impact psychologique sur une population peut être très violent. Ce fut le cas par exemple lors de l’attaque terroriste du Bataclan le 13 novembre 2015.

Si on ne regarde que les chiffres purs de la mortalité, cet événement n’a même pas laissé la moindre trace dans la mortalité à l’échelle de la France :

Dans le même temps, on voit bien que l’activité de la grippe de 2016 (au-dessus du seuil épidémique selon les bulletins de l’époque) fait une très nette différence par rapport aux années précédentes (en rose à droite sur le graphique), mais cela n’a pas fait la une des médias, même s’ils en ont un peu parlé à l’époque.

En revanche, en terme d’impact psychologique sur la population, si personne en 2020 ne se rappelle de la grippe de 2016, tout le monde se rappelle l’attaque du Bataclan. C’est là que l’impact d’un événement inattendu fait une énorme différence de ressenti, qui n’est pas forcément visible dans les chiffres.

Toutefois, si on zoome sur le département 75 (Paris), l’événement est parfaitement visible :

En fait, il est même encore plus visible en zoomant sur les 20-50 ans comparé aux plus de 60 ans où il ne l’est pas, ce qui est logique, vu l’âge moyen de ceux qui assistaient au concert.

Les chiffres sont donc à prendre avec précaution, ils ne reflètent pas toujours la réalité en fonction de ce qu’on regarde et il s’agit de sélectionner avec prudence ceux qu’on veut mettre en avant.

Conclusion

Dans quelques mois, nous aurons les données consolidées détaillées des décès de mars et avril 2020. On pourra alors discuter de l’impact global en France et en fonction des régions de ces premiers mois d’épidémie. Il faudra à ce moment-là ne pas oublier d’ajouter les morts en Allemagne, Luxembourg, Suisse et Autriche, qui ont été envoyés dans ces pays en soins intensifs. Il ne faudra pas non plus oublier que, au-delà des morts, cet épisode aura traumatisé beaucoup de gens :

  • restés confinés chez eux hantés par de la claustrophobie, stressés financièrement,
  • certains laissés à eux-mêmes avec la maladie à étouffer pendant des jours,
  • passages aux urgences,
  • guéris avec des séquelles pulmonaires graves…

Sans oublier un lot de morts non négligeable de personnes qui étaient apparemment en parfaite santé avant de contracter le Covid-19 et dont le décès a été un choc pour leur entourage, en tout point semblables à des accidents soudains. Ces dommages sont irréversibles et durables dans la population. Chaque « + 1 » est un être vivant avec un impact sur ses proches.

En attendant…

La question demeure : à quel point le Covid-19 va-t-il réussir à infléchir la courbe des décès (réponse ici), et ce malgré le confinement ? 40 % de plus ? 50 % ? Quid de l’impact négatif et positif du confinement ?

Négatif pour certains, surtout en terme psychologique mais aussi financier, ce qui a également un effet anxiogène.

Mais positif aussi car moins de stress des transports, moins d’accidents sur la voie publique et… mois de pollution, ce qui dans les grandes villes devrait avoir un effet très positif en terme de réduction de la mortalité. En effet, la pollution ferait environ 50.000 morts par an en France. C’est bien plus que le Covid-19 pour l’instant…

Et pendant ce temps, la nature reprend ses droits, et les apiculteurs en détresse (dont on n’entend jamais parler dans les médias malgré la crise sans précédent qu’ils traversent depuis 20 ans) connaissent un nouveau souffle.