Covid-19 : Suivi de la progression de l’épidémie en France, avec Power Query sur Excel

On n’arrête jamais de découvrir le potentiel de Power Query.

Tenez, voici un exemple : camarade Bertrand, dans son excellent billet, a eu l’excellente idée de taper dans les données hospitalières situées à https://www.data.gouv.fr/fr/datasets/r/63352e38-d353-4b54-bfd1-f1b3ee1cabd7 (on peut en trouver le descriptif, ainsi que d’autres données, sur cette page) pour en tirer des statistiques avec le logiciel R, très réputé dans le traitement des données. Son idée est tellement bonne que je lui ai piqué son titre. 😊

Je me suis demandé s’il était possible de faire quelque chose de similaire sur Excel avec Power Query (alias « Récupérer et transformer des données »). Et la réponse est… oui ! Cette expérience m’a même permis d’apprendre qu’on peut avoir comme source un fichier zip !

J’ai d’abord exploré une approche 100% Power Query, qui imite la syntaxe R du fichier de Bertrand. Par manque de temps, je n’ai pas terminé cette piste, d’autant plus que certaines tâches (notamment les comparaisons à des lignes précédentes) sont un peu lourdes (mais indéniablement possibles) sous Power Query.

J’ai donc réalisé une deuxième approche, dans laquelle je tire le meilleur de deux outils :

  • Power Query💪🏻, champion de l’extraction et de la transformation des données, se charge de :
    • rapatrier la liste des régions sur le site de l’INSEE (csv zippé),
    • rapatrier la liste des départements sur le site de l’INSEE (csv zippé),
    • rapatrier les données d’hospitalisation sur le site data.gouv.fr (csv),
    • assembler ces trois fichiers (fusions assez simples).
  • Puis avec les tableaux croisés dynamiques🤸🏻‍♂️, qui excellent pour l’agrégation et les calculs de variations, couplés à des segments (slicers en anglais), on produit des graphiques dynamiques.

Le résultat est un fichier qui vous présente une analyse dynamique, en fonction de vos choix de filtres géographiques. Pour mettre les données à jour à partir des données officielles, deux clics suffisent. Tout ceci avec une version récente d’Excel (2016 et plus) sans aucun programme supplémentaire !

J’ai ajouté ce fichier dans le corpus d’exemples que je fournis aux personnes qui participent à mes formations Excel niveau ninja 🐱‍👤.

Mais je le publie aussi pour que chacun ait une information objective. 😉 Testez par vous-même : vous pouvez le mettre à jour, expérimenter et le décortiquer. Il suffit de cliquer sur cette photo d’écran pour le télécharger.

Données dynamiques et toujours à jour dans Excel grâce à Power Query.
Data is beautiful !
Par contre, concernant l’esthétique, je sais que j’ai des progrès à faire. 🙂

Image : EsaRiutta / Pixabay