Les visualisations sont puissantes, mais souvent trompeuses – AIER

Une visualisation puissante des données peut démontrer en un clin d'œil ce qui pourrait prendre des minutes, voire des heures à découvrir grâce à la lecture et à l'analyse. Le pouvoir de la visualisation réside dans la capacité de relier rapidement des milliers, voire des millions de points de données, transmettant ainsi leur signification.

Chaque partie d'une visualisation implique quelque chose. Très souvent, je tracerai des lignes. Selon la nature de la visualisation, le sens est véhiculé par la pente ou la hauteur de la ligne. Une ligne dont les valeurs augmentent pourrait afficher un revenu croissant avec le temps. Ou, l'aire sous une courbe peut transmettre la distance parcourue si les unités représentées par la ligne sont des mètres par seconde.

Très souvent, je transformerai des données pour aider à clarifier leur signification. En économie, il est courant de prendre la valeur consignée des données générées au fil du temps car les valeurs consignées vous permettent de comparer la variation proportionnelle d'une unité de temps à la suivante. Supposons que votre vitesse augmente constamment pour qu'elle double toutes les 10 secondes. Ou imaginez que votre revenu double chaque année. Très rapidement, la valeur représentée par la ligne deviendra assez grande.

Ceci est illustré par un conte sur les origines des échecs. Un roi a offert de récompenser le créateur, qui a habilement demandé un cadeau de riz (ou de blé selon le rendu) où pour chaque case de l'échiquier, le nombre de grains doublerait, de 1 à 2, à 4, pour finalement atteindre 263. Très vite, le roi a appris qu'il n'avait pas tenu compte de l'ampleur du cadeau! Si nous devions enregistrer l'axe vertical pour représenter l'histoire, la ligne utilisée pour représenter le nombre de grains de riz pour chaque carré supplémentaire serait droite au lieu de devenir une courbe assez raide. La pente de la ligne correspondrait approximativement au changement en pourcentage d'une période à l'autre.

Données COVID19 et règles générales pour la visualisation des données

Comme pour tout outil, la visualisation doit être utilisée de manière responsable. Les outils de visualisation d'un type de données peuvent ne pas convenir à un autre. Si je devais représenter graphiquement la vitesse d'une voiture dans le temps dans le but d'indiquer la distance parcourue, cela n'aurait pas de sens pour moi d'enregistrer l'axe vertical. Par exemple, lorsque je génère des statistiques pour les données, je n'enregistre pas les taux d'intérêt ni n'évalue la variation en pourcentage d'un taux d'intérêt. Je calcule les valeurs enregistrées et la variation en pourcentage pour des variables qui sont des niveaux comme le PIB réel et la quantité de dollars circulant dans l'économie américaine.

Faire une transformation incorrecte des données peut conduire les observateurs de données à des conclusions incorrectes. Comme les données COVID-19 ont proliféré depuis le début de l'année, j'ai observé maintes et maintes fois des individus qui présentaient les données de manière incorrecte. Pour nommer un péché pernicieux, les comparaisons du nombre total de cas ou de décès entre les pays ou entre les comtés des États-Unis fournissent peu ou pas d'informations utiles pour comparer l'état de propagation dans chaque entité. Si l'objectif est de faire des inférences à partir de la comparaison des données de différentes juridictions, alors les données doivent être contrôlées pour la population.

Vous devez également tenir compte de la nature d'un ensemble de données. Par exemple, même en tenant compte de la population, il est peu logique de comparer le niveau de cas positifs de COVID19 dans les pays qui n'ont pas une capacité comparable à fournir des tests. Le nombre de tests par million aux États-Unis va être beaucoup plus élevé que le nombre de tests par million en Afghanistan. Ces problèmes ont été omniprésents.

Aujourd'hui, j'ai été surpris quand j'ai vu un nouveau problème dans la présentation des données concernant l'état de la propagation en Suède. le Financial Times a indiqué que le nombre quotidien de décès par million et par jour en Suède a récemment dépassé celui de l'Italie, du Royaume-Uni et de la Belgique. L'article comprend un graphique comparant le Royaume-Uni et la Suède et des liens vers un graphique comparant l'Espagne et la Suède. Les deux visualisations ont utilisé un axe y enregistré pour comparer des valeurs qui sont déjà des taux de variation. Comme je l'ai noté, l'aire sous une courbe indique l'accumulation de valeur dans le temps dans des graphiques où le taux de changement est indiqué sur l'axe vertical et le temps sur l'axe horizontal.

Si vous enregistrez des valeurs représentées par l'axe vertical, cela comprime les zones qui sont relativement grandes et développe les zones qui sont relativement petites. Les plats à emporter de la Financial Times l'article est quelque peu ambigu. L'auteur ne prend pas une position ferme dans un sens ou dans l'autre. Les nuances de l'article, cependant, ne sont pas ambiguës. Ce n'est peut-être pas l'intention de l'auteur, mais les détails subtils véhiculent beaucoup.

Le titre de l’article informe le lecteur que «le nombre de morts en Suède déconcerte ses voisins nordiques». Il cite des données concernant les différences de nouveaux décès par million chaque jour entre la Suède, le Royaume-Uni, l'Espagne et l'Italie, mais ne compare pas les niveaux. Il compare le niveau de décès total par million en Suède avec les niveaux de ses voisins, Pays-Bas, Danemark et Norvège.

L'article cite un politicien danois très inquiet:

«Je ne pense pas que le Danemark devrait déjà ouvrir sa frontière avec la Suède parce que la situation de Covid-19 est toujours hors de contrôle en Suède. Le Danemark doit attendre une normalisation en Suède. C'est donc une décision rationnelle basée uniquement sur le nombre de morts de Covid-19 », a déclaré Peter FT Skaarup, chef parlementaire du parti populiste du peuple danois, au FT.

Certains des pays voisins ont l'impression que la Suède a adopté une politique extrême et peut-être dangereuse.

Je ne connais pas exactement le sentiment que les voisins de la Suède en général ont envers sa politique. L'article peut être vraiment représentatif à cet égard. Cependant, je pense qu'il est approprié de transmettre tous les faits, pas seulement les négatifs. Dans cet esprit, j'offre au lecteur une visualisation comparant la Suède avec d'autres pays, mettant en avant l'Espagne en particulier. Je présente les données avec des axes verticaux enregistrés et des axes verticaux non enregistrés.

Dans les parcelles avec des valeurs non enregistrées, la zone sous la courbe représente le nombre total de décès liés au COVID-19 dans un pays. La zone mise en évidence entre les courbes représente la différence entre l'Espagne et la Suède. Le lecteur notera que les parcelles enregistrées sous-estiment le niveau de décès (zone sous la courbe) pour l'Espagne par rapport à la Suède.

La Suède a aplati sa courbe sans verrouillage sur la présomption que le nombre de décès qui résulteront de sa stratégie sera égal au nombre de décès qui se produiraient avec un verrouillage. La stratégie de la Suède a reçu les éloges de l’OMS, mais a reçu de vives critiques de la part de certains experts du pays. Seul le temps nous dira si cette hypothèse est correcte.

Ma meilleure supposition – je suis un économiste, pas un épidémiologiste – est que nous n'aurons pas les données nécessaires pour juger jusqu'à ce que nous voyions des vagues ultérieures de propagation. Les épidémiologistes qui dirigent la politique en Suède sont convaincus que leur approche est la bonne.

À la lumière de mes propres préférences, je dois reconnaître au moins quelques faits. La politique de la Suède n'est pas de minimiser le taux de propagation. Leur objectif est de rendre la propagation gérable, limitant ainsi les pertes de vie inutiles. La Corée du Sud, en revanche, a montré qu'un programme de suivi dès les premiers jours de la propagation est en fait assez efficace pour ralentir la propagation.

Il n'y a aucune comparaison avec le succès que nous avons observé dans toute l'Asie du Sud-Est en ralentissant la propagation.Je suis plus que peu à l'aise avec une stratégie qui utilise le suivi involontaire pour ralentir la propagation, mais son succès est impossible à nier. La perte de liberté potentielle d'une surveillance croissante vaut-elle la peine d'être supportée?

Et bien que la Suède semble se porter relativement bien compte tenu du fait qu'elle n'a pas verrouillé, elle est surclassée en termes de niveau de décès par million par un certain nombre de ses voisins qui ont verrouillé. Seul le temps nous dira si l'état final sera différent une fois par an ou plus.

Je ne peux pas non plus cacher que je me méfie des politiques qui menacent la liberté à long terme et qui me semblent manquer de respect aux protections de nos libertés civiles prévues par la Constitution américaine. Je ne suis pas à l’aise avec le fait que le virus nous rend méfiants les uns envers les autres. J'attends avec impatience une époque où la société retrouvera un niveau d'ouverture plus élevé.

J'accepte qu'un retour à la normalité fasse partie d'une conversation démocratique qui se produit fondamentalement au niveau local, et que beaucoup pensent que tous les efforts possibles doivent être faits pour maximiser l'aplatissement de la courbe. Je dois respecter l'inquiétude de ceux qui m'entourent. La plupart des États-Unis ne prennent pas en charge un type de politique suédoise. Je remarque également que la plupart ne sont pas à l'aise de discuter des options politiques.

Bien que mon intérêt oriente le sujet de mon analyse, il ne devrait pas entraîner de résultats catégoriques. Je crois que la démocratie dépend d'une volonté de s'engager ouvertement avec des idées qui remettent en question nos croyances fondamentales et nos préférences les plus fortes. S'il existe un ensemble d'idées fortement étayées par des preuves et en contradiction avec mes propres croyances, je dois au moins respecter la force de la position, sinon l'accepter toutes ensemble. Je serais malhonnête de faire autrement.

Et, quelle que soit ma position, les données doivent pouvoir parler sans être déformées. Je laisse au lecteur le soin d'interpréter ce qu'il dit.

James L. Caton

listpg_caton

James L. Caton est professeur adjoint au Département d'agroalimentaire et d'économie appliquée et membre du Center for the Study of Public Choice and Private Enterprise de la North Dakota State University. Ses intérêts de recherche incluent la simulation basée sur les agents et les théories monétaires des fluctuations macroéconomiques. Il a publié des articles dans des revues savantes, notamment Advances in Austrian Economics et the Review of Austrian Economics. Il est également co-éditeur de Macroeconomics, un ensemble d'essais et de sources primaires en deux volumes sur la pensée macroéconomique classique et moderne.
Caton a obtenu son doctorat. en économie de l'Université George Mason, sa maîtrise en économie de l'Université d'État de San Jose et son B.A. en histoire de l'Université d'État de Humboldt.

Soyez informé des nouveaux articles de James L. Caton et AIER. SOUSCRIRE

Vous pourriez également aimer...