mercredi 4 juillet 2012

Le Livre du Mois : DataVision de David McCandless


Un petit bouquin pour les vacances, sur le sujet en vogue du moment : la Data Vizualisation ou DataViz.

Alors c'est un bouquin qui contient des rendus d'études statistiques, un peu "hype". Quelques exemples :


Je vous donne le pitch de la Fnac :

Chaque jour, nous risquons l'asphyxie, la noyade, inondés que nous sommes par l'information. La télévision, les journaux, le Web déversent désormais des flots ininterrompus de données, de chiffres, de prévisions. Dans cette masse, lorsqu'on trouve un schéma clair, une illustration lumineuse, un graphique explicite, c'est le soulagement, l'île au cœur de la tempête. Le design, en révélant la beauté cachée de l'information, nous aide à la comprendre, à la hiérarchiser, à la mémoriser. Comment ? Grâce à la puissance de notre œil. La vue est de loin le plus rapide et le plus puissant de nos sens. Et l'œil est délicieusement sensible aux variations de couleurs, de formes et de motifs. Il aime ce qui est beau. L'esprit, quant à lui, s'accroche d'abord aux mots, aux chiffres et aux concepts. Et si l'on combine le langage de l'œil avec celui de l'esprit, les deux langages, utilisés simultanément, s'enrichissent l'un l'autre. Et tout ? ou presque ? devient lumineux. C'est ainsi que ce livre fait la magistrale démonstration que l'on peut comprendre et mémoriser en un clin d'œil les sept chakras, l'évolution du mariage en Occident, le pourcentage d'étudiants vierges par disciplines universitaires, la conception fonctionnaliste de la conscience, la généalogie du rock et mille autres informations cruciales ou triviales. A vous de voir.


et le blog de l'auteur : David McCandless

C'est vraiment joli et sympa (et le bouquin est pas cher en plus :) ). Il y a malheureusement (ou heureusement peut-être vu la charge de développements que ça demanderait) peu d'applications directes avec la BI, car ce sont beaucoup de rendus statiques.
Néanmoins, on retrouve certaines choses implémentées dans des solutions de reporting : je pense aux treemaps par exemple :



J'en profite pour faire un peu de pub à Djeepy qui a écrit un article sur ce phénomène, et notamment un compte-rendu d'une conférence sur le sujet.





2 commentaires:

  1. David McCandless, c'est celui que Stephen Few a flingué parce que ses graphs ne ressemblent à rien non?

    http://www.perceptualedge.com/blog/?p=935

    :)

    Au dela de simplement troller, je suis un peu d'accord avec Mister Few. Les visualisations de McCandless c'est avant tout pour faire joli et seulement un petit peu pour illustrer. Je suivais son blog mais j'ai arrêté, il sacrifie vraiment trop le fond pour la forme.

    T'as eu aussi ce feeling avec le bouquin?

    RépondreSupprimer
  2. Je pense que Stephen Few a en partie raison.

    Je crois cependant qu'il ne faut pas se tromper sur le positionnement du livre. Il est vendu au rayon Graphisme/Beaux Arts, et non au rayon informatique ou statistiques.

    Son rôle premier est de montrer de "jolies" choses.

    Je ferai un parallèle avec les conecpt-cars dans l'industrie automobile. Les constructeurs fabriquent des concept-cars qui visuellement "déchirent". De temps en temps, ils mettent un moteur dedans pour montrer qu'ils peuvent rouler, mais jamais ils les industrialisent ni les envoient en chaîne de production. Par contre ils leur arrivent de garder un élément de leur concept-car et de l'intégrer dans leurs modèles de série : c'est ce que j'ai voulu montrer en parlant des treemaps.

    Un autre élément à prendre en compte est que ce livre est là pour donner une analyse globale d'une statistique et non une analyse détaillée (on dirait qu'on parle de cube OLAP :) ). Je prendrai pour exemple une carte de la chine (petite dédicace personnelle à mon épouse) représentée par les sites internet bloqués ou partiellement censurés, un peu de la manière suivante :

    http://tim-ho.com/wp-content/uploads/2010/01/what-does-china-censor-online.gif

    Il me semble que l'analyse consiste à montrer que beaucoup de sites sont censurés et non d'avoir la liste exhaustive de ces différents sites, liste qui constitue pourtant la donnée réelle de cette analyse.

    RépondreSupprimer