Carte des Jeux olympiques

Les Jeux Olympiques de Londres 2012 sont maintenant terminés, et en tant qu'entreprise britannique, nous avons été heureux de constater que les jeux ont été un tel succès, et bien sûr que l'équipe GB l'a fait de manière spectaculaire ! Nous attendons maintenant les Jeux paralympiques dans quelques semaines, et une fois que la poussière sera retombée, nous expédierons une nouvelle version de XLCubed en septembre.

Pour l'instant, nous gardons la plupart des changements dans l'ombre, mais nous introduisons un élément, les tableaux. Le tableau des médailles olympiques nous donne une belle occasion de mieux comprendre la répartition des médailles grâce au nouveau type de graphique. Dans XLCubed, les tableaux peuvent être produits directement à partir d'un cube ou d'un tableau Excel, comme c'est le cas ici. Le premier exemple ci-dessous montre la répartition des médailles par pays et par sport. La taille du rectangle indique le nombre total de médailles, et la couleur indique le nombre de médailles d'or, plus la couleur est foncée, plus elle est dorée. Les valeurs numériques indiquent le nombre total de médailles, puis le nombre de médailles d'or. On peut voir les États-Unis au sommet, et que plus de la moitié de leurs médailles proviennent de la natation et de l'athlétisme, avec un plus grand pourcentage d'or dans la piscine.

N'importe quel pays peut être consulté pour avoir une vue d'ensemble de son palmarès, non pas que nous soyons partisans bien sûr... , mais la vue ci-dessous concerne la Grande-Bretagne (GBR) où les résultats particulièrement bons de l'équipe de cyclisme se distinguent.

En examinant les mêmes données réparties d'abord par sport puis par pays, il est facile de voir les pays qui dominent les médailles dans chaque sport, et d'approfondir le cas échéant par sport.


 Si l'on examine l'athlétisme, on constate que les États-Unis ont remporté le plus grand nombre de médailles, et aussi le plus grand nombre d'or. La Grande-Bretagne n'a remporté que 6 médailles, mais 4 étaient en or, d'où la couleur plus foncée de leur carreau.

Une version interactive sera disponible dans les prochains jours.

 

 

Drive Excel Chart Min/Max from Range

Comment déterminer les valeurs min et max d'un axe à partir d'une plage Excel ? C'est l'une des questions les plus fréquemment posées à propos d'Excel et, à chaque nouvelle version, je suis toujours étonné que cette fonctionnalité n'ait pas été ajoutée au produit de base.

C'est un scénario très courant, vous construisez un graphique linéaire et tout semble correct jusqu'à ce qu'Excel décide soudainement de mettre la valeur minimale à 0, tous les détails sont perdus et vous êtes passé d'un bel ensemble de lignes détaillées à un mélange de couleurs de quelques pixels de haut.

Il existe des techniques assez sophistiquées qu'Excel utilise pour déterminer le minimum et le maximum à utiliser, mais parfois nous voulons simplement les régler sur une valeur particulière (normalement autre chose que 0 !).

Voici un ensemble de chiffres assez simple et le graphique qui en résulte que nous obtenons à partir d'Excel (avec toutes les valeurs par défaut).

 

 

 

 

 

 

 

 

 

 

Tout cela a l'air bien, mais changeons la valeur de "C" de lundi à 86, et regardez ce qui se passe maintenant :

 

 

 

 

 

 

 

 

Excel a appliqué ses règles et a décidé que le 0 est un bon point de départ pour le graphique, mais dans ce cas, je perds beaucoup de détails et je me retrouve avec toutes les lignes regroupées.

Nous pourrions, bien sûr, changer la valeur minimale de l'axe pour quelque chose d'un peu plus raisonnable, donc nous utiliserons l'option Format Axis pour fixer une valeur minimale de 84 :

 

 

 

 

 

 

 

 

 

 

 

 

Ça a l'air mieux !

 

 

 

 

 

 

 

Les numéros de base avaient été saisis manuellement, donc pouvoir taper une valeur fixe dans l'axe minimum est bien, mais que faire si les numéros proviennent d'une base de données cube ou Sql ? Ne serait-il pas vraiment utile de pouvoir piloter la valeur minimale à partir d'une plage ; je peux changer à peu près tout ce qui concerne le graphique mais après tant d'années et tant de versions différentes, je ne peux toujours pas le faire.

Heureusement pour moi (et pour nos clients !), nous disposons déjà d'un complément Excel, de sorte que nous pouvons simplement ajouter la fonctionnalité nécessaire à cette fin en utilisant l'une des nouvelles formules de la version 6.5 :

XL3SetProperty( ObjectType, ObjectName, Property, Arg1, [Arg2],..., [Arg27] )

La formule pour faire varier l'axe du graphique est simple :

=XL3SetProperty("Chart", "Chart 1", "YMin",$C$1)

Les autres options sont :

PropriétéDescriptionValeur
"YMin" ou "YMax"Fixe les limites de l'axe Y.Numérique
"Y2Min" ou "Y2Max"Fixe les limites de l'axe Y2.Numérique
"XMin" ou "XMax".Fixe les limites de l'axe X.Numérique
"X2Min" ou "X2MaxFixe les limites de l'axe X2.Numérique

Nous pouvons enfin établir des rapports (et les publier sur le web), confiants que, quels que soient les données ou les critères choisis, nous n'allons pas nous retrouver avec un graphique linéaire commençant à 0 et regroupant toutes les lignes.

Cette formule peut également être utilisée pour modifier divers aspects de nos propres grilles, trancheurs et petits multiples basés sur les valeurs des cellules d'excel. Le genre de choses que nos clients et nous-mêmes voulions réaliser étaient des choses comme

  • Déplacer les dimensions entre les axes
  • Modifier les types de sélection des membres
  • Modifier diverses propriétés de la grille en fonction de différentes formules

Voyons comment la formule fonctionne pour réaliser certaines de ces choses :

=XL3SetProperty("Grid", "My Grid", "HierarchiesOnColumns", "[Products]", "[Regions]", $a$1)

Déplacer le produit, la région et toute autre hiérarchie dans $a$1 vers les colonnes (je pourrais utiliser un slicer ou un drop down pour mettre à jour $a$1 afin de permettre à l'utilisateur de passer d'une hiérarchie à l'autre)

=XL3SetProperty("Grid", "My Grid", "RemoveEmptyRows",$b$1)

Permet d'afficher ou non les lignes sans données sur la base de la valeur de $b$1

Si vous pensez qu'il serait utile de piloter certains aspects d'Excel à partir d'une gamme, faites-le nous savoir !

Small Multiples on River Quality

L'expression "petit multiple" a été popularisée par Edward Tufte et est devenue un terme générique pour désigner un affichage visuel utilisant le même diagramme ou graphique pour afficher différentes tranches d'un ensemble de données. Leur positionnement rapproché et leur échelle commune rendent les comparaisons très faciles et les tendances communes ou les valeurs aberrantes peuvent être rapidement repérées. Divers autres termes sont également utilisés pour décrire cette approche graphique ou certains de ses aspects spécifiques, notamment les diagrammes en treillis, les diagrammes en treillis, les diagrammes en grille et les diagrammes en panneaux.

Le cas le plus courant pour les petits multiples est celui des graphiques linéaires séparés permettant de comparer la tendance d'un grand nombre d'éléments variables. Le fait de les placer tous dans un seul graphique entraînerait soit un "graphique en spaghetti", soit beaucoup d'occlusion, comme le montre la comparaison ci-dessous. Nous utilisons ici un graphique linéaire Excel standard et un petit multiple XLCubed pour représenter les mêmes données. Le fait de séparer les graphiques tout en conservant une échelle d'axe cohérente permet une comparaison beaucoup plus facile que dans le graphique unique.

Nous avons adopté une approche légèrement différente en utilisant de petits multiples pour examiner les différences de qualité de l'eau des rivières entre les régions du Royaume-Uni. Nos données de base n'étaient pas des valeurs numériques absolues, mais 14 années de résultats classés en quatre catégories (mauvaise, mauvaise, moyenne et bonne). Nous voulions fournir une "page" qui donne une idée de la tendance dans chaque région, mais aussi un accès à la ventilation annuelle des différentes qualités d'eau.

Finalement, nous avons opté pour un petit affichage multiple de colonnes empilées à 100 %, comme indiqué ci-dessous.

Une base de pourcentage a semblé être une manière raisonnable d'aborder les données, car les différentes régions auront des nombres différents de rivières et d'échantillons prélevés. Cette approche nous permet de comparer la qualité relative de l'eau plutôt que de traiter des données absolues.

L'utilisateur sélectionne une zone géographique du pays pour visualiser la répartition régionale au sein de la zone sélectionnée. La qualité de l'eau pour une année donnée peut être analysée en localisant la région, et l'année spécifique pour voir la répartition en pourcentage pour chacune des quatre catégories.

La coloration des 4 catégories a été choisie pour aider à reconnaître "en un coup d'œil" la qualité globale de l'eau par région, ainsi que la tendance. Le bleu foncé signifie une eau de mauvaise qualité (opaque), et le bleu clair une eau de bonne qualité (pensez "vous pouvez voir à travers...").

Donc pour lire l'affichage dans son ensemble, ou pour la tendance :
- Une couleur foncée signifie un problème de qualité de l'eau.
- Une couleur claire signifie que l'eau est de bonne qualité.
- De gauche à droite, la saturation croissante des couleurs indique une baisse de la qualité au fil du temps.
- De gauche à droite, une saturation des couleurs décroissante indique une amélioration de la qualité au fil du temps.
- Toute région peut être agrandie pour voir un graphique plus grand et comprendre la répartition plus en détail.

Assez rapidement, et à partir de ce seul affichage, nous pouvons tirer un certain nombre de conclusions comme ci-dessous :
- Dans toute la région, en résumé, la qualité de l'eau s'est améliorée depuis 1992.
- Doncaster a montré une amélioration forte et constante.
- Kingston upon Hull a la plus mauvaise qualité de toute la région, et varie considérablement d'une année à l'autre.
- Si vous allez vous baigner dans une rivière du Yorkshire, le Richmondshire semble être un bon choix !

Nous avons conçu une vue prédéfinie dans ce cas pour fonctionner avec les données en question, mais le concept de petit multiple est également très puissant lors de l'exploration interactive des données. Une image peut dire mille mots comme on dit - regardez nos vidéos Youtube sur les petits multiples : Vidéo1 Vidéo2

 

Something on the Horizon

Nous avons eu un scénario intéressant en aidant un client à étendre un tableau de bord Excel existant.

Nous avions récemment effectué des travaux pour résoudre certains problèmes de performance et de conception qu'ils avaient avec leurs cubes existants des Services d'analyse. Ils disposaient désormais d'un plus grand nombre de données sous-jacentes et pouvaient interroger des périodes plus longues sans que les performances ne soient affectées (un an de données contre 28 jours).

Ils ont voulu en tirer le meilleur parti en retraçant l'évolution des données sur les ventes quotidiennes au cours des 12 derniers mois, ventilées selon leurs quatre principaux groupes d'activités. L'idéal serait que le graphique fasse partie du rapport de gestion existant, la difficulté étant l'absence de rapport immobilier pour ajouter les informations supplémentaires. C'est un problème que nous avons tous rencontré par le passé et qui, bien sûr, est généralement résolu par l'utilisation de graphiques In-Cell.

En traçant les données sur un graphique Excel dans l'espace disponible, nous obtiendrions ceci :

 

 

La conversion à Sparklines nous a donné une vue légèrement meilleure, mais étant donné le nombre de données tracées, ce n'est pas encore l'idéal.

 

 

Heureusement, notre client avait récemment mis à jour la version 6.1 de XLCubed, ce qui nous a permis d'utiliser l'un de nos plus récents types de cartes incellulaires : SparkHorizons. Le document de recherche contient une bonne explication des cartes Horizon : Sizing the Horizon : The Effects of Chart Size and Layering on the Graphical Perception of Time Series Visualizations, et Stephen Few en a déjà parlé.

Un graphique linéaire est essentiellement divisé en bandes colorées - des degrés de bleu pour les nombres positifs et des degrés de rouge pour les nombres négatifs. Dans XLCubed, il s'agit de 3 bandes de chaque couleur. La séparation de l'échelle verticale signifie que les diagrammes d'horizon peuvent être beaucoup plus efficaces que les lignes d'étincelles standard où l'échelle des nombres varie considérablement, mais où vous voulez quand même conserver une vue à l'échelle commune.

Dans ce cas, le fait de tracer les mêmes données que les cartes d'horizon rend les choses beaucoup plus claires :

Il devient maintenant très clair que les ventes ont une tendance à la hausse ou à la baisse. Il est également possible d'inverser les valeurs négatives pour qu'elles apparaissent dans le même sens que les valeurs positives :

 

Nous cherchons toujours des moyens de développer et d'étendre XLCubed, SparkHorizons a été ajouté parce qu'il semblait qu'il avait le potentiel d'être utile là où les données le permettaient, il était donc agréable de pouvoir l'utiliser dans une situation réelle.

Il convient également de mentionner que bien que, dans ce cas, les données proviennent des cubes des services d'analyse, comme ils sont disponibles sous forme de formule Excel, ils peuvent être utilisés pour tracer n'importe quelle donnée Excel, voici un exemple de la formule :

=XL3SparkHorizon(Feuille1!$V$2:$V$262,Feuille1!E10)

Les données de la feuille 1!$V$2:$V$262 seront alors représentées sous forme de graphique SparkHorizon dans la feuille 1!E10.

 


Heatmap Tables with Excel – Revisited

Nous avons revu l'un de nos guides les plus populaires, Heatmap Tables with Excel, car ils peuvent être un moyen très efficace de présenter des données sur un tableau de bord, et nous l'avons maintenant mis à jour pour Excel 2010...

Ce tableau de carte thermique est conçu pour vous montrer les revenus et les remises d'une entreprise sur une année par groupe de produits. La taille d'une bulle indique les revenus réalisés au cours d'un mois donné et la couleur de la bulle indique le taux de remise accordé. Le taux d'actualisation a été encodé sous la forme d'une gamme de couleurs vertes, allant du vert clair, pour les remises faibles, au vert foncé pour les remises élevées. Les années et les totaux des produits sont indiqués à droite et en bas comme partie intégrante du tableau.

Tufte parle souvent de l'intégration des chiffres, des images et des mots ; je pense qu'il a raison. Un moyen d'y parvenir dans Excel est d'intégrer des graphiques dans des tableaux, appelés tableaux graphiques, un moyen très efficace de montrer "plus d'informations par pixel".

Le tableau de la carte thermique est basé sur un graphique à bulles Excel ordinaire. Pour intégrer un diagramme à bulles dans un tableau, les bulles sont positionnées dans une matrice qui a la même disposition de lignes et de colonnes que notre tableau.

 

 

 

 

 

 

 

 

 

 

 

 

 

Dans notre cas, nous générons un tableau de séries de données avec une colonne pour la série X allant de 1 à 12 pour janvier - décembre et une colonne pour notre série Y allant de 1 à 8 pour nos 8 groupes de produits et une colonne pour les revenus.

Dans l'exemple de feuille de calcul, nous avons établi une formule Excel simple pour traduire les données de la grille classique :

au format requis :

Nous pouvons maintenant insérer le graphique à bulles :

 

Pour garantir que les graphiques s'intègrent exactement dans la grille du tableau, nous avons fixé les valeurs Min/Max pour l'axe X à 0,5/12,5 et pour l'axe Y à 0,5/8,5. Sinon, Excel calculerait des échelles automatiques beaucoup plus grandes. Réglez également les unités majeures sur 1 afin que nous puissions utiliser cela plus tard pour définir certaines lignes de la grille.

 

Maintenant, nous enlevons la légende, les axes X et Y, nous maximisons la surface du graphique et nous alignons le graphique avec le tableau Excel. Comme les bulles sont initialement trop grandes, nous devons les rendre plus petites. Pour contrôler la taille des bulles, allez dans les options des séries de données et augmentez la taille des bulles à 50% :

 

Cela fait déjà un joli tableau à bulles que vous pourriez utiliser pour reproduire les graphiques de Twitter.

Pour les lignes de la grille, formatez les en-têtes de vos tableaux et les lignes de la grille avec des lignes grises claires. Redimensionnez la zone du graphique, retirez la bordure et repositionnez le graphique de manière à ce que les lignes de grille du graphique et du tableau s'alignent.

Pour créer la carte thermique avec des bulles de couleurs différentes, nous utilisons le fait que par défaut, Excel ne trace pas de points de données pour les valeurs #NA. Pour la carte de chaleur, nous superposons 8 séries de bulles, une série par couleur verte, et n'affichons une bulle de revenu que si la valeur entre dans la plage de valeurs correspondant à une couleur verte de notre rampe de couleur, sinon nous affichons #NA.

Nous divisons la gamme MAX(Discount)..0 en 8 groupes pour définir les couleurs.

Les colonnes des séries de données utilisent la formule suivante pour vérifier si une valeur d'actualisation correspond à un intervalle / une nuance de couleur :

=IF(AND($E7>I$6-Step,$E7<=I$6),$D7,NA())

La formule retourne les recettes, si les valeurs d'actualisation se situent dans l'intervalle défini dans l'en-tête de colonne I$5.

 

 

Créez maintenant les huit séries de données de sorte que la taille de la bulle se réfère aux huit colonnes du tableau de données :

 

Et utilisez les styles de graphiques Excel pour choisir une gamme de couleurs - assurez-vous d'enlever la bordure de la zone du graphique.

 

 

Et vous pourriez utiliser les styles de cartes pour passer rapidement d'une couleur à l'autre - ou personnaliser chaque série pour affiner les couleurs.

Vous pouvez télécharger un point de départ pour ces fichiers ici : HeatmapSample.xlsx. La plupart des formules devraient s'adapter aux valeurs des données que vous pouvez introduire dans les fiches techniques, y compris les données provenant directement des services d'analyse si vous utilisez des grilles ou des formules XLCubed.

Vous pouvez voir une version interactive de la Heatmap ici - nous avons ajouté un lien vers certaines données du cube, certains Slicers pour piloter les paramètres et ensuite publié sur XLCubedWeb.

 

 

Flexible time-series graphing from a slicer

On nous demande souvent comment piloter un graphique à partir d'une trancheuse dans XLCubed et comment tracer les jours/mois pour un mois ou une année. Le cas de base est assez simple : vous pouvez créer une grille basée sur les "x" mois précédents de la sélection d'une trancheuse, par exemple. La difficulté peut résider dans le fait que vous souhaitez faire varier le comportement en fonction du niveau de la hiérarchie choisi par l'utilisateur. Cela est particulièrement vrai lorsque la hiérarchie contient des semestres ou des trimestres.

L'exemple ci-dessous montre une technique permettant de gérer cette complexité et d'afficher le tableau d'une manière significative pour l'utilisateur dans chaque cas. Le rapport est basé sur une trancheuse qui permet à l'utilisateur de passer de l'affichage des données du graphique en fonction des trimestres, des mois ou des jours.

Vous pouvez télécharger la feuille de calcul Excel utilisée dans l'exemple ici TimeSeriesGraphFromSlicer

Elle est connectée à la base de données de démonstration d'Adventureworks qui est livrée avec les services d'analyse.

Le diagramme ci-dessous montre le flux de données de chaque feuille de travail montrant le résultat final dans la feuille Graphique.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fiche de travail - Tableau

Cette feuille montre le graphique basé sur les données choisies dans la trancheuse au-dessus. Les données du graphique sont ainsi permutées entre les trimestres, les mois et les jours en fonction du choix de la trancheuse.

 

Fiche de travail - GridForChart

Cela montre les données qui seront représentées graphiquement, en fonction du choix fait par la sélection du trancheur. Dans cet exemple, il s'agit des mois de juillet 2001 à juin 2002. L'exercice financier 2002 a été sélectionné par l'utilisateur (dans cet exemple, l'exercice financier 2002 va de juillet 2001 à juin 2002).

Notez que les cellules A10 - A21 contiennent la valeur "VRAI" - ces cellules contiennent une déclaration XL3RowVisible comme suit :

=XL3RowVisible(B10<>””)

Cette déclaration cache les lignes sans données afin qu'elles ne soient pas tracées sur le graphique.

Fiche de travail - SlicerToMonthDay

Cette feuille contient les données qui sont renvoyées par le choix du trancheur dans le cahier de travail de la feuille Chart.

L'utilisateur sélectionne un mois

Les données seront présentées sous forme de graphiques en jours. Par exemple, si l'utilisateur sélectionne juillet 2002, le graphique sera affiché avec chaque jour de juillet sur l'axe des x. Ces derniers sont définis dans XLCubed comme étant les "enfants" de la trancheuse.

L'utilisateur sélectionne un trimestre

Les données seront présentées sous forme de mois sur une période de trois mois. Par exemple, l'utilisateur sélectionne Q1 FY 2003 et les données affichées sont pour trois mois de juillet 2002 à septembre 2002 comme ci-dessous. Ces données sont définies dans XLCubed comme "Descendants de" la trancheuse au mois. Ce sera la même chose lorsque l'utilisateur choisira l'année, le semestre ou le trimestre.

L'utilisateur sélectionne un semestre

Les données seront présentées sous forme de mois sur une période de six mois. Par exemple, l'utilisateur sélectionne le premier semestre de l'exercice 2003. La capture d'écran ci-dessous montre les données qui seront représentées graphiquement.

Toutefois, on peut constater que les valeurs T1 EF 2003 et T2 EF 2003 ne devraient pas apparaître sur le graphique.

En utilisant la fonctionnalité d'édition des membres, il est possible de les supprimer afin qu'ils n'apparaissent pas comme des points sur le graphique.

Pour ce faire, modifiez le membre Date.Fiscal et cliquez sur l'onglet Avancé.

Cliquez sur le menu déroulant à côté du premier membre - ce jeu de membres est le résultat des données lorsque l'utilisateur sélectionne H1 FY 2003 et affiche les données qui se trouvent dans les cellules B10 - B43 dans la feuille SlicerToMonthDay.

 

La capture d'écran ci-dessous montre les données qui seront soustraites - il s'agit en fait de la valeur réelle sélectionnée par l'utilisateur via le trancheur, à côté des deux valeurs du semestre fiscal T1 FY 2003 et T2 FY 2003.

 

La feuille GridForChart ne montre plus que les six mois qui devraient être tracés. Comme expliqué précédemment, une manipulation supplémentaire à l'aide de la fonctionnalité XL3RowVisible permet de supprimer les lignes vides.

 

La capture d'écran ci-dessus montre le graphique avec six mois de données pour le premier semestre de l'exercice 2003 pour les mois de juillet 2002 à décembre 2002, et les trimestres ont été exclus de façon dynamique.

Le résultat final est un sélecteur de temps flexible où l'utilisateur peut choisir des dates à différents niveaux de la hiérarchie, et obtiendra toujours un graphique de séries chronologiques significatif et contextuel.

 

 

Data Visualization – a real world example

Dans l'exemple suivant, nous travaillons sur un exemple réel de visualisation de données. Nous avons choisi un exemple qui implique des données d'exploitation - il n'est pas spécifique à un domaine particulier, donc nous espérons qu'il peut démontrer certains points importants. Le premier point, et le plus important, est que vous devez définir votre public.

Nous recevons de nombreuses questions sur "quel est le meilleur graphique pour cette situation" ou "quelle couleur dois-je utiliser pour mettre l'accent". Ces questions abordent généralement le problème sous le mauvais angle. La seule question que vous devez poser avant toute autre chose est "qui va voir cette visualisation et comment ? Que ce soit dans une salle de conférence sur une feuille imprimée ou dans une salle de marché sur un écran plasma. Les consommateurs sont-ils des experts du domaine ?

Cet exemple présente des données sur le traitement des opérations d'une banque d'investissement, le public étant les clients du département des opérations.

Point de départ

Au départ, le projet consistait simplement à essayer d'enregistrer les problèmes opérationnels rencontrés au quotidien dans les différentes lignes de produits. Un système de rapport a été mis en place et divers rapports génériques ont été produits :

DVBlog1

Malheureusement, soit les rapports ne contenaient pas de données à un niveau suffisamment granulaire, soit il était difficile pour les responsables de produits de voir où se situaient les problèmes et quelles étaient les tendances. En réalité, le rapport montrait quels étaient les principaux problèmes - malheureusement, cela était déjà connu, car lorsque quelque chose de majeur se passe mal, on se souvient qu'on s'est fait engueuler !

Ce qui a été demandé

Le client souhaitait un rapport montrant où les problèmes se produisaient dans les différentes lignes d'activité (plutôt que dans les unités opérationnelles) et comment ils se situaient historiquement, en une seule page qui pourrait être incluse dans un dossier hebdomadaire du SIG (ils avaient actuellement quatre pages par ligne de produits (8), soit un total de 32 pages. En premier lieu, ils voulaient simplement une feuille de calcul Excel qu'ils pourraient mettre à jour manuellement :

DVBlog2

Nous avons estimé que cette solution manquait de clarté et qu'il était très difficile de repérer les tendances d'un produit à l'autre.

Ce que nous avons proposé

Nous avons conçu une solution utilisant les MicroCharts pour permettre à de petits multiples de cartes de montrer une variété de vues :

DVBlog3

Cette solution a permis à l'utilisateur de visualiser les données simplement comme un ensemble cumulé de données par produit (ligne supérieure) ou par cause fondamentale (verticalement) et d'examiner ensuite plus en profondeur les tendances historiques au centre du graphique. Par exemple, il est assez facile de voir les pics historiques des données sur les causes profondes et de constater que la tendance générale s'est améliorée au fil du temps. En classant les produits et les causes profondes, vous donnez immédiatement une idée de l'échelle des données. Par exemple, vous pouvez voir qu'il y a beaucoup plus de défaillances d'applications que tout autre type de problème, mais que la majorité des causes profondes sont par ailleurs réparties assez uniformément.

Un autre point à noter est que la palette de couleurs d'origine était beaucoup plus discrète, mais le client s'est énervé parce qu'elle ressemblait à la couleur d'un concurrent et voulait qu'elle soit "plus forte".

Quelle a été la réaction des utilisateurs...

Enthousiasmés, une page a remplacé 34 et ils ont pu voir d'un coup d'œil comment fonctionnait l'ensemble de la (grande) organisation, mais aussi découvrir rapidement les détails d'un domaine particulier et identifier les tendances.

(de)Faults in Excel Charting

J'ai récemment pris la parole à SQLBitsIII, et un aspect qui s'est bien passé était une simple vue d'ensemble sur la façon de rendre l'aspect le plus important d'un graphique, à savoir les données sous-jacentes, le point central et clair et facile à lire. J'ai également eu l'occasion d'assister aux ateliers de visualisation de l'information de Stephen Few à Londres, que je recommande vivement. Stephen a également consacré un certain temps, dans le cadre d'un programme global beaucoup plus détaillé, à la manière dont un graphique par défaut typique peut être transformé en un affichage efficace.

Cette semaine, nous revenons donc à l'essentiel et à la manière d'améliorer la norme, avec un tableau Excel prêt à l'emploi. Malheureusement, malgré son omniprésence, les paramètres par défaut du graphique, dont de nombreux utilisateurs ne s'écarteront jamais, ne sont pas idéaux dans le cas d'Office 2007, et dans les versions précédentes, ils étaient plutôt horribles. Dans cet article, je vais vous présenter quelques étapes simples qui peuvent transformer les plaisirs visuels par défaut du graphique Excel en quelque chose que vous n'avez pas besoin d'être gêné de mettre sur le projecteur.

J'utilise Excel "classique" comme point de départ, parce qu'il est toujours en place dans la plupart des organisations (et aussi parce que c'est pire). L'exemple concerne les graphiques à colonnes, mais la plupart des conseils sont valables pour n'importe quel type de graphique. Pour commencer, nous avons les données de ventes unitaires de 3 produits dans 6 pays, sous forme de diagramme à colonnes Excel par défaut, ci-dessous.

BadChart

 

 

 

 

 

Joli. C'est mal à bien des égards, mais combien de centaines de fois avez-vous vu ceci ou une version de ceci ? C'est un terrain bien foulé si vous avez lu Tufte, Few at al, mais les principales recommandations pour améliorer les choses sont étonnamment simples, et rapides à mettre en œuvre.

1) Supprimer le désordre et le bruit

L'objectif du tableau est de présenter les données d'intérêt de manière claire et concise. Il n'a pas pour but de distraire l'utilisateur avec de jolis effets d'ombres ou de 3D, etc. Bien que le tableau par défaut soit sans fioritures, il y a un certain nombre d'éléments qui n'ajoutent rien ou qui ont une importance excessive et qui, ce faisant, nuisent à l'objectif général.

  • La zone du terrain
    • Le fond gris de la zone de la parcelle n'ajoute rien, donc nous l'enlevons
    • La limite de la zone de la parcelle - la supprimer également (de nombreuses études ont montré que nous n'avons besoin que de deux axes pour regrouper et visualiser efficacement les données)
  • Gridlines
    • Les lignes de grille par défaut sont noires, trop intenses visuellement. Elles sont là pour servir de référence lorsque c'est nécessaire, et non pas comme point de mire principal. Il est donc préférable de les mettre en sourdine, c'est-à-dire de les régler sur un gris clair.

2) Axes et légende

Les axes encadrent le graphique et constituent un point de référence clé ; toutefois, ils ne doivent pas tirer le centre d'intérêt du graphique lui-même. Comme pour les lignes du quadrillage, ils doivent être atténués.

  • Changer la couleur par défaut de la police noire en charbon / gris foncé
  • Changer la couleur de l'axe par défaut de noir à charbon / gris foncé
  • En général, la taille de la police est réduite à 8

Les règles pour la légende sont similaires à celles de l'axe

  • Changer la police de caractères du noir au gris
  • Supprimer la bordure ou changer sa couleur en gris très clair
  • Réduire la taille de la police à 8
  • Pour une colonne regroupée, ma préférence va à la légende placée en bas, et à la lecture en travers dans l'ordre d'affichage des colonnes.

3) Colonnes et couleur

Les bordures noires des colonnes n'ajoutent rien, et doivent donc être supprimées, elles sont une autre forme d'"encre non informative" de Tufte.

La couleur, et malheureusement, les remplissages par défaut du tableau Excel sont la prune fortement saturée et le vin avec une crème légère... Je vous conseille donc vivement de changer la palette de couleurs du graphique. Pour les graphiques à colonnes, il y a généralement un bloc de couleur raisonnable pour chaque série, donc la palette de couleurs ne doit pas être trop grasse, sinon cela devient une plaie pour les yeux. Il faut viser des couleurs d'intensité moyenne et de saturation similaire (sauf si l'on veut faire ressortir une couleur), les pastels ont tendance à bien fonctionner.

 

Toutes les étapes ci-dessus sont simples et assez rapides à mettre en œuvre, à une exception près, la palette de couleurs. À moins que vous n'ayez déjà préparé des palettes, il est possible de passer un certain temps à essayer d'obtenir la combinaison idéale - rappelez-vous la règle des 80/20 !

GoodChart2

 

 

 

 

 

 

Dans mon exemple ci-dessus, qui, je l'espère, vous conviendrez qu'il s'agit d'une amélioration, j'ai utilisé la palette de couleurs de notre prochain produit "Chart Tamer". Chart Tamer est bien plus qu'une simple palette de couleurs, mais cet aspect a bénéficié d'esprits ayant beaucoup plus d'expertise en matière de couleurs que le mien, et je choisirai à chaque fois la leur plutôt que la mienne !

Household Income Distribution 1967 – 2005 As Small Multiples Chart

Dans mon dernier billet, j'ai corrigé un graphique linéaire surchargé que Jorge a présenté dans un billet récent sur l'aversion aux pertes :

image
Jorge a demandé "est-il logique d'ajouter ces neuf séries à un seul graphique ?
Ma tentative de corriger la carte en utilisant un code de couleur a des défauts qui ont causé des quelques discussions.

image

Alors, encore une fois, comment pouvez-vous donner aux utilisateurs toutes les données qu'ils attendent tout en gardant le graphique propre et lisible ?

D Kelly O'Day a souligné que "plus de données ou de meilleures couleurs n'aideront pas une mauvaise sélection du type de graphique" et a présenté un graphique en points

image

Essayons de sélectionner le bon type de graphique. Dans Chart Rules, aussi simple que possible, mais pas plus simple ! j'ai présenté un ensemble de règles faciles à apprendre pour déterminer le meilleur type de graphique.


1. Déterminez la relation que vous voulez afficher
-

In our case a we have a Distribution Relationship, we want to show the Distribution of the Income Levels


2. Déterminez si vous voulez mettre l'accent sur des valeurs individuelles ou sur le schéma global et

emphasize individual values or the overall pattern  and Determine the chart type

Comme nous voulons mettre l'accent sur les valeurs individuelles, un diagramme en colonnes est le plus efficace.

image

Ce graphique nous donne déjà une bonne idée de la répartition des revenus en 1967 - il semble que la répartition en cloche soit presque parfaite, avec un ventre pour les niveaux de revenus moyens. Mais comment les choses ont-elles changé entre 1967 et 2005 ? Créons un ensemble de petits multiples pour montrer la situation en 1967, 2005 et l'augmentation de 1967 à 2005.

image

Using Color to Group and Label in Charts

Jorge a écrit dans un récent article sur l'aversion aux pertes, le fait que "les gens préfèrent fortement éviter les pertes que d'acquérir des gains".

L'aversion pour les pertes [...] : Traduit en termes de cartographie, cela signifie qu'il existe une "tendance à éviter de perdre des données à tout prix". Le graphique ci-dessous vous montre le revenu monétaire des ménages tel qu'il est publié.

image

Prenons le graphique ci-dessus, par exemple : cela a-t-il un sens d'ajouter ces neuf séries à un seul graphique ?

Si vous supprimez les séries de données non pertinentes, vous risquez une mutinerie sur le Bounty, même si les tendances pertinentes sont plus faciles à détecter. C'est absurde, mais très humain.

Alors, comment pouvez-vous donner aux utilisateurs toutes les données qu'ils attendent tout en gardant le tableau propre et lisible ?

Continuer à lire "Utilisation de la couleur pour regrouper et étiqueter dans les tableaux"