Visualisations avec Power BI
Intro
Dans la suite du cours, les visualisation sont appliquées sur un jeu de données concernant les tournages de films à Paris. [xls]
Nous avons déjà utilisé ce document lors d'un TP Excel et lors de notre initiation à SQL.
Question
Travail à faire : reproduire le rapport suivant : Rapport sur les tournages à Paris.
Ce rapport a deux pages contenant des histogrammes, une carte, un TreeMap, des outils de sélection et des segments.
Nous vous détaillons la procédure à suivre ci-dessous pour chaque type de visualisation.
Connexion et import des données
Dans un premier temps, il vous faut vous créer un compte en ligne sur l'outil Power BI. Ensuite, dans le menu de gauche, nous pourrons choisir la section Créer
afin d'ajoute ces données à notre compte. On choisira ensuite l'option Coller ou entrer manuellement des données
afin de copier coller les données du fichier Excel dans Power BI.
\\\ Explorer les données sous forme de Tableau
Nous avons importé toutes les données de notre base EBP dans l'outil d'analyse Power BI. Avant d'aller plus loin dans l'analyse et la visualisation de ces données, nous allons commencer par nous familiariser avec ces données.
Les différents parties du menu qui contient les outils de visualisation sont les suivantes :
La liste des différentes visualisations utilisables ;
La zone de paramétrage des visualisations ;
Les tables et leurs colonnes. Ici, une seule table "tournagedefilms" avec ses 18 colonnes.
Pour explorer les données, il est possible d'utiliser la visualisation "Table" (en rouge en haut à gauche dans l'image de gauche), puis de glisser n'importe quelle colonne dans la Zone 2 du menu de droite (en rouge au milieu à gauche). Il est possible de glisser plusieurs colonnes.
\\\ Visualisation sous forme d'histogramme
Bon, puisque le tout, c'est pas de faire des tableaux Excel mais des visualisations qui ont de la gueule de façon à épater votre manager qui est impressionné dès que y a de la couleur, on va passer aux histogrammes. Ce sera déjà un début.
Pour réaliser un histogramme, il faut cliquer sur la visualisation qui a une tête d'histogramme (encadrée en jaune dans l'image de droite). Puis ensuite, il s'agit de renseigner ce que l'on souhaite visualiser dans l'histogramme.
En l'occurrence, on s'intéresse ici au nombre de films tournés par année. On choisit donc la colonne "Année Début" que l'on renseigne dans "Axe" (zone 2), et la colonne "titre" qui va nous fournir la "valeur" (zone 2) à étudier en fonction de notre axe.
Automatiquement, Power BI calcule le nombre de titres par Année.
\\\ Encore de l'histogramme
Parce que l'histogramme c'est toujours efficace mais que votre manager n'a pas encore l'air suffisamment impressionné, on va passer au cran supérieur coté histogramme.
Il s'agit maintenant d'afficher le nombre de titres par année et en fonction du cadre dans lequel ils ont été tournés.
Pour cela, on va ajouter la colonne cadre (zone 3) dans le champ "Légende" de la zone de paramétrage de nos visualisations (zone 2) comme indiqué dans l'image de droite.
\\\ Un petit dernier coup d'histogramme
Votre manager est tellement impressionné par vos compétences de Data scientist qu'il en veut plus. Pour monter d'un cran encore, il s'agit maintenant d'afficher le nombre de titres par année et pas arrondissement. En revanche, pour que la visualisation soit lisible, on ajoute un filtre sur les arrondissements à considérer : de 75000 à 75010. Pour cela, on ajoute un filtre (zone 2) sur la colonne arrondissement comme indiqué sur l'image de gauche
\\\ Visualisation Treemap
Il est temps d'achever votre manager en montrant à toute la boite que vous avez un niveau de malade et que c'est à vous que revient le poste de manager. Pour cela, l'arme ultime, c'est le TreeMap (bien plus fort que le pie chart). En pratique, c'est pas vraiment plus pratique qu'un histogramme, mais les gens apprécient, ça fait des petits carrés rigolos.
Bon, un treemap, c'est quoi concrètement ? C'est ce qu'il y a à gauche. Ca va nous permettre de visualiser le nombre de titres par arrondissement alors que le nombre d'arrondissements est très élevé. En gros, c'est comme un histogramme qui s'utilise lorsque l'axe prend un nombre de valeur très élevé.
Pour réaliser votre Treemap, cliquer sur l'icone de visualisation (zone 1) Treemap (voir image de droite) puis renseigner dans la zone2 la colonne arrondissement comme "groupe" et le nombre de titres en "valeur" (voir image de gauche).
\\\ Carte interactive
Le treemap vous a valu la place de manager... A quand un poste de direction ? C'est le moment de briller avec une carte interactive ! Pas toujours utile, mais classe en toute circonstance.
Ici, nous allons afficher les lieux de tournages des films tournés à Paris en utilisant les coordonnées GPS. Il s'agit donc de choisir la visualisation Carte en zone 1 (Surtout pas carte Choroplèthe), et de renseigner zone 2 la latitude, la longitude.
On voit des points s'afficher sur la carte. C'est cool.
\\\ Visualisations dynamiques
Si vous ne l'aviez pas constaté, vos visualisations sont dynamiques. Il est possible de cliquer sur une barre de l'histogramme, sur un rectangle du treemap ou sur un point de la carte et toutes les visualisations changent à coté #PoudreAuxYeux
En revanche, pour simplifier cette forme d'interaction avec les données, il est également possible de fournir des boutons de sélection plus explicites que l'on appelle "Segments".
Nous allons par exemple ici proposer un moyen de filtrer les données selon la colonne "cadre". Pour cela, choisir la visualisation "Segments" en zone 1 et renseigner la colonne cadre dans le cadre Champ situé zone2.