Découverte de Power BI
Pour analyser et visualiser les données stockées dans ACCESS, il est possible de "brancher" l'outil de Business Intelligence Power BI à ACCESS.
Pour des raisons de simplicité, nous allons dans un premier temps voir comment utiliser Power BI dans sa version online.
Nous allons étudier des données issues de data.gouv.fr sur les tournages de film à Paris et créer un tableau d'analyse qu'il sera possible de partager sur internet comme celui-ci : Dashboard d'analyse des tournages
Importation des données ----------------------------------------------------------------------
Tout d'abord, il s'agit de se connecter à Power BI en ligne : https://powerbi.microsoft.com
Ensuite, nous allons charger les données à analyser dans Power BI.
Les données à télécharger sont ICI [csv].
Une fois téléchargées, il s'agit de les importer dans Power BI.
Pour cela, cliquer sur "Obtenir des données" comme sur l'image de droite.
Puis sélectionner l'obtention des données par "Fichiers" en cliquant sur "Obtenir" (encadré en noir sur l'image de gauche).
Enfin, sélectionner "Fichier Local" (grisé sur l'image de droite) et sélectionner le fichier téléchargé sur votre ordinateur.
Une fois les données importées, vous devriez voir apparaître le nouveau jeu de données comme sur l'image de gauche.
Explorer les données sous forme de Tableau ----------------------------------------------------------------------
Nous avons importé les données. Avant d'aller plus loin dans l'analyse et la visualisation de ces données, nous allons commencer par nous familiariser avec ces données.
Dans un premier temps, double-cliquez sur le jeu de données dans le menu à gauche. Vous voyez apparaître une fenêtre avec à droite un menu tel que celui présenté dans l'image à droite.
Les différents parties de ce menu sont les suivantes :
La liste des différentes visualisations utilisables ;
La zone de paramétrage des visualisations ;
Les tables et leurs colonnes. Ici, une seule table "tournagedefilms" avec ses 18 colonnes.
Pour explorer les données, il est possible d'utiliser la visualisation "Table" (en rouge en haut à gauche dans l'image de gauche), puis de glisser n'importe quelle colonne dans la Zone 2 du menu de droite (en rouge au milieu à gauche). Il est possible de glisser plusieurs colonnes.
Question
Afficher en utilisant la visualisation "Table" de Power BI la durée en mois des tournages. Que constatez-vous ? Cela est-il cohérent avec les dates de début et de fin de tournage ?
Indice
Peut-être.
Utiliser l'histogramme ----------------------------------------------------------------------
Bon, puisque le tout, c'est pas de faire des tableaux Excel mais des visualisations qui ont de la gueule de façon à épater votre manager qui est impressionné dès que y a de la couleur, on va passer aux histogrammes. Ce sera déjà un début.
Pour réaliser un histogramme, il faut cliquer sur la visualisation qui a une tête d'histogramme (encadrée en jaune dans l'image de droite). Puis ensuite, il s'agit de renseigner ce que l'on souhaite visualiser dans l'histogramme.
En l'occurrence, on s'intéresse ici au nombre de films tournés par année. On choisit donc la colonne "Année Début" que l'on renseigne dans "Axe" (zone 2), et la colonne "titre" qui va nous fournir la "valeur" (zone 2) à étudier en fonction de notre axe.
Automatiquement, Power BI calcule le nombre de titres par Année.
Question
En utilisant l'outil histogramme, afficher le nombre de films tournés en fonction du mois de début. Existe-t-il une tendance ?
Encore de l'histogramme
Parce que l'histogramme c'est toujours efficace mais que votre manager n'a pas encore l'air suffisamment impressionné, on va passer au cran supérieur coté histogramme.
Il s'agit maintenant d'afficher le nombre de titres par année et en fonction du cadre dans lequel ils ont été tournés.
Pour cela, on va ajouter la colonne cadre (zone 3) dans le champ "Légende" de la zone de paramétrage de nos visualisations (zone 2) comme indiqué dans l'image de droite.
Un petit dernier coup d'histogramme
Votre manager est tellement impressionné par vos compétences de Data scientist qu'il en veut plus. Pour monter d'un cran encore, il s'agit maintenant d'afficher le nombre de titres par année et pas arrondissement. En revanche, pour que la visualisation soit lisible, on ajoute un filtre sur les arrondissements à considérer : de 75000 à 75010. Pour cela, on ajoute un filtre (zone 2) sur la colonne arrondissement comme indiqué sur l'image de gauche
Question
En utilisant la méthode exposée ci-dessus, afficher par année le nombre de titres tournés par des réalisteurs dont le nom ou le prénom contient "tar".
Treemap ----------------------------------------------------------------------
Il est temps d'achever votre manager en montrant à toute la boite que vous avez un niveau de malade et que c'est à vous que revient le poste de manager. Pour cela, l'arme ultime, c'est le TreeMap (bien plus fort que le pie chart). En pratique, c'est pas vraiment plus pratique qu'un histogramme, mais les gens apprécient, ça fait des petits carrés rigolos.
Bon, un treemap, c'est quoi concrètement ? C'est ce qu'il y a à gauche. Ca va nous permettre de visualiser le nombre de titres par arrondissement alors que le nombre d'arrondissements est très élevé. En gros, c'est comme un histogramme qui s'utilise lorsque l'axe prend un nombre de valeur très élevé.
Pour réaliser votre Treemap, cliquer sur l'icone de visualisation (zone 1) Treemap (voir image de droite) puis renseigner dans la zone2 la colonne arrondissement comme "groupe" et le nombre de titres en "valeur" (voir image de gauche).
Question
Renseignez la colonne réalisateur dans le champ Info Bulles de la zone 2 de paramétrage de votre visualisation. Que se passe-t-il ?
Question
En utilisant le treemap, quels sont les réalisateurs ayant tourné le plus de titres ?
Carte interactive ----------------------------------------------------------------------
Le treemap vous a valu la place de manager... A quand un poste de direction ? C'est le moment de briller avec une carte interactive ! Pas toujours utile, mais classe en toute circonstance.
Ici, nous allons afficher les lieux de tournages des films tournés à Paris en utilisant les coordonnées GPS. Il s'agit donc de choisir la visualisation Carte en zone 1 (Surtout pas carte Choroplèthe), et de renseigner zone 2 la latitude, la longitude.
On voit des points s'afficher sur la carte. C'est cool.
Question
Que constatez-vous concernant ces films tournés à Paris ?
Indice
Les données fournies par le gouvernement sont vraiment de mauvaise qualité.
Visualisations dynamiques ----------------------------------------------------------------------
Si vous ne l'aviez pas constaté, vos visualisations sont dynamiques. Il est possible de cliquer sur une barre de l'histogramme, sur un rectangle du treemap ou sur un point de la carte et toutes les visualisations changent à coté #PoudreAuxYeux
En revanche, pour simplifier cette forme d'interaction avec les données, il est également possible de fournir des boutons de sélection plus explicites que l'on appelle "Segments".
Nous allons par exemple ici proposer un moyen de filtrer les données selon la colonne "cadre". Pour cela, choisir la visualisation "Segments" en zone 1 et renseigner la colonne cadre dans le cadre Champ situé zone2.
Partager votre Rapport ----------------------------------------------------------------------
Si vous sauvegardez en utilisant Crtl + S ou Fichier> Enregistrer, vous pouvez donner un nom à votre rapport.
En cliquant sur Fichier > Publier sur le web, il vous est possible d'obtenir le lien pour partager votre dashboard sur internet, par mail. Ces rapports sont mêmes consultables sur téléphone #JeSuis2.0
Question
Avec vos connaissances d'expert Power BI, reconstituer le Rapport suivant : Dashboard d'analyse des tournages
Celui-ci est sur deux pages. Vous pouvez créer des pages en cliquant sur le "+" en bas de la fenêtre.