Fleet | Blog - D’une Google Sheet à un Data Studio interactif !

D’une Google Sheet à un Data Studio interactif !

L'auteur

Abélia Petelle

Data Analyst at Fleet

Publié le 06/10/2020

Il y a un an, à la fin de mes études à l’Université Paris Dauphine, j’ai décidé d’approfondir mes connaissances dans l’analyse de données. J’ai donc suivi la formation en Data Analyse d’Ironhack afin d’acquérir toutes les compétences techniques essentielles du métier : SQL, Python, Tableau … Une expérience très challengeante qui m’a donné le goût pour la data !

Il y a 5 mois, pour concrétiser cet apprentissage, j’ai rejoint l’équipe de Fleet en tant que Data Analyst. Avec Alexandre Berriche (CEO) et Guillaume Arduin (PM), j’ai implémenté une nouvelle architecture de données afin d’aider aux mieux les équipes à comprendre l’activité ainsi que leurs performances. Un premier projet ambitieux dans lequel j’ai énormément appris !

Contexte

Comment structurer l’ensemble des données d’une entreprise afin de mesurer sa performance en temps réel ?

Chez Fleet, avec une forte croissance et l’embauche d’une dixième personne, il était devenu indispensable pour nos équipes d’instaurer une culture “Data Driven”, et par conséquent, de répondre à cette première question.

Aujourd’hui, grâce à la mise en place d’une nouvelle architecture de données, nous sommes capables d’analyser les performances de nos équipes en temps réel, et ainsi de leur donner une entière visibilité sur l’activité.

Dans cet article, nous vous partageons quelques enseignements tirés de notre expérience afin d'atteindre un tel objectif. Screenshot 2020-10-05 at 15.49.25

1. Définir les objectifs

La première étape clé de tout projet est souvent la même : il est question de s'assurer en amont d'avoir toutes les informations nécessaires et des objectifs clairs afin de mener à bien les analyses prévues.

Il faut alors interroger les managers sur leurs besoins :

  • Quel est l'objectif du rapport et à quel besoin doit-il répondre ?
  • Quels sont les KPIs à suivre ainsi que leurs priorités d’avancement ?
  • À quel membre de l'entreprise ainsi qu'à quelle fréquence les dashboards sont-ils destinés à être envoyés ?

Chez Fleet, nous avons ainsi arrêté les objectifs suivants :

  • des dashboards en temps réel ;
  • associés à chaque équipe ;
  • présentant des KPIs de performance actionnables.

Afin de confronter ces objectifs internes avec les réalités du marché, nous nous sommes documentés (articles Medium, Youtube, webinars, etc) et nous avons contacté plusieurs autres start-ups pour bénéficier de leurs conseils et expériences.

Un point fort de ces échanges fut de réaliser qu'il n’existait pas de modèle type. Parmi une dizaine d'entreprises interrogées, aucune n'avait la même architecture ni les mêmes usages pour des outils pourtant identiques.

2. Définir une architecture data

Chaque architecture data étant différente selon le business, la taille et les ressources de l’entreprise, il est primordial de s’attarder sur sa réflexion en interne.

On pourrait penser qu'un seul outil suffirait à acheminer toutes les données de l’entreprise à un logiciel de visualisation. En réalité, si l’on souhaite aller plus loin dans les analyses et croiser nos données, ces dernières doivent obligatoirement passer par plusieurs étapes de traitement : la collecte, la réplication, le stockage, la transformation et l’analyse.

Screenshot 2020-10-05 at 15.50.19

Une architecture de données optimale doit ainsi être composée de différents outils complémentaires, exerçant chacun un rôle bien défini :

Screenshot 2020-10-05 at 15.50.12

Certes, cette architecture de données est plus complexe à mettre en place mais elle garantit :

  • une indépendance vis-à-vis des fournisseurs de solutions ;
  • un choix plus large d'outils ;
  • une meilleure adaptation aux volumes croissants de données et projets de l’entreprise.

C’est pour toutes ces raisons que nous avons décidé de nous tourner vers cette stratégie. Reste alors à choisir les outils qui correspondent le mieux aux besoins de notre entreprise.

3. Benchmarker les outils adéquats

Aujourd’hui, il existe un très grand nombre d’outils spécialisés dans l’exécution des différentes tâches listées précédemment. Cependant, ces dernières années, plusieurs outils se sont démarqués pour leurs solutions :

  • peu coûteuses ;
  • sans prérequis techniques avancés ;
  • et sans nécessité de maintenance.

Chez Fleet, nous avons procédé à un benchmark complet de ces solutions. Il nous a permis de nous rendre compte qu'il était tout à fait possible, sans embaucher un ingénieur data, de mettre en place une architecture adéquate pour une start-up comme la nôtre.

Lors de notre benchmark, nous avons regardé plusieurs critères afin de choisir chaque outil : Peut-il se connecter facilement avec les autres outils du benchmark ?

  • Est-il facile d'accès ou requiert-il de la maintenance ?
  • Possède-t-il une documentation et un support de qualité ?
  • Existe t-il des bons retours des utilisateurs (G2, Gartner's reviews) ?
  • Quelles sont les ressources nécessaires à son utilisation ? (un data analyst/scientist/ingénieur)
  • Les coûts estimés rentrent-ils dans l’enveloppe du budget alloué au projet ?

Nous avons fait le choix de 4 nouveaux outils :

Screenshot 2020-10-05 at 15.51.02

4. Nettoyer les données

Une fois les solutions choisies, il est important de ne pas s'attaquer directement à leur implémentation. Il y a d'abord une étape à ne jamais oublier, celle communément appelée “Data Cleaning”. Elle est essentielle au projet afin de garantir :

  • une utilisation de __jeux de données historiques de qualité ;
  • des analyses exemptes de tout biais.

Durant cette étape, il est question de s'assurer de la justesse des données. Il faut alors se poser plusieurs questions :

Screenshot 2020-10-05 at 15.51.21

Vous comprendrez très vite qu’il s’agit souvent de l’étape la plus longue du projet. Comme le disent souvent les data scientists : “80% du métier consiste à nettoyer les données”. Chez Fleet, durant plus d'un mois nous avons mis en place des mesures correctrices et des procédures en interne pour nous assurer du respect de ces 5 critères.

5. Implémenter les outils

Ces premières étapes achevées, nous pouvons enfin passer à la mise en place des outils ! Cependant, n’allons pas trop vite car l’important ne réside pas ici dans la rapidité avec laquelle vous allez accomplir cette étape mais dans la façon que vous aurez de la planifier, de tester les outils choisis et de corriger les éventuelles erreurs.

Chez Fleet, nous avons mis en place un PoC (« Proof Of Concept ») en partant d’un cas d’usage précis : analyser la performance des différents canaux d’acquisition marketing (Online et Offline).

Cela nous a permis d’identifier les éventuelles limites de certains outils et d’affiner notre stratégie.

Pour finir, une fois tous les outils en place, il est essentiel de s’assurer de la connectivité des données :

Screenshot 2020-10-05 at 15.51.13

Pour être honnête, il est presque impossible de ne pas rencontrer d’erreurs lors de l’implémentation des différents outils. Il ne faut donc pas s’inquiéter si cela vous arrive. La documentation et l’aide des équipes support sont souvent bien souvent suffisants.

6. Créer les dashboards

Nous abordons l’avant-dernière étape du projet : la création des dashboards.

Cette étape peut être plus ou moins longue selon l’outil de visualisation choisi. Globalement plus vous payerez, plus vous serez accompagnés.

Pour notre part, nous avons implémenté Google Data Studio, un outil gratuit et facile d’utilisation. Une première étape a été d'écrire et d’enregistrer au préalable nos requêtes SQL directement dans Big Query. Nous avons par la suite directement interrogé ces “vues” (tables intermédiaires de calculs) en tant que sources de données de notre Data Studio. Une autre solution est de créer des “vues” via des scripts Python sur votre application en appelant l’API de Big Query. Je ne rentrerai pas dans les détails techniques mais vous l’avez compris, les possibilités de calcul sont larges et variées !

Screenshot 2020-10-05 at 15.50.51

La dernière étape a été de créer manuellement nos 5 dashboards (Business, Sales, Operation, Marketing, Product) en commençant par les KPIs prioritaires listés dans la première étape du projet. Cette étape peut être assez longue puisque vous partez pour chaque rapport d’une page blanche. Elle est cependant très agréable à réaliser pour les amateurs ou experts de visualisation !

7. Faire adopter le nouvel outil aux équipes

L’adoption des outils par toutes les équipes de l’entreprise est la dernière étape fondamentale de réussite du projet.

Chez Fleet, nous avons implémenté nos dashboards Data Studio directement dans l’interface de notre back-office. Les équipes peuvent ainsi gérer les opérations et visualiser l’activité et leurs performances au même endroit. De plus, à chaque fin de mois nous envoyons les reportings aux équipes concernées afin qu’elles puissent avoir une vision mensuelle de l’activité.

Vous l’aurez compris, afin d’assurer un bon taux d’adoption de l’outil, il est donc indispensable de :

  • Fournir un maximum de libre service ;
  • Prendre en compte les retours et besoins d’amélioration ;
  • Expliquer le fonctionnement de l’outil (démos, formations) ;
  • S’assurer que chaque KPI soit bien assimilé.

Si vous êtes encore là à ce stade de l’article c’est que vous êtes déterminés à implémenter une architecture data solide !

J’espère que sa lecture vous a été utile.

Mon dernier conseil est de continuer à maintenir et à faire évoluer votre architecture de données et d’être toujours à l’écoute des nouvelles technologies du marché !

Revenir au Blog