Problématique
L'objectif était de transformer un jeu de données brut contenant 3 années de ventes (2003-2005) en un outil stratégique d'aide à la décision. Le défi consistait à traiter des données hétérogènes pour permettre aux décideurs d'identifier :
- Les patterns de ventes et les tendances saisonnières.
- La performance géographique par région et pays.
- La segmentation client (comportements d'achat).
- La rentabilité du portefeuille produits.
Ma Solution
J'ai structuré ce projet en deux phases techniques majeures pour garantir la fiabilité des analyses :
- Phase 1 : Data Cleaning & ETL (Python) :
Avant tout développement, j'ai utilisé Python (Pandas & NumPy) pour automatiser le nettoyage du dataset. Cela inclut le traitement des valeurs manquantes, la correction des types de données, la gestion des doublons et la création de colonnes calculées nécessaires aux KPIs. - Phase 2 : Développement du Dashboard (Streamlit) :
J'ai conçu une application web interactive avec le framework Streamlit. L'architecture est modulaire (couches UI, logique métier et utilitaires) et comprend 6 modules d'analyse indépendants. - Visualisation : Utilisation de la librairie Plotly pour générer des graphiques dynamiques et exploratoires permettant un filtrage en temps réel des données.
Défis & Apprentissages
Ce projet m'a permis de valider des compétences essentielles en ingénierie de données :
- Maîtrise du pipeline complet : Du nettoyage des données brutes avec Python à la visualisation finale.
- Architecture logicielle : Conception d'un code modulaire et maintenable, facilitant l'ajout de nouveaux modules d'analyse.
- Optimisation : Mise en place d'un système de cache (TTL) pour garantir la fluidité de l'application malgré le volume de données.
- Insights Métiers : Capacité à transformer des lignes de code en indicateurs de performance (KPIs) exploitables par une direction générale