Clients Total
Revenu Médian
Dépense Moy.
Age Moyen
Répartition du Chiffre d'Affaires
Analyse : On observe que la catégorie de produits qui génère le plus de chiffre d'affaires est celle des vins, suivie des viandes puis des produits aurifères.
Revenu vs Dépenses
Analyse : Le graphique montre une tendance positive entre le revenu et les dépenses totales, indiquant que les clients plus riches dépensent davantage.
Distribution des Revenus
Analyse : Après suppression des valeurs extrêmes, nous obtenons une distribution des revenus bimodale montrant le caractère hétérogène des clients.
Dépenses & Enfants
Analyse : Les clients sans enfants concentrent l'essentiel des dépenses élevées. Le nombre d'enfants apparaît comme un facteur déterminant.

Distribution des Âges
Analyse : La majorité des clients se situe entre 35 et 55 ans.
Niveaux d'Éducation
Analyse : La majorité des clients ont un niveau d'éducation Graduation suivi de PhD et Master.
Situation Familiale
Analyse : On observe une prédominance des clients Mariés et en Couple.
Distribution des Revenus par Situation Familiale
Analyse : Après regroupement en 'En Couple' et 'Seul', la distribution des revenus reste similaire entre les deux groupes.
Composition des Foyers
Analyse : La majorité des foyers n'ont pas d'enfants ou d'adolescents. Cependant, il y a une proportion significative de foyers avec un enfant.

Canaux d'Achat
Analyse : Le canal d'achat le plus utilisé est le magasin physique, suivi du site web.
Récence des Achats
Analyse : La distribution est largement uniforme, sans saisonnalité marquée.
Dépenses par Éducation
Analyse : Le graphique montre que le niveau d'éducation n'a pas d'impact significatif sur les dépenses totales.
Réponse aux Campagnes
Analyse : Le volume de non-répondants domine largement, ce qui confirme une faible activation.
Revenu selon la Réponse
Analyse : Les répondants affichent un revenu médian supérieur, ce qui positionne ce segment comme plus solvable.
Matrice de Corrélation


Dimensions du jeu de données

Dictionnaire des Variables

Description détaillée des variables disponibles dans le fichier source.



Configuration du Clustering






Variables utilisées: Dépenses Totales, Visites Web, Achats Magasin, Récence, Achats Promo
Méthode du Coude (Elbow)
Analyse : Le point d'inflexion indique le nombre optimal de clusters où l'ajout d'un cluster supplémentaire n'apporte plus de gain significatif.
Score de Silhouette
Analyse : Un score de silhouette élevé indique des clusters bien séparés. Le maximum suggère le K optimal.
Projection ACP des Clusters (Interactif)
Taille des Segments
Métriques de Qualité

Profil des Segments Clients
ADN des Segments (Radar)

Informations sur le projet

Segmentation Stratégique des Clients

Cette application a été réalisée dans le cadre de l'unité d'enseignement Data Visualisation.


Objectif

L'objectif de cette application est de segmenter les clients d'une entreprise en groupes homogènes basés sur leur comportement d'achat, en utilisant des techniques de clustering non supervisées (K-Means et CAH).


Technologies utilisées

  • R Shiny pour l'interface web interactive
  • ggplot2 et plotly pour les visualisations
  • FactoMineR pour l'ACP
  • cluster et factoextra pour le clustering