Synthèse puis utilisation cartographique de données clients
Note personnelle année prochaine : refaire export pour 0 absent dans relation, présence de plusieurs congrès obligeant filtres
Nous disposons cette fois de données brutes sur des participants à un salon de professionnels du domaine médical, à Monaco. Pour des raisons analytiques ou prédictives, il est intéressant de connaître la typologie de ces clients (sa cible, target), et leur comportement (nous parlons parfois de personas, les grands profils clients d'une activité).
Les clients s'inscrivent sur place ou à l'avance dans une application. Il peuvent déjà avoir un profil dans l'application et participer à d'autres congrès. Ils peuvent aussi payer plusieurs entrées à un même congrès.
Une base SQL est derrière et pour des raisons applicatives tout-à-fait standards, les données vous sont accessibles uniquement sous la forme de tableaux occurentiels (des tables SQL). Ici la table des profils des clients et la table des commandes effectuées.
Pour les utiliser dans des thématiques cartographiques, il nous faut d'abord les synthétiser.
Calculons les nombres de clients et chiffres d’affaire par pays.
Le fichier export_commandes liste les commandes effectuées à ce salon. Certains identifiants de clients sont donc en doublons (plusieurs commandes, plusieurs congrès...), et certains montants à 0 euros (invités ou autres).
Le fichier export_soft stocke les information sur tous les clients, dont certains n’étaient pas présents à cet événement.
1) Importer les fichiers Excel dans une base Access.
2) Requêtes de regroupement avec relation sur les deux tables, créez 3 requêtes :
- Requête ca_customers pour lister les clients présents, sommer leurs montants en euros, compter le nombre de commandes et ramener les informations géographiques. Nommez correctement chaque champ directement dans la requête et organiser l'ordre des champs logiquement.
- Requête ca_country pour lister les pays d’origine des clients présents, compter les clients par pays et sommer les CA par pays.
- Une 3ème requête nommée ca_customers_fr pour lister les départements français des clients présents (directement dans la requête, avec une extraction de chaîne), compter les clients par département et sommer les CA par département.
- À chaque requête, renommez vos champs de regroupement en gardant le format requête, et vérifiez vos résultats sur un ou deux clients ayant plus d'une commande.
3) Ouvrez sous QGIS le fichier/requête ca_country.
4) Liez la requête avec le shape country et faites quelques thématiques sur les clients et CA par pays.
5) Importez dans QGIS le fichier/requête ca_customs_fr.
6) À partir du shape des IRIS, créer un second shape des départements français.
- Création d’un nouveau champ contenant le code département (là aussi extraction de chaîne : utilisez le champ des codes commune), puis dissolution sur ce champ.
Attention : le département du Nord semble avoir des erreurs de géométrie (version 2016 de la base Contours...Iris®). Pour avoir une couche complète des départements, vous allez devoir valider les géométries ; dissoudre sur les géométries valides séparément ; puis fusionner vos 2 shapes péalablement dissous.
7) Importez et liez votre requête ca_customers_fr à votre nouveau shape.
Faîtes quelques thématiques sur le nombre de commandes et leur montant en surface de couleurs et en symboles proportionnels.
Attention : certains polygones sont multiparties (les îles), ce qui fausse certaines cartographies en cercles proportionnelle. Vous allez donc devoir extraire les centroïdes des polygones.