Classification des communes françaises d'après les présidentielles de 2012

Cet article décrit un essai de classification de l'ensemble des communes de métropole selon les résultats enregistrés au premier tour des élections présidentielles de 2012.

Les données ainsi que le code source R utilisés pour cette analyse sont librement accessibles :

https://github.com/juba/presid2012-classif-communes

Résultats

Avertissement préalable

Il est important de garder à l'esprit qu'une classification de ce genre comporte une part d'arbitraire, à la fois dans le nombre de groupes retenus, mais surtout car la classification tend à tracer des frontières là où il y a plutôt une continuité. Certaines communes placées "au centre" du groupe en auront effectivement la plupart des caractéristiques, mais d'autres situées plus en marge peuvent ressembler assez fortement à d'autres communes du groupe voisin.

Il faut donc interpréter cette classification sous forme de tendance plutôt qu'une sorte d'étiquetage qui ferait rentrer chaque commune dans un tiroir bien défini.

Descriptif des groupes

L'analyse, dont les détails sont donnés plus bas, fait ressortir huit grands groupes de communes. Le tableau ci-dessous caractérise chacun des groupes, il se lit de la manière suivante : les groupes sont en ligne, les candidats en colonne. Chaque case indique l'écart entre la moyenne des pourcentages du candidat dans les communes du groupe et son pourcentage moyen pour l'ensemble des communes. Si cet écart est positif, le vote pour ce candidat a été plus fort que la moyenne nationale, et la case est colorée en rouge. Si l'écart est négatif, le vote a été plus faible et la case est colorée en bleu.

Ainsi, si on regarde le groupe 8 (première ligne), on constate que la moyenne des pourcentages obtenus par Marine Le Pen dans les communes de ce groupe est supérieure d'environ 14 points au pourcentage moyen obtenu dans l'ensemble des communes.

En regardant les couleurs et les valeurs correspondant aux différents candidats, on peut donc caractériser chaque groupe. À noter que seuls les écarts les plus significatifs sont affichés ici, raison pour laquelle certains candidats n'apparaissent pas du tout.

En sélectionnant un groupe ci-dessous vous pouvez afficher un descriptif plus précis de la répartition des votes ainsi que la localisation des communes de ce groupe sur le territoire :

ccp_densites_groupe1.png

ccp_carte_groupe1.png

Nombre de communes : 8239 (22,5%)

Caractérisation : À droite. Sur-représentation des votes Le Pen et Sarkozy, et assez forte sous-représentation du vote Hollande.

Localisation : Concentration dans le nord et l'est, ainsi que dans le sud-ouest, de manière plus localisée.

ccp_densites_groupe2.png

ccp_carte_groupe2.png

Nombre de communes : 6707 (18,3%)

Caractérisation : Au centre. Légère sur-représentation de Hollande et Bayrou, sous-représentation de Le Pen.

Localisation : Sur tout le territoire, avec une concentration dans l'extrême sud-ouest.

ccp_densites_groupe3.png

ccp_carte_groupe3.png

Nombre de communes : 4551 (12,4%)

Caractérisation : Le Pen sans Sarkozy. Le Pen est sur-représenté, au contraire de Sarkozy. Hollande est légèrement sur-représenté.

Localisation : Essentiellement nord, est, et dans une moindre mesure le sud-ouest.

ccp_densites_groupe4.png

ccp_carte_groupe4.png

Nombre de communes : 4473 (12,2%)

Caractérisation : À gauche. Sur-représentation des votes Hollande et Mélenchon, sous-représentation du vote Sarkozy.

Localisation : Sur tout le territoire, avec quelques concentrations localisées dans le sud-ouest, au nord, dans certains secteurs du massif central ou du jura.

ccp_densites_groupe5.png

ccp_carte_groupe5.png

Nombre de communes : 4827 (13,2%)

Caractérisation : Sarkozy sans Le Pen. Forte sur-représentation du vote Sarkozy, mais sous-représentation du vote Le Pen, et dans une moindre mesure des votes Hollande et Mélenchon.

Localisation : Sur tout le territoire, avec une concentration dans l'ouest parisien.

ccp_densites_groupe6.png

ccp_carte_groupe6.png

Nombre de communes : 4033 (11%)

Caractérisation : Très à gauche. Très fort votes Hollande et Mélenchon, forte sous-représentation des votes Le Pen et Sarkozy.

Localisation : Sud ouest et centre-ouest, Bretagne, région parisienne.

ccp_densites_groupe7.png

ccp_carte_groupe7.png

Nombre de communes : 1589 (4,3%)

Caractérisation : Très à droite. Très fort vote Sarkozy, et forte sous-représentation des votes Hollande et Mélenchon. Le vote Le Pen est également sous-représenté.

Localisation : Essentiellement dans le nord-est, plus quelques concentrations au sud du massif central, sur la côte d'Azur ou en Corse.

ccp_densites_groupe8.png

ccp_carte_groupe8.png

Nombre de communes : 2143 (5,9%)

Caractérisation : Extrême droite. Très forte sur-représentation du vote Le Pen. Abstention un peu plus forte. Vote Sarkozy faible, et Hollande très faible.

Localisation : Nord-est de la France, sud de la vallée du Rhône.

Aide pour comprendre les graphiques

Le graphique de gauche décrit la répartition des communes de chaque groupe selon les votes pour les différents candidats. Les valeurs en bas représentent l'écart entre le pourcentage de vote du candidat dans la commune et le pourcentage global pour l'ensemble des communes. Plus la courbe est haute, plus le nombre de communes correspondant à cet écart de vote est important.

Si on a ce type de courbe, alors la majorité des communes ont un pourcentage de vote pour ce candidat supérieur à la moyenne globale (l'écart est supérieur à zéro). Il y a donc une sur-représentation du vote pour ce candidat dans ce groupe.

Là, c'est l'inverse. La quasi-totalité des communes de ce groupe ont un écart entre leur pourcentage de vote pour ce candidat et le pourcentage global inférieur à 0. Le vote pour ce candidat est donc fortement sous-représenté dans ce groupe.

Ici on a une répartition à peu près symétrique autour d'un maximum correspondant à l'écart nul. Il n'y a donc pas de caractéristique particulière du vote pour ce candidat dans ce groupe

La carte de France indique la répartition des communes du groupe sur le territoire. Chaque point coloré indique une commune appartenant au groupe, et on a superposé sous forme de "courbes de niveaux" une représentation de la concentration géographique de ces communes.

Carte interactive

Groupe 1
À droite

Groupe 2
Au centre

Groupe 3
Le Pen sans Sarkozy

Groupe 4
À gauche

Groupe 5
Sarkozy sans Le Pen

Groupe 6
Très à gauche

Groupe 7
Très à droite

Groupe 8
Extrême droite

Cette carte vous permet de visualiser les résultats par commune pour l'ensemble des communes analysées. Cliquez sur le symbole correspondant à une commune pour afficher le groupe d'appartenance et les résultats détaillés.

Méthode

Données

Les données utilisées pour l'analyse sont toutes disponibles librement. Les résultats du premier tour de l'élection présidentielle par commune sont disponibles sur le site data.gouv.fr :

http://www.data.gouv.fr/DataSet/572126?xtmc=%C3%A9lection+pr%C3%A9sidentielle+2012+commune&xtcr=1

La géolocalisation des communes a été effectuée à l'aide des données du RGC (Répertoire Géographique des Communes), disponible en téléchargement sur le site de l'IGN :

http://professionnels.ign.fr/rgc

L'analyse porte sur l'ensemble des communes françaises de métropole, à l'exception de trois d'entre elles dont les résultats ont été invalidés par le conseil constitutionnel : Pont-sur-Seine, Bourg-d'Oueil et Lissac.

Les pourcentages de votes pour les différents candidats ont été calculés en divisant par le nombre de votants, et non par le nombre de suffrages exprimés.

Classification

Pour effectuer cette classification, on est parti des pourcentages obtenus par chaque candidat au premier tour pour l'ensemble des communes analysées. De manière très classique, on a utilisé ces données pour calculer une matrice de distances entre chaque commune, à laquelle on a appliqué une Classification Ascendante Hiérarchique (CAH) avec une méthode de Ward.

Le choix du nombre de classes s'est fait en partie à partir du dendrogramme résultant de la CAH, mais surtout en observant les classifications obtenues pour les différents nombres de groupes possibles. En pratique, on commence avec deux groupes dont on observe les caractéristiques, puis on compare avec la classification en trois groupes, en regardant notamment quel groupe a été scindé en deux, et quelle interpréatation on peut faire de ces deux nouveaux groupes. On continue avec quatre, cinq, six, etc. groupes, et on s'arrête lorsque les deux nouveaux groupes créés en passant de n à n+1 groupes ne semblent plus réellement pertinents.

Outils

Les analyses ont été effectués à l'aide du logiciel R, logiciel libre et multiplateforme de traitement et d'analyse de données. Les graphiques ont été produits à l'aide du package ggplot2.

La carte interactive a été créée à l'aide de Google fusion tables.