Cours ACP PDF
Cours ACP PDF
Cours ACP PDF
Principales
(ACP)
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 1 14-15 février 2008
Sommaire
•Principe de l’ACP
•L’ACP en Pratique
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 2 14-15 février 2008
L’Analyse en Composantes Principales (ACP) est une méthode
statistique essentiellement descriptive qui peut être utilisée pour savoir :
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 3 14-15 février 2008
L’ACP s’intéresse à des tableaux de données rectangulaires avec des
individus en lignes et des variables quantitatives en colonnes.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 4 14-15 février 2008
Principe de l’ACP
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 5 14-15 février 2008
Principe de l’ACP
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 6 14-15 février 2008
Principe de l’ACP
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 7 14-15 février 2008
-La variance d’une composante principale (inertie) est
égale à la valeur propre portée par l’axe principal qui lui est
associé.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 8 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 9 14-15 février 2008
La première composante principale doit
"capturer" le maximum d’inertie du
tableau des données.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 10 14-15 février 2008
Examen préalable à l’interprétation des résultats
1- la règle de Kaiser qui veut qu’on ne retienne que les facteurs aux valeurs
propres supérieures à 1.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 11 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 12 14-15 février 2008
Interprétation des résultats de l’analyse:
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 13 14-15 février 2008
En commence par étudier les variables
puis on passe à l’étude des individus
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 14 14-15 février 2008
L’ACP en Pratique
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 15 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 16 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 17 14-15 février 2008
la qualité de représentation d’une variable est
égale à la coordonnée au carrée (donnée par
le logiciel avec lequel en travaille)
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 18 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 19 14-15 février 2008
En pratique: on obtient comme sorties:
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 20 14-15 février 2008
Exemple d’une ACP:
Tableau des données:
On étudie les consommations annuelles en 1972, exprimées en francs, de 8 denrées
alimentaires (les variables), les individus étant 8 catégories socio-professionnelles.
Les données sont des moyennes par CSP :
PRIN 119 6 69 56 39 5 13 41
CSUP 87 11 63 111 27 3 18 39
CMOY 103 5 68 77 32 4 11 30
EMPL 111 4 72 66 34 6 10 28
OUVR 130 3 76 52 43 7 7 16
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 21 14-15 février 2008
Les individus: catégories sociales les Variables : 8 (quantitatives)
AGRI = Exploitants agricoles PAO = Pain ordinaire
SAAG= Salariés agricoles PAA = Autre pain
PRIN = Professions indépendantes VIO = Vin ordinaire
CSUP = Cadres supérieurs VIA=Autre vin
CMOY= Cadres moyens POT= Pommes de terre
EMPL= Employés LEC=Légumes secs
OUVR = Ouvriers RAI=Raisin de tables
INAC = Inactifs PLP= Plats préparés
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 22 14-15 février 2008
Le programme SAS permettant d’obtenir les sorties ci-dessous est en Annexe.
Correlation Matrix
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 23 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 24 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 25 14-15 février 2008
INTERPRETATION
1. Choix du nombre d’axes à retenir
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 26 14-15 février 2008
2. Graphes sur le plan factoriel (1,2)
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 27 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 28 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 29 14-15 février 2008
- +
PAO RAI
LEC VIA
(VIO) PLP
(PAA)
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 30 14-15 février 2008
L’axe 1 oppose les individus consommant du pain ordinaire, des
légumes secs (et éventuellement du vin ordinaire) à ceux qui
consomment du raisin, du vin (éventuellement du pain) plus
sophistiqué et des plats préparés.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 31 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 32 14-15 février 2008
Le premier axe met donc en opposition quant à leurs habitudes
alimentaires les agriculteurs et les cadres supérieurs.
- +
AGRI CSUP
SAAG
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 33 14-15 février 2008
Touts les individus sont bien représentées sur l’axe 1 sauf les catégories
EMPL, OUVR et INAC
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 34 14-15 février 2008
Axe 2: Variables
- +
POT
PAA
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 35 14-15 février 2008
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 36 14-15 février 2008
- +
INAC
Synthése:
C1=répartition entre aliments ordinaires et aliments plus recherchés
C2=répartition de la consommation de pommes de terre
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 38 14-15 février 2008
Interprétation des résultats
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 39 14-15 février 2008
Conseils supplémentaires
-L’ACP ne peut pas traiter des variables qualitatives mais uniquement des
variables quantitatives. Il y a toutefois une astuce qui consiste à intégrer un
codage des variables qualitatives dans les identifiants des individus.
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 40 14-15 février 2008
ET BON COURAGE !!!
J-C Raynal - EHESS – La cartographie multivariée avec le logiciel Philcarto. 41 14-15 février 2008