Objectifs
- Résumer l'information :
. Quelles sont les variables les plus importantes ?
. Quelles sont les variables qui différencient le mieux les individus ?
- Créer de nouvelles variables synthétiques indépendantes.
- Fournir deux représentations graphiques.
. Positionnement des variables.
. Positionnement des individus.
Idée générale de l'ACP
- Représentation des individus dans un espace à p dimensions (1 par variable).
- Recherche d'un nouveau repère ayant la propriété de concentrer le maximum d'information sur un nombre d'axes restreints.
- Information = distance entre les individus.
Construction des 2 axes
- 1er axe
. Déterminé par la direction d'allongement maximum du nuage.
. Restitue la part d'information la plus importante du nuage (% variance totale restituée la plus importante.
. Cet axe est le 1er axe factoriel.
- 2ème axe
. Déterminé par la direction d'allongement maximum perpendiculaire au 1er axe.
. Ce second axe a une importance secondaire par rapport au 1er.
Le 1er et le 2ème axe factoriel construisent le 1er plan factoriel. Chacun des axes est défini comme une combinaison linéaire des variables initiales.
Combien d'axes retenir
Etudes des valeurs propres = % d'information apporté par chaque axe factoriel
- Retenir les axes dont les valeurs propres sont supérieures à 1
- Analyser le diagramme des valeurs propres
Représentation graphique des variables
Les variables sont représentées dans un cercle de rayon 1
- La coordonnée d'une variable sur un axe i est aussi :
. Le coefficient de corrélation linéaire entre la variable et l'axe factoriel i
. Le cosinus de l'angle formé par la variable et l'axe i
(...)
[...] Combien d'axes retenir Etudes des valeurs propres = % d'information apporté par chaque axe factoriel Retenir les axes dont les valeurs propres sont supérieures à 1 Analyser le diagramme des valeurs propres Représentation graphique des variables Les variables sont représentées dans un cercle de rayon 1 La coordonnée d'une variable sur un axe i est aussi : - Le coefficient de corrélation linéaire entre la variable et l'axe factoriel i - Le cosinus de l'angle formé par la variable et l'axe i Variables intervenant le plus dans l'interprétation de l'axe : - Variables ayant un coefficient de corrélation avec l'axe proche de 1 ou en valeur absolue) Contribution relative : qualité de représentation de la variable sur l'axe i - Appelée aussi cosinus carré - Précise à quel % une variable est représentée sur un axe i - Si une variable est mal représentée sur un axe on ne la retiendra pas dans l'interprétation de l'axe i Contribution absolue : à quel % une variable joue dans la construction de l'axe i - Retenir dans l'interprétation des axes les variables qui y contribuent plus que la moyenne Interprétation des axes Interpréter un axe factoriel = donner un sens à l'axe, une clé de lecture De manière générale, l'interprétation des axes se fait après étude du graphique des variables : - Corrélations variables/axes - Contributions relatives - Contributions absolues Etudier les valeurs propres ( retenir les axes dont les valeurs propres sont supérieures à 1 Pour chacun des axes retenus : - Relever pour chaque axe les variables les plus corrélées à cet axe et qui contribuent le plus à la création de l'axe - Vérifier la qualité de représentation des variables sur l'ensemble des axes retenus. Si la variable est mal représentée, ne pas en tenir compte - Chercher le fil conducteur entre toutes ces variables. [...]
[...] Nommer l'axe ou donner une interprétation de cet axe. [...]
[...] Créer de nouvelles variables synthétiques indépendantes Fournir deux représentations graphiques - Positionnement des variables - Positionnement des individus Idée générale de l'ACP Représentation des individus dans un espace à p dimensions par variable) Recherche d'un nouveau repère ayant la propriété de concentrer le maximum d'information sur un nombre d'axes restreint Information = distance entre les individus Construction des 2 axes 1er axe - Déterminé par la direction d'allongement maximum du nuage - Restitue la part d'information la plus importante du nuage (%variance totale restituée la plus importante) - Cet axe est le 1er axe factoriel 2éme axe - Déterminé par la direction d'allongement maximum perpendiculaire au 1er axe - Ce second axe a une importance secondaire par rapport au 1er Le 1er et le 2éme axe factoriel construisent le 1er plan factoriel. Chacun des axes est défini comme une combinaison linéaire des variables initiales. [...]
[...] Analyse en Composantes Principales Objectifs : Résumer l'information : - Quelles sont les variables les plus importantes ? - Quelles sont les variables qui différencient le mieux les individus ? [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture