Cours sur l'Analyse en Composante Principale (ACP). Celui-ci démarre par des rappels sur la loi normale, le coefficient de corrélation et les recodages puis présente l'ACP de façon théorique et a travers un exemple, ainsi que sa mise en oeuvre pratique sous le logiciel XL Stat.
[...] Exemple On considère 5 élèves notés dans 3 matières : Droit, Maths, Eco On cherche 1 plan tel que les individus éloignés restent dispersés sans le plan. Méthode Etapes : 1er axe factoriel F1 F1 est tel que la projection sur F1 donne la plus grande variance. F1 est une combinaison linéaire de x1 à xp. [...]
[...] F1 = α1X1+ α2X2+ + αpxp α αp = coefficients Propriétés : α cor (X1 ; F1) α cor (X2 ; F2) . α cor (Xp ; Fp) Dans l'exemple: F1 = 0,95*Droit + 0,77*Maths + 0,96*Eco - Pourcentage de variance expliquée = % d'information récupéré par l'axe factoriel F Info = Variance / Variance totale Dans l'exemple : % Info = 81% 2éme axe factoriel F2 F2 sera orthogonal à F1 Il est tel que F2 récupère le plus de variance F2 = β1X1+ β2X2+ + βpXp Avec : Β1 = cor (X1 ; F2) . [...]
[...] ANALYSE DE DONNEES Rappels : Loi normale Comment vérifier qu'une variable suit N ; δ) ? Allure de l'histogramme PP Gaussien Si la variable X suit vraiment une loi normale, on aura : F1 p1 F2 p2 Pi Oui Non Fi Test du khi2 Ti = pi * N Khi2 = (Oi ti) 2 / ti Si khi2 Oi ti Pratique Si khi 2 [...]
[...] Mise en œuvre sur XLStat Sous XLStat : Analyse de données ACP Tableau = valeur quanti Analyse des résultats Finalité : - Interpréter les axes F1, - Positionner les individus Statistiques simples (1er tableau) Si écart type supérieur à la moyenne variable instable Variance expliquée = % info récupérée par les axes Valeurs propres Dans l'exemple : F1 = 81% F2 = 17,6% Plan = 98,6% Cercle des corrélations Individus = points Variables = vecteurs On s'intéresse aux angles : - Si angle proche de 0 forte corrélation positive - Si angle proche de 190 = angle plat forte corrélation négative - Si angle droit indépendance On s'intéresse aux modules (longueur du vecteur) - Plus le module est grand, mieux la variable est représentée Interprétation de F1 : F1 semble corrélée avec l'éco et le droit (Corrélations entre les variables et les facteurs) - En effet : cor (F1 ; Eco) = 0,96 et cor (F1 ; Droit) = 0,95 - D'autre part, il faut regarder les corrélations entre les variables retenues (Eco/Droit) sur la matrice des corrélations cor (Eco ; Droit) = 0,96 - On regarde la qualité de représentation de Eco et Droit on regarde les cosinus carrés Sur le plan (F1 l'éco et le droit sont représentés à donc très bien représentés. F1 est donc une synthèse entre l'éco et le droit mais pas avec les maths = matières littéraires Interprétation de F2 : F2 semble corrélée avec les maths - Cor (F2 ; Maths) = 0,63 - Maths représentés à 100% F2 = matières scientifiques CLASSIFICATION Pour déterminer le nombre de groupes, on coupe l'arbre au niveau du plus grand saut de distance. [...]
[...] Quantitative qualitative Dans ce sens, il n'y a pas de problèmes particuliers Qualitative quantitative Ex : qualité d'un produit Modalités = Très mauvaise / Mauvaise / Moyenne / Assez bonne / Bonne / Très bonne / Excellente Transformation 1 ; 3 ; 5 ; 10 ; ; 20 Cependant pas rigoureux car on aurait pu mettre 2 à la place de 1 par exemple Conditions : Variable ordinale (ordre) Au moins 5 modalités II) Cas Banque Cash Travail sur le solde Description de solde : min ; max ; moy ; quartiles ; écart type ; coefficient de variation Xlstat / description de données / stat descriptives CV [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture