Pour cela, il faut consentir à une perte d'information afin de gagner en lisibilité. En fonction des phénomènes que l'on veut étudier et de la nature du tableau de données dont on dispose.
Ces différentes techniques d'analyse factorielle ont des fondements théoriques communs, l'idée générale est, à partir d'un tableau de données numériques (n lignes, p colonnes), de représenter ces données par un nuage de n points.
Il n'existe pas une seule méthode factorielle d'analyse des données, mais un ensemble de méthodes, reposant toutes sur les mêmes théories mathématiques, comme le démontre la méthode de l'ACP qui est expliqué en première partie de notre essai.
Afin de compléter notre travail nous avons illustré la partie pratique par un cas qui traite de la criminalité dans les wilayas du pays, après collecte des (...)
[...] Essai outil mathématique et statistique Sujet : Analyse en Composantes Principales ACP Réalisé par : BOUSSEKSOU Massil MAI 2008 Sommaire Introduction 1. Présentation de l'ACP 2. Objectifs de l'ACP 3. Interprétation mathématique Echantillon poids transformations de l'échantillon calcule de covariances et de corrélations critères d'inertie diagonalisation numériquement résultats théorique 4. synthèse graphique Conclusion Cas pratique Bibliographie annexes Introduction : L'analyse des données recouvre un grand nombre de méthodes qui ont pour objectif de décrire, synthétiser, expliquer l'information contenue dans de vaste tableaux de données ; parmi les méthodes d'analyse des données utilisées en gestion on trouve les méthodes multifactorielles celles-ci permettent d'obtenir des représentations graphiques qui constituent le meilleur résumé possible de l'information contenue dans un grand tableau de données. [...]
[...] Dans la littérature, on trouve deux approches différentes de l'ACP : Elle peut être présentée comme la recherche d'un ensemble réduit de variables non corrélées, combinaisons linéaires des variables initiales résumant avec précision les données (approche anglo- saxonne). Une autre interprétation repose sur la représentation des données initiales à l'aide de nuage de points dans un espace géométrique. L'objectif est alors de trouver des sous-espaces (droite, plan ) qui représentent au mieux le nuage initial. C'est cette dernière approche que nous aborderons par la suite Les objectifs de l'ACP : Résumer un tableau individus, ( variables à l'aide d'un petit nombre de facteurs. Visualiser le positionnement des individus les uns par rapport aux autres. [...]
[...] Zone Rouge Pointillés : se sont les wilayas où l'une des deux formes de criminalité recensée par notre étude est fortement élevée. Zone Orange : c'est le groupe de wilayas qui sont considérées comme moyennement risquées. Zone Verte : la criminalité dans ces wilayas est relativement basse. Bibliographie : Probabilités analyse de données et statistiques, 2eme édition ; - Manuel de gestion volume 2 ,année 2004 ,éditions ellipses. Sitographie : WWW. ONS. DZ Annexe : Tableau des données statistiques : la criminalité dans les différentes wilayas du pays. [...]
[...] Nous avons vu en outre que la variance expliquée par le n-ième vecteur propre vaut λk. Finalement, la question de l'ACP se ramène à un problème de diagonalisation de la matrice de corrélation. Numériquement : Numériquement, la matrice M étant rectangulaire, il est plus économique de la décomposer en valeurs singulières, puis de recombiner la décomposition obtenue, plutôt que de diagonaliser Résultats théoriques : Si les sections précédentes ont travaillé sur un échantillon issu de la loi conjointe suivie par X XN, que dire de la validité de nos conclusions sur n'importe quel autre échantillon issu de la même loi 5. [...]
[...] Matrice des composantes : D'après le tableau, ci-dessus les variables agressions, cambriolage, viols, kidnapping, vols de voitures et vols à la tire (cercles rouges), sont fortement corrélées avec la composante 1. Tandis que les variables, meurtres et harcèlements, sont significativement corrélées avec la composante 2 mais en signes opposés. Concernant la composante elle pourrait représenter l'ensemble des délits communs et qui demeurent assez courant en terme de recensement puisqu'ils font souvent l'objet de plaintes et d'ouverture d'enquêtes par les institutions compétentes. La composante quant à elle, pourrait représenter des crimes plus rares. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture