Les enquêtes, sondages ou autres statistiques réalisés autour de tel ou tel sujet apportent bien souvent une très grande quantité d'informations qu'il semble bien difficile d'analyser ou de représenter graphiquement. En effet pour chacun des individus "sondés", on peut faire apparaître une multitude de critères ou de caractéristiques : par exemple, on peut réunir une population de 20 personnes et récupérer leur poids, leur taille, leur âge, etc. Dans ce cas il n'est plus possible de faire apparaître dans un espace à deux dimensions, l'influence de ces critères entre eux.
Les méthodes d'analyse présentées dans ce document tentent de résoudre ce problème ; elle permettent de représenter graphiquement, dans un espace en 2 ou 3 dimensions les résultats obtenus et ce, soit à partir de critères objectifs (données personnelles d'un individu, etc.), c'est le cas de la méthode ACP, soit à partir de critères qualitatifs (présence-absence, etc.), c'est le cas de la méthode AFC.
[...] L'analyse en composantes principales, communément appelée ACP, est une méthode statistique multidimensionnelle qui permet de synthétiser un ensemble de données en identiant la redondance dans celles-ci. On pourra donc, en utilisant cette méthode, remplacer les questions par deux ou trois axes qui pourront synthétiser graphiquement l'information contenue dans le nuage de point. Dans ce premier chapitre dédié à cette méthode, le principe et les fondements de l'analyse en composantes principales seront expliqués dans un premier temps pour ensuite être illustrée par un exemple concret La matrice des données Le résultat de l'enquête est rangé dans un tableau. [...]
[...] Plus on avance, plus il devient dicile de trouver deux entités proches et donc plus le niveau augmente. Noeud Niveau Poids Objets Fils gauche Fils droit Tab Statistiques des noeuds Il est donc possible, à partir du tableau de dénir le dendrogramme ci-après. Ce dernier va nous permettre de visualiser très clairement les diérentes classes. Fig Dendrogramme 14 On peut voir ainsi qu'alors que deux groupes principaux se sont formés, deux villes restent l'une et l'autre orphelines. Elles sont vraiment trop éloignées entre elles et par rapport aux deux autres classes. [...]
[...] classe ) et cherche, à chaque étape, à constituer des Dissemblance ou distance entre deux classes À chaque étape de l'algorithme, il est nécessaire de mettre à jour le tableau des distances (ou des dissemblances). Après chaque regroupement, de deux individus, de deux classes ou d'un individu à une classe, les distances entre ce nouvel objet et les autres sont calculées et viennent remplacer, dans la matrice, les dissemblances des objets qui viennent d'être agrégés. Diérentes approches sont possibles à ce niveau, correspondant à diérentes CAH. Notons et A et B deux groupes ou éléments d'une partition donnée, di,j la distance entre deux individus quelconques i et . [...]
[...] Les méthodes d'analyse présentées ci-après tentent de résoudre ce problème ; elle permettent de représenter graphiquement, dans un espace en 2 ou 3 dimensions les résultats obtenus et ce, soit à partir de critères objectifs (données personnelles d'un individu, etc.), c'est le cas de la méthode ACP, soit à partir de critères qualitatifs (présence-absence, etc.), c'est le cas de la méthode AFC. Il est aussi possible de classer les données ; c'est-à-dire de regrouper des individus ensemble dans le but de former des entités diérenciables dans leur globalité. C'est l'objectif des méthodes de classication que nous étudierons dans le second chapitre Chapitre 1 Méthodes d'analyse 1.1 L'Analyse en Composantes principales : ACP La plupart des enquêtes et mesures eectuées se représentent sous la forme d'un tableau de données. [...]
[...] C'est une analyse en composante principale sur les prols. Cette méthode permet d'eectuer de nombreuses interprétations qui seront utilisées pour le traitement de données textuelles. Grâce à elle, il est possible de visualiser les paramètres et les individus dans le même espace, on obtient ainsi une correspondance entre les deux sur une même carte factorielle. À l'aide de représentations graphiques, on peut visualiser des groupements, des oppositions, des tendances, impossibles à discerner directement sur un tableau de données Dénition Soit une population examinée suivant deux caractères, l'un prenant un ensemble de n modalités exclusives et l'autre un ensemble de p modalités exclusives le tableau de contingence K associé à ces données est un tableau rectangulaire de dimensions et j pour le second. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture