statistiques, test Chi², variables binaires, pourcentages, variables catégorielles, test de Pearson, test d'hypothèse
Le document est un exercice corrigé de niveau licence concernant les calculs de statistiques et la mise en application du test d'hypothèse Chi² de Pearson.
[...] De même, on observe également que la densité de population dans les comtés à majorité blanche dépasse largement celle des comtés pauvres. Enfin, la composition raciale des comtés est presque inversée pour les deux variables indicatrices sélectionnées : les comtés à majorité blanche le sont en moyenne à 74% alors que les comtés à majorité pauvre sont composés à 71% de comtés à majorité noire. Avant de démonter qu'il existe une relation statistiquement significative entre pauvreté et composition raciale dans les comtés de l'Etat de l'Alabama, on rapporte la composition croisée de la population pour nos deux variables indicatrices. [...]
[...] Statistiques - Le test de Pearson Énoncé On s'intéresse à la ségrégation sociale et raciale dans l'Etat de l'Alabama au Sud des Etats-Unis à l'échelle de ses 68 comtés. Les données sont tirées du recensement de 2010, et portent sur le niveau de revenu par ménage (moyenne et médiane) le pourcentage de blancs et noirs dans la population de chaque comté, ainsi que le pourcentage de ménages pauvres, c'est-à-dire ceux dont le revenu est inférieur à 10.000 $ par an. [...]
[...] Pour ce faire, on utilise le test de Chi-2 de Pearson. Ce dernier est généralement appliqué à des variables catégorielles (ici des variables indicatrices) pour vérifier si les différences entre ensembles de données sont dues au hasard. L'hypothèse nulle de ce test postule que les fréquences de distribution des deux évènements sont mutuellement indépendantes. Dans notre cas, l'hypothèse nulle postule qu'il n'y a pas de différences entre la distribution de la pauvreté et la composition raciale des comtés. On obtient la statistique Chi-2 à partir du tableau de contingence en calculant la somme carrée de la différence entre la distribution empirique (les données du tableau ci-dessus) avec la distribution sous H0, la fréquence de cette dernière correspond à la distribution théorique. [...]
[...] Si le résultat est statistiquement significatif, il convient d'être prudent quant aux conclusions qu'on peut en tirer. D'abord sur la puissance statistique du test en lui-même : le test Chi-2 de Pearson donne des résultats pertinents lorsqu'il est appliqué à un large échantillon, ce qui n'est pas vraiment le cas ici. Qui plus est, les variables catégorielles ne sont pas bien spécifiées dans ce jeu de données : en effet, si l'Alabama est en grande majorité composé de Blancs et Noirs, il y a une moyenne de 5.5% d'autres ethnies qui fausse les résultats. [...]
[...] On note E la distribution théorique. Dans notre exemple, E = 67/4 On note O la distribution empirique. Dans notre exemple, O correspond aux cellules du tableau de contingence. La statistique obtenue sera la somme des écarts carrés entre les Ei et Oi, rapportés à Ei. Si la composition empirique correspond à celle théorique, alors la somme sera nulle, et Chi-2 = 0. On obtient une statistique Chi-2 de 19.185 à un degré de liberté. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture