Etant donnée une population statistique dont les caractéristiques sont :
- moyenne : m
- écart-type : s (sigma)
Il est commode de faire des mesures sur un sous-ensemble de cette population ; ceci est justifié par le fait que des mesures sur la population sont souvent impossibles ou coûteuses à cause principalement du grand nombre d'individus de cette population.
On effectue donc des mesures sur un ensemble de n individus tirés de la population (méthode des sondages) et on considèrera cet ensemble comme un échantillon suffisamment représentatif de la population. Le but recherché est évidemment de remplacer l'étude de la population par l'étude de
l'échantillon et d'extrapoler les conclusions faites sur l'échantillon à la population totale.
Par exemple, au minimum, on peut se poser les questions suivantes au sujet d'une variable aléatoire X :
- la moyenne (notée X barre) de l'échantillon est-elle égale à la moyenne m de la population ?
- l'écart-type v(X)^1/2 de l'échantillon est-il égal à l'écart-type s de la population ?
- la proportion p des individus de l'échantillon possédant une caractéristique donnée est-elle égale à la proportion des individus de la population totale possédant la même caractéristique ?
La réponse à ces questions est cruciale car elle est le fondement des études statistiques.
[...] Prenons maintenant un échantillon obtenu par tirage au sort des individus dans la population. A chaque individu de l'échantillon on associe une variable aléatoire Xi représentant le caractère C. On en tout n variables aléatoires indépendantes Xi qui suivent une même loi de probabilité de moyenne m et d'écart type s. Peut-on calculer m et s à partir des valeurs des variables Xi ? Considérons ici le cas de la moyenne. Quel estimateur peut-on choisir pour m ? Un choix qui paraît naturel est : Vérifions : me est donc un estimateur sans biais de m. [...]
[...] L'écart-type de l'échantillon est-il égal à l'écart-type s de la population ? La proportion p des individus de l'échantillon possédant une caractéristique donnée est-elle égale à la proportion des individus de la population totale possédant la même caractéristique ? La réponse à ces questions est cruciale, car elle est le fondement des études statistiques. La loi faible des grands nombres nous donne déjà une indication : quand le nombre d'individus n de l'échantillon est grand, la moyenne de la variable X tend vers la moyenne m de la population. [...]
[...] D'après le théorème central limite, me suit, pour n grand, une loi normale de moyenne m et d'écart type soit L'estimation d'un écart-type Intéressons-nous maintenant à la variance. Suivant le résultat précédent, on est tenté de prendre comme estimateur : Calculons son espérance mathématique : Tout d'abord, d'après le théorème de Huyghens-König, on a : . Donc : Prenons l'espérance mathématique de chaque terme de cette différence : v(Xi) = s2 = E(Xi2) - m2 donc E(Xi2) = s2 + m2 et : Donc : Ce n'est évidemment pas le résultat prévu quoique pour n grand on est approximativement satisfait. [...]
[...] La taille de l'échantillon est n. Une statistique est alors définie comme une fonction mesurable de X Xn). Soit Q une variable aléatoire représentant un paramètre inconnu de la population ; supposons que = moyenne sur la population (qui est inconnue). On estime Q sur un échantillon par une variable aléatoire Qe. L'erreur commise est donc (Qe qui est appelée le biais de l'estimateur Qe. Si la moyenne E(Qe - = 0 ou E(Qe) = l'estimateur Qe est dit sans biais. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture