Exemple 1 : On a demandé à 40 étudiants de GEA d'indiquer s'ils disposent d'un téléphone portable et dans l'affirmative de préciser l'opérateur auquel ils sont abonnés. Cette enquête a été saisie manuellement en utilisant les abréviations suivantes : A pour « aucun opérateur » (donc pas de téléphone portable), B pour « opérateur Bouygues », O pour « opérateur Orange », S pour « opérateur SFR ». Voici la grille de saisie (...)
La population statistique est ici l'ensemble des 40 étudiants de GEA auprès desquels l'étude a été engagée. Chacun d'entre eux en constitue une unité statistique. Le caractère étudié est « l'opérateur auquel chaque étudiant est abonné ». Ce caractère comporte 4 modalités notées en abrégé A-B-O-S. La série statistique est ici dite simple ou à une variable, car les unités statistiques sont réparties selon un caractère unique (dans ce chapitre nous ne nous intéresserons qu'aux séries simples). Le caractère est de nature qualitative, car ses modalités ne sont pas mesurables (on ne peut ni les additionner, ni en faire la moyenne par exemple).
Retrouvons ces définitions sur un deuxième exemple :
Exemple 2 : Un concessionnaire automobile a étudié ses ventes sur une période de 50 jours ouvrables en notant chaque jour de cette période le nombre de véhicules vendus. Voici la grille de saisie (...)
La population statistique est ici l'ensemble des 50 jours de la période pendant laquelle l'étude a été effectuée. Chacun de ces jours constitue une unité statistique. Le caractère étudié est « le nombre de véhicules vendus chaque jour ». Ce caractère comporte 6 modalités numériques : 0-1-2-3-4-5. Ce caractère est de nature quantitative, car ses modalités sont mesurables (on peut en faire la moyenne par exemple) (...)
[...] Ces notions n'ont d'intérêt que lorsque la population statistique est très volumineuse. Les courbes ayant été tracées à l'aide de segment de droite, on peut calculer plus précisément ces paramètres à l'aide d'interpolation linéaires. Calcul de la médiane par interpolation linéaire : 50% étant encadré par les fréquences cumulées croissantes 48% (associée à la borne supérieure 100) et 58% (associée à la borne supérieure 110), la médiane est donc comprise entre 100 et 110 ; elle est plus proche de 100 que de 110 car 50% est plus proche de 48% que de 58%. [...]
[...] On repère la plus petite et la plus grande des valeurs de ce champ à l'aide des fonctions MIN et MAX. On crée une colonne comprenant toutes les bornes supérieures des intervalles dans lesquels on souhaite répartir les données ; la plus petite de ces bornes supérieures devant être strictement supérieure à MIN(KILOM) et la plus grande supérieure ou égale à MAX(KILOM). On a choisi ici le champ qu'on a nommé BSUP On sélectionne ensuite le champ adjacent (ici qu'on a nommé EFFEC On écrit la fonction FREQUENCE dans la première cellule de ce champ ; elle comporte deux paramètres : le champ des données qu'on veut répartir (ici KILOM et les intervalles de répartition (ici BSUP On valide non pas en appuyant sur ENTREE, mais en frappant simultanément les touches CTRL+MAJUSCULE+ENTREE. [...]
[...] La série étant quantitative, les modalités peuvent être classées par ordre croissant. Il est dés lors possible de définir les fréquences cumulées croissantes et les fréquences cumulées décroissantes. Reprenons l'exemple 2 : Les fréquences cumulées croissantes écrites sous forme de pourcentage, se calculent selon les formules suivantes : et pour . En pratique, on additionne les fréquences. Les fréquences cumulées décroissantes écrites sous forme de pourcentage, se calculent par la formule : . Interprétons ces résultats : Considérons la fréquence cumulée croissante égale à 56% associée à la modalité 2. [...]
[...] Comme tout tableur, EXCEL ne connaît pas la continuité et ne peut traiter correctement que des séries discrètes (ne comportant qu'un nombre fini de valeurs). Beaucoup de représentations graphiques sont disponibles sur les tableurs (diagrammes en bandes, en 3D, en radar ou polaires Elles sont surtout utilisées pour les séries qualitatives. Nous verrons en TD que des précautions doivent être prises pour représenter les séries quantitatives discrètes, en particulier lorsqu'il s'agit de tracer des courbes. PARAMETRES D'UNE SERIE QUANTITATIVE. Pour toute série qualitative ou quantitative, nous connaissons déjà un paramètre de position le mode qui est la valeur la plus fréquente. [...]
[...] L'interpolation consiste à soustraire (la fonction cumulative est ici décroissante) à 26% une certaine portion (notée de l'écart séparant de 26% en respectant la proportionnalité. Il s'agit en fait d'une règle de 3 résumée dans le tableau ci-dessous : La valeur q se calcule donc selon la formule : . On trouve très précisément : Calcul de la moyenne et de la variance. Les modalités étant des intervalles, les formules utilisées pour les séries discrètes ne peuvent être appliquées ici. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture