La géographie est perpétuellement confrontée au nombre et à la mesure. Qu'elle soit définie comme l'angle spatial des sciences sociales, l'analyse des relations entre les sociétés et leur environnement ou l'étude de la surface de la Terre, le point de départ de la géographie est toujours la localisation et la mesure d'une catégorie de phénomènes dans l'espace (C. Grasland, 2000).
L'analyse et la représentation de la répartition spatiale d'un phénomène posent cependant plusieurs problèmes. En effet, la double nature de l'information géographique (à la fois graphique et attributaire) implique qu'une représentation cartographique est toujours une retranscription simplifiée, résumée de la correspondance entre une variable thématique et un espace dont le fond de carte matérialise la localisation. Cette retranscription de l'information nécessite donc une réflexion tant sur le plan mathématique (concernant les caractéristiques statistiques de la variable que l'on cherche à résumer) que sur le plan graphique (concernant la restitution et la perception visuelle de cette information résumée sous la forme de symboles sur un fond de carte).
Très souvent, consciemment ou non, l'accent est mis sur un des deux aspects en ignorant l'autre. Or de nombreux auteurs ont montré que la représentation inappropriée d'un phénomène spatial sur une carte peut conduire à une interprétation erronée ou à négliger certains aspects essentiels du phénomène étudié. Il n'est pas rare que la représentation cartographique d'une même variable par des personnes différentes, avec des principes différents (non précisés, la plupart du temps), aboutissent à des images parfois très dissemblables et par voie de conséquence à des commentaires et à des interprétations distinctes voire opposées (Cauvin et al., 1987).
Dans de nombreux cas, comme l'a montré Jenks (un géographe américain ayant beaucoup travaillé sur ces questions et à qui l'on doit notamment une méthode de discrétisation qui porte son nom) : « bien des résultats ne proviennent que d'un choix peu judicieux du regroupement en classes des valeurs d'une variable. »
Il convient de noter que ces choix « peu judicieux » ne sont pas toujours innocents et relèvent parfois d'une volonté délibérée de biaiser l'interprétation de la carte ; (voire à ce sujet, les ouvrages de M. Monmonier ainsi que celui de L. Cambrézy et R. De Maximy).
Les bases de la représentation graphique de l'information géographique ayant été abordées en première année, le présent document insistera sur la dimension statistique de l'outil cartographique.
L'objectif de ce cours consiste à fournir les connaissances nécessaires pour une analyse critique des documents cartographiques mais aussi les bases permettant la réalisation de cartes thématiques traduisant « au mieux » les phénomènes étudiés. Plus largement, en présentant la méthode la plus couramment utilisée pour la réalisation de cartes thématiques, ce cours constitue une première approche de l'outil statistique appliqué à la géographie en se limitant pour le moment aux distributions à une dimension.
Le but de cette première approche de l'outil statistique est de fournir les bases nécessaires à la réalisation d'une représentation cartographique par le découpage en classes des valeurs prises par une variable thématique ; en d'autres termes de réaliser une discrétisation.
[...] (lire oméga oméga oméga dont l'ensemble formera la population Ω (lire oméga) représentant la totalité des unités statistiques. On écrira : Ω = {ω1, ω ωn } Pour que la population soit bien définie, il faut que, pour chaque unité, on puisse répondre par oui ou par non à la question : l'unité (ou l'élément, ou l'individu) est-elle élément de la population (l'ensemble) observée ? Pour toute étude statistique, il est en effet primordial de définir sans ambiguïté la population étudiée. [...]
[...] Ainsi, lorsque l'on a affaire à des taux d'accroissement, des ratios, des durées ou des vitesses moyennes, ou encore des écarts à la moyenne, on utilise d'autres types de moyenne : moyenne géométrique moyenne harmonique moyenne quadratique Les formules correspondant au calcul de ces moyennes ne sont pas abordées dans ce cours. Pour de plus de détail on se réfèrera à l'ouvrage de Lahousse et Piédanna (1998). Propriétés de la moyenne La somme des écarts à la moyenne est égale à zéro. La moyenne minimise la somme du carré des distances à tous les éléments Attention à ne pas confondre avec la médiane qui minimise la valeur absolue des distances et non pas les distances élevées au carré. [...]
[...] Notons qu'en géographie, l'échelle d'analyse du phénomène étudié revêt une importance particulière. Etudier les migrations à l'échelle communale n'aura, par exemple, pas la même signification que si l'étude porte sur l'échelle départementale ou régionale. Dans le premier cas, la mobilité résidentielle locale risque d'être dominante alors que le second rendra compte de la redistribution nationale. D'une manière générale, il convient également de préciser les conditions d'observation en précisant notamment le lieu et la date de celles-ci ainsi que les sources et les références des données étudiées. [...]
[...] Le mode est donc une valeur centrale qui est assez fragile (sensible au choix des classes) pour les caractères quantitatifs continus. En revanche, c'est la seule valeur centrale utilisable pour les caractères qualitatifs nominaux - La médiane La médiane notée Me est la valeur partageant les observations d'une distribution statistique classées (dans l'ordre croissant ou décroissant) en deux sous-ensembles d'effectifs égaux. C'est la valeur pour laquelle la fréquence cumulée est égale à 0,5 (ou 50 On note : La médiane est un cas particulier de quantiles (indicateurs qui permettent de diviser la population d'une distribution statistique en sous-ensembles d'effectifs égaux cf La détermination de la médiane peut se faire dans le cas de variables qualitatives ordinales ou dans le cas de variables quantitatives. [...]
[...] Toutes les valeurs centrales sont actuellement simples à calculer. être peu sensible aux fluctuations d'échantillonnage Il s'agit en apparence de l'inverse de la propriété Mais on peut dire que cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes). La moyenne "explose" en présence d'une valeur aberrante alors que la médiane est très robuste. Le mode est en situation intermédiaire se prêter au calcul algébrique Lorsque l'on connaît les valeurs centrales de k échantillons E Ek d'effectifs respectifs P Pk, peut-on retrouver la valeur centrale de E qui est la réunion de tous ces échantillons ? [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture