Épreuve corrigé, analyse de données, analyse unidimensionnelle, bidimensionnelle et multidimensionnelle (ACP), catégories sociales, nuage de points, variance des erreurs
Cette épreuve est composée de trois exercices. Pour l'exercice 1 : on considère un échantillon de 1000 personnes d'une ville, interrogées à l'occasion d'une enquête
sur la sensibilité des dangers du tabac. La répartition est définie par rapport aux différentes professions et catégories sociales, comme le montre le tableau ci-dessous.
[...] 1pt Calculons les résidus 𝜀𝑖 1.5 pt 𝑦𝑖 TOTAL 𝑦̂ 𝜀𝑖 2 𝜀𝑖 5.3652 - 3.8888 − 0.0001 ≈ 0 Une estimation de la variance des erreurs est 𝑠 2 = 120.261 12− = pt Un intervalle de confiance de prévision est sous la forme : Pour 𝑥0 = 11, on a 𝑦̂0 = − 4.73818 × 11 + 100.7469 = 48.627 ; On a 𝑡( ) = 2.228 ; 𝑠 = √ 12.0261 = 3.4678 ; (𝑥0 − 𝑥̅ = (11 − 10.8333 = 0.0277 ∑(𝑥𝑖 − 𝑥̅ = En faisant les remplacements idoines, on trouve [ 40.585 ; 56.669 2pts EXERCICE 3 La matrice M est obtenue après avoir trouvé les quatre moyennes qui sont respectivement dans l'ordre des matières : MECA ELEC(11), DESSIN et MATHS La matrice M des données centrées est donc : 2 − −3 − −2 − − − M = −6 −3 −4 −5 1pt −10 −7 −8 − − −3 [ L'inertie 𝐼 est égale à la somme des valeurs propres qui coïncide aussi avec 𝑇𝑟(𝑉) = 23.2 + 13 + 12.8 + 21.8 = pt Les deux plus grandes valeurs propres 60.9832 et 4.9937 expliquent à elles seules 60.9832 + = de l'inertie totale. Elles répondent donc à la question pt 70.8 𝐶1 = 𝑀𝑈1 et 𝐶2 = 𝑀𝑈 La métrique utilisée dans le cas non normé est la matrice unité. [...]
[...] Il est donc utile pour un client de prévoir approximativement le temps d'attente en fonction par exemple, du nombre de guichets ouverts. Une des banques d'une grande métropole ayant 21 guichets, possède les données statistiques suivantes : Nombre de caisses ouvertes xi Temps moyens d'attente en minutes yi On cherche à expliquer le temps moyen d'attente Y par le nombre de guichets ouverts X. On pose 𝑦 = 𝑏 + 𝑎𝑥 + 𝜀. 1234- Tracer le nuage de points et commenter. [...]
[...] Les différents calculs nous donnent : C1 - 0.78 9.23 C 6.52 pt Représentation des individus dans l'espace réduit : COMMENTAIRES : Les individus i2 et i9 d'une part et les individus i5 et i8 d'autre part se ressemblent car, ces points sont proches. En revanche, i7 et i8 s'opposent. [...]
[...] DESSIN MATHS On donne les résultats suivants : • • • ] Matrice des variances-covariances : 𝑉 = [ Valeurs propres associées à V : 60.9832 ; 4.9937 ; 4.0350 ; − Vecteurs propres : 𝑈1 = ( 0.3906 ) , 𝑈2 = (− 0.5402 ) , 𝑈3 = (− 0.7444 ) , 𝑈4 = ( 0.0364 ) − − Déterminer la matrice M 1pt En exploitant les résultats ci-dessus, Montrer que l'inertie du nuage des individus est 𝐼 = pt Déterminer les valeurs propres permettant de faire une projection adéquate du nuage des individus sur un plan pt Déterminer les composantes principales C1 et C pt Représenter les individus dans le plan réduit. Commenter pts CORRECTION: EXERCICE 1 6pts Nous recopions et complétons le tableau : Le calcul des fréquences est assez aisé. L'effectif total est 𝑁 = 25000 + 24000 + 2000 + 12000 + 4500 + 7500 + 15000 = Par exemple, la fréquence de la catégorie « étudiant » est = On calcule de même celles des autres catégories. [...]
[...] ANALYSE DE DONNEES Analyse unidimensionnelle, bidimensionnelle et multidimensionnelle (ACP) EXERCICE 1 (Analyse unidimensionnelle) 6pts On considère un échantillon de 1000 personnes d'une ville, interrogées à l'occasion d'une enquête sur la sensibilité des dangers du tabac. La répartition est définie par rapport aux différentes professions et catégories sociales, comme le montre le tableau ci-dessous : Professions et Catégories sociales Effectif dans la population Etudiants Paysans Retraités Conducteurs Sportifs Fonctionnaires Ouvriers TOTAL Fréquence Effectif dans la observé dans population l'échantillon 𝑶𝒊 Effectif Théorique 𝒕𝒊 (𝑶𝒊 − 𝒕𝒊 )𝟐 𝒕𝒊 𝑶𝒊 − 𝒕𝒊 Recopier et compléter ce tableau. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture