Un agronome étudie les effets d'un fertilisant sur la production d'herbe. Les graines sont semées de façon à ce que leur distribution soit uniforme sur la surface du terrain. Dix parcelles de 1m² sont choisies au hasard et différentes masses de fertilisant sont déposées sur chacune. Deux mois plus tard, on récolte l'herbe et on la pèse.
Nous allons nous servir de cette expérience comme base pour voir les différents aspects de la régression linéaire. Nous allons ainsi établir la droite de régression (équation de la droite et prédiction), comparer les valeurs de r et R², étudier les résidus (normalité) et enfin transformer des variables dans le but d'une linéarisation.
[...] La revue scientifique L2 Biologie TP : Droite de Régression Table des matières I. Introduction II. Droite de régression Préliminaires Graphe (nuage de point) Calcul du coefficient de corrélation Calcul des paramètres de la droite de régression y = a*x + b Tracé de la droite de régression Prédictions III. Étude de la normalité des résidus Calcul des résidus normalisés Moyenne des résidus ii) Variance des résidus iii) Calcul des résidus Distribution aléatoire Loi normal Trie des résidus ii) Calcul de Fobs iii) Calcul de Fthéo iv) Tracé de Fobs et Fthéo Calcul de Fobs(xi) Fthéo( xi ) vi) Calcul de Dobs vii) Conclusion Homoscédasticité IV.Comparaison de r (coefficient de corrélation) et (coefficient de détermination) Tracé du graphe Calcul de r Calcul de Conclusion V. [...]
[...] On peux ainsi normaliser nos résidus et on obtient : ei = yi y(predit) 11,7818181818 -12,503030303 - -5,3575757576 - -22,496969697 -6,7818181818 residus normalisés 0,65773289 -0,6979953457 - -0,2990925282 - -1,2559179463 -0,3786024197 Fig.6 : calcul des résidus normalisés. distribution aléatoires résidus 0,65773289 -0,6979953457 - -0,2990925282 - -1,2559179463 -0,3786024197 xi Fig : Tableau regroupant les résidus et le xi On veut ici, vérifier que cette distribution présente les caractéristiques de résidus. Résidus en fonction des xi résidus xi Colonne A Fig : Histogramme représentant les résidus normalisés en fonction des xi. On a 6 valeurs négatives et 4 positives. On a une alternance de signe positif et négatif : . [...]
[...] Conclusion : Au risque α = on ne met pas en évidence une différence significative, on ne peux donc rejeter le fait que la distribution dans la population soit normale. Homoscédasticité On cherche à vérifier que dans le plot ei = l'espace est occupé (pas de tendance). ei = f(yi) ei - -20 -30 yi Colonne B Fig : Graphique représentant ei en fonction des résidus normalisés. On voit sur ce graphique que l'espace est bien occupé dans tout l'ensemble, il n'y a donc pas de tendance. [...]
[...] sxy = [ yi) - yi) / n ] / = [ - / On trouve sxy = 4648,611 et = 5729,167 donc r = 0,96 De plus, nos calculs nous donnent â = 0,81 (que l'on peut aussi trouver avec la fonction DROITREG( ) et b = 51,93 ( que l'on peut également obtenir avec la fonction PENTE( ) ou ORDONNEE.ORIGINE( ) L'équation de notre droite est donc y = 0,81 * x + 51,93 On trace cette droite de régression sur notre graphique ainsi on a : Production d'herbe en fonction de la masse du fertilisant 300 = 0,81x + Production d'herbe = Masse de fertilisant masse de f ertilisant production d'herbe Régression linéaire pour masse de f ertilisant production d'herbe prediction y chapeau Régression linéaire pour prediction y chapeau Fig : Production d'herbe en fonction de la masse de fertilisant. Les points en rose représentent la valeur prédite de la masse de fertilisants. Avec ses points on linéarise. Prédiction : Grâce à l'équation de notre droite on peut faire des prédiction quand à la production d'herbe ou la quantité de fertilisant qu'il faut avoir pour une production d'herbe donnée. [...]
[...] Pour la droite représentant y = x + 2 on a r = 1 et pour y = 4x + 7 on a = 0,56 Calcul de Les droites de régression linéaires nous donnent les valeurs de Ainsi, pour la droite représentant y = x + 2 on a = 1 et pour y = 4x + 7 on a = 0,32 (en faisant le modèle d'une parabole) Conclusion Pour la droite représentant y = x + 2 on a r = 1 = Pour y = 4x + 7 on a = 0,32 et = 0,56 Les valeurs de r et sont les mêmes dans le cas ou nous avons une relation linéaire et autrement sont significativement différentes. Ces deux valeurs dépendent du modèle utilisé. Une valeur élevée pour montre que nos points se rapprochent du modèle, ici notre valeur est de 0,32 donc nos points sont éloignés (du modèle) ainsi notre droite ne suis pas totalement l'équation d'une parabole.(f(x)=x²) V. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture