Sciences - Ingénierie - Industrie, Session R, jeux de données, packages R chargés, session, regroupement de fonctions, données documentées, evir, evd, R.miner, graphics, théorie des valeurs extrêmes, application, probabilité, modélisation, loi Pareto, loi Weibull, loi Frechet, loi uniforme, graphique de HILL, beta
Dans une session R, nous avons accès à un bon nombre de fonctions et de jeux de données. Les objets accessibles sont ceux contenus dans les packages R chargés à l'ouverture de la session. Un package R est simplement un regroupement de fonctions et de données documentées. Ce tutoriel à pour but de vous faire une présentation de certains packages qui ont été choisis à savoir evir, evd, R.miner, et graphics, des packages qui nous permettrons d'explorer le monde de la théorie des valeurs extrêmes.
[...] head(ls("package:datasets"), n = head(ls("package:datasets"), "ability.cov" "airmiles" "AirPassengers" "airquality" "anscombe" "attenu" "attitude" "austres" Dans notre cas espèce seulement les 8 premiers éléments de la liste sont affichés ici, car cette liste compte normalement 104 éléments. Cependant, les jeux de données sont parfois cachés. Ils sont alors traités différemment des fonctions privées et ne se retrouvent même pas dans l'espace de noms du package. La fonction data est très utile dans ce cas. Cette fonction a en fait plusieurs utilités. [...]
[...] Puisque certains excès peuvent être négatifs, nous mettons les zéros à la place des termes négatifs : X=matrix(0,nrow=length(seuil),ncol=length(nidd2)) head(X, #View(X) for(i in 1:length(seuil)) {for(j in 1:length(nidd2)) {X[i,j]=max(nidd2[j]-seuil[i],0)} } head(X, On calcule pour chaque seuil la moyenne des excès: somme=rep(0,length(seuil)) somme Compteur=rep(0,length(seuil)) Compteur e NULL for(i in 1:length(seuil)) { for(j in 1:length(nidd2)) { if ( { somme[i]=somme[i]+X[i,j] Compteur[i]=Compteur[i]+1 } } e[i]=somme[i]/Compteur[i] } e La fonction moyenne des excès est une méthode permettant de répondre à l'une des dificultés de la modélisation des sinistres extrêmes qui est la détermination du seuil. Ainsi, graphiquement il est possible de déterminer le seuil le plus adéquat, en prenant la valeur à partir de laquelle la fonction moyenne des excès est linéaire. Regardons ensemble ce que cela produit: plot(seuil,e,type='l') Dans notre cas, La fonction moyenne des excès est linéaire à partir de la valeur 260. [...]
[...] On trace sur un même graphique les 3 estimateurs γ: PWM, EMV , Hill de Frechet frechet=rfrechet(1000, loc=0, scale=1, shape=1) f_hill(frechet,1000) Warning in gpd(loi, nextremes = method = Asymptotic standard errors not available forPWM Method when xi > 0.5 Pareto Pareto=rpareto(1000,10,15) f_hill(Pareto,1000) loi de Burr bur=rburr(1000,1,1,2) f_hill(bur,1000) Warning in gpd(loi, nextremes = method = Asymptotic standard errors not available forPWM Method when xi > 0.5 f_hill(nidd,length(nidd)) En conclusion, à partir des graphes obtenus précédemment, pour les lois considérées,la fonction Hill devient une droite horizontale aux environs de la valeur 260, est l'estimateur de Hill est proche de EMV et PWM. On peut donc considérer que le domaine d'attraction de la distribution des crues est Frechet [...]
[...] On dispose de {X1,··· un échantillon de hauteurs d'eau annuelles. On note X1,n X2,n Xn,n. Calculer le niveau d'eau h qui est atteint ou dépassé une seule fois sur T > i.e. résoudre Modélisation : Le but ici étant d'écrire un programme permettant de calculer la fonction empirique des excès moyens et de tracer les différents seuils: Application 1 On Charge au préalable nos deux packages, les bouts de code suivant permettent de faire ce travail: library(evd) library(evir) Nous allons commencer par lire les données du fichier Nidd et les classer par ordre décroissant dans un vecteur noté nidd. [...]
[...] Listes des fonctions de Evir Fonctions Rôles dgev Renvoie la distribution des valeurs extrêmes généralisées dgpd Distribution de la Pareto généralisée emplot Graphique de la fonction de distribution empirique Fonctions Rôles findthresh Permet de trouver le seuil gev Permet de trouver le seuil gpd Permet d'ajuster les valeurs des valeurs extrêmes généralisées gumbel Permet d'ajuste la distribution de Gumbell nidd.annual Les données de la rivière Nidd pgev Donne la valeur de la distribution des valeurs extrêmes généralisées interpret.gpdbiv Interprétation des résultats de l'ajustement pgd bivarié rgpd Distribution de la Pareto généralisée Listes des fonctions de Evd Fonctions Rôles failure Temps d'échec dextreme Distributions des maxima et es minima dmvevd Distributions paramétriques et valeurs extrêmes multivariées fextreme Ajustement du maximum de vraisemblance des maxima et des minima qfrechet Permet de trouver le seuil gpd Distribution de Fréchet qnweibull distribution inverse de weibull gumbel Permet d'ajuste la distribution de Gumbell rorder Distributions des statistiques d'ordres confint.evd Calcule les intervalles de confiance Accéder au contenu d'un package R chargé Une fois un package chargé en R avec la commande library, son contenu est accessible dans la session R. Nous avons vu dans des notes précédentes comment fonctionne l'évaluation d'expressions en R. Nous savons donc que le chargement d'un nouveau package ajoute un environnement dans le chemin de recherche de juste en dessous de l'environnement de travail. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture