L'objectif de ce rapport est d'expliquer un comportement d'achat par une analyse discriminante canonique à l'aide du logiciel SAS. Les données utilisées dans cette étude sont tirées d'une enquête réalisée par un grand magasin en 2002 ayant notamment pour objectif de mieux connaître les clients et de mesurer leur satisfaction.
[...] Nous commenterons ensuite les résultats de l'analyse discriminante obtenus avec la procédure CANDISC sous SAS. Présentation de la variable achat3 La variable achat3 est composée de trois modalités : A : si l'individu n'a réalisé aucun achat au cours des six derniers mois. B : si l'individu a réalisé 1 à 4 achats au cours des six derniers mois. C : si l'individu a réalisé 5 achats ou plus au cours des six derniers mois. Nous tenterons donc de trouver une représentation des individus qui sépare au mieux les trois groupes. [...]
[...] Cette analyse a été effectué avec la procécure CANDISC sous SAS. Sur les deux tableaux ci-dessous, on peut observer les carré des distances entre les centroîdes de deux groupes, et donc d'une certaine manière la qualité de discrimination, ainsi que les F-stats de Fisher sur l'hypothèse que les centroîdes sont égaux . On peut donc conclure que les groupes A et B sont proches tandis que le groupe C est plus éloigné de ces deux classes. Le tableau ci-dessous nous permet d'affirmer que notre modèle est discriminant vis-à-vis des trois groupes composés par la variable achat3 En effet, les quatre tests suivants sont équivalents : ils nous permettent de tester l'hypothèse nulle selon laquelle il n'existe pas de différences entres les classes au sens des variables et donc que les moyennes des variables sont égales. [...]
[...] Les quatre autres variables présentes dans ce tableau ont un pouvoir discriminant assez faible et on observe d'ailleurs que la probabilité associée au F-Ratio est faiblement inférieur à Cette procédure permet de mettre en avant que les six variables sélectionnés permettent de discriminer significativement les trois groupes, et cela mieux que cinq variables. L'algoritme a exclu les variables Offre et Age En effet, ces deux variable présentent un lambda de Wilks qui n est pas suffisament faible pour que le F-Ratio soit grand. Les probabiltés associées au F-Ratio sont donc supérieurs à 5%. Ces deux variables ne seront pas retenues dans le modèle sur lequel nous effectuerons une analyse discriminante canonique. [...]
[...] Présélection des variables continues Afin de déterminer le meilleur modèle, nous avons utilisé la procédure STEPDISC de SAS qui est un algorithme de sélection des variables pas à pas. Cet algorithme est basé sur la minimisation du critère lambda de Wilks. La première variable qui sera insérée dans le modèle est celle qui aura les plus faibles lambda parmi tous les modèles réduits à une variable. Puis l'algorithme réitère le même processus : quand variables ont été sélectionnées et offrent un lambda pour tous les modèles à variables le plus faible possible, on cherche une variable supplémentaire minimisant un lambda à variables. [...]
[...] Cet axe est donc faiblement discriminant. Représentation graphique Passons maintenant à l'analyse graphique. On peut donc observer visuellement que les remarques effectuées précédemment s'avèrent exactes. En effet, l'axe 1 est beaucoup discriminant que l'axe 2. De plus on observe également que les classes A et B sont tellement proches qu'on distingue très peu. Par contre, la classe C se distingue des deux autres classes. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture