En tant qu'instrument de mesure, les tests ont certaines qualités métriques (mesurables) que l'on doit contrôler. On distingue ainsi trois qualités : la sensibilité, la fidélité et la validité. "Mesurer c'est faire correspondre des nombres aux choses selon certaines règles", Reuchlin (1997).
L'une de ces règles est la sensibilité, c'est-à-dire la finesse discriminative. On dit qu'un test est sensible quand il discrimine correctement les sujets, qu'il les différencie du point de vue de la dimension mesurée.
En effet, le but d'un test est de classer un individu parmi un groupe : si tous les individus ont le même score au test, s'il n'y a que des ex aequo, aucun classement ne peut être effectué et le test ne sert à rien. Il faut donc que l'on puisse rendre compte des différences individuelles avec un test sensible.
La sensibilité maximale est représentée par une distribution rectangulaire sur l'étendue maximale, c'est-à-dire du premier au dernier score possible.
Vous verrez que le plus souvent, dans la construction d'un test, et plus largement d'une épreuve psychologique, on recherche une distribution gaussienne, en forme de cloche, bien que cela ne représente donc pas la sensibilité la plus grande.
[...] Il n'est pas possible d'évaluer la validité de contenu à l'aide d'un coefficient de corrélation comme pour les autres qualités psychométriques. En fait, il n'est pas possible d'avoir une estimation chiffrée de la validité de contenu. On peut en revanche faire appel à des experts de la discipline choisie et qui sauront juger de la représentativité des items sélectionnés. Pour mémoire, sachez que l'on peut aussi parler de validité convergente, divergente et de construit. Si vous souhaitez en savoir plus sur ces types de validité, vous pouvez consulter l'ouvrage de Reuchlin. [...]
[...] Autrement dit, un test est valide s'il mesure bien ce qu'il est censé mesurer. Par exemple, un test de connaissances en géographie qui porterait essentiellement sur des connaissances en économie ne serait pas valide. Il existe plusieurs types de validité. On peut tout d'abord estimer la validité de critère. Il s'agit d'évaluer la validité d'un test à l'aide d'un critère externe. Par exemple, si un test est censé évaluer la réussite scolaire, on pourra choisir comme critère externe la moyenne des notes d'un trimestre. [...]
[...] Il vaut alors mieux procéder à une partition pair/impair. Cela consiste à mettre tous les items pairs d'un côté et tous les items impairs de l'autre. On peut penser que les deux parties ainsi constituées seront plus équivalentes. Le deuxième problème est que la fidélité d'une épreuve augmente si l'on augmente son nombre d'items. Or, le nombre d'items est par définition divisé par deux avec la méthode de partition par moitié. Il faut donc souvent recourir à une correction du coefficient de corrélation à l'aide de la formule de Spearman-Brown. [...]
[...] La différence entre les deux se situe au niveau du délai qui sépare la passation du test de celle du critère. Si les deux sont passés en même temps (c'est-à-dire à quelques minutes ou jours d'intervalle, pas exactement en même temps bien sûr on parlera de validité concourante. Si le test est passé avant le critère (plusieurs semaines ou mois avant), on parlera de validité prédictive, car le test aura alors pour fonction de prédire le critère. Par exemple, il n'est pas rare que l'on souhaite savoir, à la fin du CM2, si les enfants réussiront ou non en 6e. [...]
[...] On appelle cette méthode celle des formes parallèles. Une fois que les deux mesures sont recueillies, il suffit, comme pour le test-retest, de procéder au calcul de la corrélation entre les deux séries de mesure. L'hypothèse sous- jacente est que, si le test n'est pas entaché d'une forte erreur de mesure (et qu'il mesure bien la même dimension que l'autre épreuve), les classements des sujets devraient être semblables dans les deux cas. Le problème majeur posé par cette méthode est tout simplement qu'il n'existe pas toujours d'épreuve parallèle mesurant la même dimension que le test. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture