Construction Des Tests Et Methodes Des Tests 2022 2023

Télécharger au format docx, pdf ou txt
Télécharger au format docx, pdf ou txt
Vous êtes sur la page 1sur 79

Page |1

UNIVERSITE DE GOMA
« UNIGOM »
B.P. 204 GOMA

Scientia Splendet et Conscientia

DOMAINE DES SCIENCES PSYCHOLOGIQUES ET DE L’EDUCATION

DEPARTEMENT DE PSYCHOLOGIE

COURS DE

CONSTRUCTION ET METHODES DES TESTS


30 HEURES

Par le Pr Bedan MOKAKANDO A.

Destiné aux Etudiants de L2 LMD en Psychologie

ANNEE ACADEMIQUE 2022-2023

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |2

O. INTRODUCTION GENERALE
Toute discipline scientifique a son objet d’étude, ses méthodes, ses techniques et ses
instruments de mesure. Les instruments privilégiés de la psychologie, pour étudier les
comportements, sont les Tests Psychométriques ou Tests Psychotechniques. La pédagogie qui est
une science connexe utilise aussi des tests, appelés tests scolaires ou de connaissances.
Le but ultime des études psychométriques est d’arriver à apprécier les conduites humaines.
La notion d’appréciation repose essentiellement sur l’idée de « mesure » et « d’évaluation ».
Le terme « MESURE » se réfère à des observations exprimées en quantités, c’est-à-dire
transformées en expressions numériques. La mesure, c’est l’opération par laquelle on fait
correspondre à des données matérielles, quantitativement définies, des expressions représentant le
nombre d’unités qu’elles contiennent. On distingue quatre niveau de mesure, à savoir l’échelle
nominale, l’échelle ordinaire, l’échelle à intervalles égaux et l’échelle de rapports.
L’évaluation paraît comme une démarche mentale et scientifique (méthodique) en vue de
juger, de critiquer et d’interpréter, à partir des observations faites au moyen d’appareils, de procédés
d’enregistrement, d’épreuves, etc. Elle dépasse la mesure par le fait qu’elle insiste sur la
signification et l’utilité des informations.
Pour faire l’appréciation d’un comportement, le psychologue se base sur des normes, des
principes, des procédures à suivre et des techniques à appliquer (les techniques de présentation du
matériel, de correction, d’interprétation…). Tout cela constitue « La méthode de tests ».
Le problème d’évaluation quantitative s’est posé à la psychologie expérimentale ; il
intéressait particulièrement la psychologie différentielle, avec les concepts d’aptitudes et de
capacités et au point de vue de ses applications, par exemple : évaluation précise des conduites
individuelles dans le but d’effectuer les classements scolaires, la sélection professionnelle,
l’orientation vocationnelle, etc. Mais faut-il encore construire ces tests afin de s’en servir.
La construction des épreuves dont la validité est acceptable est un défi que les
psychologues et les pédagogues doivent relever dans les différentes évaluations de la personne
qu’ils sont appelés à réaliser dans le cadre de leurs sciences respectives. La construction des tests
concourt à l’accomplissement de cet objectif. En effet, qu’il s’agisse d’évaluer les facultés
psychologiques ou d’évaluer les acquis scolaires, qu’il s’agisse de mener des investigations sur les
différentes questions touchant leurs sciences, la construction des instruments fiables, dont les
résultats sont dignes de confiance s’impose afin que les spécialistes précités méritent le qualificatif
de scientifiques.
Sans revenir aux multiples définitions du mot « test », considérons qu’il s’agit d’un
instrument de mesure réalisé par un expert, ou un groupe d’experts ou encore des spécialistes en
psychométrie ou en mesure et évaluation en Sciences de l’Education et en Psychologie. Cet
instrument doit reposer sur des qualités métrologiques éprouvées comme la validité, la fidélité.
Remarquons qu’il existe aussi des « tests non standardisés » c'est-à-dire des instruments de
mesure dont on a seulement assuré ou établi la validité. La construction de telles épreuves fait
également partie des objectifs de ce cours.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |3

OBJECTIFS DU COURS
Le cours de construction des tests et de méthodes des tests poursuit les objectifs de rendre l’étudiant
capable de :
1. Présenter les étapes d’élaboration d’un test
2. Décrire les taxonomies de Bloom, Guilford et Krathwoohl ;
3. Appliquer les règles de construction des questions et par conséquent de relever les erreurs de
construction et d’y apporter des corrections ;
4. Analyser les items par au moins une technique ;
5. Etablir l’étalonnage d’une épreuve par Centilage, notes standard et échelles normalisées ;
6. Présenter les grands tests mondialement connus : les noms des auteurs, le but et la population
sur laquelle ils sont destinés ;
7. Définir les qualités métrologiques d’un bon test et de décrire la procédure de leur évaluation ;
8. Présenter l’importance et l’utilité des tests dans des situations psychologique, pédagogique,
académique et professionnelle ;
9. Maîtriser les termes techniques et les sigles utilisés dans le testing et la construction des tests.

A. CONTENU SOMMAIRE DU COURS

INTRODUCTION GENERALE
Première partie : CONSTRUCTION DES TESTS
Chapitre I. Etapes de construction d’un test
Chapitre II. Etude des taxonomies et élaboration des questions
Chapitre III. Techniques d’analyse des items et d’étalonnage

Deuxième partie : METHODE DES TESTS


Chapitre IV : Généralités sur les tests
Chapitre V : Catégories de tests, centres de documentation et catalogues
Chapitre VI : Panorama des tests

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |4

CHAPITRE 1
ETAPES DE CONSTRUCTION D'UN TEST
La construction d’un instrument de mesure fiable ou d'un test, en psychologie comme en éducation,
est un processus de longue haleine. Cinq étapes principales peuvent être distinguées dans ce
processus. Ce chapitre se limite à une brève présentation de chacune de ces étapes.

1.1. 1ère ÉTAPE : LA DÉTERMINATION DES UTILISATIONS PRÉVUES DU TEST


La première question que doit se poser la personne désireuse de construire un test concerne les
fonctions que ce dernier devra remplir. A quoi va-t-il servir ? Par exemple, un test de
mathématique peut avoir pour fonction de sélectionner des sujets, de diagnostiquer des difficultés
d'apprentissage ou encore de déterminer si un élève maîtrise les compétences attendues en fin
d'année scolaire. De même, un questionnaire d'anxiété peut être utilisé pour recruter des personnes
possédant certaines caractéristiques de personnalité ou pour évaluer l'effet d'un médicament
anxiolytique. Le plus souvent, un même test ne peut remplir toutes ces fonctions. En effet, les
usages prévisibles d'un test déterminent profondément ses caractéristiques. En particulier, une
distinction nette doit être tracée entre les tests normés et les tests critériés.

Les tests normés visent à discriminer les sujets appartenant à la population pour laquelle est
construit le test. Ces tests peuvent, par exemple, nous procurer des informations sur le degré
d'anxiété d'un sujet par rapport au niveau de l'anxiété dans l'ensemble de la population. Il en va de
même pour le niveau de compétence en mathématique ou pour tout autre caractéristique que l'on
souhaite mesurer. Par contre, les tests critériés ont pour fonction d'évaluer si un sujet possède ou
non certaines caractéristiques prises comme référence. Par exemple, pour remplir correctement
une certaine fonction professionnelle, le niveau d'anxiété du sujet ne dépasse-t-il pas un seuil
déterminé ? Ou encore, le sujet possède-t-il les compétences en mathématiques nécessaires pour
aborder un programme d'études donné ?

Le choix de construire un test normé ou un test critérié conditionne la méthodologie utilisée. Des
techniques particulières doivent être appliquées pour obtenir des tests possédant les propriétés
métriques spécifiques dont on a besoin.

La distinction entre test normé et test critérié n'est pas la seule qui puisse être faite. Dans le domaine
éducatif, il existe de profondes différences entre les tests destinés à l'évaluation certificative et ceux
utilisés pour l'évaluation formative ou l'évaluation diagnostique. Un test certificatif doit couvrir
l'ensemble d'un programme scolaire. Un tel test est habituellement centré sur les performances. Il
doit en effet permettre de vérifier si l'élève est capable de réaliser les tâches que l'on attend de lui en
fin d'apprentissage. Par contre, un test diagnostique est généralement beaucoup plus ciblé. Son but
est de comprendre le sens d'une performance.

Par exemple, il ne s'agit plus, comme avec un test certificatif, de simplement vérifier si un élève
peut additionner correctement deux nombres décimaux, niais de comprendre pourquoi certains
élèves présentent des difficultés pour réaliser de telles additions. L'information que l'on désire
recueillir ne se limite plus à la performance, niais concerne les capacités cognitives sous-jacentes à
ces performances. Pour atteindre cet objectif, il est nécessaire d'utiliser un test qui s'appuie sur un

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |5

modèle des processus mis en jeu pour réaliser des additions avec des décimaux. Un tel modèle
permet d'éclairer les difficultés rencontrées par les élèves et, le cas échéant, de mettre en œuvre des
actions remédiatives. Ainsi, les propriétés d'un test diagnostique sont nécessairement très différentes
de celles d'un test certificatif. Ces deux types d'outils doivent, par conséquent, être conçus de
manière spécifique en s'appuyant sur une méthodologie adaptée.

Il est possible d'opérer d'autres distinctions entre les fonctions que peuvent remplir les tests. Comme
nous venons de le voir, ces fonctions déterminent la nature du test à construire et, par conséquent, la
méthodologie à utiliser pour élaborer un tel outil. On ne peut donc éluder une réflexion approfondie
sur l'usage auquel on destine un test. Au point de départ du travail de construction, un choix doit
toujours être opéré entre différentes fonctions possibles. Il est illusoire de vouloir créer un test «
généraliste qui ambitionne de répondre à tous les besoins des praticiens.
1.2. 2ème ÉTAPE : LA DÉFINITION DE CE QUE L'ON SOUHAITE MESURER
Habituellement, le point de départ d'un test est un objectif relativement vague et général : « évaluer
la compréhension en lecture à l'école primaire », « apprécier le développement social de 3 à 6 ans »,
« diagnostiquer les troubles de la mémoire », « sélectionner du personnel de bureau », etc. Ces
intentions sont encore beaucoup trop vagues pour permettre réellement de débuter la construction
d'un test. Elles nécessitent un travail d'approfondissement des concepts et d'opérationnalisation
de ceux-ci. En d'autres termes, il s'agit de définir avec précision les caractéristiques psychologiques
ou éducatives que le test devra mesurer. Sur base de cette définition, des items pourront alors être
construits. Cette première étape est donc cruciale. La validation du contenu du test repose sur ce
travail préalable de définition de ce que l'on veut mesurer.
Mais comment passer d'une intention vague à la définition opérationnelle d'un concept ? Selon les
domaines, plusieurs méthodes peuvent être utilisées :
1) La définition des objectifs pédagogiques. (…) Ici construction d'un tableau (les
spécifications). Lorsqu'il s'agit d'évaluer des apprentissages scolaires, la démarche la plus
fréquente consiste à préciser les performances que les élèves devront démontrer à un
moment donné de leur apprentissage. De nombreux outils ont été développés pour permettre
une opérationnalisation suffisante de ces objectifs. Le tableau de spécifications est un de
ces outils permettant de déterminer les divers types de comportements attendus
relativement à un contenu disciplinaire. La section 2 du présent chapitre présente en détail
la construction d'un tableau de spécifications ainsi que d'autres méthodes permettant de
préciser les caractéristiques que doit évaluer un test d'acquis scolaire.
2) L'analyse de contenu d'entretiens. Lorsque le praticien n'a pas d'idées précises à propos des
caractéristiques permettant de discriminer les individus qui seront évalués par le test, il est
intéressant de commencer par interroger des personnes appartenant à la population visée par
ce test. L'interview, libre ou semi-structurée, permet de recueillir un grand nombre
d'informations qui seront sélectionnées et classées au moyen d'une analyse de contenu. Par
exemple, Hunt et Mc Kenna (1992) ont procédé de la sorte pour mettre au point un
questionnaire de qualité de vie destiné à des patients dépressifs. Cinq psychiatres ont
interviewé 30 patients dépressifs à propos de différentes facettes de leur vie quotidienne.
Une analyse de contenu des entretiens a permis de mettre en évidence un certain nombre de
propositions caractéristiques, permettant d'apprécier la qualité de vie des patients dépressifs.
Ces propositions ont ensuite servi à construire les items du questionnaire.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |6

3) L'observation directe des comportements. Dans certains cas, plutôt que d'interroger les
personnes, il est préférable de les observer dans leur milieu de vie ou de travail. Cette
méthode a été utilisée par Binet pour construire le tout premier test d'intelligence de
l'histoire. Au début de ce siècle, Binet ne pouvait s'appuyer que sur un modèle rudimentaire
et vague de l'intelligence. Dès 1900, il commença donc à observer les handicapés mentaux
adultes de l'Asile Sainte-Anne et les enfants d'une école d'un quartier populaire de Paris afin
de mettre en évidence les comportements permettant de distinguer les individus sans
handicap intellectuel des individus handicapés mentaux. Les items de l'échelle métrique
d'intelligence de 1905 sont issus de ce travail d'observation.
4) La méthode des incidents critiques. L'origine de cette méthode est attribuée à Flanagan
(1954). Elle est particulièrement utile pour construire des outils d'évaluation des
performances professionnelles. Elle consiste à demander à des responsables de décrire des
situations de travail où les employés sous leurs ordres ont agi de manière particulièrement
efficace ou, au contraire, inefficace. Partant de cette description, certains comportements «
critiques » peuvent être mis en évidence et servir à construire des échelles d'évaluation.
5) La référence à un modèle théorique. À la différence des autres méthodes, celle-ci ne part pas
de l'expérience, mais d'un modèle de la réalité construit au cours de recherches antérieures.
Depuis le début des années 1980, les développements de la psychologie cognitive ont
conduit à la création de nombreux modèles théoriques utilisables par les constructeurs de
tests. Des tests destinés au diagnostic des troubles de la lecture ont, par exemple, été créés
sur base de modèles décrivant les processus impliqués dans l'activité de lecture (p.ex. de
Parti, 1994 ; Mousty & al., 1994). D'autres outils ont également été construits en référence à
des modèles théoriques pour évaluer des caractéristiques aussi diverses que le calcul, la
motivation, la mémoire.

1.3. 3ème ÉTAPE : LA CRÉATION DES ITEMS


II y a près de cinquante ans, Georges Gallup, fondateur du célèbre institut de sondage du même
nom, affirmait (1947, p. 383) « Trop d'attention a été accordée à la constitution des échantillons et
trop peu à la création des questions (….). Des différences dans la construction des questions
conduisent souvent à des résultats qui présentent de plus grandes variations que celles
habituellement observées en fonction des différentes techniques d'échantillonnage ».
Cette constatation garde toute son actualité et peut être généralisée aux questions construites pour
les tests psychologiques et les tests d'acquis scolaires. Souvent, les praticiens ne suivent aucune
méthodologie pour construire les items. Ayant en tête ce qu'ils souhaitent mesurer, ils se fient à leur
intuition pour produire les questions. Pourtant, il est indispensable d'avoir un projet et un plan précis
avant de se lancer dans la production d'items :
1) Quel format d'items choisir ? Pourquoi ? Le choix d'un format ne doit pas être arbitraire. Il
découle d'un ensemble de contraintes concernant les objectifs du test et les conditions
matérielles de création, de passation et de cotation de celui-ci. En conséquence, il n'y a pas
de bon format d'item dans l'absolu. Un format est bon s'il est adéquat au but et à la situation
d'évaluation.
2) Quel doit être le niveau de difficulté des items ? Le choix du niveau de difficulté des items
dépend de l'objectif du test. Ce niveau variera selon que le test est normé ou critérié,

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |7

certificatif ou formatif. En d'autres termes, c'est la nature des informations que l'on désire
recueillir qui doit déterminer le niveau de difficulté des items à produire.
3) Combien faut-il créer d'items ? Le nombre d'items à créer dépend de plusieurs facteurs. Le
premier facteur est la durée du test. Selon que l'on souhaite un test court, pouvant être passé
en 10 minutes, ou un test diagnostique se déroulant sur plusieurs séances d'examen, le
nombre d'items à créer variera considérablement. Un second facteur à prendre en compte est
le niveau désiré de fidélité du test. Un test long sera généralement plus fidèle qu'un test
court. Par ailleurs, si le test comporte plusieurs sous-scores, il sera nécessaire d'assurer la
fidélité de ceux-ci en prévoyant suffisamment d'items dans chacune des sous-échelles du
test. Enfin, un dernier facteur à prendre en considération est l'élimination, quasi inévitable,
de certains items après leur évaluation par des experts et leur mise à l'essai. Si l'on veut que
la version finale du test contienne assez d'items, il faudra donc en créer plus que le strict
nécessaire. Si, par exemple, le test final doit contenir 20 items, on en créera 30 et l'on
retiendra les 20 meilleurs de ceux-ci. Habituellement, un surplus de 30 à 50 % d'items est
nécessaire pour éviter de ne pas avoir un nombre suffisant d'items après la mise à l'essai.

1.4. 4ème ÉTAPE : L'ÉVALUATION DES ITEMS


Une définition précise de ce que l'on souhaite mesurer et une méthodologie rigoureuse de
construction des items sont des conditions nécessaires, mais non suffisantes pour obtenir des items
valides et fiables. Pour garantir les propriétés métriques des items, une évaluation minutieuse de
ceux-ci doit également être réalisée. Deux démarches complémentaires sont habituellement suivies
pour réaliser cette tâche :
1) Une évaluation des items par des juges. Ceux-ci sont chargés d'apprécier la conformité des
items aux exigences définies lors de la deuxièm étape du processus de construction du test
(Validité de construit). La réalisation d’une mise à l'essai des items suivie d'une analyse
qualitative et quantitative des résultats.
2) La mise à l'essai complète l'appréciation des items par des juges. Cette dernière évaluation
reste en effet subjective malgré la rigueur méthodologique avec laquelle elle peut être
réalisée. La mise à l'essai permet de recueillir des données empiriques, directement de la
population à laquelle est destiné le test.

La mise à l'essai consiste à faire passer tous les items à un échantillon de la population. Cet
échantillon ne doit pas nécessairement être représentatif ni de très grande taille. Sa taille dépend en
fait de l'hétérogénéité de la population visée par le test et de la grandeur de la population de
référence. Par exemple, si un questionnaire de stress est destiné à évaluer uniquement des pilotes
d'avion, une mise à l'essai sur un échantillon de 50 pilotes permettra généralement une évaluation
satisfaisante des items, car la population des pilotes d'avion est plus homogène et de plus petite
taille que la population en général. Par contre, si la population est plus hétérogène, un échantillon de
200 à 300 personnes peut être nécessaire pour réaliser une mise à l'essai valable, Par exemple, la
mise à l'essai des items de la version française du WISC-III (Wechsler intelligence Scale for
Children version 3) a été réalisée sur un échantillon de 220 enfants. Ce test est destiné à évaluer
tous les enfants français entre 6 et 16 ans. Dans ce cas, l'échantillon du prétest doit être de plus
grande taille, car il doit inclure des enfants des deux sexes, de différents âges et de différents
milieux sociaux. On ne vise toutefois pas à ce qu'un tel échantillon soit parfaitement représentatif de

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |8

la population. Il doit avant tout refléter l'hétérogénéité de celle-ci. Un échantillon trop homogène
risque en effet de masquer certains items problématiques. Par exemple, si les items d'un
questionnaire de dépression destiné à des personnes âgées sont prétestés sur un échantillon qui ne
comprend que des retraités possédant un diplôme d'études supérieures, certains problèmes risquent
de passer inaperçus. L'inclusion de personnes âges possédant le seul diplôme d'études primaires
aurait permis de mettre en évidence des questions dont le vocabulaire trop complexe peut entraîner
des erreurs de compréhension.

Les résultats d'une mise à l'essai sont analysés d'un point de vue tant qualitatif que quantitatif. En
particulier, les commentaires des sujets à propos des items peuvent se révéler précieux pour
comprendre des résultats aberrants et pour remédier à certains problèmes de formulation des
questions. De même, les problèmes de manipulation du matériel, d'enregistrement des réponses, de
temps de passation, de cotation des réponses peuvent être repérés à cette occasion. Ces problèmes,
en apparence mineurs, doivent retenir toute l'attention du constructeur car ils peuvent diminuer
considérablement la validité des résultats d'un test. C'est, par exemple, le cas d'un espace trop petit
pour noter les réponses ou d'un livret de test difficile à manipuler.

En plus de ces vérifications qualitatives, la mise à l'essai permet de réaliser différentes analyses
statistiques des résultats. Ces analyses portent, entre autres, sur la difficulté des items, leur
discrimination, leur fonctionnement différentiel. Sur base de ces analyses et des observations
qualitatives, les meilleurs items seront finalement sélectionnés et serviront à construire la version
définitive du test.
1.5. 5ème ÉTAPE : LA DÉTERMINATION DES PROPRIÉTÉS MÉTRIQUES DU TEST
DÉFINITIF
Une fois les meilleurs items sélectionnés et la version définitive du test constituée, il reste à
déterminer les propriétés métriques de ce test. Les propriétés qui doivent retenir l'attention du
constructeur varient en fonction de la nature du test. S'il s'agit d'un test normé, il sera nécessaire
d'établir des normes et de présenter celles-ci selon une échelle aisément compréhensible par les
praticiens. S'il s'agit d'un test critérié, il faudra préciser des scores de référence utiles, Par ailleurs, si
les résultats du test doivent être mis en relation avec ceux d'autres tests, il y aura lieu de mettre en
équivalence les échelles de mesure concernées.
Par ailleurs, une investigation approfondie de la validité et de la fidélité des résultats de la version
finale du test devra toujours être réalisée. Le constructeur doit rassembler des preuves de la validité
des inférences permises par les résultats au test. Par exemple, s'il propose aux praticiens de calculer
et d'interpréter différents sous-scores au test, il sera nécessaire de prouver la pertinence de tels sous-
scores quant à l'interprétation qui en est faite (American Psychological Association, 1999, p. 20
Il faut souligner que l'évaluation de la validité des résultats à un test n'est pas du seul ressort du
constructeur. Elle est partagée par l'utilisateur du test. En fait, la validité n'est jamais une qualité
acquise une fois pour toutes. Chaque nouvelle inférence qu'un praticien veut réaliser à partir des
résultats d'un test doit faire l'objet d'une validation spécifique. Par exemple, si un test de mémoire a
été créé pour évaluer les compétences mnésiques des enfants et des adolescents, la pertinence de
l'usage de ce test avec des adultes devra être démontrée sur base de données empiriques.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
Page |9

Le constructeur devra également apporter des informations à propos de la fidélité des résultats. Il
peut choisir parmi une variété d'indicateurs tels que le coefficient de fidélité et les autres mesures
liées à celui-ci et nécessaires aux praticiens, telles que l'erreur de mesure de scores, les intervalles
de confiance, l'erreur de mesure des différences entre scores, etc
Lorsqu'un test n'est pas réservé au seul usage de son constructeur, mais est destiné à être diffusé,
la rédaction d'une documentation destinée aux utilisateurs est nécessaire (American Educational
Research Association, 1999, pp. 67-70). Cette documentation doit présenter les données métriques
citées ci-dessus (normes, coefficient de fidélité...) ainsi que les bases théoriques du test, les
fonctions pour lesquelles il a été créé et les qualifications requises pour pouvoir l'utiliser et en
interpréter correctement les résultats.

Le constructeur d'un test n'a pas seulement une responsabilité méthodologique, il doit également
assumer une responsabilité éthique. L'instrument qu'il a créé va en effet servir à évaluer des
personnes et à prendre des décisions à leur propos. Les informations communiquées dans le manuel
doivent permettre de garantir un usage correct du test dans le respect des principes
déontologiques.
Au-delà des difficultés pratiques et devant les enjeux élevés entourant l'utilisation des tests,
l'utilisateur et le constructeur de tests ont le devoir de se conformer à un certain nombre de règles
déontologiques et à posséder des standards éthiques élevés. En plus des références déjà
mentionnées, il existe plusieurs autres références en ce domaine, notamment un numéro spécial de
la revue Mesure et évaluation en éducation (1997) totalement consacré à ces questions dans le
domaine de l'éducation, Pour une perspective plus générale concernant l'éthique de l'agir
évaluationnel, Hadji (2012) aborde plusieurs questions philosophiques formant la base d'une
éthique en évaluation.

Chapitre II. ETUDE DES TAXONOMIES ET ELABORATION DES QUESTIONS


2.1. ETUDES DES TAXONOMIES
Une taxonomie, en tant que classification systématique, sert de référence de guide. Dans
notre cas, nous appellerons taxonomie une classification hiérarchisée des objectifs.
Les taxonomies ont été mises au point pour aider les formateurs à créer des évaluations
pour chaque niveau d’apprentissage et par effet de retour, les pousser à développer des
enseignements, des formations de niveau de plus en plus élevé.
Les objectifs peuvent être de trois ordres : psycho-moteur, cognitif et affectif. Les deux
derniers qui retiendront notre attention.
2.1.1. TAXONOMIE DE B.S. BLOOM
B.S BLOOM et ses collaborateurs ont édité une taxonomie des objectifs cognitifs. Celle-ci
se veut être une hiérarchie cognitive pouvant se manifester dans une situation d’apprentissage ou
d’examen. Selon l’initiateur de la taxonomie, le cognitif englobe les objectifs qui rappellent les
connaissances et le développement des habiletés et capacités intellectuelles. Son hypothèse
fondamentale est que la formation peut être désarticulée en un certain nombre de composante de

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 10

telle sorte que la stimulation de chacune d’elles puisse contribuer à la formation intégrale de
l’individu.
Cette taxonomie a été fort exploitée pour sa simplicité et sa pertinence en occident et
même en Afrique. En dépit de son succès, la taxonomie de B.SBLOOM a fait l’objet de nombreux
débats.
De façon globale la taxonomie comporte six niveaux et les numérotations qui suivent ne
concernent que la présentation du modèle.
1.00. CONNAISSANCES
1.10. Connaissance des informations spécifiques ou des données particulières
1.11. Connaissance de terminologie
1.12. Connaissances des faits spécifiques
1.20. Connaissance de moyens d’utilisation ou de traitement des informations (ou des données)
1.21. Connaissance de convention
1.22. Connaissance des tendances et successions
1.23. Connaissance de classification
1.24. Connaissance de critères
1.25. Connaissance de méthodes et procédés
1.30. Connaissance de représentations abstraites
1.31. Connaissance des principes et généralisation des lois
1.32. Connaissance des théories
2.00. COMPREHENSION
2.10. Traduction
2.20. Interprétation
2.30 Extrapolation
3.00. APPLIQUATION
3.10. Application de relation ou directe
3.20. Application à tiroir ou de système
4.00. ANALYSE
4.10. Analyse des éléments
4.20. Analyse des relations
4.30. Analyse des principes organisateurs
5.00. SYNTHSE (formulation ou production)
5.10. Production d’une communication singulière ou d’une œuvre personnelle.
5.20. Production de projet d’activité ou de plan d’actions
5.30. Dérivation d’un ensemble de relations abstraites ou déduction des propositions
6.00 EVALUATION OU JUGEMENT
6.10 Evaluation à partir des critères internes

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 11

6.20. Evaluation à partir des critères externes.

1.2.2. Quelques définitions et illustrations


1.00. CONNAISSANCES
Définition : La connaissance est la capacité de reconnaître et de rappeler à la mémoire
- des données spécifiques, donc des termes, des fiats tels que les événements, des
dates, des personnes, des lieux ;
- Des manières de traiter les données spécifiques, donc des conventions (le langage, les
usages) des tendances et séquences (évolution des phénomènes), des classifications,
des critères, d’évaluation des données particulières, des méthodes.
- Des représentations abstraites, donc des principes et lois des théories et structures.
2.00. COMPREHENSION
Définition : Il s’agit de la compréhension au niveau le plus élémentaire. Celle-ci peut se manifester
par :
- La transposition ou l’habileté à reproduire une connaissance en changeant sa forme (par
exemple rendre une métaphore en langage courant) ou transformer des énoncés symboliques
sous forme mathématique ou verbale
- L’interprétation : c'est-à-dire l’explication ou le résumé d’un certain matériel
- L’extrapolation, habilité à expliciter les tendances, les conséquences du phénomène décrit
dans le matériel présenté.
3.00. APPLICATION
Le concept désigne l’aptitude à exploiter dans certaines situations particulières des lois, des
principes. C’est la capacité l’habileté à exécuter les séquences dictées par une règle, à résoudre des
problèmes. Elle implique dans une bonne partie l’aspect « savoir-faire ».
Théoriquement, il existe plusieurs façons de concevoir l’application.
- de faire le choix des principes qui permettent de résoudre un problème ou d’effectuer un
exercice,
- donner ou indiquer toutes les démarches conduisant à la solution,
- donner les principes, les démarches et la solution globale à un problème posé.
En pratique, cette rubrique comprend deux sous-rubriques : l’application directe et l’application
indirecte. Les règles et principes ont été enseignés ; toutes les données ne sont néanmoins pas
nécessairement directement disponibles. On mesure la capacité de l’élève à résoudre un problème
par l’application de principe qu’il doit préalablement se remémorer
4.00. ANALYSE
Définition : Dans son acceptation première, l’analyse est une opération intellectuelle qui consiste à
décomposer et à discerner les parties d’un tout (communication) soit pour les identifier, soit pour
ressortir les relations existant entre les parties, soit pour découvrir les principes organisateurs de la
communication. En d’autres termes, l’analyse est la capacité de rechercher les éléments et les
principes qui les organisent dans un matériel ou une situation présentée. Certains auteurs ajoutent à

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 12

cette définition de B.S BLOOM la capacité de détecter les incohérences, les absurdités, les manques
de données, etc. Tout spécialement dans des situations nouvelles ou complexes.
En pratique, on mesure la capacité de l’apprenant à identifier des structures, à examiner les relations
(pertinentes) entre les éléments d’un problème posé, à vérifier, à établir un diagnostic, à être vigilent
aux incohérences,… Il faut apporter des connaissances extérieures.

5.00. SYNTHESE, PRODUCTION OU FORMULATION


Définition : appelée aussi « créativité » par LUHAHI a Niama LUHAHI, la synthèse suppose une
opération intellectuelle par laquelle on rassemble les éléments de connaissances concernant un objet
de pensée en un tout cohérent, en une nouvelle structure dont on ne disposait pas au départ.
Pour.BLOOM, la synthèse est la capacité de rassembler des éléments ‘ou parties) d’un
matériel ou d’une situation présentée dans le but de réorganiser un nouveau tout. A ce titre, elle peut
être :
- Une production d’un ouvrage personnel (par exemple un récit tiré du morceau de prose
présenté)
- Une production d’une série de relations abstraites (par exemple, capacité d’établir des
généralisations)
En pratique, BLOOM distingue trois types de synthèse ou production déjà cités plus haut dans le
plan général. On mesure la capacité de l’apprenant à créer un ordre à partir du désordre,
d’organiser, de formuler, de créer un plan etc., tous les éléments étant disponibles.
6.00. EVALUATION
Définition : l’évaluation est une activité qui consiste à émettre une opinion à partir des critères
internes ou externes sur des messages, des communications. C’est en d’autres mots la formulation
de jugements sur la valeur de certaines idées d’un travail, ce qui la différencie de la connaissance
En pratique, l’évaluation peut e faire soit en termes d’évidence interne, soit en termes d’évidence
externe.
Dans le premier cas, il s’agit d’une appréciation fondée sur les critères internes prenant en
ligne de compte la cohérence, la rigueur, l’absence de faille dans une communication. Ce type
d’évaluation porte sur l’exactitude, la pertinence, la véracité, la précision.
Dans le second cas, il s’agit d’une aptitude qui consiste à apprécier une communication à
partir des références externes. Le sujet est invité soit à interroger sa mémoire soit à recourir à la
consultation des références données ou choisies par lui-même.
La conception des questions peut être abordée par deux modalités en fait
complémentaires procédant d’en haut en bas et de la base au sommet.
La première méthode dite « Méthode top down » consiste, pour chaque objectif opérationnel, à
déterminer d’abord la (ou les) niveau (x) taxonomique (s) exigé (s), c'est-à-dire ce qui doit être
connu, compris, appliqué, analysé, évolué, puis créer les questions nécessaires pour chacun de ces
niveaux d’objectif opérationnel (niveaux ….. questions). Ainsi, on présentera d’abord toutes les

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 13

questions de connaissances puis on fournira les réponses correctes avant de présenter les questions
de compréhension et ainsi de suite.
La seconde méthodologie « appelée « Méthode bottom-up » consiste à repérer des situations –
problèmes que l’apprenant doit être capable de résoudre. On crée des questions révélatrices qui,
inévitablement, impliquent plusieurs niveaux taxonomiques (Questions …… niveaux). En
définitive, les méthodes « TOP DOWN » et « BOTTON-UP » peuvent être associées comme susdit,
le tout dépend de la qualité de la besogne escomptée et de la perspicacité des chercheurs.

2.2.2. SYSTEME TRIDIMENSIONEL DE J.P. GUILPORD

2.2.2.1. Présentation générale


Le système de J.P. GUILFORD est un modèle des activités intellectuelles à trois
dimensions. Il inclut des concepts de contenus et de performance, celui du processus mental ou
d’opération sur le contenu pour aboutir à un produit. Alors que B.S. BLOOM fixe les objectifs et
développe les composantes d’un processus d’éducation, J.P. GUILFORD analyse lui les structures
de l’intelligence dont il souligne par ailleurs l’aspect opératoire et productif.
Le modèle tridimensionnel, résultant de 20 ans de recherche factorielle dégage les
opérations intellectuelles théoriquement possible. Les processus mentaux se traduisent par des
opérations, celles-ci aboutissent à des produits qui sont de contenus divers.
Les cinq opérations : la cognition (C), la mémoire (Mé), la production divergente (pD,
Pd), la production convergente (pN, Pn) et l’évaluation (E).
Les six produits sont représentés par les unités (U), les classes (cl), les relations (R), les
systèmes (Sy), les transformations (T) et les implications (I).
Enfin, les contenus peuvent être figural ou figuratif (F) symbolique (S) sémantique (M)
et comportemental (B)
Graphiquement, le modèle peut-être représenté de la manière suivante
OPERATION

C Mé Po Pn E

P U

O Cl

U R

T Sy

C S
O M
UNIGOM L2 PSY LMD N
: CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
T
E S
N
U
S
P a g e | 14

Ainsi que l’illustre cette représentation graphique, le modèle guilfordien est composé de
cinq matrices correspondant aux opérations. Chaque matrice possède 24 cellules déterminées par les
produits et les contenus. La nomenclature classique prévoit dans l’ordre chronologique l’opération,
le contenu et le produit.
Par exemple :
Mé FU : Mémoire des Unités Figuratives
E B I : Evaluation des Implications Comportementales

2.2.2.2 Définitions des concepts par dimension


Les dimensions concernées sont successivement les opérations, les produits et les
contenus.
1. Opérations
A. La cognition : c’est le connu disponible, la reconnaissance ou le souvenir, ce qui
subsiste d’une assimilation antérieure.
B. La mémoire : c’est l’aptitude à retenir de nouvelles connaissances, un nouveau savoir
ou savoir-faire. Cette matrice permet la définition d’activités d’apprentissage à travers leurs effets
immédiats, mesurables en termes du nombre d’erreurs ou de répétitions requises. La mémoire se
différencie de la cognition en ce sens que celle-ci envisage les effets lointains, le reliquat
d’apprentissage antérieur.
C. La production convergente : c’est l’habileté à produire une seule réponse à partir
d’une série d’information.
D. La production divergente : c’est l’aptitude à fournir des solutions variées à un
problème posé donné, l’habileté à exprimer ou à interpréter une information de façon variée ou
remarquable. C’est enfin l’habileté à produire les idées à la foi neuves et valables.
E. L’évaluation, c’est l’opération par laquelle on prend une décision en portant un
jugement en terme de critère d’identité ou de contraire sur l’exactitude, l’adéquation ou
d’acceptabilité d’une information donnée. L’évaluation intervient essentiellement dans
l’interprétation et dans l’analyse lorsque la présentation de l’information conduit à un choix, à une
sélection, à une alternative.
.2 Produits
Les produits sont les résultats du traitement des informations. Ces produits sont de six
ordres :
A. Les unités : ce sont des portions d’informations isolées ou circonscrites ; ce sont des
éléments simples et particuliers qui constituent les composantes des autres produits.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 15

B. Les classes : c’est l’ensemble des éléments particuliers ayant des caractéristiques
partagées.
C. Les relations : ce sont des connexions, des liens reconnus entre éléments, les unités.
D. Les systèmes : ce sont des ensembles organisés d’éléments logiquement solitaires et
considérés dans leurs relations.
E. Les transformations : ce sont des acquisitions d’autres caractères formels, le passage
d’une forme à une autre ; des changements apportés dans des informations ou dans leur utilisation
F. Les implications : ce sont des relations de conséquence, de prolongement,
d’élaboration ou de déduction.
3. Contenus
Les contenus sont les matières premières informationnelles sur lesquelles se font les
opérations. Les contenus peuvent revêtir quatre formes ou modèles.
A. Figural ou figuratif : c’est le contenu qui n’a pas une valeur évocatrice. Il n’est
susceptible que d’une seule interprétation. C’est une information à besoin d’une certaine
organisation et de structuration.
B. Symbolique : c’est le contenu qui représente une autre chose en vertu d’une
correspondance analogique. C’est l’information sous forme des signes dépourvus de signification
par et en eux-mêmes.
C. Sémantique : c’est contenu a trait au sens et à la signification du langage. Il s’agit en
fait d’un cas particulier du contenu symbolique, la signification étant ici verbal.
D. Comportemental : ce contenu concerne les conduites répondant à des stimuli internes
et externes. Il concerne les informations qui interviennent dans les interactions humines où jouent la
perception d’attitudes, des besoins, des désires, d’intentions, de pensée comme formes
d’intelligence sociale.

2.2.3. Illustrations des matrices (par opérations)


Les matrices seront présentées pour les 5 opérations et pour une lecture facile du texte
24 exemples seulement illustreront l’ensemble du modèle taxonomique.
2.2.3.1. Matrice Cognition
F S M B

U CFU* CSU CMU CBU

cl CFcl Ccl CMcl CBcl

R CFR CSR CMR CBR*

Sy CFSy CSSy CMSy* CBSy

T CFT CST* CMT CBT

I CFI* CSI CMI CBI

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 16

B. Dénomination et définitions des cellules


1) CFU* : Cognition des unités figurales : c’est l’aptitude à connaître ou à reconnaître une
unité des figures ; une silhouette d’une façon globale et spontanée
2) CSU : Cognition des unités symboliques : c’est l’aptitude à reconnaître les unités
symboliques, lettres, chiffres ou autres symboles
3) CMU : Cognition des unités sémantiques : il s’agit de la recognition de la signification
verbale des mots, des termes. C’est une aptitude à reconnaître le sens de mots.
4) CBU : Cognition des unités comportementales. En opération de cognition les unités de
comportement peuvent être soit gestuelles soit relationnelles
5) CFcl : Cognition des classes Figuratives : c’est l’aptitude à reconnaître, à découvrir, à
redécouvrir la classe des figures.
6) CScl : Cognition des classes des symboliques : ces symboles peuvent être de tous ordres, de
tous domaines
7) CMcl : Cognition des classes sémantiques : c’est une aptitude à reconnaître, redécouvrir,
découvrir les classes des mots ayant une même signification verbale
8) CBcl : Cognition des classes comportementales. Ces comportements peuvent être gestuels
ou rationnels.
9) CFR : Cognition des relations figurales : aptitude à découvrir les relations entre les figures
géométriques ou autres.
10) CSR : Cognition des relations symboliques : c’est la connaissance des liens entre les
symboles (chiffres, lettres)
11) CSR : Cognition de relations sémantiques : aptitude à reconnaître la relation entre les sens
des mots
12) CBR* : Cognition des relations comportementales : c’est la reconnaissance de relations
entre les comportements. Dans ce cas, on distingue généralement les relations qui
unissent les comportements de deux individus et les comportements successifs d’un
individu.
13) CFSy : Cognition des systèmes figuraux ou figuratifs peuvent être des cartes à jouer, des
signaux routiers et autres.
14) CMSy* : Cognition des systèmes sémantiques : c’est la connaissance d’un langage littéraire,
technique, scientifique organisé.
15) CSSy : Cognition des systèmes symbolique : c’est la connaissance des symboles relatifs à
un système (domaine organisé)
16) CBSy : Cognition des systèmes comportementaux : c’est la connaissance d’un ensemble de
comportements à adopter dans une situation ordonnée précise.
17) CFT : Cognition des transformations figuratives : c’est l’aptitude à reconnaître les
modifications subies par une quelconque figure
18) CST : Cognition des transformations symboliques : c’est l’aptitude à opérer une
transformation sur les symboles (chiffre, convention)
19) CHT : Cognition des transformations sémantiques : c’est l’aptitude de reconnaître ou à
connaître comment l’on procède à la transformation des mots
20) CBT : Cognition des transformations comportementales : c’est l’aptitude à connaître les
changements devant être adoptés dans les comportements.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 17

21) CFI* : Cognition des implications figuratives : c’est la connaissances des implications entre
els figures
22) CSI : Cognition des implications symboliques : c’est la connaissance des implications entre
les symboles
23) CMI : Cognition des implications sémantique : c’est l’aptitude à connaître des implications
entre le signification des mots. Cette habileté peut être exploitée en stylistique
24) CSI : Cognition des implications comportementales : c’est la connaissance au niveau
individuel ou collectif des implications dans les comportements.

2.2.3.TAXONOMIE DE D.R. KRATHWOHL

2.2.3.1. Présentation générale


La taxonomie de D.R. KRATHWOHL hiérarchise cinq en rubriques, les objectifs de
domaine effectif. Elle repose sur la notion d’intériorisation ou d’internalisation ou encore
d’intégration. L’intériorisation peut être définie comme le fait d’incorporer quelque chose dans
l’esprit ou le corps, l’adoption comme siens d’idées, d’usage, des modèles ou des valeurs d’une
autre personne ou de la société.
L’exploitation de la taxonomie suppose au préalable un entraînement délibéré, un
endoctrinement, un apprentissage à l’issue duquel l’adoption du comportement infusé se fait
progressivement et imprègne toute la personnalité de l’individu.
La taxonomie est conçue suivant un modèle optimiste en ce sens que l’ascendance du
continuum d’intériorisation va dans le sens d’un changement d’attitudes culturellement valorisées.
Le même système taxonomique conçoit le comportement affectif sur un continuum de 5
rubriques, le réception, la réponse, la valorisation, l’organisation et la caractérisation. Chaque
rubrique possède un certain nombre de sous rubrique qu’on peut à la limite considérer comme
objectifs spécifiques, les premières étant des objectifs généraux.
Structurellement, la taxonomie comporte les rubriques et sous-rubriques suivantes :
1.0. Réception
1.1. Conscience
1.2. Volonté de recevoir
1.3. Attention dirigée
2.0. Réponse
2.1. Assentiment (Approbation)
2.2. Volonté de réponse
2.3. Satisfaction à répondre
3.0. Valorisation
3.1. Acceptation de la valeur
3.2. Donner une préférence à une valeur
3.3. Engagement à une valeur
4.0. Organisation des valeurs

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 18

4.1. Conceptualisation des valeurs


4.2. Organisation d’un système des valeurs
0.5. Caractérisation d’un système des valeurs
5.1. Disposition généralisée
5.2. Caractérisation

2.2.3.2. Rubriques et Sous-rubriques détaillées


Définitions, exemples d’objectifs, problèmes de mesure et illustration1
1.0. RECEPTION
A) Définition
Ce premier niveau concerne la sensibilisation de l’individu à l’existence de certains
stimuli, son consentement à les recevoir ou à porter attention.
1.1. Conscience : le sujet est simplement sensibilisé à la présence des objets ou des
événements qui l’entourent. La tâche consiste ici à amener quelqu’un à être conscient de l’existence
d’un phénomène autour de lui.
1.2. Volonté à recevoir : A ce niveau, le sujet accepte un stimulus donné mais reste dans
une position de neutralité.
1.3. Attention dirigée : Il surgit ici le problème de la directivité. Devant un ensemble
important de stimuli, l’individu dirige son attention vers un seul stimulus ou un ensemble de stimuli
précis.
Problème de mesures
1.1. Le problème ici consiste à mesurer la conscience de l’existence d’un événement ou d’un état
des choses. Etre conscient de quelque chose ou de quelqu’un signifie connaître cette chose,
même si cette connaissance est au niveau le plus bas. Il faut réduire au maximum le rôle du
raisonnement et de la mémoire.
1.2. A ce niveau, on suppose que la conscience existe déjà et l’on se contente de relever si cette
conscience est positive ou négative pour savoir s’il y a absence ou rejet de stimulus. On se sert
généralement de l’inventaire d’intérêt de type traditionnel tout en évitant des formulations
d’extrêmes (Très, …. Le plus,…)
1.3. Un phénomène nouveau apparaît : la différenciation, dans un stimulus donné du fond et de la
forme de façon consciente et semi-consciente, ou encore, la différenciation de certains aspects
d’un stimulus nettement séparés des autres impressions.
2.0. REPONSE
A) Définition
2.1. Assentiment
A ce niveau, le consentement est encore passif.
1
La numération se conformera au plan succinct de la taxonomie

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 19

Il s’agit d’une simple approbation, l’individu n’a pas encore compris la nécessité de son
choix si bien qu’il peut encore changer s’il n’y avait pas une autre contrainte ou information.
2.2. Volonté de répondre
Ici le concept « volonté » est essentiel, il implique la notion « d’activité volontaire »
c’est plus une réponse délibérément choisis qu’une réponse à une suggestion extérieure. Pour
réaliser la plupart des objectifs situés à ce niveau, le formateur devra se limiter à favoriser un climat
qui permettra au sujet de manifester le comportement dans un contexte social.
2.3. Satisfaction à répondre
Après avoir répondue à un comportement, l’individu éprouve un sentiment soit positif,
soit négatif. Ce fait agit comme un renforcement dans la ituation ultérieure. En d’autres termes, il
s’ajoute au niveau précédent un sentiment de satisfaction, une réponse émotionnelle
Problèmes de mesures posées
2.1. Le problème principal est de déterminer l’instrument d’appréhension. Celle-ci est possible par
des interviews directes ou en présentant des « choix forcés » ou encore des inventaires du type
projectif ou encore « check-lists »
2.2. Le problème posé ici est de savoir si le comportement relève du choix ou d’une suggestion
extérieure.
Plusieurs méthodes peuvent être utilisées :
- observation et relevé des comportements où cette volonté apparaît clairement ;
- questionnaires auto-administrés
- qualité de production (ou travail réalisé)
2.3. A ce niveau, il faut déterminer si une satisfaction ou une réaction émotionnelle positive
accompagne le comportement, sachant surtout que les réactions émotionnelles sont exprimées
parfois avec subtilité et réserve. Ici, la mesure comporte deux démarches.
1) décider quels comportements expriment la satisfaction
2) Mettre en œuvre une méthode d’enseignement systématique des manifestations de
satisfaction.
Concrètement, on peut recourir au questionnaire, à la méthode objective sous forme de
check-list ou aux méthodes projectives.
3.0. VALORISATION
L’individu commence à attribuer une valeur aux phénomènes, aux comportements. Ce
concept de « valeur » est le résultat tant de l’effort personnel de l’individu qu’un produit social,
progressivement intériorisé et qui lui servira de critère personnel. C’est en fait à ce niveau que
débute l’attitude (positive ou négative) en tant que phénomène affectif.
A) Définition
3.1. Acceptation d’une valeur

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 20

Les éléments suivants caractérisent ce niveau


- attribution d’une valeur à un phénomène
- la valeur apparaît dans le comportement dominant ;
- régularité de la réponse en face des phénomènes ou objectifs avec lesquels on identifie la
croyance,
- permanence pour une valeur

3.2. Préférence pour une valeur


Ici, le comportement implique un engagement assez profond envers la valeur pour la
suivre, la rechercher et la désirer.
3.2. Engagement à une valeur
Lorsqu’une valeur a été choisie par l’individu, celui-ci ne doit agir qu’en fonction d’elle
car déjà incorporée en lui. L’engagement à une valeur implique la détermination de la poursuivre et
de la posséder totalement. La croyance comporte un degré élevé de certitude et l’individu à ce
niveau est clairement perçu comme un possesseur.
Problème de mesures
3.1. On peut retenir comme approche permettant de mesurer l’acceptation, les questionnaires,
l’observation et les expressions des croyances et attitudes.
3.2. La mesure de la « préférence pour une valeur » peut être effectuée notamment par le temps
consacré à l’activité considérée comme valeur, les questionnaires d’intérêt et la production des
apprenants.
3.3. L’engagement à une valeur peut ressortir à travers la durée de l’activité valorisé, l’énergie
consacré à l’objet ou au phénomène valorisé, les actes concrets au nom de cette valeur, des
examens pour mettre à l‘épreuve et autres techniques pour mesurer directement ou
indirectement les attitudes, les croyances et les valeurs.
4.0. ORGANISATION
A mesure que l’individu intériorise des valeurs, ils se trouvent confronté à des situations
qui comportent plus d’une valeur. Ainsi il lui est nécessaire :
1) d’organiser les valeurs en système ;
2) de déterminer les interrelations qui existent entre elles ;
3) d’établir celles qui sont les plus dominantes et pénétrantes.
Ce système se construit progressivement, graduellement et chaque fois qu’une nouvelle
valeur s’ajoute, s’y intègre.
A. Définition
4.1. Conceptualisation des valeurs
Cette sous-rubrique implique l’abstraction ; le processus d’abstraction inclut ceux
d’analyse et de différenciation.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 21

Le processus d’abstraction isole les qualités qui sont les caractéristiques des concepts particuliers
dont il s’agit et la généralisation permet l’application de ce concept à un ensemble des données plus
vaste que celui dont il provenait.
Ainsi le concept représente une connaissance qui n’est pas perçue directement par le
sens, mais qui est plutôt le résultat de la manipulation d’impressions sensorielles sous une forme
abstraite.
4.2. Organisation d’un système de valeur
L’individu établit une certaine hiérarchie dans son système des valeurs. Il classe celles-ci
dans un ordre acceptable pour lui dans le temps et dans l’espace. L’individu sera ainsi amené à
formuler une philosophie de vie.
C. Problèmes de mesure
4.1. Pour la mesure de cette sous-rubrique, il faut établir trois types de preuves.
1) la preuve que l’individu forme un jugement d’évaluation à propos de l’objet
2) la preuve qu’il pense de façon abstraite ou symbolique à l’objet qu’il valorise
3) la preuve d’une généralisation concernant un ensemble de valeurs dont l’objet valorisé fait
partie
4.2. La mesure de l’organisation d’un système de valeurs comprend d’une part l’identification des
éléments du système des valeurs, d’autres part l’identification de la structure des valeurs à
l’intérieur du système (les valeurs centrales dominantes et celles qui occupent les positions
périphériques)
Nombreux tests permettent l’évaluation de ces aspects de la personnalité : MMPI, Sixteen
Personality factors, questionnaire de Cattell, Study of values d’Allport, Version et Lindzey,
etc.
5.0. CARACTERISATION
A) Définition
Le niveau concerne l’organisation et la permanence du système des valeurs de
l’individu. D’une façon générale, l’individu analyse les contradictions dans les actes posés, dans les
activités ou dans les attitudes. L’individu est ici décrit en fonction d’une double référence :
1) de ses caractéristiques personnelles uniques, c'est-à-dire de ses ensembles
fondamentaux d’orientation qui se composent d’une grande variété de comportement disparates
2) de sa philosophie de la vie, de sa conception de l’univers, de ses principes, de ses
idéaux, son crédo, personnel qui permettent l’intégration et la cohésion de différents aspects de sa
vie.
5.1. Disposition généralisée
Elle met en exergue la cohérence interne d’un système de valeurs ou ‘attitudes. C’est
une tendance à déterminer une orientation de base vers un phénomène, une stabilité d’action.
5.2. Caractérisation

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 22

C’est l’intégration des croyances, des désirs des attitudes en une philosophie ou une
conception de l’ensemble du monde. A ce niveau l’uniformité et la cohérence des comportements
sont visibles et l’individu peut ainsi imposer son comportement à l’entourage. C’est un stade
dynamique.
Problèmes de mesure posés
5.1. Pour la mesure, on se réfère essentiellement à un modèle de mesure direct emprunté aux études
concernant les effets de l’information sur les attitudes sociales.
- Echelles d’attitudes après avoir fixé la base cognitive grâce aux faits et informations ;
- Instruments sur la solution des problèmes dans les recherches sur l’apprentissage et la
pensée humaine. On insiste non pas sur la démarche cognitive mais sur la qualité de
l’approche (soins, objectivité et sûreté)
- Diverses méthodes pour juger les aspects de la personnalité comme le « rating scale » ou
échelle d’évaluation.
- Les techniques projectives comme TAT sans mettre un accent particulier sur les aspects
cliniques ou anomaux. On se contente de rechercher des preuves d’uniformité et de
cohérence dans les récits.
5.2. Le problème de mesure doit être envisagé ici sous l’angle de transfert d’objectifs et des
comportements des catégories inférieures dans le sens le plus général.
Les sentiments et les valeurs spécifiques rattachés auparavant à des objectifs particuliers
deviennent maintenant des phénomènes génériques tels que caractère et moralité. C’est le
stade atteint par les grands humanistes de l’histoire qui sont aujourd’hui universellement
reconnus et vénérés à cause de leurs philosophies de la vie qui caractérisent et pénètre tout
leur comportement (cohérence, profondeur,…)
Comme instrument de mesure, on peut utiliser :
- des interviews intensives
- des techniques projectives (phrases à compléter, RORCHACH, T.A.T, dissertations auto-
centrées)
- des techniques sociométriques concernant les traits de personnalité, de caractère et de
sociabilité.

2.3. ELABORATION DES QUESTIONS


Le matériel d’une question est l’ensemble des matériaux qui constituent sa structure ou
son contenu. C’est le support de son soubassement. Dans le cadre pratique, ce point s’inspire de la
taxonomie de J.P.GUILFORD en ce qui concerne le contenu. Celui-ci inclut la manière selon
laquelle une information peut se présenter ; sous une forme figurale ou perspective (figure, dessin,
objet) symbolique (lettres, chiffre, syllabe) sémantique (mots significatifs) comportement (réaction
motrice, attitudes, mouvements.
Remarquons enfin que les épreuves peuvent avoir un matériel singulier ou combiné.
Les formes des questions constituent les différentes manières d’organiser, de structurer
les contenus et matériel pour produire des questions ou des items sollicitant des comportements

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 23

précis. Il existe trois principales formes des questions : els questions ouvertes, les questions fermées
et les questions combinées.

2.3.1 QUESTIONS OUVERTES


Les questions dites ouvertes sont celles auxquelles le sujet formule ses réponses avec
son propre matériel. Elles peuvent être soit ouvertes soit longues ou encore plus ou moins longues
2.3.1.1. Questions courtes
On distingue dans les questions courtes plusieurs variétés : les questions directes, les
questions de compétition et les questions lacunaires.
1. Questions directs
Dans ce genre de questions on sollicite du sujet une réponse courtes et directe. Celle-ci
peut-être formulée soit d’une façon interrogative soit d’une façon impérative.
Ex : - Forme interrogation : qu’entendez-vous par « taxonomie »
- Forme impérative : donnez les différentes phases de la mitose
2. Questions lacunaires et de complétion
Ces deux genres de questions comportent l’omission du mot-clé qui conduit à la bonne
réponse ou du moins la sollicite. Ces deux types de questions sont parfois confondus, toutefois dans
les questions lacunaires le vide peut se situer n’importe où tandis que celui-ci se trouvent à la fin
dans les questions de complétion.
- Exemple de question de complétion
La capitale de la République gabonaise s’appelle ………………..
- Exemple de question de lacunaire
……………… est la capitale de la République gabonaise
Comme toutes les formes des questions, les questions lacunaires et de complétion
requièrent pour leur construction le respect des règles précises.
A. Règles de construction des questions lacunaires et de complétion (Travail dirigé)
Chaque étudiant compose questions en respectant les règles ci-après.
1°) L’item doit faire appel une seule bonne réponse en vue d’éviter l’ambiguïté
Exemple d’un item ambiguë
La capitale la R.D.C est …………..
2°) L’omission devra concerner seulement les mots-clés
3°) Il faudra éviter de mettre en exergue des éléments grammaticaux susceptibles d’induire ou
d’orienter le sujet à répondre.
Exemple d’un item aux éléments grammaticaux inducteurs
L’ardoise est un ……….. utile à l’école
4°) Il faudra éviter de prendre des phrases tirées textuellement du livre :
Exemple : maître corbeau sur ……….. perché.
5°) Il faudra prévoir la même longueur, les mêmes espaces, les mêmes vides ou le même nombre
des points pour les questions consécutives.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 24

En principe, il est conseillé de garder le même système de référence choisi d’un bout à l’autre
(points, traits, vides, etc.)
6°) Il faudra proscrire l’utilisation abusive des phrases stéréotypées en variant le plus possible la
place des lacunes et en recourant aux verbes d’action différents dans les items successifs.
Exemples des phrases stéréotypes
1. ……………. s’appelle
2……………… s’appelle
2.3.2. Questions à réponses plus ou moins longues : question d’essai
Ce sont des questions connues sous le nom de dissertation, de composition, de rédaction,
etc. Elles évaluent des processus mentaux complexes : la capacité du sujet à s’exprimer, à écrire une
langue, sa créativité voire ses attitudes.
On distingue de grandes variétés de questions d’essai : les questions d’essai à réponse courtes et les
questions d’essai à réponses étendues
2.3.2.1. Questions d’essai à réponses étendues
Le sujet est appelé à utiliser ses propres mots. Il organise son travail comme bon lui
semble. L’examinateur ne donne aucune directive contraignante ni de limitation de page ou de
volume. Les différentes règles y relatives sont celles généralement définies dans la dissertation, la
stylistique, la grammaire, etc.
2.3.2.2. Questions d’essai à réponses courtes
Le sujet est invité à organiser ses réponses librement mais de manière très brève.
Habituellement on limite le volume et le sujet travaille sous des directives précises. L’examinateur
devra user des verbes d’action opérationnels (citez, justifiez, énumérez)
Il existe plusieurs variétés des questions d’essai à réponses courtes. Retenons en sept
1°) Question de rappel sélectif composé à partir des éléments donnés ou vus
Exemple : Parmi les premiers ministres qui se sont succédés depuis l’indépendance, citez ceux
qui sont originaires de la Province Orientale
2°) Appréciation d’un échantillon à partir de différents faits ou de plusieurs faits
Exemple : Nommez l’étudiant le plus populaire actuellement à l’Université de Kisangani.
3°) Comparaison de deux faits
Exemple : Dites en 10 lignes ce qui différencie la révolution congolaise de la révolution
anglaise
4°) Décision pour ou contre certains faits
Exemple : Citez les noms de 3 musiciens les plus talentueux du 3ème millénaire.
5°) Résumé d’un travail
Exemple : Résumez à l’aide de deux exemples les applications de la loi normale réduite..
6°) Exemple d’un fait
Exemple : Illustrez à l’aide de deux exemples les applications de la loi réduite.
7°) Variétés de la classification
Exemple : Identifier les éléments qui contiennent de l’eau : N, Na, H2O

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 25

2.3.2. QUESTIONS FERMEES OU QUESTIONS DE SELECTION


On classe sous cette rubrique les questions pour lesquelles le répondant opère un choix
parmi les réponses qui lui sont proposées. On distingue notamment les questions d’appariement (ou
matching item), les questions alternatives (vrai-faux) les questions à choix multiples (classiques et
rénovées) et les questions d’échelle.
2.3.2.1. Questions d’appariement (MATCHING ITEM)
C’est une forme de question de type sélectif. Elle se présente sous formes de deux colonnes
placées l’une en face de l’autre.
La colonne de gauche contient les items ou les prémisses celle de droite renferme les
réponses, les occurrences, les alternatives ou les dis tracteurs.
Il existe deux types ou formes de questions d’appariement : appariement parfait et
appariement imparfait.
1. Question d’appariement parfait ou question d’appariement à correspondance biunivoque.
Il s’agit d’un item ou le nombre de prémisses est égal au nombre de réponses. La consigne pourrait
être la suivante : « appariez les éléments de gauche avec ceux de droit ». Il faut bien sûr prévoir un
endroit pour la réponse du sujet. C’est la forme traditionnelle de matching item, actuellement fort
critiquée. En effet, cette forme a un inconvénient majeur : le sujet peut facilement divine les bonnes
réponses du moment qu’il en connaît une ou deux, en définitive, il n’y a pas de distracteur.
2. Question d’appariement imparfait
Deux cas peuvent se présenter ; la forme asymétrique par défaut où le nombre de solution est
inférieur et la forme asymétrique par excès où le nombre de solutions est plus élevé que celui des
prémisses.
Principales règles de construction (Travail dirigé) :
1° Avant l’élaboration définitive, confectionner deux listes : à gauche, celle des items ou prémisses
constituée des éléments différents du programme sur lesquels porte l’évaluation ; à droit 2
réponses au moins par prémisses ;
2° Arranger les prémisses et les alternatives soit par ordre alphabétique soit par ordre de grandeur
croissant ou décroissant ;
3° Eliminer par remplacement les réponses qui se trouvent devant leurs prémisses ;
4° on conseille que le rapport entre les éléments de gauche et ceux de droite soit respectivement de
N
NàN+2
5° le nombre d’entrée doit être limité à 10
6° on conseille que les éléments les plus longs soient consignés dans la colonne de gauche ;
7° Item doit être présenté sur une même page ;
8° il faudrait prévoir pour une prémisse (gauche) une et une seule réponse correcte à droite ;
9° il faudrait prévoir une place pour les réponses du sujet ;
10° L’appariement doit porter sur des éléments homogènes, c'est-à-dire relevant de la même
discipline.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 26

11°Dans chaque colonne, les éléments devront également être homogènes (auteurs…, œuvre, etc.).

2.3.2.2. Questions alternatives (VRAI-FAUX)


Ce sont des questions de sélection ou le répondant doit choisir entre deux vérités possibles
mutuellement exclusives. Quoi que celle-ci ne soient pas nécessairement vrais ou fausses, cette
variété de questions est appelée vrai/faux. (oui-nom ; d’accord/pas d’accord).
Les items vrai faux se présentent dans une déclaration au mode indicatif qui est soit
affirmative, soit interrogative et à laquelle l’on doit répondre respectivement par V ou F, oui ou
nom, d’accord ou pas d’accord.
2.3.2.1. Variété des questions alternatives
1° Variété des items V/F avec correction ; questions à étage.
Dans ce type de question, on souligne le mot sur laquelle porte la solution vérité. Dans ce
cas le reste de l’affirmation ou l’interrogation est vrai et ne pose pas de problème. On demande au
répondant de dire selon le cas si cela est vrai ou faux. Au cas où c’est faux, on lui demande de
barrer les mots qui rendent la déclaration fausse et de les remplacer par d’autres pour que la phrase
devienne correcte.
Exemple : l’oxygène active la combustion V/F.
2° Variété des items faisant appel à la réflexion ou à a logique
Pour cette Variété, on peut proposer une consigne de ce genre ; « lisez attentivement
chacune des propositions suivantes, si la proposition est vraie encerclez V ; si elle est fausse,
encerclez F. si le contraire de l’idée exprimé par la proposition est vrai encerclez CV ; si le contraire
de l’idée exprimé par la proposition est faux, encerclez CF ; c’est pour éviter le guessing.
Exemple : Tous les arbres sont des plantes V F CV CF
3° Variété à questions groupées
Pour l’élaboration de ce genre de question, on part d’un mot clé puis on construit une série
de propositions, certains auteurs l’appellent « question à support ».
Exemple : le lac Kivu
a. baigne la ville de GOMA V/F
b. Est le plus profond d’AFRIQUE V/F
c. Traverse toute les provinces de la RDC V/F

Quelques directives pour la construction des questions du type alternatif.


1° La consigne devra être formulée de telle sorte que tous les répondants en aient les mêmes
compréhensions. Il faudrait donc que la consigne soit illustrée d’un exemple. Exemple d’une
bonne consigne ; « lisez attentivement chacune des affirmations suivantes. Lorsque ‘affirmation
est vraie entourer la réponse V et si elle est fausse, entourez la lettre F.
2° Il faudra éviter de tirer les phrases textuellement d’un cours ou d’un livre.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 27

3° Il faudra éviter des phrases partiellement vraies et partiellement fausses. L’item doit être classé
comme V ou F de façon univoque. Exemple non corrigé ; la valeur de T est de 3. V ou F
4° Eviter de développer les déclarations par l’insertion des termes négatifs. Mauvais Exemple :
« N’est-il pas faux de nier que l’absence d’arrêt à un signal « STOP » n’entraîne pas
directement le retrait du permis de conduire. V ou F.
5° Eviter l’emploi des termes ou expressions généralement associés à une vraie ou fausse
déclaration. Ces termes sont « tous, toujours, aucun, jamais ». Il faudrait aussi éviter l’emploi
des termes exprimant une restriction ; « parfois, souvent,… ».
6° L’on devra aussi éviter de construire des vraies déclarations plus longues que les fausse.
7° Il faut se méfier des termes ou expressions ambigu ou mal définis. « Fréquemment, petit, grand,
grandement, 90%, beaucoup, peu,… »

2.3.2.3 Question à choix multiple (QCM)


Une question à choix multiple ou à voie multiples est une question à laquelle le sujet répond
en opérant une solution (au moins) parmi les solutions proposées chacune étant jugée correcte ou
incorrecte indépendamment du sujet qui doit y répondre.
Ainsi par convention, on réservera cette appellation de QCM aux questions dont la solution
correcte est, au moment ou la pose, disponible à l’ensemble des personnes compétentes ou plus
simplement connu de l’interrogateur. C’est à cela que tient principalement la différence entre les
questions à choix multiple et les questions d’opinion.
On appliquera l’appellation de questions à choix multiple aux questions dont les solutions
ont été décrétées correctes, incorrectes, partiellement correctes indépendamment des individus qui y
répondent ; ou encore aux questions dont les solutions sont objectivement correctes, l’objectivité
étant appréciée par l’accord entre les spécialistes.
La question à choix multiple comporte un certain nombre de composantes. Généralement on
en distingue quatre.
a) La Consigne : Est un stimulus destiné à motiver le sujet répondant et à l’orienter dans sa
réponse. Elle est présentée dès le début en vue d’informer celui-ci sur le type de questions à
aborder, la façon de répondre et les principes de notation ou de cotation.
b) L’amorce : Appelée aussi tronc, corps, article de base, prémisse, tige, thème ou encore
introduction, l’amorce définit le problème. Elle pose la question. Elle peut se présenter sous forme
de question du type interrogatif ou d’une déclaration incomplète.
c) Les solutions : Elles comprennent des solutions correctes et des solutions incorrectes appelées
« distracteur ». Les solutions sont aussi dénommées choix, suggestions, options, occurrences.
d) Le barème (Conséquence, note, tarif, cote) : C’est l’ensemble des points à gagner ou à perdre ;
l’on devra veiller à ce qu’il soit précis. Le plus courant est le suivant :
- TC : Tarif réponse correcte 1
- TI : Tarif pour réponse incorrecte 0
- TO : Tarif pour omission 0

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 28

Chacun d’eux peut être double ou simple.


Simple double
TC : +1 (+2) (+2)
TI : 0 (-2) (-1)
TO : 0 (0) (0)
Le tarif équilibré TC = +1 ; TI = -1 ; TO = 0
En pratique, on distingue une kyrielle de formes de questions qu’on peut regrouper en deux :
- questions à choix multiple directe ;
- questions à choix multiple indirecte.

A) Les questions à choix multiple directes


Une question à choix multiple directe est une question à laquelle on pourrait répondre sans
lire les solutions proposées. En fait c’est une question ouverte de complétion ou lacunaire ou d’essai
à réponse restreinte à laquelle on aurait ajouté des solutions ou des suggestions.
Il existe plusieurs variantes :
1) question à choix directe simple
C’est une question classique où l’on exploite uniquement le niveau 1 du simplexe.
Exemple : quel paramètre faut-il utiliser pour étudier l’homogénéité d’une distribution ?
1. indice de variation
2. coefficient de voussure
3. coefficient d’aplatissement
4. coefficient de corrélation

2) question à choix multiple directe à solution réunies ou à choix rénovés.


C’est une question où il y a plus d’une bonne réponse.
Exemple : parmi les animaux suivants le (s) quel (s) appartient (nent) au groupe de mammifère.
1. rat
2. crocodile
3. antilope
3) Question à choix multiple directe avec solution aucune
Dans ce genre de question parmi les suggestions on prévoit une occurrence « aucune ».
Exemple : la ville suivante est la capitale de la république du Bénin
1. Fretown
2. Kinshasa
3. Aucune
4) Questions à choix multiple avec toutes les réponses bonnes

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 29

5) Question à choix multiple du type ABDO


Cette question comporte en réalité 2 sous-questions bien qu’il y ait 4 solutions ; A, B, les
deux, aucun.
Exemple : pour étudier l’homogénéité d’une distribution on se base sur :
1. son indice de variation
2. son indice de dispensaire
3. les deux
4. ni l’un ni l’autre.
6) question à choix multiple à association composée
Très proche des questions de matching, ce genre de question dérive du type ABDO.
Exemple : attribuez aux assertions ci-dessous une des qualifications suivantes.
1. Nominale
2. Ordinale
3. Métrique d’intervalle
4. Métrique rationnelle
A côté de chaque lettre écrivez le chiffre correspondant :
A. Place d’un étudiant
B. La note à un test

7) question à choix multiple directe portant sur deux éléments et leurs relations
Exemple : Prenons deux faits historiques A et B.
Répondez de la manière suivante en encerclant la lettre qui précède votre chois
1. A et B sont vrais, A est antérieur à B ;
2. A et B sont vrais, A est postérieur à B ;
3. A et vrai, Best faux ;
4. A est faux et B est vrai
5. A et B son faux.
Voici les événements historiques concernés :
A. la proclamation de l’Etat indépendant du Congo a eu lieu le 30 juin 1960 ;
B. Le héros national Patrice Emery LUMUMBA est mort dans une prison dans la Province du
Bas-congo.

8/ Question à choix multiple portant la caractère nécessaire ou suffisant des données


On peut demander au sujet de ne pas répondre de manière classique mais de se prononcer
soit sur la caractère suffisant ou nécessaire de certaines données ou énoncés pour pouvoir fournir sa
réponse.
Exemple : sachant que :
A. la moyenne d’une distribution est de 12 (X)
B. son écart-type est de (SD)
C. son effectif est 20 (N)
Exprimez la mesure 15 en Z. Ne répondez pas directement, mais deux questions (1°) et (2°) vous
sont posées sur cette question unique.
(1°) question sur le caractère suffisant : le problème ci-dessous pourrait-il être résolu à partir d’une
ou de certaines données seulement. Répondez maintenant en choisissant les réponses ci-après ;

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 30

1. A suffit
2. B suffit
3. C suffit
4. A et B suffisent
5. B et C suffisent
6. A et C suffisent
7. A et B suffisent
(2°) questions sur le caractère nécessaire : le problème ci-dessous pourrait-il être résolu si un
plusieurs de ces informations étaient absentes. Répondez en choisissant les réponses suivantes.
1) A peut être omise
2) B peut être omise
3) C peut être omise
4) Ni A, ni B, ni C ne peuvent être omises.

9) Question à choix multiple avec la meilleure réponse


Dans ce type de question on présente toutes les réponses correctes et le sujet doit choisir la
meilleure d’entre elles, la plus concise de toutes.

B. Les questions à choix multiples indirectes


Elles sont également appelées « questions à rebours ». Pour y répondre le sujet est obligé
d’examiner l’ensemble des réponses proposées. Il ne s’agit donc plus d’une question ouverte à
laquelle on aurait ajouté des solutions.
Dans la forme la plus répandue de ce type de question, on demande de choisir parmi les
solutions proposées celle ou (celles) qui ne répond (ent) pas aux conditions décrites dans l’amorce.
Nous pouvons retenir quatre types principaux.

1) question à choix multiple de type sauf ou excepté


Exemple : en terme botanique, tous les fruits suivants sont des pommes excepté :
1. les poires
2. les grenades
3. l’aubergine.

2) question à choix multiple avec l’amorce complète


Exemple : laquelle des villes ci-dessous est située en République Démocratique du Congo ?
1. Bouaké
2. Kabale
3. Lomé
4. Zongo
3) question à choix multiple indirecte sans amorce
Dans ce type de question l’amorce ne présente pas de problèmes précis. Cette formule cache
le plus souvent un regroupement abusif de plusieurs questions de type alternatif. La pseudo amorce
qui est généralement utilisé est Parmi les affirmations suivantes laquelle est correcte ?
4) question à choix multiple indirecte avec une pseudo-amorce ou une amorce incomplète
Ici les amorces ne font que situer le contexte de la question mais ne la pose pas comme telle

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 31

Exemple : lorsque n… et que p q, on peut dire que la distribution des probabilités


1. suit la loi binomiale
2. est identique à la courbe gaussienne
3. est proche de la loi de poisson
4. présente des similitudes avec la loi hypergéométrique.

Quelques directives pour l’élaboration des questions à choix multiples.


Certaines directives sont générales et rejoignent celles qui ont été formulées pour d’autres
formes de questions, d’autres sont particulières aux questions à choix multiple.
D’une façon générale, il faut :
A. veiller à l’attractivité maximale des réponses en choisissant celles qui sont les plus plausibles.
B. éviter d’induire les sujets à pointer les bonnes réponses. En effet, lorsque le sujet est soumis à
une question à choix multiple dont il ignore la bonne réponse, il procède par élimination et
cherche les indices qui puissent l’orienter sur la bonne voie.
D’une façon précise, voici quelques indications ou recommandations devant diriger le
rédacteur des questions à choix multiples.
1° éviter des réponses absurdes ou peu vraisemblables
Par exemple : combien de calories environ sont-elles recommandées par jour à un adolescent
congolais
A = 0 ; B = 2500 ; C = 5000 ; D = 30 000
Les réponses A et D seront d’office éliminées.
2° éviter dans l’amorce certaines constructions grammaticales susceptibles de guider
systématiquement le sujet dans la recherche de la bonne réponse. Ce genre d’indices grammaticaux
ont trait notamment au genre au nombre ainsi qu’aux accords.
Par exemple : une dépenses signifie une :
A. dette
B. gaspillage
C. prêt
D. utilisation de l’argent
les réponses B et C seront d’emblée mises de côté.
3° Eviter la similitude entre les termes utilisés dans l’amorce et ceux de la série des réponses.
Par exemple : quel est le nom de l’organisme qui s’occupe de la police internationale
A=CIA
B=FBI
C = Interpol (*)
D = S A S.
4° éviter d’utiliser dans certaines solutions un terme plus proche de l’amorce que dans les autres
solutions.
Par exemple : la fonction du fibrinogène dans le sang est :
A = de porter l’oxygène aux cellules
B = d’apporter la nourriture aux cellules
C= de coaguler le sang (*)
5° éviter de proposer les réponses correctes en plus de détailles que les fausses.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 32

6° éviter de former les bonnes réponses dans un langage tiré textuellement d’un ouvrage ou du
cours. Le terme devra comporter une certaine technicité.
7° Eliminer certains termes spécifiques qui ont une affinité soit avec les bonnes réponses soit avec
les fausses réponses, tels que ; habituellement, quelque fois, parfois, peut-être, peu,…, tous, jamais,
toujours, souvent, etc…
8° Eviter les réponses exclusives ou inclusives.
Par exemple : un quadrilatère dont les côtés opposés sont parallèles est appelé…
A. hexagone
B. Octogone
C. Parallélogramme
D. Trapèze
E. Triangle.
9° présenter des réponses homogènes, c'est-à-dire les réponses portant sur un contenu identique, et
ce de la même façon.
10° Offrir au moins plusieurs possibilités de réponses 4 ou 5 pour réduire la chance de répondre au
hasard et corriger ainsi les écueils des questions alternatives.
11° veiller à ce que l’amorce présente clairement le problème envisager pour une meilleure
compréhension.
Par exemple : la chauve-souris ;
A. chasse les oiseux ;
B. est l’ennemi de l’homme
C. mange des insectes ;
D. mange des rats
12° Eliminer les détails inutiles de l’amorce pour éviter l’ambiguïté.
Par exemple : Nos os sont mis en mouvement par nos muscles ;
Il existe différentes sortes de muscles dans notre corps. « lequel des éléments suivantes serait classé
« muscle-lisse ?
A = adénoïde
B = Cœur
C = Tendons
D = triceps
13° il faut réduire l’emploi des expressions négatives parce que celles-ci diminuent la clarté d’un
item et y ajoute artificiellement des difficultés. Cependant on peut de temps à temps en faire usage
pour s’assurer que le sujet connaît des exceptions ou s’il est à même de détecter les erreurs et les
aberrations.
14° s’assurer qu’il n’existe qu’une et une seule réponse correcte ou nettement meilleure.
Par exemple : un garçon daltonien hérite ses traits de :
A. sa mère
B. son père
C. ses grands-frères
D. ses ancêtres reculés.
15° N’utiliser « aucun de cela seulement lorsque la réponse attendue peut être classée d’une
manière univoque comme vraie ou fausse.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 33

16° Veiller à ce que la consigne reste précise et concise ; elle devra montrer au sujet comment se
comporter et éventuellement fixer ce dernier sur la tarification des réponses.
17° varier la place de la bonne réponse dans les questions successives pour éviter de révéler au
répondant la tendance spatiale de la bonne réponse.

2.3.2.4 Les solutions générales implicites


Bon nombre de gens croient que toute question doit être apprise à l’école, sinon on est
dispensé d’y répondre. Mais dans la vie pratique, nos comportements ne sont pas nécessairement
une réponse apprise. Ainsi l’apprenant d’aujourd’hui doit apprendre à produire ses solutions
personnelles aux problèmes qui se poseront dans son travail quotidien et que nous ne pouvons
prévoir actuellement.
L’enseignement traditionnel procède par sollicitation explicite alors que la vie exigera des
acteurs sociaux des réponses spontanées. C’est ainsi que l’équipe de D.LECLERCQ a proposé de
développer un système de sollicitation implicite où le formateur présente « une situation
questionnant à l’étudiant sans pourtant la lui énoncer comme telle. Pour systématiser le principe de
la sollicitation implicite, les auteurs proposent de recourir aux questions à choix multiple mais en
les transformant quelque peu en introduisant des absurdités dans l’énoncé, en ne fournissant
d’information on ou encore en rédigeant des questions où toutes les solutions sont correctes et
d’autres questions où aucune ne l’est. Bien sûr, les apprenants seront avertis de ces éventualités
dans la consigne.
Les solutions, aucune, toutes, manque et absurdité, ne figureront pas parmi les solutions
proposées. C’est par elles qu’on mesurera la vigilance cognitive de l’apprenant.
Les solutions AUCUNE (6) et TOUTES (7) font porter la vigilance cognitive sur les
propositions de réponses, tandis que les solutions MANQUE (8) et ABSURDITE (9) font porter la
vigilance cognitive sur l’énoncé (ou introduction) de la question.
Dans ces cas (8 et 9), l’apprenant ne doit même pas lire les solutions proposées.
 Consigne

La consigne d’une solution générale implicite peut revêtir cette forme


« les questions qui suivent sont à choix multiple. Chaque question comporte une (et une seule)
solution correcte. Cependant, certaines solutions (appelées solutions générales) font appel à votre
vigilance. Elles vous sont proposées sous le numéros de code suivants ; 6-7-8 ou 9 et ne seront pas
dactylographiées dans les questions à choix multiples bien qu’elles soient d’applications pour
toutes ; 6 ou rejet = aucune des solutions proposées n’est sont correctes ; 7 ou toutes ; Toutes les
solutions proposées sont correctes : 8 ou Manque = il est impossible de répondre parce que de
l’information (ou moins une donnée) manque dans l’énoncé de la question (donc pas dans le cours
ni dans la connaissance actuelle sur le problème).9 ou absurdité un absurdité dans l’énoncé rend
toute la question sans objet (par exemple contre-vérité dans l’énoncé).
Par exemple :
La capitale de la RDC s’appelle

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 34

1. BUKAVU 3.
2. KANANGA
3. KINSHASA
La capitale du Guinée s’appelle
1. BUMBA
2. GOMA 6
3. KINDU
L’ancienne province orientale comprenait les districts
1. BAS-UELE
2. HAUT-UELE 7
3. ITURI
4. TSHOPO
A sa mort Simon KIMBANGU avait l’âge de
1. 3 ans
2. 20 ans 8
3. 30ans
Jules César a rencontré Stanley en
1. 1850
2. 1915
3. 1945 9

2.3. ECHELLES D’ATTITUDE


2.3.1. Notion
Une échelle l’attitude est une série, un ensemble d’affirmation ou de propositions auxquelles
le sujet répond. Cette méthode exige que l’individu ou la personne réagisse verbalement par une
approbation ou désapprobations qui s’effectuent par rapport à l’ensemble des propositions qui lui
sont soumises.
C’est ce qu’on appelle les items de l’échelle d’attitude.
2.3.2. Critères de sélection des items
Avant d’insérer les items dans une échelle d’attitude, ces derniers doivent remplir certaines
fonctions ;
1) les items doivent avoir une fonction diagnostique. C'est-à-dire ils doivent avoir une
certaine validité la réaction d’un sujet aux items doit être déterminée réellement par
l’attitude du sujet envers l’objet précis.
2) Ils doivent avoir une fonction discriminative, c'est-à-dire ils doivent non seulement
discriminer les personnes qui présentent d’attitude favorables ou défavorables mais
aussi doivent distinguer toutes les nuances intermédiaires entre les pro et les anti.
Ces fonctions constituent les critères de sélection.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 35

Principes pratique de rédaction :


- l’item doit exprimer une opinion et non un fait ;
- il doit être court simplement exprimé dans la langue des personnes auxquelles il s’adresse ;
- il doit exprimer une pensée complète, il ne faut pas qu’il y ait des sous-entendus, des
interrogations ;
- il doit être exprimé à la voix active, de telle sorte que la prise de position soit personnelle ;
- l’objet de l’attitude mesurée doit être le sujet de la phrase.
Ces principes ne sont pas immuables mais il faut en tenir compte.
Elles se rapportent à deux niveaux de mesure :
 Les unes se rapportent aux échelles ordinaires ;
 Les autres se rapportent aux échelles d’intervalles.
L’échelle ordinaire exprime la relation A plus grand que B ou A plus petit que B sans que la
différence A-B soit nécessairement é gale à la différence C-D. Cette catégorie comprend les
échelles de LIKERT, GUTIMA et le BOGARDUS.
Dans l’échelle d’intervalle, on trouve la relation A plus grande que B, A plus petit que B
tout en renseignent sur le grandeur de différence, c'est-à-dire la différence entre A-B = C-D ;
Entrent dans cette catégorie les échelles de THURSTONE.

2.3.3. Echelle de Thurstone ou échelle des Intervalles apparemment égaux (1929).

a) Introduction
En 1929, THURSTONE a essayé de construire des échelles où les distances entre les
différentes catégories de réponses seraient plus ou moins équivalentes. Ce qui requiert un certain
nombre d’opération ou étapes.

b) Etapes de construction
1. Rassembler un grand nombre de proposition simple qui se rapportent à l’objet de l’attitude.
Il faut rassembler 150 à 200. propositions
2. faire appel à un groupe d’experts en la matière. Chacun de ces experts, appelé juge, doit
apprécier les différentes propositions (items) en plaçant chaque item selon son degré de
valence sur un continuum (échelle) à 11 intervalles, et ces intervalles sont considérés comme
étant égaux.

1 2 3 4 5 6 7 8 9 10 11
Contre Pour
Ils doivent être au moins 25 juges.
3. Après leur travail, on établit pour chaque item sur la base de 11 intervalles, un tableau de
fréquence et sur base de ce dernier, on calcul des indices. Ces indices sont la valeur scolaire
S et la valeur Q.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 36

La valeur scolaire S ou la valeur de l’item, ou encore la côte d’attitude. Celui-ci indique la


place exacte de l’item sur le continuum d’attitude, elle est calculée par la technique du calcul de la
médiane.

N
− f sous Md . i
2
f Md
1. Mdn = lim inf. +
N
− f dessus Md . i
2
f Md
2. Md = lim Sup. -
La valeur Q, appelée le coefficient d’ambiguïté expire la fonction discriminative de l’item,
ou le degré d’accord du juge. Elle n’et rien d’autre que l’écart semi-interquartile de la distribution
des jugements.

Q3
−Q 1
Q= 2
4. La 4ème étape consiste à construire l’échelle provisoires ou échelle d’essai et l’appliquer à
une population d’essai. On élimine les items qui ont une valeur Q élevée parce que cela
traduit une grande discordance entre les juges et une signification vague de l’item.
En pratique, tout item avant une valeur Q plus grande que 1.90 est considérée comme vague.
On répartit ensuite les items qui restent en fonction de leur valeur sur les différents intervalles du
continuum ; in détermine aussi le nombre d’item à garder pour chaque intervalle en tenant compte
que ce nombre doit être le même pour chaque intervalle à l’étape suivante qui est celle de l’étude de
l’unidimensionnalité ou homogénéité de l’item. On conseille que l’échelle définitive contienne au
moins 22 items. On retient ainsi 4 items par intervalle pour l’échelle provisoire.
L’ensemble des items ayant des valeurs Q les plus basés et retenues pour chaque intervalle
constitue l’échelle provisoire.
On l’applique alors à une population d’essai qui est autre que celle que l’on veut étudier.
5. 5ème étape : la construction de l’échelle définitive et l’application à la population considérée.
Pour cela :
a. Calculer des coefficients de polyvalence de l’item qui est la différence absolue entre
les rangs théoriques et réels de chaque item, en fonction de fréquence d’acceptation
b. Eliminer les items polyvalents ou multimensionnels pour retenir les items claires et
unidimensionnels et ainsi on obtient l’échelle définitive prête à servir comme
instrument de mesure d’attitude. On l’applique alors à la population considérée, en
présentant au hasard sur une feuille de test les items retenus et en demandent au sujet
de marquer une croix à côté des items auxquelles i donnent son approbation
c. Une fois cela fait, on obtient le côté d’attitude d’un sujet en calculant la médiane ou
la moyenne des côtes d’attitudes des items auxquels il adhère. Cette médiane ou cette
moyenne permet de localiser le sujet sur l’échelle d’attitude.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 37

3.3. Echelle de Likert ou méthodes de classement additionnées


Celle-ci a une construction plus simple et plus rapide que la précédente LIKERT a essayé de
construire en 1932 des échelles moins « coûteuses » et basées dès le départ sur l’application des
sujets pour « mesurer » les attitudes. La technique consiste essentiellement, non pas à choisir entre
plusieurs affirmations ou indicateurs, mais à évaluer le degré d’accord perçu pour chacune de
proportions.
Les indicateurs retenus sont ceux qui sont suffisamment corrélés avec un ensemble
homogène d’indicateur censés représenter une même attitude.
1ère étape : Elaborer ou rassembler un certain nombre de propositions se rapportant à l’objet de l’
2ème étape : Soumettre ces propositions à un groupe de juges, ceux-ci indiquent, déterminent la
direction et l’intensité des réactions très profonde que chacun des items provoquent en
eux. Les juges expriment leurs opinions selon les 5 catégories suivantes :
 approbation totale ;
 approbation ;
 indécision ;
 désaccord ;
 désaccord total.
Chacun de ces catégories est pondérée arbitrairement en attribuant un coefficient
numérique. Le sens de la pondération est inverse dans le cas des items négatifs.
Voici comment l’on pondère :
a. Items positifs b. Items négatifs
 approbation total 4 5 +2 0 1 -2
 approbation 3 4 +1 1 2 -1
 .indécision 2 3 0 2 3 0
 Désaccord 1 2 -1 3 4 +1.
 Désaccord total 0 1 -2 4 5 +2
Pour détenir le sucre de chaque sujet, il suffit d’additionner les notes correspondantes à ses
réponses à tous les items. C’est pourquoi on appelle cette méthode : méthode de classement
additionné.
Dans l’élaboration de cette échelle il n’est pas nécessaire de nourrir aux juges experts parce
que le questionnaire peut être soumis directement à un échantillon extrait de la population que l’on
veut étudier. Cet échantillon doit être représentatif de la population à étudier.
3ème étape : Sélectionner les items devant constituer l’échelle définitive sur la base de leur fonction
discrimination. Rappelons qu’un item est discriminatif s’il partage le sujet à attitude
favorable et le sujet à atteindre défavorable. Dans le cas de l’échelle de LIKERT. Le
critère discriminatif est interne à l’échelle.
On fait l’hypothèse que la distribution des résultats totaux représente la distribution des
attitudes.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 38

Ainsi pour connaître le pouvoir de discrimination des items, on calcule la relation entre le
score dans chaque item et la note totale. En d’autres termes, on cherche à connaître la relation, ou la
corrélation item-total. Pour trouver cette corrélation, on tient uniquement compte de deux groupes
extrêmement de la distribution totale. Dont chacun représente 25% de sujets. Ensuite on calcul la
moyenne obtenue par chacun de ces groupes extrêmes à chaque item et on essaye de voir s’il y a
uyne différence entre ces moyennes.
On se sert du test statistique t pour calculer la différence des moyennes.

où t = test t

SDM¿ MH = moyenne du groupe supérieure ( high)


MH − ML¿ ¿ ML = moyenne du groupe inf érieure (low )
t= ¿ SDM = erreu−type de la différence des moyennes
L’écart-type de la distribution de la différence des moyennes
4ème étape : Après la construction, on l’applique à la population étudiée. Pour chaque item, les sujets
doivent donner l’une de 5 réactions ou alternatives étudiées.

Chapitre III. TECHNIQUES D’ANALYSE DES ITEMS ET D’ETALONNAGE


3.1. TECHNIQUES D’ANALYSE DES ITEMS
3.1.1. Définition
L’analyse des items (ANITEM) désigne une procédure et un ensemble des techniques qui
permettent d’étudier le comportement des questions d’un instrument de mesure notamment en ce
qui concerne la facilité (ou la difficulté) des items et leur pouvoir discriminatif.
Sur base de ces deux indices, l’analyse des items permet de sélectionner les items d’un
instrument de mesure selon les critères d’acceptabilité de chaque technique. Il en existe de plusieurs
sortes.
Les items retenus sont ceux qui se révèlent concordants, congruents, adaptés ou de même
famille. Ils doivent manifester une différenciation entre les sujets forts et faibles sur le plan des
aptitudes et des capacités.
Les items non concordants ou peu discriminatifs sont soit écartés soit améliorés.
Il existe toute une nomenclature pour la cotation
+: Réussite
- : Echec
O : Omission
U : Unreached (non atteint)

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 39

W : Wrong (Fausse réponse)


R : Right (Bonne réponse)

3.1.2. Notions d’indice de FACILITE ou DE DIFFICULTE ET DISCRIMINATION


L’indice de facilité est le rapport du nombre de sujets qui ont répondu correctement au
nombre de sujets qui ont essayé à l’item ou qui l’ont abordé. C’est le taux de réussite ou de succès.
Les valeurs des indices de facilité vont soit de 0 à 1 soit de 0 à 100.
L’indice de discrimination renseigne sur le pouvoir séparateur de l’item examiné. Il montre
dans quelle mesure l’item fait manifester la discrimination ou la différenciation entre les sujets
d’aptitudes généralement élevés et les sujets moins doués.
La discrimination peut être parfaite, positive, nulle ou négative ainsi on peut avoir :
- un item à valeur discriminative parfaite : tous les sujets du groupe supérieur ont répondu
correctement à l’item, mais personne du groupe inférieur ;
- un item à valeur discriminative nulle : le nombre des sujets du groupe supérieur qui ont
répondu correctement à l’item est la même que celui du groupe inférieur ;
- un item à valeur discriminative négative : le nombre des sujets du groupe inférieur qui ont
répondu correctement à l’item dépasse le nombre de sujets du groupe supérieur qui ont
répondu correctement à l’item. Ces valeurs des indices de discrimination vont de 0 à 1 et
leurs calculs varient selon les auteurs. Pour certains l’indice de discrimination n’est que la
différence entre les pourcentages des groupes extrêmes.

3.1.3. TECHNIQUE DE STANLEY et HOPKINS


Cette technique repose sur les notions de difficulté et de discrimination. Elle utilise les 27%
supérieurs et les 27% inférieurs de l’échantillon testé en exploitant les propositions de réussite. Elle
ne tient pas compte des omissions dans le calcul.
A) Formules
1) p ou IDf = indice de difficulté
PH + PL
p=
2
PH = Proportion de réussite dans le groupe supérieur
PL = proportion de réussite dans le groupe inférieur.
2) IDS = indice de discrimination : PH - PL
Démarches
1) Après correction, ordonner les protocoles dans l’ordre décroissant de mérite ;
2) Multiplier 0,27 X N pour obtenir 27% du groupe supérieur et inférieur ;

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 40

3) Du score le plus élevé, compter un protocole pour obtenir le nombre des sujets du groupe
supérieur ;
4) Du score le moins élevé, compter un protocole pour obtenir le nombre des sujets du groupe
inférieur ;
5) Calculer la proportion de réussite des sujets ayant répondu correctement à l’item dans le groupe
supérieur selon la formule.
6) Idem pour le groupe inférieur.
7) Déterminer l’indice de difficulté selon la formule reprise supra ;
8) Déterminer l’indice de discrimination selon la formule reprise plus haut ;
9) Prendre la décision.
p=IDf : 0,25 à 0,75 : item accepté
D= IDs : 0,40 à 1 : item accepté ou 40 à 100

3.1.4. TECHNIQUE DE N.E GRONLUND


Cette technique se fonde sur le calcul des indices de difficulté et de discrimination. Elle
considère le tiers supérieur et le tiers inférieur de l’échantillon ainsi que les omissions.
A) Formules
R
P= X 100
1) T

P = Indice de difficulté de l’item


R = Nombre des sujets du tiers supérieurs et inférieur ayant réussi à l’item
T = Total des sujets du groupe supérieur et inférieur ayant essayé l’item.
RV −RL
IDs=
2) 1 /2 T
IDs = Indice de discrimination
RV= Nombre de sujets du tiers supérieur ayant réussi à l’ITEM
RL = Nombre des sujets du tiers inférieur ayant réussi à l’ITEM
T : Voir supra

B) DEMARCHES : voir première technique mutatis mutandis.

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 41

ILLUSTRATION POUR LES DEUX TECHNIQUES

Sujet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Items

1 0 1 0 1 1 1 1 1 0 1 0 1 0 1 0 1 0 1 0 1

2 1 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0

3 0 0 1 1 1 1 0 1 1 0 1 1 1 1 1 1 0 1 1 1

4 1 1 0 0 0 1 1 0 0 0 1 1 0 1 1 1 0 1 0 0

5 0 1 0 1 1 1 0 1 0 0 1 0 0 1 1 0 0 1 0 0

6 0 0 1 0 0 1 0 1 0 0 1 0 0 0 1 1 0 1 0 0

7 1 1 0 1 1 1 1 1 0 0 1 0 0 1 1 0 0 0 1 0

8 1 1 0 0 0 0 1 1 0 0 0 0 0 1 1 1 0 1 0 0

9 0 0 1 1 1 1 0 0 1 0 1 1 0 0 1 1 0 1 0 0

10 1 1 0 0 0 1 0 0 1 0 1 0 0 0 1 1 0 1 0 1

Total 5 7 3 5 5 8 4 6 3 2 7 4 1 6 8 7 0 9 2 3

Ordre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Sujets 18 15 6 2 16 11 8 14 4 5 1 7 12 3 9 20 10 19 13 17

Points 9 8 8 7 7 7 6 6 5 5 5 4 4 3 3 3 2 2 1 0

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 42

UNIGOM L2 PSY LMD : CONSTRUCTION DES TESTS ET METHODE DES TESTS 2022-2023
P a g e | 43

3.2. TECHNIQUES D’ETALONNAGE D’UN TEST

3.2.1. Introduction
Etalonner, c’est déterminer pour un ensemble de scores observés donnés, obtenus après
l’administration d’une épreuve, d’un test ou d’une batterie de tests à un échantillon, une base
commune en vue de la comparaison juste de scores. Tout ceci parce que l’interprétation de tout
score exige un point de référence. Etalonner consiste donc à définir des normes.
Il existe deux grands types d’étalonnage dans le groupe de référence, celui des tests
normatifs et des tests centrés sur l’objectif.

3.2.2. Etalonnage normatif


Dans ce cas, on prend comme norme la distribution des performances individuelles dans
une tâche ou dans un ensemble des tâches.
Les systèmes d’étalonnage normatifs les plus utilisés sont les suivants :
a. le centilage ou percentillage
b. les notes standard ou notes
c. l’échelle normalisée à 5 classes
d. l’échelle normalisée à 9 classes (stanines).
Nous n’insisterons que sur ces deux systèmes étant donné leur utilisation fréquente.
A. Le centilage ou percentillage
Il consiste à diviser un ensemble d’observations (scores, notes, données) en 100
propositions, chacune ayant un nombre égal de proportions. Le percentille ou le centile est un
point en dessous duquel se trouve p pourcent de scores d’un échantillon.
Par exemple p20 signifie qu’en dessous de ce point se trouvent 20% de scores d’un
échantillon. Il existe 99 percentiles et le médian correspond au 50ème centile.
En principe, on ne calcule pas les centiles à partir de moins de cent notes. On peut
déterminer les centiles à l’aide d’une formule qui entraîne des calculs assez longs. Le plus
souvent, on se contente d’approximations, aisément lues sur un abaque construit de la façon
suivante sur du papier millimétré :
1° porter horizontalement la valeur des classes ;
2° pointer les effectifs cumulés aux limites supérieures exactes des classes ;
3° rejoindre les points en une courbe qui, si les scores se distribuent assez normalement, prend la
forme d’un S (Ogive de Galton). Si l’Ogive s’ébauche bien, on peut se permettre de régulariser de
« polir » son tracé.
4° Il suffit alors de partir de l’échelle verticale pour venir lire à partir du point rencontré sur
l’Ogive, la valeur approximative du centile cherché.
(Travail dirigé de l’étudiant)

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 43 sur 79
P a g e | 44

Remarquons qu’en pratique on préfère étalonner soit en décile, soit en quartile.


Le décilage consiste à diviser un ensemble d’observations en dixième de tout ; dans une
distribution il y a 9 déciles qui sont D1, D2, D3, D4, D5, D6, D7, D8 et D9.
Dans le quartilage l’évaluateur divise un ensemble d’observation en quatre groupes égaux, chacun
ayant un nombre égal de proportions. On a trois quartiles : Q1, Q2 et Q3.
- Le Q1 : c’est un point en dessous duquel se trouve un quart d’observations, c'est-à-dire
25% d’observations.
- Q2 : c’est un point en dessous duquel se trouvent 50% d’observations. Il correspond à la
médiane
- Le Q3 : c’est un point en dessous duquel tombent trois quarts d’observations.
- La différence entre Q3 et Q2 est appelée écart interquartile.
La valeur approximative de l’écart – type = ¾ de l’écart interquartile.
B/ Les notes (standards ou notes z (écart réduit)
Les notes étalonnées visent à déterminer la base commune comparaison entre les notes en
adoptant l’échelle z.
Partons d’un cas concret.
Un élève a obtenu les notes brutes suivantes : calcul : 22 sur 25 ; lecture : 72 sur 100 ;
sciences 26 sur 50.
L’examen de ces notes n’apprend pas grand – chose.
Si l’enseignant est sévère en lecture et beaucoup moins en calcul, le 72/100 en lecture est peut être
plus brillant que le 22/25 en calcul.
De plus, des notes brutes ne permettent pas la comparaison avec d’autres élèves de même niveau
pédagogique, par exemple.
Pour rendre la comparaison possible, on exprime ces notes en fonction des écarts – types,
ce qui permet de les situer sur une même courbe (notes étalonnées ou scores standards).
Calcul des scores standards par le z (pour le calcul).
X− M
z=
SD

Nous pouvons appliquer ce système pour la comparaison des résultats de deux étudiants I
et II à l’issue de l’application d’une série de tests dont les résultats figurent dans le tableau
suivant :

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 44 sur 79
P a g e | 45

Ecarts X
Tests Moyennes X (x-n) Déviation Notes étalonnées
types Scores bruts

I II (I – x) II I II

Anglais 155,7 26,4 195 162 + 39,3 + 6,3 + 1,49 + 0,24

Lecture 33,7 8,2 20 54 - 13,7 + 20,3 - 1,67 + 2,48

Information 54,5 9,2 39 72 - 15,5 + 17,5 - 1,67 + 1,88

Aptitudes scolaires 87,1 25,8 139 84 + 51,9 - 3,1 + 2,01 - 0,12

Attention 24,8 6,8 41 25 + 16,2 + 0,2 + 2,38 + 0,03

Totaux 76,4 434 397 + 2,54 + 4,51

Moyennes + 0,51 + 0,90

En fin, il est utile de rappeler que généralement pour éviter le décimal, on transforme les notes z
en note T en appliquant la formule suivante :T = 10z + 50 où est 50 est la moyenne et 10 l’écart
type.
C) Echelle normalisée à 5 classes.
Comme le nom l’indique, cette échelle comporte 5 classes normalisées et est
d’application pour les échantillons dont les effectifs sont compris entre 50 et 100. Dans cette
échelle, les 2ème, 3ème et 4ème classes sont reparties par écart-type, selon la distribution normale, la
3ème classe est centrée sur la moyenne, tandis que les classes extrêmes, la première et la cinquième
sont d’étendue illimitée.
L’échelle peut être ainsi présentée.
-1,5 SD -0,5 SD +0,5 SD +1,5 SD
Ecart-type

Classe 1 2 3 4 5

Pourcentage : 7% 24% 38% 24% 7%

a) Echelle normalisée à 9 classes (stanines)

Cette échelle est indiquée pour les échantillons dont la taille est supérieure à 100.
Les principales caractéristiques sont les suivantes : les premières et neuvième classes sont
d’étendues illimitées, les autres classes comportent un demi-écart, la cinquième étant centrée sur la
moyenne.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 45 sur 79
P a g e | 46

L’échelle peut être ainsi schématisée :


Ecart-type
-1,75 SD -1,25 SD -0,75 SD -0,25SD +0,25SD +0,75SD +1,25SD +1,75SD

7 8 9
1 2 3 4 5 6

Classe
Pourcentage 4% 7% 12% 17% 20% 17% 12% 7%
4%

3.2.3. Etalonnage par rapport à l’objectif


La première préoccupation de l’éducation de base n’est pas compétitive ou
sélective, mais formative. Pour aider un apprenant, il importe bien moins de lui indiquer quelle
place il occupe, par rapport aux autres, dans la course au savoir, que de lui apprendre jusqu’où ses
efforts l’ont conduit sur le chemin qui mène, la maîtrise désiré d’un apprentissage. A quelle
distance se trouve-t-il encore de l’objectif à atteindre et quels obstacles doit-il surmonter ?
Dans cette nouvelle perspective, le critère, la norme n’est plus la référence par
rapport au groupe d’appartenance mais plutôt la tâche assignée et l’étalonnage se fera selon les
composantes maîtrises. On fera alors appel aux tests centrés sur les objectifs (criterion referenced
tests).
En passant de l’étalonnage traditionnel à l’étalonnage centré sur les objectifs, on
abandonne un critère externe (les performances du groupe de référence) pour adopter un critère
interne (le degré de maîtrise d’un apprentissage). Ce critère s’identifie à l’objectif poursuivi qu’il
s’agisse de macro-objectif ou de micro-objectif
Actuellement, l’intérêt se porte surtout sur les micro-objectifs parce qu’ils semblent
permettre un progrès considérable de la pratique scolaire.
On tend essentiellement vers l’exhaustivité des items avant de procéder à un choix.
Ainsi pour chaque micro-objectif, on précise les comportements à produire et les
critères de réussite pour chaque individu ou pour un groupe.
Deux exemples peuvent être édifiants à ce propos :
- Pour chaque objectif, l’élève doit réussir au moins sept items sur dix.
- Pour chaque objectif, 90% du groupe doit réussir au moins sept items sur dix.

Comme nous le remarquons, la théorie de la construction des tetis, centrés sur les objectifs,
essentiellement du domaine de la pédagogie scolaire est encore un plein développement.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 46 sur 79
P a g e | 47

Le but poursuivi étant principalement diagnostic, l’important, pour la pratique scolaire, est
le dresser des tableaux récapitulatifs faisant apparaître clairement la situation de chaque élève ; on
saura où intervenir.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 47 sur 79
P a g e | 48

DEUXIEME PARTIE : METHODE DES TESTS

Chapitre IV: GENERALITES SUR LES TESTS


4.1. Repères historiques
L’apparition des tests psychologiques peut être datée du début du 20 ème siècle avec les travaux de
Binet en 1905. Cette apparition ne peut être pensée sans référence aux bouleversements des
méthodes de la psychologie qui se déroulent à partir de la seconde moitié du 19ème siècle.
Les travaux de Binet et Simon et leur reprise par les psychologues américains qui seront à
l’origine de la mise en de la « Méthode des tests » et de sa diffusion. L Terman et R Yerkes sont
les deux auteurs majeurs de cette diffusion. Nés dans le milieu éducatif, les tests vont être utilisés
pour la sélection des recrues dans l’armée américaine par Yerkes et ensuite pénétrer le milieu
universitaire, les entreprises, ...
4.2. Définition.
Le terme « test », éthymologiquement, vient du latin testum qui signifiait un pot de terre.
Le mot test comme « Epreuve mentale » a été introduit en 1890 par James Mc Keen
CATTELL, un psychologue américain. Pour Cattell, le test mental désigne toute expérience
psychologique destinée à permettre une application numérique, la mesure d’un processus, d’une
fonction, effectuée, afin de le caractériser, sur un individu que l’on soumet à des épreuves
déterminées (ZURFLUH, p.35)
La définition de PICHOT semble plus inclusive : « On appelle test mental une situation
expérimentale standard servant de stimulus à un comportement. Ce comportement et évalué par
une comparaison statistique avec celui d’autres individus placés dans la même situation,
permettant ainsi de classer le sujet examiné, soit quantitativement, soit typologiquement » (Pierre
PICHOT, Tests mentaux en psychiatrie, Paris, PUF, 1949).
D’une manière générale, on peut définir le test comme étant une épreuve soigneusement
préparée et administrée de la même manière à un groupe d’individus bien déterminé, dans les
mêmes conditions et dont les résultats sont interprétés de la même façon pour tout le monde.
Testothèque : lieu où on garde les tests.

4.3. Exigences ou qualités d’un bon test.


1 But et base théorique.
L’identification du but (finalité globale) et de la base théorique est sans doute la première exigence
d’un bon test. On doit préciser ce qu’on veut mesurer ou appréhender par le test. Par exemple si
le test mesure l’intelligence, quelle est la définition que l’auteur donne à l’intelligence ?
Dans les manuels de test, les auteurs donnent une définition précise de chaque facteur étudié
(identification du but) et la bibliographie où se trouve la recherche pour justifier le choix des
facteurs considérés pour mesurer l’aptitude envisagée (base théorique).

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 48 sur 79
P a g e | 49

2 Rigueur dans la Construction


La construction d’un test doit être scientifique, son élaboration doit provenir d’une opération
systématique et contrôlée. (Cfr première partie du cours)
3. Standardisation
La standardisation porte essentiellement sur le contenu, l’administration, la correction et
l’interprétation des résultats.
4. Sensibilité
La sensibilité ou fonction de discriminations des individus entre eux, est la qualité qui permet à un
instrument de différencier des valeurs voisines de la grandeur à mesurer. Cette différenciation
s’obtient par le choix des items. Le test sensible sera donc celui qui permettra un classement des
individus avec peu d’ex-aequo.
5 Etalonnage
L’Etalonnage permet de faire le classement des résultats et de situer chaque réponse dans une
distribution statistique. L’étalonnage se fait en fonction des normes établies à partir d’un examen
préalable ayant porté sur un nombre plus ou moins élevé des sujets (370,400 ou 450) et
représentatif de la population. C’est une opération qui permet d’établir des normes de classement
de résultats.
Les étalonnages s’établissent par la normalisation, le décilage, le centilage ou percentilage, le
quartilage.
6. Validité.
Chaque test a son objectif, son but ou sa finalité. Deux questions se posent en effet lorsqu’il s’agit
de définir le terme de validité :
 a) Le test mesure-t-il ce qu’il prétend mesurer ?
 b) Avec quelle précision le mesure-t-il ?
Selon Jean SIMON (1972, p. 80), la validité est le degré au quel un test atteint le but
pour lequel il a été conçu.
Des congres organisées par l’A..P.A( American Psychological Association) et par l’A.E.R.A.
American Educational Association ) ont essayé de déterminer le sens de quatre types de validité :
Validité des concepts opérationnels ou validité de construct.
C’est une validité inductive, inférentielle ou conceptuelle. Il s’agit d’un modèle théorique ou
hypothétique. Par exemple : la personnalité, l’honnêteté, la créativité … pour qu’un test de
créativité soit valide, il doit couvrir tous les comportements ou traits attribués à la créativité.
Validité prédictive ou pronostique
Il s’agit d’une validité qui consiste à prévoir le niveau de performance qu’atteindra plus tard un
sujet à partir des résultats actuels au test. La technique consiste à calculer la corrélation entre les

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 49 sur 79
P a g e | 50

résultats aux tests et ceux obtenus par le même individu au cours de l’année scolaire dans des
situations réelles. Ici, le pronostic est très lent.
Validité concurrente
On voudrait savoir avec quel degré il y a ressemblance entre les notes obtenues au test et la
situation présente. Cette validité permet de faire une prédiction immédiate. La procédure est la
même que dans le cas de la validité prédictive.
Validité congruente
Il s’agit de comparer deux instruments de mesure portant sur la même matière ou contenu mais
présentés sous deux formes (de questions) différentes. La validité congruente consiste à voir si les
deux tests mesurent la même chose ou non.
7. Fidélité
On parle de la fidélité ou de la constance d’un test pour désigner la stabilité des notes obtenues
lors d’une administration répétée d’une même épreuve ou des épreuves parallèles sur une même
population. En d’autres termes, si les conditions ne changent pas, la répétition de l’examen (test)
doit toujours conduire au même résultat plus ou moins proche.
Voici les méthodes ou procédés utilisés dans le calcul de la fidélité : test-retest, deux formes
parallèles, méthode pair-impair, méthode de partage, concordance entre juges (projectifs).

Chapitre V: CATEGORIES DE TESTS, CENTRES DE DOCUMENTATION ET


CATALOGUES
5.1. CRITERES DE CLASSIFICATION DES TESTS.
Il serait quasi impossible de prétendre fournir un bilan exact de tous les tests existants.
On se contente cependant de les classer d’après certains critères. On peut classer les tests comme
suit :
1. Selon l’activité physique ou le mode d’expression de la réponse :
On distingue :
a) les tests papier-crayon : le sujet emploie crayon et papier pour répondre
b) les tests verbaux : le sujet y répond en utilisant des mots ou éléments sémantiques
(mots écrits)
c) les tests manuels ou de performance : on se sert de ses mains pour manipuler ou
exécuter une tâche
d) les tests projectifs : le sujet est appelé à structurer un matériel ambigu
e) les tests oraux : le sujet y répond oralement.
2. Selon l’âge des sujets examinés ; les tests de développement (baby-tests)
et les tests du niveau mental
3. Selon l’objet d’étude: les tests pour enfants et les tests pour adultes.
4. Selon le temps ou durée de passation

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 50 sur 79
P a g e | 51

a) les tests chronométrés ou à temps limité : on se sert d’un chronomètre ou, à défaut,
d’une montre pour vérifier la vitesse et la précision du travail.
b) les tests non chronométrés ou à temps libre : on s’intéresse à la profondeur de la
matière c’est-à-dire qualité de la réponse.
5. Selon le degré d’exigences.
On distingue :
a) les tests standardisés.
- tests qui passent par les techniques d’administration, de correction et d’interprétation. Tout y est
contrôlé.
b) Les tests non standardisés
6. Selon la qualité du jugement de l’examinateur.
a) les tests objectifs :
- dont l’observation, la correction et l’interprétation ne sont pas influencées par
l’équation personnelle de l’examinateur (subjectivité). Le jugement est dit objectif.
b) les tests non objectifs ;
- il s’agit de ceux dont l’observation, la cotation et l’interprétation dépendent
exclusivement de l’examinateur (jugement subjectif)
7. Selon la finalité globale ou segment de conduite étudié
On distingue :
a) les tests d’intelligence
b) les tests d’aptitude
c) les tests de connaissance
d) les échelles d’attitudes et d’intérêts
e) les tests de personnalité
f) les tests de caractère
g) les tests sociométriques
8. Selon le nombre de sujets examinés.
a) test individuel : test appliqué à un seul individu
b) test collectif : test qui sont adressé à un groupe d’individus. Ces tests permettant de se faire
une idée globale sur le niveau du groupe.
9. Selon la fonction du test
a) les tests diagnostics
- ils permettent de découvrir les déficiences, les points faibles chez les sujets.
b) les tests pronostics
-permettant de prédire le rendement futur ou l’avenir d’un sujet dans un domaine déterminé
c) les tests de rendement
- pour faire état du niveau de connaissance atteint par le sujet
d) les épreuves cliniques.
-utilisées dans le cadre clinique pour identifier certains troubles ou anomalies de la personnalité.

5. CATALOGUES ET CENTRES DE DOCUMENTATION EN PSYCHOMETRIE.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 51 sur 79
P a g e | 52

Les centres de documentation ont pour but (1974, p.83) :


- d’assurer la communication entre les chercheurs par une information succincte et rapide
sur les travaux en cours ;
- d’assurer à ces mêmes chercheurs une information plus élaborée sur les recherches
publiées.
- De faciliter l’accès aux documents originaux
- De mettre régulièrement à la disposition des enseignants et des administrateurs des
documents des synthèses faisant le point et de dégager les principales tendances.

Parmi les sources d’informations, citons spécialement :


1. le catalogue des établissements d’application psychotechnique « E.A.P » en France
2. le catalogue d’editest en Belgique (Bruxelles)
3. le catalogue du centre de psychologie appliquée à Paris (CPA)
4. le catalogue I.N.S.P en France
5. le catalogue de Buros (10.000 tests par an), « mental mesurement year books » à New
Jersey.
6. le catalogue du centre de documentation en sciences humaines du CNRS et de l’Université
de Paris et Nantere.
7. le catalogue de l’INRDP (institut national pour la recherche et la documentation
pédagogique) en France.

Au Congo on peut signaler :


2. l’I.N.P.P Institut National de Préparation Professionnelle.
3. le service professionnel de sélection et d’orientation professionnelle de grande entreprise :
la GECAMINE, la SOTEXKI,
4. UPN, UNKIS.

CHAPITRE VI : PANORAMA DES TESTS

5.1. LES TESTS D’INTELLIGENCE ET D’APTITUDES

Notion d’intelligence

Quand on parle de l’intelligence, on fait souvent allusion à la capacité qu’a un individu :

- de penser et de comprendre par lui-même ;


- de formuler des jugements et de raisonnements personnels ;
- de s’adapter à des situations nouvelles (milieu) ;
- de résoudre les problèmes que pose la vie

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 52 sur 79
P a g e | 53

La théorie d’intelligence de Spearman, connue sous le nom de « Théorie de deux facteurs ou théorie
Bifactorielle » considère qu’il existe une seule aptitude générale sous-jacente à toutes les activités
cognitives. Chaque test, tâche ou travail réclame une activité mentale dépendant d’une aptitude générale(G)
et d’une aptitude spécifique ou spéciale (S). D’après Spearman, l’aptitude générale ou facteur G est une
énergie mentale dont chaque individu est doué.

I. Tests psycho-moteurs ou sensori-moteurs.

Les tests psycho-moteurs sont ceux qui concernent le développement sensoriel, moteur et intellectuel. En
général, ces instruments sont élaborés pour les tout petits ; on les appelle Baby-tests, les tests de
développement.

1. Echelle ou inventaire de développement de Gesell

L’inventaire de développement de GESELL vise à déterminer ces niveaux de maturité chez les nourrissons
et les enfants âgés de 0 semaines à 6 ans sur base de description des comportements caractéristiques de
niveau d’âge : comportements moteur, adaptif, verbal et personnel-social.

Cette instrument permet de poser le diagnostic clinique dont les déviations et les retards de développement
à partit du quotient dit de développement.

Q.D = A.D x 100 où QD et AD = quotient et âge de développement

A.R

AR = âge réel

2. Echelle de Brunet-Lézine

Le Brunet–Lézine est un instrument de mesure et d’analyse bien adapté à l’examen des enfants suivant
l’âge. Il met l’accent sur le contrôle postural et motricité (P), le coordination oculo-motrice ou adaptation
vis-à-vis des objets (C), les premiers éléments du langage (L), les relations sociales et personnelles (S).

L’échelle s’applique aux enfants de 0 à 24 mois, et avec les épreuves complémentaires aux enfants de 2 à 6
ans.

II. Tests d’intelligence générale

A. Les tests individuels

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 53 sur 79
P a g e | 54

1. Le test de Binet – Simon

En 1905, ils publient une première échelle d’intelligence qui porte leurs noms et qui sera modifié et
complétée par les révisions de 1908 et de 1911 (forme définitive). Cette échelle comprend n ensemble de
tests ou épreuves étalonnées pour les différents âges de 3 à 10 ans et en outre, des séries d’épreuves pour 12
ans, 15 ans et l’âge adulte. Les items sont classés par ordre de difficulté croissante de sorte qu’à chaque âge
corresponde un groupe de 5 à 6 épreuves. L’Echelle entière comporte 55 items de 3 ans à l’âge adulte. En
1909, Goddard traduit en Anglais l’échelle de 1908 et l’introduit aux U.S.A.

La Stanford Revision de Terman 1916.

Cette révision fut publiée pour la première fois aux U.S.A en 1917. Terman fait intervenir la notion de Q.I
de Stern. Cette révision situe l’âge adulte à 16 ans.

Q.I. = A.M. x 100

A.C

Classification de Binet-Simon.

Q.I. Interprétation

140 et plus …………….Intelligence très supérieure

120 à 139 ………………Intelligence supérieure

110 à 119 ………………Intelligence légèrement supérieure

90 à 109 ……………….Intelligence normale

80 à 89 …………………Lenteur d’esprit

70 à 79 …………………Zone marginale

50 à 59 …………………Débilité mentale

20 à 29 …………………Imbécillité

0 à 19 …………………..Idiotie

La révision de Terman-Merrill en 1937.

La forme actuelle de Binet-Simon est le résultat de la révision de 1937, publiée pour la 1 ère fois aux U.S.A.
en 1938, et connue sous le nom de TERMAN-MERRI.

- L’échelle Terman-Merril se présente comme suit :

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 54 sur 79
P a g e | 55

6 épreuves par ½ année d’âge de 2 à 5 ans (1)

6 épreuves par année d’âge de 6 à 14 ans (2)

6 épreuves pour le niveau d’adulte moyen (3)

6 épreuves pour le niveau d’adulte supérieur I (4)

6 épreuves pour le niveau d’adulte supérieur II (5)

6 épreuves pour le niveau d’adulte supérieur III (6)

- Une épreuve est dite représentative de 6 ans, lorsqu’elle est réussie par 75 % des sujets de cet âge, 25 %
des sujets de 5 ans et 100% des sujets de 7ans.

- Les résultats de ces tests-échelle peuvent s’exprimer de deux manières : sous forme d’âge mental (A.M) et
sous forme de rapport entre l’âge mental et l’âge réel : le quotient intellectuel.

2. Echelle d’intelligence de Wechsler

Sa première échelle date de 1939 ; elle est connue sous le nom de « Wechsler-Bellevue Scale for
Adolescents and Adults » (W.B.S.A.A). Il est divisé en deux partis dont la première, élaborée en 1949,
s’appelle W.I.S.C (Echelle d’intelligence de Wechsler pour enfants) ; la seconde, construite en 1955, est
connue sous le nom de W.A.I.S (Wechsler Adults Intelligence Scale). En 1967 la 4 ème échelle : Wechsler
Preschool and primairy scale of intelligence (W.P.P.S.I.). Les échelles de Wechsler comprennent chacune
une épreuve verbale et une épreuve non verbale.

Le W.I.S.C.

Le W.I.S.C est une suite logique de l’échelle Wechsler-Belle vue utilisée pour adolescents et Adultes. C’est
une batterie de tests d’intelligence pour enfants de 5 à 15 ans. La plupart des items ont été tirés de la forme
II des échelles antérieures. Mais de nouvelles questions ont été ajoutées au début de chaque test (rubrique)
pour permettre l’examen des enfants dès l’âge de 5 ans. Le W.I.S.C est un test individuel et chronométré.

On utilise le QI standard qui est lié directement à la distribution normale.

1. Structure de l’échelle (W.I.S.C.)


Le WISC est composé de 12 tests répartis en deux sous-groupes nommés « verbal » et de « performance » :

Groupe Verbal Groupe de performance

- Information générale - Complètement d’images

- Compréhension générale - Arrangement d’images

- Arithmétique - Cubes

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 55 sur 79
P a g e | 56

- Similitudes - Assemblage d’objets

- Vocabulaire - Code

- Mémoire des chiffres - Labyrinthes.

2. Classification intellectuelle de wechsler.

Q.I Standard Classification

130 et plus Très supérieur

120 à 129 Supérieur

110 à 119 Normal fort

90 à 109 Moyen

80 à 89 Normal faible

70 à 79 Limite

69 t moins Débile.

1. L’Echelle de performance de Grâce ARTHUR.

L’Echelle de performance de Grâce ARTHUR est utilisée dans certaines circonstances lors de l’examen des
sujets handicapés de la parole (muets) ou de l’ouïe (sourds) ou lors de l’examen des sujets inhibés ou de
langues étrangères.

La version originale remonte à 1930 et portait deux formes avec 9 subtests. Sa forme révisée de 1947 et qui
existe en matériel français comporte 5 substests seulement.

Composition de l’échelle.

- Les cubes de Kohs : mesurent l’étendue de la mémoire immédiate et l’organisation des gestes
d’intelligence pratique.
- Les planches de Seguin : ou « test d’encastrement » de SEGUIN Il mesure la rapidité de réactions
psychomotrices et la précision du geste.
- Le test de Healy : ou TEST DE COMPL7TEMENT DE FIGURE DE Healy. Ce test comporte deux
formes. Il s’agit d’une scène ou histoire constituée à partir de 11 figures, pièces ou images ou
images, chacune d’entre elles manquant une partie (images incomplètes).
- Les labyrinthes de Portéus.
- le test des pochoirs (ou Stencil Design Test).
2. Echelle de performance de BORELLI-OLERON.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 56 sur 79
P a g e | 57

Le Borelli-Oléron est un test d’intelligence générale pour enfants anormaux (déficients mentaux) de 5 à 8
ans. Il est aussi utiliser dans l’examen d’enfants normaux inhibés devant les épreuves verbales ou
présentant des difficultés linguistiques (langage).

Composition(7 items) :

- La reproduction des patterns (modèles) de cubes

- La reconstitution des mannequins ;

- L’encastrement des formes géométriques ;

- Le puzzle de Healy ;

- Les cubes de Knox

- La copie en reproduction des dessins géométriques ;

- La reconstruction des cubes d’après figures.

3. Le test des cubes de Kohs (Kohs Block Design).

Créé en 1920 et mis au point en 1923, le test de Kohs est une épreuve non verbale d’intelligence générale et
pratique peu affectée par la culture et la scolarité.

Dans sa version originale (1920) il comprend 16 cubes colorés entre lesquels il faut reproduire 35 modèles
(dessins) de difficultés croissantes. Dès 1923, Kohs ramène la série à 17 modèles devenus classiques.

Dans le manuel de Kohs, la cotation tient compte du succès, au temps et de l’exactitude ; ce dernier facteur
étant mesuré par le nombre de mouvements du sujet au cours de la manipulation des cubes.

Il permet en effet d’évaluer l’expressio analytique et synthétique de la pensée conceptuelle jusqu’à ses
niveaux les plus élevés, l’étendue de la mémoire immédiate et l’organisation des gestes (structuration
spatiale). Ce test permet également un diagnostic rapide de la débilité mentale.

4. Test des cubes tactiles d’Ohkawi-Kohs.

Connaître le degré d’intelligence des aveugles afin de fonder leur orientation scolaire et professionnelle.

Description :

a) Le matériel :
- 16 cubes tactiles identiques mais à 6 faces différentes.
- 18 figures à reproduire ; cubes et figures recouvert des mêmes tissus :

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 57 sur 79
P a g e | 58

 Flanelle de coton, tissu doux et chaud de leinte bleu clair ;


 Toile de lin, rigueuse et sèche de teinte bis ;
 Soie très fine, unie et rouge ;
 Coton de textile inégal, facile à reconnaître avec des rayures roussâtres et bleues ;
N.B : Dix modèles sont à réaliser avec 4 cubes, deux avec 9 cubes, six avec 16 cubes.

b) Passation : individuelle

c) Population : Test applicable aux aveugles de cécité totale de 6 ans à l’âge adulte.

L’âge mental est déterminé en fonction des scores et à partir d’une table des âges mentaux. Le Q.I. est
calculé en divisant l’A.M.

B. LES TESTS COLLECTIFS

1. Army alpha et army bêta examination.

La révision de 1946 de ce dernier test comporte 6 subtests :

- 5 épreuves de labyrinthes (type Porteus) ;


- 6 séries de lettres à coder par des nombres à partir d’un code initial ;
- 20 images fausses où il faut découvrir des absurdités ;
- 18 figures exprimant des relations spatiales à comprendre ;
- 20 images à compléter ;
- 50 items de collationnement qui constituent un test de vitesse de perception.

2. Calofornia Test of Mental Maturity (C.T.M.M)

C’est un test très connu dans les pays occidentaux. Il est construit par année d’étude 1-3 ; 4 -8 ; 7
– 10 ; 9 – adultes. On y considère les aspects suivants : mémoire immédiate et retardée, relation spatiale
dans le sens de gauche et droite, raisonnement logique, raisonnement arithmétique, vocabulaire.

3. Le test B 53 de BONNARDEL

Mis au point en 1953 par le prof. Bonnardel, le test B 53 est une épreuve centrée sur les aspects
dynamiques de l’intelligence. Il est sensible à tous les niveaux intellectuels et, en particulier, les plus
élevés.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 58 sur 79
P a g e | 59

Il comporte un cahier qui contient 65 séries de figures, les cinq premières servant d’exemple. Chaque item
est constitué par deux groupes de figures situées sur la même ligne. Les trois figures de gauche indiquent la
nature de la série. Le sujet doit choisir, parmi les figures de droite, celle qui continue la série.

 Premier exemple : ABC/ SDMUHT


 application : rapide, collective ou individuelle
 Temps de passation : 15 minutes ou libre
 Population : test applicable dans la sélection d’apprentis, d’ouvriers, de programmeurs et
d’analystes, d’ingénieurs, et de tous les autres candidats à des postes professionnels où la réussite
est plus conditionnés par le dynamisme intellectuel que par l’intelligence spéculative et
contemplative.
 Notation : l’épreuve est notée 1 point par réponse juste. La note globale correspond, en temps
imposé, au nombre de bonnes réponses données en 15 minutes.

4. Test Mosaïque de R. GILLE

Test papier-crayon d’intelligence générale, mis au point en 1944 par René GILLE et destiné aux enfants de
5 à 14 ans.

Composition : cahier de 62 questions présentées sous forme d’images et constituant autant de petits
problèmes dont la solution met en jeu des connaissances acquises, de comparaison de poids, d’espace, de
dimensions, de vitesses, des quantités, d’âges, la distinction extérieure-intérieure et droite-gauche, des
classements, des analogies, des similitudes, des repérages de lacunes, des jugements de valeur, du calcul
mental, des séries de figures à compléter.

5. Les tests D 48 et D 70 (Test de dominos)

A) le D 48 est un test non verbal d’intelligence général, à forte saturation en facteur g. Il a été mis au
point par psychiatre français PICHOT, en 1948, à partir du test Dominos de l’armée Britannique, conçu par
l’Anglais ANSTEY. Il s’agit d’une épreuve parallèle au Matrix 38.

La tache du sujet consiste à découvrir d’abord la loi ou règle qui domine la série et à compléter en suite
cette série en écrivant sur la feuille de réponse le nombre de points correspondant au dernier domino. Le
test applicable à partir de 12 ans.

Spécificité : dans le D 70, les lois ont été variées de façon plus systématique, parfois sous forme combinée,
ce qui rend les problèmes plus difficiles que dans le D 48. On a modifié la disposition du dernier domino.

- Application : individuelle ou collective


- Temps : 25 minutes
- Population : application aux jeunes gens à partir de 18 ans à l’âge adulte, y
compris les adultes de niveau intellectuel supérieur.
- Notation : feuille de réponse, grille de correction. La note est le nombre total

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 59 sur 79
P a g e | 60

- Interprétation : se fait en fonction des étalonnages disponibles, présentés en 10


classes normalisées (déciles), triées par classe d’âge, niveaux culturels et
professionnels.

9. Les standard Progressive Matrices au Matrix 38.

Il s’agit en fin de compte d’un test d’intelligence abstraite ( facteur g de spearman), conçu pour
ouvrir le champ total du développement intellectuel des individus.

La première version expérimentale a été établie en 1936 par deux Anglais J.C. RAVEN et L.S.
PENROSE. Elle a été révisée et standardisée en 1938 (MATRIX 38). Conçu à l’origine pour des adultes et
des adolescents de niveau moyen, ce test a donné lieu à des extensions : deux Révisions de 1947 (Matrix
1947 et 1947e) ont étendu ce test aux enfants de 3 à 10 ans ainsi qu’aux débiles légers et profonds et aux
analphabètes (Matrix 1947e ou les problèmes sont imprimés sur fond de couleur), aux adultes de niveau
supérieur à la moyenne (PMA – T 1947). Advenced Progressive Matrices qui comprend deux séries I et II.
En 1956, on a fait la révision de l’ordre des items.

Descriptions du Matrix 38.

Le Matrix 38 comporte cinq séries (A B C D E) de 12 problèmes. Ces problèmes sont :

- Pour série A : 12 treillis de figures auxquelles manque n morceau indiqué par un blanc, à retrouver dans
six figures présentées en bas de page.
- Pour série B : 12 groupes de 4 figures auxquels manque une quatrième figure à retrouver dans six
figures présentées en bas de page.
- Pour les séries C,D et E : 36 groupes de 9 figures auxquels manque une neuvième figure, à retrouver
dans 8 figures présentées en bas de page. N.B : ces trois dernières séries mettent en jeu des capacités
logiques (analogie, permutation, alternance de structure…)
- Application :
 applicable aux:
- candidats à des postes administratifs ( à partir de la sténo-dactylo) ;

- candidats moniteurs de formation Professionnelle des adultes ;

- licenciés d’études supérieurs ;

- recrues militaires ;

- filles de salle en hôpital psychiatrique

- lycéens…

- Temps : libre ou 45 minutes

- Population : adolescents et adultes de niveau moyen

- Notation et interprétation : la note est constituée par le nombre de bonnes réponses. Elle peut
être interprétée sur un étalonnage en centiles.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 60 sur 79
P a g e | 61

10. Culture-free Intelligence Test de R.B. Cattell

Après la 1ère Guerre mondiale, il y a eu beaucoup d’émigrants aux U.S.A. les psychologues américains
étaient désireux de connaître leur niveau mental (Q.I). Pour ce faire, R.B. CATTELL et son équipe ont mis
au point en 1940, un test papier-crayon présenté initialement sous le titre « culture-Free Intelligence Test ».

Temps : 25 minutes dont 14 minutes de travail effectif

Population : Echelle 1 pour – enfants de 8 à 12 ans débiles et adultes internés.

III. TESTS MULTIFACTORIELS D’INTELLIGENCE

Les tests qui exploitent un seul aspect de l’intelligence sont dits « Tests unifactoriels ou spécifiques ». Par
contre, les tests miltifactoriels (ou batteries factorielles) sont ceux qui mesurent plusieurs aspects à la fois.
Ils sont composés de tests d’intelligence générale et de tests d’aptitude choisis à partir d’une analyse
factorielle faite sur base d’un tableau d’intercorrélations entre de nombreux tests ayant des facteurs
communs. Parmi ces batteries, les plus connues sont :

A. LE P.M.A : ( Primary Mental Abilities)

Connu en français sous le titre de « Batterie Factorielle d’Aptitude Mentales Primaires », le P.M.A est un
test construit en 1941 par le couple LL. THURSTONE et G.T. THURSTONE à partir d’analyses
factorielles menées depuis 1932 au laboratoire Psychométrique de Chicago.

Thurstone est l’inventeur de la « Méthode centroïde » employée dans l’analyse factorielle ; cette méthode a
permis d’extraire 12 facteurs de groupe nommés « aptitudes mentales primaires » dont les plus connus
sont :

N facteur numérique R facteur de raisonnement

V facteur de compréhension verbale M facteur de mémoire

S facteur spatial Mo facteur de motricité

W facteur de fluidité verbale P facteur de vitesse de perception

Le P.M.A n’inclut pas tous les 12 facteurs.

Tableau

Groupe d’âge

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 61 sur 79
P a g e | 62

5 – 7 ans Mo P N R V S

7 – 11 ans Mo P N R V S

11 – 17 ans Mo P N R V S W

B. Le D.A.T (Differential Aptitude Tests).

En français: Batterie factorielle d’aptitudes différentielles, ce test fut élaboré par BENNET, H.
SEASHORE et A.G. WESMAN, le D.A.T et publié pour la première fois aux U.S.A en 1947 par The
Psychological Corporation. Il fut traduit et adapté au Canada par CHEVRIER en 1963.

Le D.A.T comprend 8 sous-tests :

1. le test de raisonnement :
2. le test d’Aptitude Numérique :
3. le test de Raisonnement abstrait ou épreuve logique non verbale
4. Le test de relations spatiales ou d’habiletés perceptuelles.
5. le test de raisonnement mécanique ou sens de la mécanique
6. le test de sens de bureau.
Le test a 2 parties de 100 items à 3 minutes chacune.

7. le test d’orthographe.
8. le test règles grammaticales
N.B : Le DAT concerne particulièrement l’orientation scolaire.

E. LA G.A.T.B. (General Aptitude Test Battery)

La GATB est une batterie des tests d’aptitude destinée principalement à résoudre les cas d’orientation
professionnelle (vocational guidance) bien qu’elle puisse être appliquée à certains problèmes d’orientation
scolaire dans l’enseignement technique. Elle fut mise au point aux services américains de l’emploi (Bureau
of Employment Security) œuvrant sous la direction de DVORAK en 1956. Elle a déjà été adapté dans
plusieurs pays (Suisse, Belgique, …)

1. Structure générale
La GATB est composée de 12 tests sélectionnés qui constituent de bonnes mesures de neuf aptitudes
considérées comme importantes pour la réussite dans une large variété d’occupations professionnelles.

- 8 tests papier-crayon.
- 4 tests d’appareil

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 62 sur 79
P a g e | 63

Chacun de ces 12 tests est numéroté de 1 à 12 ; les tests papier-crayon, de 1 à 7, sont rassemblés dans une
couverture cartonnée. Le test 8 est une feuille séparée ; les tests 9 et 10 comportent l’emploi du tableau à
chevilles ; les tests 11 et 12 comportent l’emploi du tableau de dextérité digitale. Il faut 2 heures 15 minutes
pour l’administration complète de la GATB.

TABLEAU

Aptitude Tests Nature

G. intelligence 3 Figures à trois dimensions

4 Vocabulaire

6 Raisonnement arithmétique

V. Aptitude 4 Vocabulaire
verbale

N. Aptitude 2 Calcul
numérique
6 Raisonnement arithmétique

S. Aptitude 3 Figure à trois dimensions


spatiale

P. perception de 5 Comparaison outil


forme
7 Comparaison de forme

Q. Sens 1 Comparaison de noms


administratif

K. Coordination 8 Traçage de traits


motrice

F. Dextérité 11 Assemblage
digitale
12 Désassemblage

M. Dextérité 9 Placement de cheville


manuelle
10 Retournement de cheville.

IV. TESTS DE CREATIVITE

Quand on parle de la créativité, on fait souvent l’association d’idées avec les termes comme imagination,
découverte, invention, création, production divergente. Selon le Dictionnaire de Psychologie de Sillamy, la
créativité est la disposition à créer qui existe à l’état potentiel chez les individus et à tous les âges,
étroitement dépendante du milieu socio-culturel. Cette tendance naturelle à se réaliser nécessite des
conditions favorables pour s’exprimer (la crainte de la déviation et le conformisme social sont le carcan de
la créativité).

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 63 sur 79
P a g e | 64

1. LES TESTS DE CREATIVITE DE GUILFORD.

Pour Guilford, la créativité correspond à la tranche de production divergente ; il insiste sur les facteurs de
fluidité, flexibilité et d’originalité.

1. La fluidité verbale (pDSU)


a) Test de préfixes ou de suffixes : le sujet doit écrire une liste de mots commençant ou se terminant
par une lettre donnée.
b) Test de liste des mots : le sujet écrit des mots contenant une certaine lettre.
c) Test de rimes : le sujet présente une liste de mots rimant avec un mot donné.

2. La fluidité idéationnelle (pDMU)


a) Le test d’utilisations inhabituelles : le sujet établit la liste des usages d’un objet donné (une brique),
le score étant le nombre total de réponses

b) le sujet cite des objets ayant une ou deux qualités communes par exemple, des objets à la fois solides
et comestibles.

5. L’originalité (pDMT ou pDMU)

a) Test de conséquences : écrire toutes les conséquences aux quelles cous pourrez penser d’une
situation comme celle-ci : « les gens n’ont plus besoin de dormir pour vivre ».
b) Test d’utilisations inhabituelles, mais c’est le mode de score qui permettra de mesurer l’originalité.
c) Test de titre d’histoire : présenter une histoire très courte et lui demander de donner des titres
ingénieux et drôles. Le score est basé sur l’ingéniosité des réponses appréciées par plusieurs juges.

6. La sensibilité aux problèmes.

Ce facteur n’entre pas dans la production divergente, mais bien dans le modèle appelé « Evaluation ou
jugement (voir Bloom). On utilise « Le test de perception de problèmes ». On donne au sujet le nom d’un
objet ordinaire (une boîte en carton, un arbre) puis on lui demande de poser des questions intéressantes et
originales au sujet de l’objet en question.

2. BATTERIE DES TESTS DE TORRANCE (ou tests de pensée créative).


La batterie se compose de 10 épreuves : 7 verbales et 3 figurales. Elles peuvent être administrées à des
groupes de 20 à 25 sujets. Toutes les épreuves sont chronométrées : durée totale de passation 1h10’.

Epreuves verbales.

1. le jeu I : consiste à montrer au sujet une image assez complexe, à partir de laquelle on lui demande
de poser des questions pour s’informer de la situation présentées dans l’image (on considère les
questions pertinentes).
2. le jeu II : on demande au sujet de deviner les causes de la situation présentée.
3. le jeu III : on lui demande de deviner les conséquences de la situation

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 64 sur 79
P a g e | 65

4. le jeu IV : on lui présente un objet (un éléphant en peluche) et lui demande d’énumérer toutes les
améliorations ou toutes les transformations qu’il peut trouver pour rendre ce jouet plus drôle ou
plus amusant.
5. le jeu V : les utilisations inhabituelles (voir Guilford). Torrance utilise une boîte en carton ou une
boîte à conserve.
6. le jeu VI : le sujet est invité à poser des questions sur cette boîte en carton ou de conserve.
7. le jeu VII : test de conséquences de Guilford : on lui propose une situation tout à fait improbable et
lui demande d’en tirer toutes les conséquences possibles.

Epreuves figurales.

1) composition d’une image ou d’un tableau original. A partir d’une forme donnée (en couleur), on
demande au sujet de compléter, d’ajouter traits et lignes au crayon pour composer une image
originale, intéressante et qui, en quelque sorte, racontera une histoire.
2) Test de complètement des figures. On donne dix (10) figures différentes composées chacune d’un
ou de deux traits droits ou courbes. Le sujet doit compléter ces figures pour en faire des
représentations précises dont, par ailleurs, on lui demande le titre.
3) La dernière épreuve figurale consiste à présenter une série de cercles à partir desquels le sujet doit
dessiner, en ajoutant lignes et traits une image représentant un objet ou une image dont on lui
demande de donner le nom ou le titre.

Remarques : on élabore trois scores

a) le score de fluidité (quantité) : c’est le nombre de réponses pertinentes données par le sujet, c’est –
à-dire les réponses qui ont un rapport avec la question ou le problème posé.
b) Le score de flexibilité (variété) : il s’agit du nombre de catégories dans lesquelles on peut classer
les réponses données par le sujet.
c) Le score d’originalité. Wilson, Guilford et Christenses ont élaboré trois méthodes de mesure de
l’originalité en fonction de trois définitions suivantes :
 L’originalité : rareté d’une réponse dans un groupe donné. Ici la mesure est statistique. Toutes les
réponses sont groupées dans cinq classes selon leur fréquence d’apparition et affectées d’un indice de
fréquences allant de 1 à 5 c'est-à-dire des réponses plus fréquentes aux réponses rares.
 L’originalité : capacité à produire des associations indirectes, à percevoir des relations éloignées entre
des objets dans l’expérience courante. Le score total est le nombre d’association faites par le sujet et
l’originalité est définie par la notion de relation éloignée et apparente.
 L’originalité : capacité à produire des réponses jugées ingénieuses : tois juges classent les réponses en
cinq catégories selon le degré d’ingéniosité de chaque réponse. Un indice d’ingéniosité est ainsi
attribué à chaque réponse et obtient un score total d’originalité pour le sujet.

3. EPREUVE DE CREATIVITE DE MEUNIER

Il a été mis au point en 1970 par G. MEUNIER. Il est utilisé en orientation professionnelle pour déceler les
sujets doués de capacité créatrices et, en sélection du personnel pour l’affectation à des postes où il est
nécessaire de faire preuve d’imagination.

. Il se présente sous forme de jeu : 4 jeux de huit figures de carton noir découpé, réalisées à partir de figures
simples (cercles, losange, triangle) qu’on a déformées pour leur enlever le caractère géométrique.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 65 sur 79
P a g e | 66

VII. TESTS D’APTITUDE OU TESTS D’HABILETES SPECIALES

Ce sont des épreuves qui permettent de mettre en évidence les aptitudes ou les talents d’un individu en vue
de prédire sa performance future dans une tâche déterminée. Ils sont utilisés pour l’examen, la sélection et
l’orientation des individus dans la vie professionnelle.

 Test d’Aptitude mécanique


 Tests d’administration (Clerical Tests).
 Tests de coordination et de dissociation sensori-motrice
 Tests de motricité et de dextérité digitale.
 Tests d’attention.
 Tests d’aptitude spatiale
 Tests d’aptitude artistique.
 Tests d’aptitude musicale
 Tests d’audition

VIII. TESTS DE PERSONNALITE

La personnalité est connue comme l’organisation dynamique des aspects cognitifs, affectifs, conatifs. La
personnalité est une réalité complexe résultant du fonctionnement de tous les aspects de chaque être
humain. C’est, en fin de compte, la manière d’agir et de réagir propre à chaque individu.

Projection.

La conception psychanalytique de la personnalité souligne l’importance de conflits intrapsychiques qui


opposent le « ça » au « moi ». Les instincts sont communs à tous les hommes, mais la manière dont le moi
réalise son adaptation individualise chaque homme.

Dans les tests de personnalité, dits de projection, qui utilisent la tendance de tous les instincts refoulés à
s’extérioriser « à se projeter ».

Types de projection.

1. la projection spéculaire (speculum : miroir) : le sujet retrouve dans l’image d’autrui les
caractéristiques qu’il prétend et qu’il voudrait être siennes.
2. la projection cathartique (purification, décharge).
3. la projection complémentaire (Allport).

A. Les techniques projectives.

Les techniques projectives présentent, par rapport aux autres certaines particularités : il n’y a pas de
réponse juste ni de réussite, mais une grande variété de réponses possibles, le sujet ne connaît pas la
signification ni l’importance de sa réponse et il n’y a pas de temps imposé. Sa réponse devra être
interprétée par un psychologue spécialiste en matière.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 66 sur 79
P a g e | 67

Le matériel est ambigu, c’est-à-dire un matériel où toutes les interprétations sont possibles (formulation de
la tâche, temps accordé, manière de répondre). Les consignes sont les plus larges, les plus vagues et
vraiment non directives.

Dans la pratique, on distingue deux types de tests projectifs :

a) Les tests projectifs structuraux (du type Rorschach) :


Ces tests donnent une sorte de vue radiologique de l’ensemble de la personnalité. Ils assortissent une coupe
représentative de l’organisation du système de personnalité, des dispositions comportementales, des
mécanismes de défense, de l’équilibre physique, de la façon d’appréhender le monde et ses formes.

b) Les tests thématiques (du type T.A.T.)


Ce sont des tests qui révèlent le contenu significatif d’une personnalité : nature des conflits, besoins
fondamentaux, réaction à l’entourage, fantasmes habituels, moments-clé de l’histoire vécue (régression),
etc.

i. Le test de Rorschach
H.Rorschach, psychiatre Suisse, est né à Zurich en 1884. il est mort en 1922.

Il est composé de 10 planches sur lesquelles figurent des tâches d’encre symétriques. Cinq planches sont
colorées (2, 3, 8, 9 et 10), les cinq autres sont en noir-gris-blanc. Ce test fut inventé en 1921.

Consigne : On présente une planche au sujet et on lui demande de dire ce que la tâche d’encre pourrait
représenter. Ses réactions sont observées et ses réponses permettent de la classer selon trois critères utilisés
par Rorschach et correspondant aux trois problèmes suivants :

1.- La localisation ou modes d’appréhension : le sujet voit-i l’ensemble ou plutôt les détails de la tâche ?

2.- Les déterminants : perçoit-il plutôt la forme, la couleur ou l’image d’un mouvement ?

3.- Le contenu : quel est le contenu des interprétations du sujet ?

Dans la notation et le dépouillement on tient au compte de la localisation, du déterminant, du contenu, de


l’originalité, de la banalité et de la succession des réponses.

1) La localisation ou modes d’appréhension.


G : interprétation globale ;

D : détail normal ;

Do : détail oligophrène ou inhibitoire ou interprétation fragmentaire ;

Dd : petits détails ou détails rares ;

Dde : petit détail extérieur ;

Ddi : petit détail intérieur ;

Ddc : petit détail central ;

Dbl : détail intermaculaire ou interprétation du fond blanc.

2) Les déterminants des interprétations (réponses).


On distingue l’interprétation de la forme, de la couleur du mouvement et du clair-obscur.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 67 sur 79
P a g e | 68

a) Forme « F »
b) Couleur « C »
c) Mouvement ou Kinésithérapie « K ».

On note :

- K : interprétation d’hommes vus en mouvement


- Kan : interprétation d’animaux vus en mouvement
- Kobjet : interprétation d’objets vus en mouvement.
d) Clair-obscur (Clob)
3) Le contenu des interprétations.
On note :

H : si l’interprétation concerne l’être humain pris globalement ;

Hd : détail d’un être humain ;

(H) : parahumain

A : contenu animal interprété globalement ;

(A) : paraanimal
Ad : détail ou partie d’animaux ;

Obj : si le contenu porte un objet.

Anat - anatomique

Sex - sexe

Nat - nature (rocher, pierre, eau, montagne…), etc.

4) Banalité et originalité des interprétations.


5) Notion de succession.
a) La succession rigide (cas idéal) :
b) La succession ordonnée
c) La succession relâchée
d) La succession incohérente
e) La succession renversée.

3.2.2 Le Thematic Aperception Test (T.A.T) de MURRAY

Le T.A.T est une méthode destinée à révéler les composantes fondamentales de la personnalité ainsi que les
tendances fondamentales refoulées que le sujet ou le malade a de la peine à admettre (pulsions, émotions,
sentiments, complexes, conflits)…

En 1943, il a produit la forme définitive.

Objet : c’est de faire inventer des histoires en rapport avec les tableaux des images présentées en vue de
l’évaluation de la personnalité du sujet.

Matériel : le T.A.T actuel comporte 20 planches portant des images d’un ou des personnages en
situation. Il y a des planches pour garçons de moins de 14 ans, pour filles de moins de 14 ans,

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 68 sur 79
P a g e | 69

pour filles et garçons, pour les hommes et pour les femmes. Certaines planches sont communes
aux deux sexes, d’autres sont utilisables pour tous.

B M (Boy and Male : Garcons et Homme)

G F (Girl and Female : Fille et Femme)

M (Male): sujet masculin au-delà de 14 ans

F (Female) : sujet féminin au-delà de 14 ans

B (Boy) : Garcon de moins de 14 ans

G (Girl) : Fille de moins de 14 ans

B G (Boy and Girl) 14 ans

Administration

- l’application du T.A.T est très simple; on divise l’ensemble de planches en deux


sessions, 10 planches pour chacune.
- L’examinateur présente au sujet une série de planches, une à une, et donne la
consigne suivante :
« je vais vous présenter une série d’images l’une après l’autre. Vous devez inventer une histoire pour
chacune d’elles en imaginant ce qui a procédé ou entraîné la situation et ce que en a été le dénouement »

- on prévoit habituellement deux séances, par exemple les deux jours successifs.
- le sujet est d’habitude assis devant l’examinateur. Si le sujet est adulte, l’examinateur peut
tourner le dos ou utiliser un lit long pour lui permettre d’être plus à plus à l’aise, plus relaxé,
plus allongé.

Interprétation du T.A.T

Plusieurs systèmes d’interprétations ont été mis au point aux U.S.A et en EUROPE (Murray,
Bellak, Henry, Tomkins, Wyatt, Aron et Shentoub) : on examinera l’interprétation selon 3 écoles plus la
feuille de dépouillement abrégé de BELLAK : Ecoles de MURRAY, TOMKINS et de PIOTROWSKI.

II. LA FEULLE DE DEPOUILLEMENT ABREGE DE BELLAK


Pour la notation et l’interprétation du T.A.T et du C.A.T. Elle comporte les 10 points suivants :

1. le thème principal
2. le héros principal (âge, sexe, traits, images du corps…)
3. les besoins principaux du héros
4. les performances, les objets et les circonstances
5. la conception de l’environnement (personnages parentaux, personnages de même âge que le
sujet, les personnages plus jeunes que le sujet).
6. les conflits significatifs
7. la nature des anxiétés
8. les principaux mécanismes de défenses du moi contre les conflits et les craintes
9. la sévérité du surmoi
10. l’intégration du moi (créativité et situation de l’intrigue).

3.2.4 Le test de SZONDI

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 69 sur 79
P a g e | 70

Elaboré en 1947 par un Psychiatre Hongrois Lipot SZONDI, ce test permet de déceler les principales
pulsions d’un sujet, d’où son appellation de « diagnostic expérimental des pulsions de L. SZONDI ».

Le matériel comporte 6 séries (ou jeux) de 8 photos d’hommes qui ont été déjà identifiés par des
psychiatres comme homosexuels, sadiques, hystériques, catatoniques, paranoïques, déprimés, maniaques,
etc. L’épreuve consiste pour le sujet et pour chaque jeu de choisir 2 photos qu’il préfère et deux photos
qu’il aime le moins (chaque jeu est composé de 8 images).

Administration : individuelle, en 15’, à partir des sujets de 4-5 ans.

Description du matériel.

L’épreuve comporte 6 séries (ou jeux) de 8 photographies. Ces photos représentent des malades qui
correspondent aux 8 facteurs pulsionnels.

3.2.5 Le test de frustration de Saul ROSENZWEIG

Le test de Rosenzweig appelé «Picture Association study for assossing to frustration », en abrégé P.F. test
(PICTURE FRUSTRATION STUDY), est une épreuve de complètement de dialogue qui explore un aspect
particulier de la personnalité : la frustration. C’est un procédé destiné à révéler les types de réactions aux
« stress » de la vie courante. Il a été élaboré sur une théorie psychanalytique de frustration découverte par
Rosenzweig (1934). Selon cette théorie, il existe trois niveaux de défenses psycho-biologique qui se
compénètrent :

Description de l’épreuve.

Le P.F test comporte une série de 24 dessins représentant chacun deux personnages placés dans
une situation de frustration du type courant. Le personnage placé à gauche parle dans une bulle (carré)
décrivant soit sa propre frustration, soit celle de son interlocuteur. Le personnage à droite a, au dessus de
lui un carré. L’épreuve consiste pour le sujet « à inventer le contenu du carré vide en notant mentalement la
première réponse qui lui vient à l’esprit et qui serait susceptible d’être formulée par le personnage de droite
en réponse à celui de gauche. On suppose que le sujet testé s’identifie à la personne et sa façon de répondre
à la frustration se manifeste dans les réponses.

Administration

La passation est individuelle et à temps illimité. Après avoir lu les instructions, l’examinateur demande au
sujet de travailler aussi vite qu’il pourra.

Le sujet de son coté, lit les mots prononcés par le personnage de gauche, et après il inscrit la réponse dans
la case réservée à cet effet.

Dépouillement et cotation du test :

Chaque réponse est cotée en fonction de deux aspects essentiels : direction de l’agression et type de
réaction.

- pour le premier point :


 l’agression peut être tournée vers l’extérieur appelée réponses extra punitives : ce
sont des réponses dans lesquelles le sujet attribue agressivement la frustration (tort) à
des tiers ou à des choses extérieures à lui (colère, irritation)(E )

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 70 sur 79
P a g e | 71

 l’agression peut être tournée vers l’intérieur (vers soi-même : le moi). Cette réponse
est appelée réponse intro punitive : ce sujet attribue agressivement la frustration à
lui-même (la culpabilité, le remords) (I)
 L’agression peut être écartée : réponses impunitives (M). il y a un essai d’éviter de
formuler une réponse soit aux autres, soit à soi-même.
- comme types de réactions ; l’auteur en distingue 3. L’agression peut prendre la forme :
1) d’un blocage (prédominance de l’obstacle : 0 – D),
2) d’une défense de l’organisation du comportement (défense du moi, Ego-défense : E – D),
3) d’une recherche de solution (persistance du besoin : N – P).

3.2.6 Le test de l’arbre de Koch

3.2.7 Le test du dessin de famille de Louis CORMAN

3.2.8 Le D4 ou dessin à quatre éléments

3.2.9 La méthode des fables de Louisa DUSS

3.2.10 Le test de la pyramide colorée de Max PFISTER

b. INVENTAIRES OU QUESTIONNAIRES DE PERSONNALITE


Les inventaires de personnalité sont des questionnaires standardisés destinés à recueillir un très grand
nombre d’informations psychologiques, culturelles et médicales sur les personnes qui y répondent. Le
questionnaire cherche ainsi à faire l’inventaire de certains traits de personnalité.

Selon le nombre des traits, on distingue :

a) les questionnaires uniphasiques : sont ceux qui explorent un seul trait de personnalité. Ex : -A.S.
Reaction Study d’Alloport, - le test de Masculinité – Féminité de Terman et Miles
b) les quastionnaires multiphasiques : ils permettent d’obtenir simultanément des notes pour
plusieurs traits. Ex : - Inventaire de personnalité de BERNREUTER, -16 P.F de cattell (16
personnality factors).
1. Inventaire multiphasique de personnalité de Minnesota (MMPI) (1940).
Le MMPI (Minnesota Multiphasic Personnality Inventory) est un instrument psycho-métrique monté aux
USA par HATHAWAY et Mc KINLEY et destiné à fournir, dans le cadre d’un seul test, des évaluations
précises des principaux éléments de la personnalité. Il comprend 550 items recouvrant des vastes champs
d’intérêts depuis la condition physique et physiologique jusqu’aux conduites sociales et aux attitudes
morales des individus examinés.

L’épreuve consiste à classer 550 propositions dans trois catégories (vrai, faux, je ne sais pas).

Les réponses aux différents items peuvent être classées sur 4 échelles de validité et 9 échelles cliniques
correspondant aux tendances suivantes : hypocondrie, dépression, hystérie, déviation psychopathique,
masculinité-féminité, paranoïa, schizophrénie, psychasthénie et hypomanie.

1) L’échelle d’hypocondrie (Hs) : elle mesure le taux normal d’intérêt porté aux fonctions corporelles.
2) L’échelle de dépression (D) : mesure la profondeur du symptôme de dépression (découragement,
état de fatigabilité)

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 71 sur 79
P a g e | 72

3) L’échelle d’hystérie (Hy) : mesure le degré de ressemblance du sujet avec les malades qui ont
manifesté des symptômes hystériques
4) L’échelle de déviation psycho-pathique (Pd) : mesure la ressemblance du sujet avec un groupe
d’individus qui manifestent leur incapacité à profiter de l’expérience. Pépère les individus qui un
jour peuvent commettre des actes délictueux.
5) L’échelle d’intérêt (Mf) : mesure la tendance vers la masculinité ou la féminité d’une structure
d’intérêt
6) L’échelle de paranoïa (Pa) : mesure le degré de ressemblance du sujet avec un groupe de malades
caractérisés par la méfiance, un orgueil exagéré, l’égoïsme et la susceptibilité.
7) L’échelle de Psychasthénie (Pt) : mesure le degré de ressemblance du sujet avec un groupe de
malades qui souffrent de phobies. Permet de détecter l’anxiété.
8) L’échelle de schizophrénie (Sc) : elle mesure la similitude des réponses du sujet avec celles des
malades caractérisés par les pensées et les comportements inhabituels. Tendance d’éviter le contact
avec autrui.
9) L’échelle d’hypomanie (Ma) : mesure les facteurs de personnalité caractérisant les personnes
atteintes d’hyperactivité en pensée et en action.
Mode d’utilisation

- Le MMPI a deux formes : individuelle et collective.


- Le temps de passation est de 1h00’ à 1h30’.
- Application : A partir de 16 ans. Il y a 550 fiches portant chacune une proposition.
Le sujet a pour tâche de classer ces fiches-propositions dans trois catégories.

2. Inventaire multiphasique de Bernreuter.


Créé entre 1930-1931, il mesure six traits de personnalité à partir de 25 questions à réponses : oui, non ?

- La tendance névrotique (instabilité de l’émotion)


- La tendance à se suffire à soi-même (self-sufficiency) goût de la solitude ;
- L’introversion-extraversion : consistant à vivre retiré en soi-même ou à chercher la compagnie
d’autrui, les rapports personnels ;
- La domination-soumission : tendance à dominer, à diriger ou à vouloir se soumettre ;
- La confiance en soi (trait ajoutés par John C. Flanagan et considérés comme (traits, facteurs)
indépendants.
- La sociabilité
La passation demande un niveau de culture moyen. Il existe un étalonnage français de sujets masculins de
19 à 25 ans, de culture secondaire ou supérieure.

4. Le 16 P.F de Cattell

Le 16 P.F. « 16 Personnality Factor Test » est un inventaire mis au point en 1950 par Cattell, Saunders et
Stice à l’institut d’étude de la personnalité et des attitudes à Illinois (Institute for Personnality and Ability
Testing). Il a été adapté en France (1952) par le centre de Psychologie appliquée. Le 16 PF mesure les 16
facteurs suivants : cyclothymie- schizothymie ;- intelligence générale- défiance mentale ;- force de moi-
névrotisme ;- ascendance-soumission ;- expansivité - non expansivité ; caractère affirmé-caractère
dépendant ; cyclothymie audacieuse-schizophrénie essentielle de repli sur soi-même ; sensibilité
émotionnelle-rudesse de maturité ; méfiance inquiète -méfiance calme ; suffisance indépendante – manque
de résolution ; contrôle de la volonté – stabilité de caractère ; tension nerveuse. Il comporte deux autres
facteurs : D : tempérament flegmatique-excitabilité ; J : goût pour l’activité en groupe- individualisme
délicat).

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 72 sur 79
P a g e | 73

4. Questionnaire caractérologique de G. Berger


Dans son « traité de Caractérologie ». Le Senne définit le caractère comme suit : « c’est le noyau des
dispositions foncières, reçu de l’hérédité, congénitales, qui constitue la substructure (squelette mental)
somatopsychologique d’un individu ».

L’école de Gronigue retient trois propriétés constitutives du caractère (l’émotivité, l’activité et le


retentissement) et Berger y ajoute deux facteurs complémentaires (la largeur du champ de conscience et la
polarité) ainsi que 4 facteurs de tendance (avidité, intérêts sensoriels, tendresse et passion intellectuelle). La
combinaison de ces trois traits principaux conduit à l’identification de 8 types psychologiques :

EAS : Passionné nEnAS : Apathique

EAP : colérique nEnAP : Amorphe

EnAS : sentimental

EnAP : Nerveux

nEAS : flegmatique

nEAP : sanguin

Il y a 90 questions réparties en 9 séries de 10. Chaque question est double parfois triple (elle décrit deux
comportements nettement opposés et, dans certains cas, un troisième comportement intermédiaire).

5. Questionnaire d’estime de soi


C’est un questionnaire, élaboré par Janis et Field en 1958 (Feelings of Inadequancy) sur la population
américaine. Il a été adapté à la population française par Rime et Leyens (1974-1975). L’estime de soi est la
valeur qu’un individu attribue à sa propre personne.

IX. ECHELLES D’ATTITUDES ET QUESTIONNAIRES D’INTERETS.

Les échelles d’attitudes sont des instruments de recherche dont l’importance dans les études sociologiques,
économiques (publicité), politique (propagande), pédagogique et psychologiques est considérable. Ils
concernent le domaine de l’opinion publique.

Les questionnaires d’intérêts cherchent à décrire la personne sous le seul angle de ses motivations pour telle
activité. Ils jouent un rôle important dans l’orientation professionnelle et scolaire.

4.2. Les échelles d’attitudes


Il y a association d’idées entre les termes attitude, opinion, sentiment et ressentiment. D’après
THURSTONE, l’attitude est une disposition interne à agir ou à réagir sous l’impulsion d’un sentiment
(positif ou négatif) et du ressentiment. C’est le degré du ressentiment qui est lui-même attaché à un objet
psychologique (objet d’attitude).

L’attitude est donc une attente, une disposition, un schème dynamique qui pousse à l’action, et cette action
se fait sous l’impulsion du sentiment ou du ressentiment. L’opinion elle, est l’expression verbale ou
gestuelle de l’attitude.

Caractéristiques ou dimensions de l’attitude


- La direction : on est pour ou contre l’objet d’attitude
- Le degré : est exprimé par l’étendue de l’attitude
- L’intensité : indique à quel point l’attitude est importante pour le sujet

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 73 sur 79
P a g e | 74

- La cohérence : marque la relation entre les attitudes et les opinions d’une part, les attitudes et les
comportements réels d’autre part.
- Le jaillissement ou influences : indique la mesure dans laquelle l’attitude influence le
comportement réel de l’individu :

1.- Echelle de THURSTONE ou échelle à intervalles apparaissant égaux.


2.- Echelle de LIKERT ou méthode de classements additionnés.
3.-Echelle de distance sociale de E. BOGARDUS

Elle est destinée à mesurer la distance sociale, c'est-à-dire le degré d’acceptation ou de rejet qui existe entre
un individu particulier et un groupe d’individus considéré comme un ensemble ; pas d’un individu à un
autre individu ou à un groupe d’individu ou considérant particulièrement un individu connu bon ou
mauvais de ce groupe.

L’échelle se présente sous forme d’un tableau à double entrée portant en abscisses les noms de différents
groupes humains (ex : Tanzanie, Ruandais, congolais, Togolais, congolais, Ougandais…) et, en ordonnés 7
propositions exprimant ou caractérisant les types de rapports que le sujet répondant aimerait entretenir avec
les individus appartenant à ces groupes.

4.2. Les questionnaires d’intérêts


Il est malaisé d’établir une distinction nette entre l’attitude et l’intérêt. L’intérêt exprime relation de
convenance entre les tendances (ou besoins) du sujet et les objets (ou activités) susceptibles de satisfaire
ces besoins. Les intérêts varient avec l’âge du sujet, sa formation ; et les facteurs sociaux de son milieu
propre

D.E. SUPER a étudié le premier comment identifier et grouper les intérêts, il en distingue les 3 groupes
suivants :

a) les intérêts exprimés : on peut les identifier en demandant au sujet de dire, d’écrire ou de citer les
activités, les professions qui l’intéressent le plus ou le moins quand il a libre choix dans ses préférences et
rejets (questionnaire, interview)

b) les intérêts manifestés


Il s’agit des intérêts qui peuvent être identifiés par l’observation directe du comportement d’un individu au
cours de son travail ou de ses loisirs (jeu…). Très souvent ces intérêts sont éphémères.

c) Les intérêts inventoriés.


Ils sont identifiés et mesurés à l’aide des instruments standardisés et par lesquels on demande au sujet de
choisir parmi les activités présentées (liste-inventaire) celles qu’il préfère et celle qu’il n’aime pas. Certains
chercheurs indiquent qu’il y a une corrélation élevée entre les notes obtenues dans la discipline préférée et
l’intérêt manifesté par cette discipline.

1.- INTEREST FINDER DE A. JERSILD ET R. TASCH

Ce test est destiné aux sujets de 6 à 18 ans. Il consiste en une série de phrases à compléter.

Ex. : - Nos trois envie d’étudier…

- Je n’ai pas envie d’étudier…


- Ce que j’aime le mieux quand je ne suis pas à l’école, c’est…
- Quand je serai grand, je serai…je ferai…etc.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 74 sur 79
P a g e | 75

2.- QUESTIONNAIRE POUR GARCONS DE 10 A 12 ANS DE L’ I.N.O.P.

L’épreuve porte sur 72 items auxquels le sujet doit répondre en faisant le choix entre trois réponses : plait
beaucoup, plait moyennement, déplait.

Domaines d’intérêts :

a) intérêts techniques
b) intérêts sociaux
c) intérêts sportifs
d) intérêts pour la nature (zoo, jardin)
e) intérêts artistiques
f) intérêts intellectuels (visiter un musée)
g) intérêts pour le commerce
h) intérêts d’imagination.
4.- TECHNIQUES DES TITRES DE LIVRES FICTIFS DE R. THORNDIKE

La liste de Thorndike contient une série de titres d’ouvrages fictifs suivis, chacun, d’un résumé imaginaire.
Il permet d’étudier les intérêts littéraires chez les sujets de 10 à 15 ans. L’enfant doit indiquer les ouvrages
qu’il aimerait lire lorsqu’on lui présente le titre et le résumé.

5.- WHAT I LIKE TO DO, AN INVENTORY OF CHILDREN’S INTEREST DE THORPE ET


MEYERS.

Il s’agit d’un inventaire d’intérêts pour enfants; les réponses sont du type oui-non.

Domaine du test :

- art - jeu calme

- musique - mécanique

- service social - activité familiale

- jeu actif - science

6.- INVENTAIRE D’INTERETS VOCATIONNELS DE C.E. ET E.G. GERMANE.

Il comprend 9 domaines d’intérêts, les questions sont du type oui-non :

- commercial - académique (professeurs)

- mécanique - scientifique

- esthétique - tous travaux

- manuel - familial

- agricole.

10- CONTROLE DES INTERETS PROFESSIONNELS DE R. DERIVIERE.

Il a trois formes :

a) forme cadets : (fin de l’enseignement primaire). Cette forme permet d’identifier les grands types
d’aspiration chez les finalistes de l’école primaire
b) forme juniors (fin du secondaire inférieur)

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 75 sur 79
P a g e | 76

c) forme seniors (fin du secondaire supérieur). Cette forme permet de différentier les intérêts selon
neuf secteurs différents :
- langue - dessin
- sciences - administration
- professions actives - commerce
- mathématique - profession technique
- profession sociale

Pour chacune des activités proposées le sujet s’exprime selon une échelle de 5 degrés (rejet, indifférence,
acceptation, intérêt, préférence).

11. QUESTIONNAIRE DE MOTIVATION DE MEUNIER ET CHENE


C’est un questionnaire qui permet d’appréhender les motifs qui poussent le sujet à choisir une activité
professionnelle. Ainsi, la perception de ce motifs par le sujet provoque le mouvement est constitué une
activité propre à la conscience humaine et la réussite de l’adaptation individuelle repose en grande partie
sur cette capacité à saisir les motifs qui déclenchent et orientent l’effet modificateur. L’instrument d’échelle
porte sur les principaux aspects de la motivation qui sont : l’authenticité, le niveau de conscience et la
force. Ainsi il existe 3 notes suivant ces 3 aspects.

Ex : a) Etre patient et soigneux

b) ou bien avoir une bonne présence d’esprit et posséder des réflexes rapides.

Il y a toujours une alternative, le sujet choisit soit a soit b, et non les deux à la fois.

X. TESTS SOCIOMETRIQUES

C’est à J.L MORENO, psychiatre viennois que l’on doit la sociométrie. L’hypothèse de Moreno est que
« les sentiments *, les émotions et les idées pourraient quitter l’organisme ou entrer en lui ». C’est dire que
les sentiments, les émotions et les idées résident dans certaines structures à l’intérieur desquelles ils
peuvent apparaître ou s’évanouir.

Dans le terme « sociométrie » on peut extraire deux idées essentielles : l’idée de l’Etre social (socius) et
l’idée de mesure (metrum) de cet être social. Ainsi faire la sociométrie c’est être à même d’appliquer le
metrum au socius et d’établir une sorte de géographie psychologique du groupe. En effet, tout être humain
entretient dans son milieu un certain nombre de relations grâce auxquelles il participe au sein d’une
communauté, d’un groupe. Il évite ainsi l’isolement. Ces relations sont tantôt positives (préférences) tantôt
négatives (répulsions). L’étude de ces relations peut nous renseigner sur la structure relationnelle d’un
groupe.

Selon LAENG M. et AVANZINI G. « vocabulaire de pédagogie moderne 1974, p.230, la sociométrique est
l’étude objective des relations socioaffectives à l’intérieur des groupes humains, visant à dégager la
structure des réseaux de communication et la télé : unité d’interaction.

La télé est une empathie à deux directions tout comme le téléphone a deux extrémités. Il s’agit, dans un
processus d’attraction et de répulsion, d’un ensemble de courants affectifs entre tel ou tel individu et qui
donnent naissance à l’atome social et aux réseaux sociométriques qui forment la tradition et l’opinion
publique. L’empathie c’est de la sensibilité aux attitudes d’autrui et la pénétration de ces sentiments,
lesquels sentiments peuvent être, soit positifs, soit négatifs, soit neutres.

Dans un groupe déterminé, la sociométrie permettrait la détection des leaders (les populaires, les stars), des
individus isolés ou rejetés par le groupe, des individus en conflits et des individus entretenant des relations

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 76 sur 79
P a g e | 77

ou affinités positives. La connaissance de la structure relationnelle d’un groupe de personnes (classe,


école…) est nécessaire pour pouvoir situer chaque participant, (élèves, enseignants) ; comprendre une
réaction, calmer les tensions en réparant ou en rapprochant les membres (ex. : séparation des leaders
rivaux).

Bref, la sociométrie vise l’harmonisation et l’équilibre des relations socio-affectives d’un groupe. Elle
permet une action à la fois préventive, curative et constructive.

Vecteurs sociométriques

0 choix attendu (attente) 0 …………… rejet attendu

0 choix émis (émission) 0 ……………. Rejet émis

Choix reçu (réception) ……………..0 rejet subi

0 0 choix réciproque 0 ……………0 rejet réciproque

0 0 choix réciproque (Dyade) 0 ………… 0 rejet réciproque

N.B : 0 symbolise l’Individu

L’atome social est un ensemble constitué par les choix et les rejets dont un individu est l’objet. Celui-ci
peut être un leader ou un isolé. Les dyades ou choix réciproques sont à la base de la cohésion et de l’entente
parfaite entre les membres du groupe. Deux individus en relation de réciprocité forment une dyade.

Les indices sociométriques (modèle mathématique).

p : nombre de choix reçus

n : nombre de rejets reçus

p : nombre de choix émis

n : nombre de rejets émis

p : nombre de choix réciproques

n : nombre de rejets réciproques

p ou p : nombre d’individus par les quels le sujet se croit désiré

n ou n :: nombre d’individus par lesquels le sujet se croit rejeté

p ou p : nombre d’individus qui se croient choisis par le sujet

n ou n : nombre d’individus qui se croient rejetés par le sujet.

Le sociogramme.

Le sociogramme est la carte sociographique des relations entre les individus du groupe. Chaque individu y
possède sa place comme point de départ et comme point de relation des estimations.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 77 sur 79
P a g e | 78

La matrice sociométrique ou sociomatrice.

La matrice sociométrique se présente sous forme d’un tableau à double entrée. Chaque individu figure tant
en abscisses qu’en ordonnées.

Il existe deux types de sociomatrices :

a) La matrice socio-sélective qui concerne les émissions des choix et des rejets.
b) La matrice socio-perceptive porte sur les attentes des choix et des rejets.
On peut donc construire deux sociomatrices sélectives (choix, rejets) et deux sociomatrices perceptives
(attentes de choix, rejets).
A B C D E F SE/p

A AS 1 1 1 1 1 5

B 1 AS 1 - - - 2

C 1 1 AS 1 - - 3

D 1 1 - AS 1 - 3

E 1 1 - - AS - 2

F - 1 1 1 1 AS 4

SP/ 4 5 3 3 3 2
p

AS= auto-sélection

SE/p= score d’expansivité mesuré par p nombre de choix émis

SP/p : score de popularité mesuré par p nombre de choix reçus (c’est le statut sociométrique).

Les techniques sociométriques

1) Le questionnaire sociométrique
2) Le test sociométrique
3) Le test de perception sociométrique (socio-empathy)
4) Les mesures de réputation (Guess Who test)
5) Les tests objectifs de relations sociales.

(Voir document pdf)

BIBLIOGRAPHIE

ANZIEU. D et C. CHABERT. (1983). Les méthodes projectives. Paris : PUF.


BACKERS THOMAS. M. (1968). « Le test des trois personnages » in Actualités pédagogiques, Nov.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 78 sur 79
P a g e | 79

BERNAUD J.L. (2008). Les Méthodes d’évaluation de la personnalité. Paris : Dunod


BERNAUD J.L. (2013). Tests et théories de l’intelligence. Paris : Dunod
BERNAUD J.L. (2014). Méthodes de tests et questionnaires en psychologie. Paris : Dunod
BINOIS et PICHOT (1958). Le test de vocabulaire. Bruxelles : Editest.
BECK. S.J. (1967). Le test de RORSCHACH. Volume I et II. Paris : PUF.
BEIZMAN. G. (1966). Livret de cotation des formes dans le RORSCHACH. Paris : PUF.
BERNET. A. (1971). “Recherche sur le test de l’arbre”, in Revue de Psychologie Appliquée, vol. 21, n°2,
101-122.
BOUTONIER. J. (1959). Les dessins des enfants. Paris : les éd. Du scarabée.
CHABERT. C. (2013). Psychanalyse et méthodes projectives. 2è éd. Paris : Dunod
DELAY. J. PICHOT. P. PERSE.J. (1955). Méthodes projectives en clinique. Paris : PUF.
LOOSLI-USTERI. M. (1965). Manuel pratique du test de RORSHACH. Paris : PUF.
LOOSLI-USTERI. M. (1967). Le diagnostic individuel chez l’enfant au moyen du test de RORSCHACH. 2e
éd. Paris : PUF.
MORENO, JL (1954). Fondement de la sociométrie. Paris : PUF
MURRAY. H.A. (1979). Exploration de la personnalité. Paris : PUF.
OMBREDANE. P. (1954). « L’exploration de la mentalité des Noirs Congolais au moyen d’une épreuve
projective, « Le TAT Congo », in Mémoire de l’Institut Royal C.B, Bruxelles.
PICHOT. P. (1968). Les tests mentaux. Paris : PUF.
RORSCHACH. H. (1962). Psychodiagnostic. Paris : PUF.
SZONDI. L. (1962). Diagnostic expérimental des pulsions. Paris : PUF.
SZONDI. L.(1965).« Le test de Szondi employé comme critère de l’indication d’une psycho thérapie
analytique », in Revue de Psychologie Appliquée, Vol. 15, n°2, 2e Trimestre, 95-121.
TARANTINO. G.O. (1973), « Le test de RORSHACH au Zaïre : Etude des réponses banales
universelles », in Revue Zaïroise de Psychologie et de Pédagogie, II, 79-93.
VINAY. A. (2014). Le dessin dans l’examen psychologique de l’enfant. Paris : Dunod.
ZURFLUH. J. (1976). Tests mentaux. Paris : Delaye.

Boxus, E., les Q.C.M. à solutions générales au service de l’évaluation à livre ouvert, Document ronéotype
Université de Liège, 1988.
Davis, F.B., Analyses des items, Louvain, Nauwelaerts, 1966
De Ketele, J.M., « objectifs et évaluations ; comparaison et confrontation de quelques terminologies
utilisées ».
In Bulletin de Pédagogie Universitaire, N°13, Jan. 1987.

Krathwohl D.R., and Al. Taxonomy of educational objectives Hand book II. The affective domain, N.Y.
David Mac Kay,Traduction Lavallée M.
Leclercq, D., Qualité de question et signification de score avec application aux questions à choix multiple,
Bruxelles, Labor, 1987.
Noizet, G. et Caverni, J.P., Psychologie de l’évaluation scolaire, Paris, P.U.F., 1979.
Tibamwenda Basara B., Essai de détermination du niveau taxonomique des comportements - types liés à
une attitude pédagogique, D.E.S., ronéotypé Kisangani, 1988.

UNIGOM : Cours de Construction des tests et Méthodes des tests : L2 LMD PSYCH. Page 79 sur 79

Vous aimerez peut-être aussi

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy