Sunteți pe pagina 1din 8

L’évaluation sommative

et ses rôles multiples


Gérard Scallon (1999)
Deuxième révision: mai 2000
Département des fondements et pratiques en éducation
Faculté des sciences de l’éducation, Université Laval

Dans les écrits francophones européens, on utilise de plus en plus l'expression


"évaluation certificative". Au Québec, l'adjectif "sommative" a été adopté d'abord
comme traduction libre du terme anglais. Il a été ainsi utilisé et toléré comme un
néologisme. Le qualificatif est ambigu et suggère, à première vue, l'idée de somme.
Était-ce là une façon de désigner l'évaluation continue qui procède de plusieurs
résultats chiffrés cumulés en cours de route pour donner une somme ou un total.
Et si on donne à l'évaluation sommative le sens d'une évaluation terminale, d'autres
problèmes surgissent. L'évaluation sommative, telle que menée dans le cours de la
formation des individus, peut être à la fois au terme et au début d'un processus. Par
exemple, des résultats de fin d'année (évaluation sommative) peuvent servir à
l'entrée d'une autre année pour prescrire des activités de rattrapage (évaluation
diagnostique). Pour l'instant et pour un certain temps encore, on va se permettre de
qualifier indifféremment l'évaluation de "sommative" ou de "certificative", tout en
étant conscient que l'évaluation certificative recevra tôt ou tard ses lettres de
noblesse.

Introduction
Pendant de nombreuses années, le discours de l’évaluation des apprentissages a été
confiné aux examens de fin d’année, comme cela se passait au Québec, avant 1964, au
temps du Département de l’Instruction publique. Les préoccupations d’ordre théorique
visaient particulièrement les instruments de mesure à utiliser lors de ces moments
fatidiques. Il s’agissait alors d’accorder le diplôme de fin d’étude primaire ou de fin d'étude
secondaire ou encore de décider du passage d’un élève d'un degré à l'autre à l'intérieur
d'un même niveau. Sans aucun doute, l’évaluation occupait un espace beaucoup plus
grand mais les procédés utilisés n’étaient pas traités comme ils le sont aujourd’hui.
La reconnaissance de deux fonctions bien identifiées de l’évaluation nous est venue de
Scriven (1967) au regard de l’évaluation des moyens d’enseignement: l’évaluation
formative, pour ce qui est d’ajuster les diverses étapes d’une démarche pendant le
processus même d’élaboration d’un produit et l’évaluation sommative, pour ce qui est
d’attester de la qualité du produit dans sa phase finale. C’est cette typologie qui a été
transposée par Bloom, Hastings et Madaus (1971) à l’évaluation des apprentissages en y
ajoutant une fonction reconnue de longue date: l’évaluation diagnostique.

Un parallèle entre deux applications de la même


typologie
En premier lieu, il apparaît intéressant de dresser un parallèle entre la notion d’évaluation
sommative telle qu’entendue par Scriven et celle qui a été transposée à l’évaluation des
apprentissages. Dans l’esprit de Scriven, et cela est très vraisemblable, l’évaluation
sommative survient au moment où l’élaboration d’un produit (programme d’étude ou
programme d’intervention) est complètement terminée. En poursuivant l’idée de l’auteur,
on peut penser à un rapport définitif décrivant un projet , acheminé en plusieurs
exemplaires imprimés à des autorités compétentes. Aucune retouche n’est envisagée et la
décision sera prise d’accepter le projet en tout ou en partie ou encore de le refuser
globalement .
Ces caractères de "terminal" et de "définitif" de l’objet de l’évaluation sommative émergent
avec assez d’évidence de la position de Scriven. Mais il y a plus! Les auteurs du projet tel
que décrit dans notre exemple, c'est-à-dire les responsables de son élaboration, qui y ont
participé, qui ont réalisé en cours de route les correctifs qui s’imposaient (évaluation
formative) ne sont pas les mêmes (ou ne devraient pas être les mêmes) que ceux qui sont
responsables de l’évaluation sommative.
Lorsque l’objet de l’évaluation sommative est l’apprentissage, la transposition de la
typologie de Scriven n’est pas aussi simple qu’elle n’en paraît. On doit comprendre que
Bloom, Hastings et Madaus (1971) devaient avoir pour souci que l’évaluation sommative
des apprentissages puisse s’accorder à une pratique qu'ils connaissaient déjà et par
laquelle des prises d’information sont réalisées bien avant que l’on ait un produit fini,
définitif. Sinon, l’évaluation sommative surviendrait à la toute fin de la formation des
individus, lorsque ceux-ci atteignent un âge très avancé.

Une transposition non réussie


Les deux caractères de la typologie de Scriven ne se prêtent pas facilement à l'évaluation
des apprentissages ou à celle des élèves.
Premièrement, dans une bonne majorité de systèmes éducatifs, l’idée d’une prise
d’information rigoureusement terminale est pratiquement exclue lorsqu’il s’agit
d’évaluer des apprentissages.
Deuxièmement, il est difficile, voire pratiquement impossible, de séparer les rôles
d’évaluation au point de s’assurer que les personnes chargées d’évaluation
sommative seront différentes de celles chargées de la formation et de l’évaluation
formative (comme le suggère Scriven pour l'évaluation des moyens d'enseignement).
Dans le monde scolaire en général, on a confié aux enseignants la double responsabilité
de l’évaluation formative et de l’évaluation sommative. C’est un premier sujet de réflexion
que d’examiner de près s’il y a là un conflit d’intérêts!

PARALLÈLE: l’évaluation sommative selon...


a
SCRIVEN BLOOM et al.

objet: moyens d’enseignement apprentissages

moment: lorsque le produit pendant et à la fin de la


est fini période de formation
responsables: autres que ceux de les mêmes:
l’év. formative év. form. et év. som.
a.- C’est aussi une position traditionnelle qui relève de l’évaluation continue.

En bref, l’évaluation sommative des apprentissages ne peut renvoyer à une pratique


d’évaluation exclusivement terminale et les enseignants ne peuvent être dégagés
des responsabilités qui s’y rattachent. L’évaluation sommative continue et la
responsabilité des enseignants sont deux aspects qui demandent à être justifiés.

Précisions additionnelles au sujet de l'évaluation


sommative terminale
Rappelons que cette pratique se reconnaît à l'utilisation d'examens de fin d'année (ou de
fin de programme si c'est la période de temps considérée). Examens, travaux, exercices
passés en cours d'année ou en cours de période ne comptent pratiquement pas. Le sort
des individus, leur attestation d'étude ou leur diplôme dépendent presque exclusivement
de leur performance à l'examen terminal. Cette pratique soulève de nombreuses difficultés
que corrige l'évaluation sommative continue dont il sera question à la section suivante.
Cette évaluation terminale n'a pas que des côtés négatifs. Elle intéresse ceux et celles qui
veulent à tout prix obtenir un portrait récent de chaque individu tel qu'il se présente au
terme d'une longue période de formation. C'est là un avantage très recherché que ne
possède pas l'évaluation continue cumulative qui rassemble, en un total arithmétique, une
multitude de portraits plus ou moins lointains. L'idée de portrait récent refait de plus en
plus surface avec l'approche par compétences.
1.- À la défense de l’évaluation sommative continue
Si, par rapport à une longue période de formation ou d’enseignement et d’apprentissage,
l’évaluation sommative était rigoureusement terminale, on s’approcherait alors
substantiellement du concept d’évaluation sommative tel qu’entendu par Scriven au regard
de l’évaluation des moyens d’enseignement. Tel n’est pas le cas et nombre de systèmes
éducatifs ont adopté, depuis longtemps, une pratique d’évaluation continue dont la raison
d’être semble se perdre dans la nuit des temps. La notion même d’évaluation continue a
été traitée pour la première fois, de façon directe, dans un ouvrage de De Landsheere paru
en 1974. Plusieurs auteurs américains y ont fait également allusion. Pour appuyer cette
pratique on trouve essentiellement trois ordres de justifications.

• Éviter le bachotage (ou la procrastination).


Dans un contexte où l’évaluation (officielle) est terminale, certains élèves ont
tendance à remettre à la toute fin, presque à la veille des examens, le travail et les
efforts qu’ils auraient du répartir tout au long de la période d’enseignement et
d’apprentissage.
• Assurer un meilleur échantillonnage des éléments d’observation.
Pour ce qui est de l’éventail des questions ou problèmes à poser ou des tâches
complexes à faire accomplir comme procédés d’évaluation, on ne peut comparer ce
que peut contenir un seul examen terminal et plusieurs examens partiels disséminés
en cours de route. En évaluation continue, le temps d’examen et l’échantillonnage
des questions sont substantiellement plus élevés que ceux que l’on pourrait
associer à un examen terminal. C’est sans doute dans le cadre de ce raisonnement
que l’on peut miser sur les deux à la fois dans une pratique d’évaluation continue:
examens partiels coiffés d’un examen terminal.
• Réduire l’anxiété
Le fait de savoir que le passage d’un degré à l’autre ou l’obtention d’un diplôme sont
tributaires d’un seul examen terminal est une source importante d’anxiété pour
plusieurs élèves, et fort probablement une source de démotivation. Dans une
succession d’examens partiels les résultats obtenus sont souvent les signes avant-
coureurs d’un échec tout en étant des stimulants pour apporter des correctifs
dont les résultats seront connus lors d’examens partiels subséquents. L’effet surprise
est réduit d’autant.
En bref, l’évaluation sommative qui serait menée de façon rigoureusement terminale
comporte plusieurs effets pervers tant chez les élèves que du point de vue métrologique
(qualités des instruments utilisés), effets qui semblent être corrigés par une pratique
d'évaluation continue.

2.- Impliquer les enseignants dans l’évaluation sommative


L’évaluation sommative des apprentissages serait-elle mieux servie si elle était
réservée à des experts, à des personnes qui s’y consacreraient pleinement ou
encore si elle était sous la responsabilités de personnes autres que les
enseignants? On laisserait ainsi plus de temps aux enseignants pour s’occuper
d’enseignement, d’apprentissage ou de formation tout en évitant quelque conflit d’intérêt.
La question ne se pose pas avec l’évaluation formative et le problème soulevé touche
principalement l’évaluation sommative.

Il n’y a pas de réponse "tout ou rien" à la question soulevée. Au Québec, le ministère de


l’Éducation intervient dans plusieurs programmes d’étude du primaire et du secondaire
avec des épreuves uniques (secondaire), des épreuves obligatoires de fins de cycle et des
épreuves d’appoint. Ce sont là des pratiques d’évaluation "sommative" (utilisons encore le
terme pour l’instant) dont la source est externe par rapport à une classe ou à une école. La
responsabilité est partagée avec les établissements scolaires, ce qui amène une part de
responsabilité assumée par les enseignants. Le portrait à dresser est loin d’être négatif et
ce, pour les raisons suivantes.

1.- Les enseignants connaissent bien leurs élèves et sont plus en mesure que d’autres
professionnels de porter des jugements éclairés, notamment pour ce qui est du passage
d’un degré scolaire à un autre ou du passage du primaire au secondaire.
2.- Les enseignants de plusieurs établissements scolaires (notamment au Québec) sont
encadrés (équipes disciplinaires) pour réaliser l’évaluation sommative. Ils ont accès à des
guides d’évaluation, à des modèles d’instruments, voire à des recueils déjà prêts à être
utilisés (p. ex., la Banque d’instruments de mesure (BIM) produite par la Société GRICS).
3.- Enfin, les programmes d’études doivent être transposés en activités quotidiennes à
faire vivre aux élèves, ce qui amène des adaptations inévitables de l’évaluation
pédagogique à toutes sortes de circonstances. Par rapport à une source externe, et de ce
point de vue, l’enseignant demeure la personne la plus compétente pour assumer une
bonne part de l’évaluation sommative.

Les buts multiples de l’évaluation sommative


Il ne faudrait pas penser que la fonction sommative de l’évaluation renvoie à une façon
stéréotypée voire unique de faire les choses. Les examens à visée sommative, qu’ils
soient pris isolément ou groupés ensemble dans une pratique d’évaluation continue,
peuvent servir à diverses fins. Bloom, Hastings et Madaus (1971) et Bloom, Madaus et
Hastings (1981) ont été les premiers à le reconnaître. Voici les buts spécifiques pour
lesquels on utilise des examens dits sommatifs dans l’esprit de ces auteurs (1981, pages
88-93).
L’attribution de notes (grades) souvent exprimées en lettres.
(attribution qui peut être critériée ou normative)
La prédiction de la réussite d’un cours subséquent.
(recherche des composantes critiques d’un examen )
La détermination du point d’entrée dans un cours subséquent.
(un recouvrement avec la fonction diagnostique de l’évaluation)
L’information en retour aux étudiants.
(un recouvrement avec la fonction formative;
il s’agit d’un feed-back d’une tout autre nature).
La certification (attestation, confirmation) d’habiletés et de compétences
(le domaine des compétences minimales - - - résultat séparé pour chaque cellule d’un
tableau de spécifications).
Jusqu’ici, c’est l’élève qui est objet d’évaluation. Dans certains cas, le but de l’évaluation
sommative peut être de comparer des groupes d’élèves quant aux apprentissages
réalisés. C’est le groupe qui devient alors objet d’évaluation.
Il est important de signaler que la préparation des instruments doit être adaptée à chacun
de ces buts. Dans certains cas, on doit chercher à amplifier les différences individuelles à
cause de l’approche normative. En d’autres cas il faudra découper les objectifs d’un cours
de façon telle que l’on puisse déterminer un point d’entrée significatif. Enfin, l’attestation de
compétences exige une définition claire des objectifs d’apprentissage visés par la
démarche d’évaluation (voir Bloom, Madaus et Hastings, 1981, p. 93).
Dans un article traitant d’instrumentation à développer pour diverses fonctions de
l’évaluation, Cardinet (1984) a décrit diverses formes de bilans dont la généralité est plus
grande que ceux établis en évaluation formative. Il apparaît donc que ces bilans
intéressent la méthodologie de l’évaluation sommative. En voici quelques uns qui ont été
décrits par l’auteur:
- - - le bilan effectué à la fin d’une boucle d’apprentissage pour déterminer l’élément
constitutif d’un objectif global maîtrisé par un élève;
- - - le contrôle du niveau terminal d’intégration d’un objectif. (bilan qui correspond le mieux
à la demande sociale de certification des compétences - - - page 107)
- - - le contrôle d’un objectif opérationnel unique (épreuve de maîtrise);
- - - le contrôle d’un ensemble d’objectifs (le tableau de spécifications est cité comme l’un
des outils propres à ce type de bilan - - page 103);
- - - les bilans individuels ou collectifs.
D’un point de vue plus technique, Cardinet (1986) a identifié deux bases distinctes pour la
certification. Si l’on veut rendre compte d’apprentissages relevant d’un programme officiel
("formation définie à l’avance"), on parlera d’évaluation par objectifs. Si on veut apprécier
une formation obtenue en dehors des programmes officiels, on parlera de reconnaissance
des acquis. Ce sont deux perspectives distinctes pour l’évaluation sommative et l’auteur a
fait état de nombreuses difficultés qui leur sont spécifiques et qui doivent être surmontées.
Signalons que c’est dans le contexte de la reconnaissance des acquis, lorsqu’un adulte
reprend la route de l’école ou qu’un élève d’une classe régulière change d’établissement
que survient la notion de "passeport de formation" ou de "portefeuille de compétences".

La justification de l’appellation "certificative"


Dans un article documenté sur le sujet, et à l’instar de plusieurs auteurs qui l’ont précédé,
Tourneur (1985) préconise l’appellation "évaluation certificative". L’auteur affirme que, de
tous les buts reconnus de l’évaluation sommative (notation, attestation, feed-back, etc.), la
certification des compétences constitue son rôle le plus spécifique et le plus important. (p.
11). Il y aurait donc là l’explication d’origine de l’expression "évaluation certificative".
Tourneur reconnaît deux fonctions principales que remplit la certification: une fonction
externe et une fonction interne. La certification externe s’intéresse aux compétences
telles qu’on veut les voir démontrer au terme de la formation et telles que reliées à la vie
sociale et au monde professionnel. La certification interne vise à attester les
apprentissages à divers moments, dans le but de s’assurer que la personne est en mesure
de progresser dans sa formation.
En considérant plusieurs points de vue, Tourneur a dressé un parallèle entre les deux
fonctions, sous forme de tableau. On voit bien que les décisions ne sont pas les mêmes.
En certification interne, il s’agit d’admettre l’étudiant dans une classe, un cycle ou dans une
formation subséquente. En certification externe, il s’agit d’accorder un diplôme (électricien,
ajusteur, médecin, pour prendre les exemples de l’auteur). Du point de vue des objets
souhaitables de la mesure, il y a aussi des différences importantes entre les deux
fonctions. En certification interne, ce sont les objectifs intermédiaires et terminaux
d’intégration (un concept introduit par De Ketele en 1983) qui sont visés. En certification
externe, ce sont des situations réelles ou simulées (représentatives de la profession). Nous
nous approchons ici de l’authentic assessment des auteurs américains.

En conclusion
Dans les ouvrages anglo-saxons, l’évaluation sommative est de moins en moins
évoquée. Nombre d’auteurs font maintenant allusion à la notion d’assessment et
plus particulièrement à celle d’authentic assessment à la suite des travaux de
Wiggins (1989). Là encore, on sent un certain malaise à conserver le vocabulaire de
l’évaluation sommative. L’assessment est une entreprise beaucoup plus englobante,
beaucoup plus complexe et repose sur une multiplicité de procédés de collecte
d’informations. Le terme n’est pas facile à traduire et le mot "appréciation" a été
quelque fois utilisé dans les textes francophones. C’est trop peu pour dégager une
tendance manifeste.
Ce qu’il faut retenir de cet exposé, c’est que l’évaluation sommative renvoie à une
multitude de fonctions qui ne doivent pas être confondues à celle qui est
caractéristique de l’évaluation formative. Lorsque menée en cours de formation, son
caractère "sommatif", entendu dans le sens rigoureux du terme, disparaît quelque
peu pour faire place à des usages qui la rapprochent de l’évaluation formative. Il ne
s’agit pas de se substituer à cette dernière mais d’entretenir avec elle des liens de
complémentarité. L’important est de maintenir le cap sur la qualité de la formation et
sur la justesse des décisions à prendre pour faire progresser les individus.

RÉFÉRENCES

Bloom, B. S., Hastings, J. T. & Madaus, G. F. (1971). Handbook on Formative and


Summative Evaluation of Student Learning. New York: McGraw-Hill Book. Co.
Bloom, B. S., Madaus, G. F. & Hastings, J. T. (1981). Evaluation to Improve Learning. New
York: McGraw-Hill Book. Co.
Cardinet, J. (1984). Des instruments d’évaluation pour chaque fonction. Mesure et
évaluation en éducation, 8 (1 et 2), 45-118.
Cardinet, J. (1986). De nouvelles bases pour la certification. Neuchâtel: Institut romand de
recherches et de documentation pédagogiques (Recherches 86.112).
De Ketele, J. M. (1983). Objectif et évaluation: comparaison et confrontation de quelques
terminologies utilisées. Louvain-la-Neuve: Laboratoire de Pédagogie expérimentale.
De Landsheere, G. (1974). Évaluation continue et examens. Précis de docimologie (3e
édition). Bruxelles-Paris: Labor-Nathan.

Scriven, M. (1967). The Methodology of Evaluation, In Perspectives of Curriculum


Evaluation. (A.E.R.A. Monograph Series on Curriculum Evaluation, no 1). Chicago: Rand
McNally.
Société GRICS. (1999). Banque d’Instruments de Mesure (BIM). Adresse Internet:
http://www.grics.qc.ca

Tourneur, Y. (1985). La certification des compétences. Mesure et évaluation en éducation,


7(4), 9-20.
Wiggins, G. (1989). Teaching to the (authentic) test. Educational Leadership. 46(7), 41-47.

S-ar putea să vă placă și