Évaluation de l'Apprentissage : Guide et Méthodes Pédagogiques

Introduction

Nous savons que l'apprentissage est inférentiel ; nous ne l'observons pas directement, mais plutôt à travers ses produits et ses résultats. Les chercheurs et les praticiens qui travaillent avec les étudiants peuvent croire que les étudiants ont appris, mais la seule façon de le savoir est d'évaluer les produits et les résultats de l'apprentissage.

L'évaluation implique « une tentative formelle de déterminer le statut des étudiants par rapport aux variables éducatives d'intérêt » (Popham, 2008, p. 6). À l'école, la variable éducative d'intérêt est le plus souvent la réussite des élèves dans des domaines tels que la lecture, l'écriture, les mathématiques, les sciences et les études sociales. Bien que la réussite des élèves ait toujours été essentielle, son importance a été soulignée par la loi fédérale No Child Left Behind de 2001 (Shaul & Ganson, 2005). Cette loi comporte de nombreuses dispositions (Popham, 2008). Parmi les plus importantes, on trouve l'obligation de tester annuellement les élèves de la 3e à la 8e année, puis au lycée, en lecture et en mathématiques, et pour les systèmes scolaires de montrer des augmentations du nombre d'élèves réalisant des progrès annuels adéquats dans ces matières.

Deux points méritent d'être soulignés concernant ce texte. Bien que la responsabilisation conduise souvent à ce que les tests soient le moyen d'évaluation, cette dernière comprend de nombreuses procédures de mesure autres que les tests (décrites ci-dessous). Les chercheurs et les praticiens veulent savoir si l'apprentissage a eu lieu, et il peut exister d'autres procédures que les tests qui fournissent des preuves de l'apprentissage des élèves. Deuxièmement, les compétences des élèves dans les domaines de contenu sont souvent le résultat d'apprentissage évalué, mais les chercheurs et les praticiens peuvent également s'intéresser à d'autres formes d'apprentissage. Par exemple, ils peuvent vouloir savoir si les élèves ont acquis de nouvelles attitudes ou des stratégies d'autorégulation, ou si les intérêts, les valeurs, le sentiment d'efficacité personnelle et la motivation des élèves ont changé à la suite de l'apprentissage du contenu.

Cette section couvre les moyens d'évaluer les produits ou les résultats de l'apprentissage. Ces méthodes comprennent les observations directes, les réponses écrites, les réponses orales, les évaluations par les autres et les auto-évaluations.

Observations Directes

Les observations directes sont des exemples de comportement des étudiants que nous observons pour évaluer si l'apprentissage a eu lieu. Les enseignants utilisent fréquemment les observations directes. Un professeur de chimie souhaite que les étudiants apprennent les procédures de laboratoire. Le professeur observe les étudiants en laboratoire pour déterminer s'ils mettent en œuvre les procédures appropriées. Un professeur d'éducation physique observe les élèves dribbler un ballon de basket pour évaluer dans quelle mesure ils ont acquis cette compétence. Un enseignant du primaire évalue dans quelle mesure les élèves ont appris les règles de la classe en fonction de leur comportement en classe.

Les observations directes sont des indices valides de l'apprentissage si elles sont simples et impliquent peu d'inférence de la part des observateurs. Elles fonctionnent mieux lorsque les comportements peuvent être spécifiés et que les élèves peuvent ensuite être observés pour vérifier si leurs comportements correspondent à la norme.

Méthodes d'évaluation de l'apprentissage.
Catégorie Définition
Observations directes Exemples de comportement qui démontrent l'apprentissage
Réponses écrites Performances écrites lors de tests, de quiz, de devoirs, de dissertations et de projets
Réponses orales Questions, commentaires et réponses verbalisés pendant l'apprentissage
Évaluations par d'autres Jugements des observateurs sur les apprenants concernant des attributs révélateurs de l'apprentissage
Auto-évaluations Jugements des personnes sur elles-mêmes
Questionnaires Évaluations écrites d'éléments ou réponses à des questions
Entretiens Réponses orales à des questions
Rappels stimulés Rappel des pensées accompagnant les performances d'une personne à des moments donnés
Pensées à voix haute Verbalisation à voix haute des pensées, des actions et des sentiments d'une personne tout en effectuant une tâche
Dialogues Conversations entre deux ou plusieurs personnes

Un problème avec les observations directes est qu'elles se concentrent uniquement sur ce qui peut être observé et contournent donc les processus cognitifs et affectifs qui sous-tendent les actions. Par exemple, le professeur de chimie sait que les élèves ont appris les procédures de laboratoire, mais il ou elle ne sait pas à quoi les élèves pensent pendant qu'ils effectuent les procédures ni à quel point ils sont sûrs de bien les exécuter.

Un deuxième problème est que, bien que l'observation directe d'un comportement indique qu'un apprentissage a eu lieu, l'absence de comportement approprié ne signifie pas qu'aucun apprentissage n'a eu lieu. L'apprentissage n'est pas la même chose que la performance. De nombreux facteurs autres que l'apprentissage peuvent affecter la performance. Les élèves peuvent ne pas effectuer les actions apprises parce qu'ils ne sont pas motivés, sont malades ou sont occupés à faire autre chose. Nous devons écarter ces autres facteurs pour conclure de l'absence de performance qu'aucun apprentissage n'a eu lieu. Cela nécessite de faire l'hypothèse - qui parfois peut être injustifiée - que puisque les élèves essaient généralement de faire de leur mieux, s'ils ne performent pas, ils n'ont pas appris.

Réponses écrites

L'apprentissage est souvent évalué sur la base des réponses écrites des étudiants lors de tests, de questionnaires, de devoirs à la maison, de dissertations et de rapports. En fonction du niveau de maîtrise indiqué dans les réponses, les enseignants décident si un apprentissage adéquat a eu lieu ou si un enseignement supplémentaire est nécessaire parce que les étudiants ne comprennent pas pleinement la matière. Par exemple, supposons qu'un enseignant planifie une unité sur la géographie d'Hawaï. Initialement, l'enseignant suppose que les étudiants connaissent peu ce sujet. Un prétest administré avant le début de l'enseignement confirmera la conviction de l'enseignant si les étudiants obtiennent de mauvais résultats. L'enseignant réévalue les étudiants après l'unité d'enseignement. Les gains dans les résultats des tests amènent l'enseignant à conclure que les apprenants ont acquis des connaissances.

Leur relative facilité d'utilisation et leur capacité à couvrir une grande variété de matières font des réponses écrites des indicateurs souhaitables de l'apprentissage. Nous supposons que les réponses écrites reflètent l'apprentissage, mais de nombreux facteurs peuvent affecter la performance du comportement même lorsque les étudiants ont appris. Les réponses écrites nous obligent à croire que les étudiants font de leur mieux et qu'aucun facteur externe (par exemple, la fatigue, la maladie, la tricherie) n'intervient de telle sorte que leur travail écrit ne représente pas ce qu'ils ont appris. Nous devons essayer d'identifier les facteurs externes qui peuvent affecter la performance et obscurcir les évaluations de l'apprentissage.

Réponses Orales

Les réponses orales font partie intégrante de la culture scolaire. Les enseignants interrogent les élèves pour répondre à des questions et évaluer l'apprentissage en fonction de ce qu'ils disent. Les élèves posent également des questions pendant les leçons. Si leurs questions indiquent un manque de compréhension, c'est le signe qu'un apprentissage approprié n'a pas eu lieu.

Comme pour les réponses écrites, nous supposons que les réponses orales sont des reflets valides de ce que les élèves savent, ce qui n'est pas toujours vrai. De plus, la verbalisation est une tâche, et il peut y avoir des problèmes à traduire ce que l'on sait en son expression orale en raison d'une terminologie inconnue, de l'anxiété liée à la prise de parole ou de difficultés linguistiques. Les enseignants peuvent reformuler ce que disent les élèves, mais une telle reformulation peut ne pas refléter fidèlement la nature des pensées des élèves.

Évaluations par des tiers

Une autre façon d'évaluer l'apprentissage consiste pour des individus (par exemple, enseignants, parents, administrateurs, chercheurs, pairs) à évaluer les élèves sur la quantité ou la qualité de leur apprentissage. Ces évaluations par des tiers (par exemple, « Dans quelle mesure Timmy peut-il résoudre des problèmes du type 52 x 36 = ? », « Quels progrès Alicia a-t-elle fait dans ses compétences en écriture au cours des 6 derniers mois ? ») fournissent des données utiles et peuvent aider à identifier les élèves ayant des besoins exceptionnels (par exemple, « À quelle fréquence Matt a-t-il besoin de plus de temps pour apprendre ? », « À quelle vitesse Jenny termine-t-elle son travail ? »).

Un avantage des évaluations par des tiers est que les observateurs peuvent être plus objectifs à propos des élèves que les élèves ne le sont à leur propre sujet (auto-évaluations, abordées ensuite). Les évaluations peuvent également être faites pour les processus d'apprentissage qui sous-tendent les actions (par exemple, la compréhension, la motivation, les attitudes) et ainsi fournir des données inaccessibles par des observations directes ; par exemple, « Dans quelle mesure Seth comprend-il les causes de la Seconde Guerre mondiale ? » Mais les évaluations par des tiers nécessitent plus d'inférence que les observations directes. Il peut être problématique d'évaluer avec précision la facilité d'apprentissage, la profondeur de compréhension ou les attitudes des élèves. De plus, les évaluations exigent des observateurs qu'ils se souviennent de ce que font les élèves et seront déformées lorsque les évaluateurs ne se souviendront sélectivement que des comportements positifs ou négatifs.

Auto-évaluations

Les auto-évaluations sont les évaluations et les déclarations que les personnes font sur elles-mêmes. Les auto-évaluations prennent diverses formes : questionnaires, entretiens, rappels stimulés, verbalisations à voix haute et dialogues.

Les questionnaires présentent aux répondants des éléments ou des questions portant sur leurs pensées et leurs actions. Les répondants peuvent enregistrer les types d'activités dans lesquelles ils s'engagent, évaluer leurs niveaux de compétence perçus et juger de la fréquence ou de la durée de leur engagement dans ces activités (par exemple, « Depuis combien de temps étudiez-vous l'espagnol ? » « Est-ce difficile pour vous d'apprendre les théorèmes géométriques ? »). De nombreux instruments d'auto-évaluation demandent aux répondants d'enregistrer des évaluations sur des échelles numériques (« Sur une échelle de 10 points, où 1 = faible et 10 = élevé, évaluez votre capacité à réduire les fractions. »).

Les entretiens sont un type de questionnaire dans lequel un intervieweur présente les questions ou les points à discuter et le répondant répond oralement. Les entretiens sont généralement menés individuellement, bien que des groupes puissent être interrogés. Un chercheur pourrait décrire un contexte d'apprentissage et demander aux étudiants comment ils apprennent généralement dans ce contexte (par exemple, « Lorsque le professeur de français commence une leçon, quelles sont vos pensées ? Comment pensez-vous que vous vous en sortirez ? »). Les intervieweurs peuvent avoir besoin de relancer les répondants si les réponses sont trop brèves ou peu coopératives.

Dans la procédure de rappel stimulé, les personnes travaillent sur une tâche et se souviennent ensuite de leurs pensées à différents moments de la tâche. Les intervieweurs les interrogent (par exemple, « À quoi pensiez-vous lorsque vous étiez bloqué ici ? »). Si la performance a été enregistrée sur vidéo, les répondants la regardent ensuite et se souviennent, en particulier lorsque les intervieweurs arrêtent l'enregistrement et posent des questions. Il est impératif que la procédure de rappel soit effectuée peu de temps après la performance afin que les participants n'oublient pas leurs pensées.

Les verbalisations à voix haute sont des procédures dans lesquelles les étudiants verbalisent leurs pensées, leurs actions et leurs sentiments tout en travaillant sur une tâche. Les verbalisations peuvent être enregistrées par des observateurs et ensuite notées en fonction du niveau de compréhension. Les verbalisations à voix haute exigent que les répondants verbalisent ; de nombreux étudiants ne sont pas habitués à parler à voix haute lorsqu'ils travaillent à l'école. Parler à voix haute peut sembler maladroit à certains, et ils peuvent se sentir gênés ou avoir difficulté à exprimer leurs pensées. Les chercheurs peuvent devoir relancer les étudiants s'ils ne verbalisent pas.

Un autre type d'auto-évaluation est le dialogue, qui est une conversation entre deux personnes ou plus pendant qu'elles sont engagées dans une tâche d'apprentissage. Comme les verbalisations à voix haute, les dialogues peuvent être enregistrés et analysés pour détecter les déclarations indiquant un apprentissage et les facteurs qui semblent affecter l'apprentissage dans le contexte. Bien que les dialogues utilisent des interactions réelles pendant que les étudiants travaillent sur une tâche, leur analyse nécessite une interprétation qui peut aller au-delà des éléments réels de la situation.

Le choix de la mesure d'auto-évaluation doit correspondre au but de l'évaluation. Les questionnaires peuvent couvrir beaucoup de matériel ; les entretiens sont préférables pour explorer quelques questions en profondeur. Les rappels stimulés demandent aux répondants de se souvenir de leurs pensées au moment où les actions ont eu lieu ; les verbalisations à voix haute examinent les pensées présentes. Les dialogues permettent d'étudier les schémas d'interaction sociale.

Les instruments d'auto-évaluation sont généralement faciles à développer et à administrer ; les questionnaires sont généralement faciles à remplir et à noter. Un problème peut survenir lorsque des inférences doivent être tirées des réponses des étudiants. Il est essentiel d'avoir un système de notation fiable. D'autres préoccupations concernant les auto-évaluations sont de savoir si les étudiants donnent des réponses socialement acceptables qui ne correspondent pas à leurs croyances, si les informations auto-déclarées correspondent au comportement réel et si les jeunes enfants sont capables de s'auto-évaluer avec précision. En garantissant que les données sont confidentielles, les chercheurs peuvent aider à promouvoir des réponses véridiques. Un bon moyen de valider les auto-évaluations est d'utiliser des évaluations multiples (par exemple, auto-évaluations, observations directes, réponses orales et écrites). Il existe des preuves qu'à partir de la troisième année environ, les auto-évaluations sont des indicateurs valides et fiables des croyances et des actions qu'elles sont conçues pour évaluer (Assor & Connell, 1992), mais les chercheurs doivent utiliser les auto-évaluations avec prudence pour minimiser les problèmes potentiels.