Introduzione
Una teoria comportamentale ben nota è il condizionamento operante, formulato da B. F. (Burrhus Frederic) Skinner (1904–1990). A partire dagli anni '30, Skinner pubblicò una serie di articoli che riportavano i risultati di studi di laboratorio con animali in cui identificò le varie componenti del condizionamento operante. Riassunse gran parte di questo lavoro iniziale nel suo influente libro, Il Comportamento degli Organismi (Skinner, 1938).
Skinner applicò le sue idee ai problemi umani. All'inizio della sua carriera, si interessò all'istruzione e sviluppò macchine per l'insegnamento e l'istruzione programmata. La Tecnologia dell'Insegnamento (Skinner, 1968) affronta l'istruzione, la motivazione, la disciplina e la creatività. Nel 1948, dopo un periodo difficile della sua vita, pubblicò Walden Due, che descrive come i principi comportamentali possono essere applicati per creare una società utopica. Skinner (1971) affrontò i problemi della vita moderna e sostenne l'applicazione di una tecnologia comportamentale alla progettazione delle culture in Al di là della Libertà e della Dignità. Skinner e altri hanno applicato i principi del condizionamento operante a settori quali l'apprendimento e la disciplina scolastica, lo sviluppo infantile, l'acquisizione del linguaggio, i comportamenti sociali, le malattie mentali, i problemi medici, l'abuso di sostanze e la formazione professionale (DeGrandpre, 2000; Karoly & Harris, 1986; Morris, 2003).
Da giovane, Skinner aspirava a diventare uno scrittore (Skinner, 1970):
Costruii un piccolo studio in soffitta e mi misi al lavoro. I risultati furono disastrosi. Dissipai il mio tempo. Leggevo senza meta, costruivo modellini di navi, suonavo il pianoforte, ascoltavo la radio appena inventata, contribuivo alla colonna umoristica di un giornale locale ma non scrivevo quasi nient'altro, e pensavo di consultare uno psichiatra. (p. 6)
Si interessò alla psicologia dopo aver letto i Riflessi Condizionati di Pavlov (1927) e il Comportamentismo di Watson (1924). La sua successiva carriera ebbe un profondo impatto sulla psicologia dell'apprendimento.
Nonostante la sua ammissione di “Ho fallito come scrittore perché non avevo niente di importante da dire” (Skinner, 1970, p. 7), fu uno scrittore prolifico che incanalò le sue aspirazioni letterarie nella scrittura scientifica che abbracciò sei decenni (Lattal, 1992). La sua dedizione alla sua professione è evidente nel suo discorso su invito alla convention dell'American Psychological Association otto giorni prima della sua morte (Holland, 1992; Skinner, 1990). L'associazione lo onorò con un numero speciale della sua rivista mensile, American Psychologist (American Psychological Association, 1992). Sebbene la sua teoria sia stata screditata dagli attuali teorici dell'apprendimento perché non può spiegare adeguatamente forme di apprendimento superiori e complesse (Bargh & Ferguson, 2000), la sua influenza continua poiché i principi del condizionamento operante sono comunemente applicati per migliorare l'apprendimento e il comportamento degli studenti (Morris, 2003). Nello scenario di apertura, ad esempio, Leo utilizza i principi del condizionamento operante per controllare il cattivo comportamento degli studenti. Emily e Shayna, d'altra parte, sostengono l'importanza dei fattori cognitivi.
Quadro Concettuale
Questa sezione discute le assunzioni alla base del condizionamento operante, come esso rifletta un'analisi funzionale del comportamento e le implicazioni della teoria per la previsione e il controllo del comportamento. La teoria e i principi del condizionamento operante sono complessi (Dragoi & Staddon, 1999); in questo capitolo vengono trattati i principi più rilevanti per l'apprendimento umano.
Assunzioni Scientifiche
Pavlov ha individuato il locus dell'apprendimento nel sistema nervoso e ha considerato il comportamento come una manifestazione del funzionamento neurologico. Skinner (1938) non ha negato che il funzionamento neurologico accompagni il comportamento, ma ha creduto che una psicologia del comportamento possa essere compresa nei suoi termini senza riferimento a eventi neurologici o altri eventi interni.
Skinner ha sollevato obiezioni simili ai processi e alle entità non osservabili proposti dalle moderne visioni cognitive dell'apprendimento (Overskeid, 2007). Gli eventi privati, o risposte interne, sono accessibili solo all'individuo e possono essere studiati attraverso i resoconti verbali delle persone, che sono forme di comportamento (Skinner, 1953). Skinner non ha negato l'esistenza di atteggiamenti, credenze, opinioni, desideri e altre forme di conoscenza di sé (dopotutto, le aveva), ma piuttosto ha qualificato il loro ruolo.
Le persone non sperimentano la coscienza o le emozioni, ma piuttosto i propri corpi, e le reazioni interne sono risposte a stimoli interni (Skinner, 1987). Un ulteriore problema con i processi interni è che tradurli in linguaggio è difficile, perché il linguaggio non cattura completamente le dimensioni di un'esperienza interna (ad esempio, il dolore). Molto di ciò che viene chiamato conoscenza implica l'uso del linguaggio (comportamento verbale). I pensieri sono tipi di comportamento che sono provocati da altri stimoli (ambientali o privati) e che danno origine a risposte (palesi o nascoste). Quando gli eventi privati sono espressi come comportamenti palesi, il loro ruolo in un'analisi funzionale può essere determinato.
Analisi Funzionale del Comportamento
Skinner (1953) si riferiva al suo modo di esaminare il comportamento come un'analisi funzionale:
Le variabili esterne di cui il comportamento è una funzione forniscono ciò che può essere chiamato un'analisi causale o funzionale. Ci impegniamo a prevedere e controllare il comportamento dell'organismo individuale. Questa è la nostra “variabile dipendente”: l'effetto per il quale dobbiamo trovare la causa. Le nostre “variabili indipendenti”: le cause del comportamento: sono le condizioni esterne di cui il comportamento è una funzione. Le relazioni tra le due: le “relazioni di causa-effetto” nel comportamento: sono le leggi di una scienza. Una sintesi di queste leggi espresse in termini quantitativi fornisce un quadro completo dell'organismo come sistema comportamentale. (p. 35)
L'apprendimento è “la riorganizzazione delle risposte in una situazione complessa”; il condizionamento si riferisce al “rafforzamento del comportamento che deriva dal rinforzo” (Skinner, 1953, p. 65). Esistono due tipi di condizionamento: Tipo S e Tipo R. Il Tipo S è il condizionamento pavloviano, caratterizzato dall'associazione dello stimolo rinforzante (incondizionato) con un altro stimolo (condizionato). La S richiama l'attenzione sull'importanza dello stimolo nell'ottenere una risposta dall'organismo. La risposta data allo stimolo elicitante è nota come comportamento rispondente.
Sebbene il condizionamento di Tipo S possa spiegare le reazioni emotive condizionate, la maggior parte dei comportamenti umani vengono emessi in presenza di stimoli piuttosto che automaticamente elicitati da essi. Le risposte sono controllate dalle loro conseguenze, non da stimoli antecedenti. Questo tipo di comportamento, che Skinner ha definito Tipo R per enfatizzare l'aspetto della risposta, è un comportamento operante perché opera sull'ambiente per produrre un effetto.
Skinner (1938, p. 21):
Se il verificarsi di un operante è seguito dalla presentazione di uno stimolo rinforzante, la forza aumenta. . . . Se il verificarsi di un operante già rafforzato attraverso il condizionamento non è seguito dallo stimolo rinforzante, la forza diminuisce.
Potremmo pensare al comportamento operante come “imparare facendo” e, di fatto, gran parte dell'apprendimento avviene quando eseguiamo comportamenti (Lesgold, 2001). A differenza del comportamento rispondente, che prima del condizionamento non si verifica, la probabilità di occorrenza di un operante non è mai zero perché la risposta deve essere data affinché il rinforzo venga fornito. Il rinforzo cambia la probabilità o il tasso di occorrenza della risposta. I comportamenti operanti agiscono sui loro ambienti e diventano più o meno probabili a causa del rinforzo.
Processi di base
Questa sezione esamina i processi di base nel condizionamento operante: rinforzo, estinzione, rinforzi primari e secondari, il principio di Premack, punizione, programmi di rinforzo, generalizzazione e discriminazione.
Rinforzo
Il rinforzo è responsabile del rafforzamento della risposta, aumentando la frequenza della risposta o rendendo più probabile che le risposte si verifichino. Un rinforzatore (o stimolo di rinforzo) è qualsiasi stimolo o evento che segue una risposta che porta al rafforzamento della risposta. I rinforzatori (ricompense) sono definiti in base ai loro effetti, che non dipendono da processi mentali come coscienza, intenzioni o obiettivi (Schultz, 2006). Poiché i rinforzatori sono definiti dai loro effetti, non possono essere determinati in anticipo.
Skinner (1953, pp. 72–73):
L'unico modo per dire se un dato evento è rinforzante per un dato organismo in determinate condizioni è fare un test diretto. Osserviamo la frequenza di una risposta selezionata, quindi rendiamo un evento contingente su di essa e osserviamo qualsiasi cambiamento nella frequenza. Se c'è un cambiamento, classifichiamo l'evento come rinforzante per l'organismo nelle condizioni esistenti.
I rinforzatori sono specifici per la situazione: si applicano agli individui in determinati momenti in determinate condizioni. Ciò che è rinforzante per un particolare studente durante la lettura ora potrebbe non esserlo durante la matematica ora o durante la lettura più tardi. Nonostante questa specificità, gli stimoli o gli eventi che rafforzano il comportamento possono, in una certa misura, essere previsti (Skinner, 1953). Gli studenti in genere trovano rinforzanti eventi come lodi degli insegnanti, tempo libero, privilegi, adesivi e voti alti. Tuttavia, non si può mai sapere con certezza se una conseguenza è rinforzante finché non viene presentata dopo una risposta e vediamo se il comportamento cambia.
Il modello operante di base del condizionamento è la contingenza a tre termini:
Uno stimolo discriminativo prepara l'occasione per l'emissione di una risposta (R), seguita da uno stimolo di rinforzo ( , o rinforzo). Lo stimolo di rinforzo è qualsiasi stimolo (evento, conseguenza) che aumenta la probabilità che la risposta venga emessa in futuro quando è presente lo stimolo discriminativo. In termini più familiari, potremmo etichettare questo il modello A-B-C:
Il rinforzo positivo implica la presentazione di uno stimolo, o l'aggiunta di qualcosa a una situazione, a seguito di una risposta, che aumenta la probabilità futura che tale risposta si verifichi in quella situazione. Un rinforzatore positivo è uno stimolo che, quando presentato a seguito di una risposta, aumenta la probabilità futura che la risposta si verifichi in quella situazione. Nello scenario di apertura, Leo utilizza i punti come rinforzatori positivi per un buon comportamento.
'T' si riferisce all'insegnante, 'L' all'alunno:
| Stimolo discriminativo | Risposta | Stimolo rinforzante (punitivo) |
|---|---|---|
| Rinforzo positivo (presenta rinforzatore positivo) | - | - |
| 'T': dà tempo di studio indipendente | 'L': studia | 'T': loda 'L': per il buon lavoro |
| Rinforzo negativo (rimuove rinforzatore negativo) | - | - |
| 'T': dà tempo di studio indipendente | 'L': studia | 'T': dice che 'L': non deve fare i compiti |
| Punizione (presenta rinforzatore negativo) | - | - |
| 'T': dà tempo di studio indipendente | 'L': perde tempo | 'T': assegna i compiti |
| Punizione (rimuove rinforzatore positivo) | - | - |
| 'T': dà tempo di studio indipendente | 'L': perde tempo | 'T': dice che 'L': perderà il tempo libero |
Il rinforzo negativo comporta la rimozione di uno stimolo, o la sottrazione di qualcosa da una situazione a seguito di una risposta, che aumenta la probabilità futura che la risposta si verifichi in quella situazione. Un rinforzatore negativo è uno stimolo che, quando rimosso da una risposta, aumenta la probabilità futura che la risposta si verifichi in quella situazione. Alcuni stimoli che spesso funzionano come rinforzatori negativi sono luci intense, rumori forti, critiche, persone fastidiose e voti bassi, perché i comportamenti che li rimuovono tendono a essere rinforzanti. Il rinforzo positivo e negativo hanno lo stesso effetto: aumentano la probabilità che la risposta venga data in futuro in presenza dello stimolo.
Per illustrare questi processi, si supponga che un insegnante stia tenendo una sessione di domande e risposte con la classe. L'insegnante pone una domanda ( o A), chiama uno studente volontario che dà la risposta corretta (R o B) e loda lo studente ( o C). Se il volontariato di questo studente aumenta o rimane a un livello alto, la lode è un rinforzatore positivo e questo è un esempio di rinforzo positivo perché dare la lode ha aumentato il volontariato. Ora si supponga che dopo che uno studente dà la risposta corretta l'insegnante gli dice che non ha bisogno di fare i compiti. Se il volontariato di questo studente aumenta o rimane a un livello alto, i compiti sono un rinforzatore negativo e questo è un esempio di rinforzo negativo perché rimuovere i compiti ha aumentato il volontariato.
Rinforzo positivo e negativo
Gli insegnanti possono usare il rinforzo positivo e negativo per motivare gli studenti a padroneggiare le abilità e trascorrere più tempo sul compito. Ad esempio, mentre insegna concetti in un'unità di scienze, un insegnante potrebbe chiedere agli studenti di completare le domande alla fine del capitolo. L'insegnante potrebbe anche allestire centri di attività intorno alla stanza che coinvolgono esperimenti pratici relativi alla lezione. Gli studenti circolerebbero e completerebbero gli esperimenti a condizione che rispondano correttamente alle domande del capitolo (rinforzo positivo). Questa contingenza riflette il principio di Premack di fornire l'opportunità di impegnarsi in un'attività più apprezzata (esperimenti) come rinforzo per impegnarsi in una meno apprezzata (completare le domande del capitolo). Gli studenti che completano correttamente l'80% delle domande e che partecipano a un minimo di due esperimenti non devono fare i compiti. Questo funzionerebbe come rinforzo negativo nella misura in cui gli studenti percepiscono i compiti come un rinforzatore negativo.
Un consulente della scuola media che lavora con uno studente per migliorare il comportamento in classe potrebbe chiedere a ciascuno degli insegnanti dello studente di spuntare “sì” o “no” in relazione al comportamento in classe per quel giorno (accettabile, inaccettabile). Per ogni “sì”, lo studente riceve 1 minuto nel laboratorio di informatica per giocare ai giochi al computer (rinforzo positivo per questo studente). Alla fine della settimana lo studente può utilizzare il tempo al computer guadagnato dopo il pranzo. Inoltre, se lo studente guadagna un minimo di 15 minuti in laboratorio, non deve portare a casa una nota di comportamento da firmare dai genitori (questo presuppone che lo studente percepisca una nota di comportamento come un rinforzatore negativo).
Estinzione
L'estinzione comporta il declino della forza della risposta a causa della mancanza di rinforzo. Gli studenti che alzano la mano in classe ma non vengono mai chiamati possono smettere di alzare la mano. Le persone che inviano molti messaggi di posta elettronica alla stessa persona ma non ricevono mai una risposta alla fine possono smettere di inviare messaggi a quella persona.
La velocità con cui si verifica l'estinzione dipende dalla storia del rinforzo (Skinner, 1953). L'estinzione si verifica rapidamente se poche risposte precedenti sono state rinforzate. La risposta è molto più durevole con una storia di rinforzo più lunga. L'estinzione non è la stessa cosa della dimenticanza. Le risposte che si estinguono possono essere eseguite ma non lo sono a causa della mancanza di rinforzo. Negli esempi precedenti, gli studenti sanno ancora come alzare la mano e le persone sanno ancora come inviare messaggi di posta elettronica. La dimenticanza implica una vera perdita di condizionamento nel tempo in cui le opportunità di risposta non sono state presenti.
Rinforzatori primari e secondari
Stimoli come cibo, acqua e riparo sono chiamati rinforzatori primari perché sono necessari per la sopravvivenza. I rinforzatori secondari sono stimoli che vengono condizionati attraverso la loro associazione con rinforzatori primari. Il bicchiere di latte preferito di un bambino diventa secondariamente rinforzante attraverso la sua associazione con il latte (un rinforzatore primario). Un rinforzatore secondario che viene abbinato a più di un rinforzatore primario è un rinforzatore generalizzato. Le persone lavorano lunghe ore per guadagnare denaro (un rinforzatore generalizzato), che usano per acquistare molti rinforzatori (ad esempio, cibo, alloggio, televisori, vacanze).
Il condizionamento operante spiega lo sviluppo e il mantenimento di gran parte del comportamento sociale con rinforzatori generalizzati. I bambini possono comportarsi in modi per attirare l'attenzione degli adulti. L'attenzione è rinforzante perché è abbinata a rinforzatori primari degli adulti (ad esempio, cibo, acqua, protezione). Importanti rinforzatori generalizzati educativi sono la lode degli insegnanti, i voti alti, i privilegi, gli onori e i diplomi. Questi rinforzatori sono spesso abbinati ad altri rinforzatori generalizzati, come l'approvazione (da parte di genitori e amici) e il denaro (un diploma universitario porta a un buon lavoro).
Principio di Premack
Ricorda che etichettiamo una conseguenza comportamentale come rinforzante solo dopo averla applicata e aver visto come influisce sul comportamento futuro. È alquanto preoccupante che dobbiamo usare il buon senso o il processo per tentativi ed errori nella scelta dei rinforzatori perché non possiamo sapere con certezza in anticipo se una conseguenza funzionerà come un rinforzatore.
Premack (1962, 1971) ha descritto un mezzo per ordinare i rinforzatori che consente di prevedere i rinforzatori. Il principio di Premack afferma che l'opportunità di impegnarsi in un'attività più apprezzata rafforza l'impegno in un'attività meno apprezzata, dove “valore” è definito in termini di quantità di risposta o tempo trascorso sull'attività in assenza di rinforzo. Se viene organizzata una contingenza in modo tale che il valore del secondo evento (contingente) sia superiore al valore del primo evento (strumentale), ci si aspetterà un aumento della probabilità di occorrenza del primo evento (l'ipotesi della ricompensa). Se il valore del secondo evento è inferiore a quello del primo evento, la probabilità di occorrenza del primo evento dovrebbe diminuire (l'ipotesi della punizione).
Supponiamo che a un bambino sia permesso di scegliere tra lavorare a un progetto artistico, andare al centro multimediale, leggere un libro in classe o lavorare al computer. Nel corso di 10 scelte di questo tipo, il bambino va al centro multimediale 6 volte, lavora al computer 3 volte, lavora a un progetto artistico 1 volta e non legge mai un libro in classe. Per questo bambino, l'opportunità di andare al centro multimediale è la più apprezzata. Per applicare il principio di Premack, un insegnante potrebbe dire al bambino: “Dopo aver finito di leggere questo libro, puoi andare al centro multimediale.” Una notevole evidenza empirica supporta le idee di Premack, specialmente per quanto riguarda l'ipotesi della ricompensa (Dunham, 1977).
Il principio di Premack offre una guida per la selezione di rinforzatori efficaci: osservare cosa fanno le persone quando hanno una scelta e ordinare quei comportamenti in termini di probabilità. L'ordine non è permanente, poiché il valore dei rinforzatori può cambiare. Qualsiasi rinforzatore, quando applicato spesso, può provocare sazietà e portare a una diminuzione della risposta. Gli insegnanti che impiegano il principio di Premack devono controllare periodicamente le preferenze degli studenti osservandoli e chiedendo loro cosa gli piace fare. Determinare in anticipo quali rinforzatori hanno maggiori probabilità di essere efficaci in una situazione è fondamentale nella pianificazione di un programma di cambiamento comportamentale (Timberlake & Farmer-Dougan, 1991).
Punizione
La punizione diminuisce la probabilità futura di rispondere a uno stimolo. La punizione può comportare il ritiro di un rinforzatore positivo o la presentazione di un rinforzatore negativo a seguito di una risposta, come mostrato nella tabella 'Processi di rinforzo e punizione'. Supponiamo che durante una sessione di domande e risposte uno studente infastidisca ripetutamente un altro studente quando l'insegnante non sta guardando (l'insegnante non sta guardando o A; cattiva condotta = R o B). L'insegnante individua la cattiva condotta e dice: “Smetti di infastidirlo” ( o C). Se lo studente smette di infastidire l'altro studente, la critica dell'insegnante opera come un rinforzatore negativo e questo è un esempio di punizione perché dare la critica ha diminuito la cattiva condotta. Ma si noti che dal punto di vista dell'insegnante, questo è un esempio di rinforzo negativo (cattiva condotta = o A; critica = R o B; fine della cattiva condotta = o C). Poiché l'insegnante è stato rinforzato negativamente, è probabile che l'insegnante continui a criticare la cattiva condotta degli studenti.
Invece di criticare lo studente, si supponga che l'insegnante dica: “Oggi dovrai rimanere dentro durante la ricreazione.” Se la cattiva condotta dello studente si ferma, la ricreazione funziona come un rinforzatore positivo e questo è un esempio di punizione perché la perdita della ricreazione ferma la cattiva condotta. Come prima, la cessazione della cattiva condotta degli studenti è rinforzante negativamente per l'insegnante.
La punizione sopprime una risposta ma non la elimina; quando la minaccia di punizione viene rimossa, la risposta punita può ritornare. Gli effetti della punizione sono complessi. La punizione spesso porta a risposte che sono incompatibili con il comportamento punito e che sono abbastanza forti da sopprimerlo (Skinner, 1953). Sculacciare un bambino per cattiva condotta può produrre senso di colpa e paura, che possono sopprimere la cattiva condotta. Se il bambino si comporta male in futuro, il senso di colpa e la paura condizionati possono riapparire e portare il bambino a smettere rapidamente di comportarsi male. La punizione condiziona anche le risposte che portano a sfuggire o evitare la punizione. Gli studenti il cui insegnante critica le risposte errate imparano presto a evitare di offrire risposte. La punizione può condizionare comportamenti disadattivi, perché la punizione non insegna come comportarsi in modo più produttivo. La punizione può ulteriormente ostacolare l'apprendimento creando un conflitto tale che l'individuo oscilla tra rispondere in un modo o nell'altro. Se l'insegnante a volte critica gli studenti per le risposte errate e a volte no, gli studenti non sanno mai quando arriverà la critica. Un comportamento variabile di questo tipo può avere sottoprodotti emotivi (paura, rabbia, pianto) che interferiscono con l'apprendimento.
La punizione è usata spesso nelle scuole per affrontare i problemi. Le punizioni comuni sono la perdita di privilegi, gli allontanamenti dalla classe, le sospensioni dentro e fuori dalla scuola e le espulsioni (Maag, 2001). Eppure ci sono diverse alternative alla punizione. Una è quella di cambiare gli stimoli discriminativi per il comportamento negativo. Ad esempio, uno studente seduto in fondo alla stanza può comportarsi male spesso. Gli insegnanti possono cambiare gli stimoli discriminativi spostando lo studente problematico nella parte anteriore della classe. Un'altra alternativa è quella di permettere al comportamento indesiderato di continuare fino a quando l'autore non diventa sazio, il che è simile al metodo della fatica di Guthrie. Un genitore può permettere a un bambino che fa i capricci di continuare a farli fino a quando non si stanca. Una terza alternativa è quella di estinguere un comportamento indesiderato ignorandolo. Questo può funzionare bene con comportamenti scorretti minori (ad esempio, studenti che sussurrano l'uno all'altro), ma quando le classi diventano problematiche, gli insegnanti devono agire in altri modi. Una quarta alternativa è quella di condizionare un comportamento incompatibile con il rinforzo positivo. La lode dell'insegnante per le abitudini di lavoro produttive aiuta a condizionare quelle abitudini. Il vantaggio principale di questa alternativa rispetto alla punizione è che mostra allo studente come comportarsi in modo adattivo.
| Alternativa | Esempio |
|---|---|
| Cambia gli stimoli discriminativi | Allontana lo studente che si comporta male dagli altri studenti che si comportano male. |
| Permetti al comportamento indesiderato di continuare | Chiedi allo studente che si alza quando dovrebbe essere seduto di continuare a stare in piedi. |
| Estingui il comportamento indesiderato | Ignora il comportamento scorretto minore in modo che non sia rinforzato dall'attenzione dell'insegnante. |
| Condiziona un comportamento incompatibile | Rinforza i progressi di apprendimento, che si verificano solo quando lo studente non si comporta male. |
Programmi di rinforzo
I programmi si riferiscono a quando viene applicato il rinforzo (Ferster & Skinner, 1957; Skinner, 1938; Zeiler, 1977). Un programma continuo prevede il rinforzo per ogni risposta corretta. Questo può essere auspicabile mentre le abilità vengono acquisite: gli studenti ricevono un feedback dopo ogni risposta sull'accuratezza del loro lavoro. Il rinforzo continuo aiuta a garantire che le risposte errate non vengano apprese.
Un programma intermittente prevede il rinforzo di alcune ma non tutte le risposte corrette. Il rinforzo intermittente è comune nelle classi, perché di solito non è possibile per gli insegnanti rinforzare ogni studente per ogni risposta corretta o desiderabile. Gli studenti non vengono chiamati ogni volta che alzano la mano, non vengono elogiati dopo aver lavorato su ogni problema e non viene costantemente detto loro che si stanno comportando in modo appropriato.
I programmi intermittenti sono definiti in termini di tempo o numero di risposte. Un programma a intervalli prevede il rinforzo della prima risposta corretta dopo uno specifico periodo di tempo. In un programma a intervallo fisso (FI), l'intervallo di tempo è costante da un rinforzo all'altro. Un programma FI5 significa che il rinforzo viene fornito per la prima risposta data dopo 5 minuti. Gli studenti che ricevono 30 minuti di tempo libero ogni venerdì (a condizione di un buon comportamento durante la settimana) operano secondo un programma a intervallo fisso. In un programma a intervallo variabile (VI), l'intervallo di tempo varia da occasione a occasione intorno a un valore medio. Un programma VI5 significa che in media, la prima risposta corretta dopo 5 minuti viene rinforzata, ma l'intervallo di tempo varia (ad esempio, 2, 3, 7 o 8 minuti). Gli studenti che ricevono 30 minuti di tempo libero (a condizione di un buon comportamento) in media una volta alla settimana, ma non necessariamente lo stesso giorno ogni settimana, operano secondo un programma a intervallo variabile.
Un programma a rapporto dipende dal numero di risposte corrette o dalla velocità di risposta. In un programma a rapporto fisso (FR), ogni ennesima risposta corretta viene rinforzata, dove n è costante. Un programma FR10 significa che ogni 10a risposta corretta riceve un rinforzo. In un programma a rapporto variabile (VR), ogni ennesima risposta corretta viene rinforzata, ma il valore varia intorno a un numero medio n. Un insegnante può dare tempo libero dopo che ogni quinta attività di lavoro è stata completata (FR5) o periodicamente intorno a una media di cinque attività completate (VR5).
I programmi di rinforzo producono modelli caratteristici di risposta. In generale, i programmi a rapporto producono tassi di risposta più elevati rispetto ai programmi a intervalli. Un fattore limitante nei programmi a rapporto è l'affaticamento dovuto alla risposta rapida. I programmi a intervallo fisso producono un modello a forma di conchiglia. La risposta diminuisce immediatamente dopo il rinforzo, ma aumenta verso la fine dell'intervallo tra i rinforzi. Il programma a intervallo variabile produce un tasso di risposta costante. I quiz non annunciati operano su programmi a intervallo variabile e in genere mantengono gli studenti che studiano regolarmente. I programmi intermittenti sono più resistenti all'estinzione rispetto ai programmi continui: quando il rinforzo viene interrotto, la risposta continua per un tempo più lungo se il rinforzo è stato intermittente piuttosto che continuo. La durata dei programmi intermittenti può essere vista nella persistenza delle persone in eventi come giocare alle slot machine, pescare e fare acquisti per affari.
Generalizzazione
Una volta che una certa risposta si verifica regolarmente a un dato stimolo, la risposta può verificarsi anche ad altri stimoli. Questo è chiamato generalizzazione (Skinner, 1953). La generalizzazione sembra problematica per la teoria operante, perché una risposta non dovrebbe essere data in una situazione in cui non è mai stata rinforzata. Skinner ha spiegato la generalizzazione notando che le persone eseguono molti comportamenti che portano alla risposta finale (rinforzata). Questi comportamenti componenti sono spesso parte delle catene di comportamento di diversi compiti e quindi sono rinforzati in contesti diversi. Quando le persone sono in una nuova situazione, è probabile che eseguano i comportamenti componenti, che producono una risposta accurata o una rapida acquisizione della risposta corretta.
Ad esempio, gli studenti con buone abitudini accademiche in genere vengono in classe, prestano attenzione e partecipano alle attività, prendono appunti, fanno le letture richieste e si tengono al passo con i compiti. Questi comportamenti componenti producono risultati elevati e voti. Quando tali studenti iniziano una nuova classe, non è necessario che il contenuto sia simile alle classi precedenti in cui sono stati iscritti. Piuttosto, i comportamenti componenti hanno ricevuto un rinforzo ripetuto e quindi è probabile che si generalizzino al nuovo ambiente.
La generalizzazione, tuttavia, non si verifica automaticamente. O'Leary e Drabman (1971) hanno notato che la generalizzazione “deve essere programmata come qualsiasi altro cambiamento comportamentale” (p. 393). Un problema con molti programmi di modifica del comportamento è che cambiano i comportamenti ma i nuovi comportamenti non si generalizzano al di fuori del contesto di formazione. O'Leary e Drabman (1971) offrono suggerimenti su come facilitare la generalizzazione.
Discriminazione
La discriminazione, il processo complementare alla generalizzazione, implica rispondere in modo diverso (in intensità o velocità) a seconda dello stimolo o delle caratteristiche di una situazione (Rilling, 1977). Sebbene gli insegnanti vogliano che gli studenti generalizzino ciò che imparano ad altre situazioni, vogliono anche che rispondano in modo discriminatorio. Nel risolvere problemi di matematica, gli insegnanti potrebbero volere che gli studenti adottino un approccio generale alla risoluzione dei problemi che comprenda passaggi come determinare le informazioni fornite e necessarie, disegnare un'immagine e generare formule utili. Gli insegnanti vogliono anche che gli studenti imparino a discriminare i tipi di problemi (ad esempio, area, velocità-tempo-distanza, tasso di interesse). Essere in grado di identificare rapidamente il tipo di problema aumenta il successo degli studenti.
Generalizzazione
La generalizzazione può far avanzare lo sviluppo delle competenze in diverse aree disciplinari. Trovare le idee principali è rilevante per le arti linguistiche, le scienze sociali, la matematica (problemi di parole) e altre aree di contenuto. Un insegnante di arti linguistiche potrebbe fornire agli studenti una strategia per trovare le idee principali. Una volta che gli studenti padroneggiano questa strategia, l'insegnante spiega come modificarne l'uso per altre materie accademiche e chiede agli studenti di pensare agli usi. Insegnando bene la strategia in un dominio e facilitando le potenziali applicazioni in altri domini, gli insegnanti risparmiano molto tempo e sforzi perché non devono insegnare la strategia in ogni area di contenuto.
L'insegnamento dei comportamenti previsti (ad esempio, camminare nel corridoio, alzare la mano per parlare) può anche essere generalizzato. Ad esempio, se tutti gli insegnanti della settima elementare decidono di far usare agli studenti lo stesso formato per l'intestazione dei loro documenti, potrebbe essere spiegato in una classe. Quindi agli studenti potrebbe essere chiesto di usare lo stesso formato (con piccole modifiche) in ciascuna delle loro altre classi.
| Nome | Scopo |
|---|---|
| Coinvolgimento dei genitori | Coinvolgi i genitori nei programmi di cambiamento comportamentale. |
| Alte aspettative | Trasmetti agli studenti che sono capaci di esibirsi bene. |
| Autovalutazione | Insegna agli studenti a monitorare e valutare i loro comportamenti. |
| Contingenza | Ritira le contingenza artificiali (ad esempio, punti) e sostituiscile con quelle naturali (privilegi). |
| Partecipazione | Consenti agli studenti di partecipare alla specificazione dei comportamenti da rinforzare e delle contingenza di rinforzo. |
| Accademici | Fornisci un buon programma accademico perché molti studenti con problemi comportamentali hanno carenze accademiche. |
| Vantaggi | Mostra agli studenti come i cambiamenti comportamentali li avvantaggeranno collegando i cambiamenti alle attività di interesse. |
| Rinforzo | Rinforza gli studenti in diversi ambienti per ridurre la discriminazione tra situazioni rinforzate e non rinforzate. |
| Coerenza | Prepara gli insegnanti nelle classi normali a continuare a modellare i comportamenti degli studenti nelle classi speciali dopo che sono stati integrati nel programma normale. |
Spence (1936) ha proposto che per insegnare la discriminazione, le risposte desiderate dovrebbero essere rinforzate e le risposte indesiderate estinte mediante la mancanza di rinforzo. A scuola, gli insegnanti sottolineano le somiglianze e le differenze tra contenuti simili e prevedono revisioni periodiche per garantire che gli studenti discriminino correttamente e applichino metodi corretti di risoluzione dei problemi.
Si pensa generalmente che gli errori siano dirompenti e producano l'apprendimento di risposte errate. Ciò suggerisce che gli errori degli studenti dovrebbero essere ridotti al minimo. Se tutti gli errori debbano essere eliminati è discutibile. La ricerca sulla motivazione mostra che gli studenti che imparano a gestire gli errori in modo adattivo successivamente persistono più a lungo su compiti difficili rispetto agli studenti che hanno sperimentato un apprendimento senza errori (Dweck, 1975)
Cambiamento Comportamentale
Il rinforzo può essere dato per aver dato risposte corrette solo quando le persone sanno cosa fare. Spesso, tuttavia, le risposte operanti non esistono in forma finale e rifinita. Se gli insegnanti aspettano di fornire rinforzo fino a quando gli studenti emettono le risposte corrette, molti studenti non riceverebbero mai rinforzo perché non acquisirebbero mai le risposte. Ora passiamo a una discussione su come avviene il cambiamento comportamentale nel condizionamento operante, che ha importanti implicazioni per l'apprendimento.
Approssimazioni Successive (Modellamento)
Il metodo base del condizionamento operante per il cambiamento comportamentale è il modellamento, o rinforzo differenziale di approssimazioni successive alla forma o al ritmo desiderato del comportamento (Morse & Kelleher, 1977). Per modellare il comportamento, si aderisce alla seguente sequenza:
- Identificare ciò che lo studente sa fare ora (comportamento iniziale)
- Identificare il comportamento desiderato
- Identificare potenziali rinforzi nell'ambiente dello studente
- Dividere il comportamento desiderato in piccoli sottogradi da padroneggiare in sequenza
- Spostare lo studente dal comportamento iniziale al comportamento desiderato rinforzando successivamente ogni approssimazione al comportamento desiderato
Il modellamento è apprendere facendo con feedback correttivo. Un esempio naturale di modellamento può essere visto in uno studente che tenta di tirare a canestro da un punto del campo. Il primo tiro è corto rispetto al canestro. Lo studente tira più forte la seconda volta e la palla colpisce il tabellone. Lo studente non tira così forte la terza volta e la palla colpisce il bordo destro e rimbalza. Al quarto tentativo, lo studente tira con la stessa forza del terzo tentativo ma mira a sinistra. La palla colpisce il bordo sinistro e rimbalza. Infine, lo studente tira con la stessa forza ma mira leggermente a destra e la palla entra nel canestro. Gradualmente il tiro è stato affinato in una forma accurata.
Il modellamento potrebbe essere applicato sistematicamente con uno studente iperattivo che può lavorare su un compito solo per un paio di minuti prima di distrarsi. L'obiettivo è modellare il comportamento dello studente in modo che possa lavorare ininterrottamente per 30 minuti. Inizialmente l'insegnante fornisce un rinforzo quando lo studente lavora in modo produttivo per 2 minuti. Dopo diversi intervalli di 2 minuti di successo, il criterio per il rinforzo viene portato a 3 minuti. Supponendo che lavori ininterrottamente per diversi periodi di 3 minuti, il criterio viene portato a 4 minuti. Questo processo continua fino all'obiettivo di 30 minuti, a condizione che lo studente esegua in modo affidabile al livello del criterio. Se lo studente incontra difficoltà a un certo punto, il criterio per il rinforzo diminuisce a un livello in cui può eseguire con successo.
Un'abilità accademica che potrebbe essere modellata è insegnare a uno studente le tabelline del 6. Attualmente conosce solo e Per guadagnare rinforzo, deve recitare correttamente questi due più Dopo che può farlo in modo affidabile, il criterio per il rinforzo viene innalzato per includere Questo processo continua fino a quando non recita accuratamente tutti i fatti fino a
Concatenamento
La maggior parte delle azioni umane sono complesse e includono diverse contingenze a tre termini (A–B–C) collegate successivamente. Ad esempio, tirare a canestro richiede palleggiare, girarsi, mettersi in posizione, saltare e rilasciare la palla. Ogni risposta altera l'ambiente e questa condizione alterata funge da stimolo per la risposta successiva. Il concatenamento è il processo di produzione o alterazione di alcune delle variabili che fungono da stimoli per le risposte future (Skinner, 1953). Una catena consiste in una serie di operanti, ognuno dei quali prepara l'occasione per ulteriori risposte.
Le catene sono simili agli atti di Guthrie, mentre le singole contingenze a tre termini assomigliano ai movimenti. Alcune catene acquisiscono un'unità funzionale; la catena è una sequenza integrata tale che l'implementazione di successo definisce un'abilità. Quando le abilità sono ben affinate, l'esecuzione della catena avviene automaticamente. Andare in bicicletta consiste in diversi atti discreti, eppure un ciclista esperto li esegue con scarso o nessun sforzo cosciente. Tale automaticità è spesso presente nelle abilità cognitive (ad esempio, leggere, risolvere problemi matematici). Il concatenamento svolge un ruolo fondamentale nell'acquisizione di abilità (Gollub, 1977; Skinner, 1978).
Behavior Modification
La modifica del comportamento (o terapia comportamentale) si riferisce all'applicazione sistematica dei principi di apprendimento comportamentale per facilitare i comportamenti adattivi (Ullmann & Krasner, 1965). La modifica del comportamento è stata impiegata con adulti e bambini in contesti diversi come aule scolastiche, contesti di consulenza, prigioni e ospedali psichiatrici. È stata utilizzata per trattare fobie, linguaggio disfunzionale, comportamenti dirompenti, interazioni sociali negative, scarsa educazione dei figli e scarso autocontrollo (Ayllon & Azrin, 1968; Becker, 1971; Keller & Ribes-Inesta, 1974; Ulrich, Stachnik, & Mabry, 1966). Lovaas (1977) ha impiegato con successo la modifica del comportamento per insegnare il linguaggio ai bambini autistici.
Behavior Modification
La modifica del comportamento per gli studenti problematici è difficile perché tali studenti possono mostrare poche risposte appropriate da rinforzare positivamente. Un insegnante potrebbe usare lo shaping per affrontare un specifico comportamento fastidioso. Kathy Stone ha problemi con Erik, che continuamente spinge e urta gli altri studenti quando la classe si mette in fila per andare da qualche parte nell'edificio. Quando la classe sta percorrendo solo una breve distanza, la signora Stone potrebbe informare Erik che se rimane in fila senza spingere e urtare, sarà il capofila sulla via del ritorno in classe; tuttavia, se spinge o urta, verrà immediatamente rimosso dalla fila. Questa procedura può essere ripetuta finché Erik non riesce a gestire brevi distanze. La signora Stone può quindi permettergli di camminare con la classe per distanze progressivamente più lunghe finché non riesce a comportarsi in fila per qualsiasi distanza.
Sarah, un'altra bambina nella classe di Kathy Stone, consegna frequentemente lavori disordinati. La signora Stone potrebbe usare rinforzatori generalizzati come adesivi speciali (scambiabili con vari privilegi) per aiutare Sarah, il cui lavoro è tipicamente sporco, strappato e a malapena leggibile. A Sarah viene detto che se consegna un compito pulito, può guadagnare un adesivo; se non è strappato, un altro adesivo; e se la scrittura è ordinata, un terzo adesivo. Una volta che Sarah inizia a migliorare, la signora Stone può gradualmente spostare le ricompense in altre aree di miglioramento (ad esempio, lavoro corretto, finire il lavoro in tempo).
Tecniche
Le tecniche di base della modifica del comportamento includono il rinforzo dei comportamenti desiderati e l'estinzione di quelli indesiderati. La punizione viene impiegata raramente ma, quando viene utilizzata, più spesso comporta la rimozione di un rinforzatore positivo piuttosto che la presentazione di un rinforzatore negativo.
Nel decidere un programma di cambiamento, i modificatori del comportamento si concentrano in genere sui seguenti tre aspetti (Ullmann & Krasner, 1965):
- Quali dei comportamenti dell'individuo sono disadattivi e quali dovrebbero essere aumentati (diminuiti)?
- Quali contingenze ambientali supportano attualmente i comportamenti dell'individuo (sia per mantenere comportamenti indesiderabili sia per ridurre la probabilità di eseguire risposte più adattive)?
- Quali caratteristiche ambientali possono essere alterate per cambiare il comportamento dell'individuo?
Il cambiamento è più probabile quando i modificatori e i clienti concordano sulla necessità di un cambiamento e decidono congiuntamente gli obiettivi desiderati. Il primo passo per stabilire un programma è definire il problema in termini comportamentali. Ad esempio, l'affermazione “Keith è fuori dal suo posto troppo spesso” si riferisce a un comportamento manifesto che può essere misurato: si può tenere un registro della quantità di tempo in cui Keith è fuori dal suo posto. Le espressioni generali che si riferiscono a elementi non osservabili (“Keith ha un brutto atteggiamento”) non consentono una definizione oggettiva del problema.
Il passo successivo è determinare i rinforzatori che mantengono il comportamento indesiderabile. Forse Keith riceve l'attenzione dell'insegnante solo quando si alza dal suo posto e non quando è seduto. Un piano semplice è far sì che l'insegnante presti attenzione a Keith mentre è seduto e impegnato nel lavoro accademico e di ignorarlo quando si alza dal suo posto. Se la quantità di volte in cui Keith si alza dal suo posto diminuisce, l'attenzione dell'insegnante è un rinforzatore positivo.
Un programma di modifica del comportamento potrebbe impiegare rinforzatori generalizzati come punti che gli studenti scambiano con rinforzatori di backup, come ricompense tangibili, tempo libero o privilegi. Avere più di un backup assicura che almeno uno sia efficace per ogni studente in ogni momento. Deve essere stabilito un criterio comportamentale per guadagnare il rinforzo. La procedura di modellamento in five fasi (discusso in precedenza) può essere impiegata. Il criterio è inizialmente definito al livello del comportamento iniziale e progredisce a piccoli incrementi verso il comportamento desiderato. Viene dato un punto allo studente ogni volta che il criterio viene soddisfitto. Per estinguere qualsiasi comportamento indesiderabile di Keith, l'insegnante non dovrebbe prestargli troppa attenzione se si alza dal suo posto, ma piuttosto dovrebbe informarlo privatamente che poiché non soddisfa il criterio, non guadagna un punto.
La punizione viene usata di rado, ma potrebbe essere necessaria quando il comportamento diventa così dirompente da non poter essere ignorato (ad esempio, litigare). Una punizione comune è il time-out (dalla rinforzo). Durante il time-out, lo studente viene rimosso dal contesto sociale della classe. Lì lo studente continua a impegnarsi nel lavoro accademico senza interazione sociale tra pari o l'opportunità di guadagnare rinforzo. Un'altra punizione è rimuovere i rinforzatori positivi (ad esempio, tempo libero, ricreazione, privilegi) per cattiva condotta.
I critici hanno sostenuto che la modifica del comportamento plasma comportamenti quieti e docili (Winett & Winkler, 1972). Sebbene sia necessaria una ragionevole quantità di silenzio per garantire che l'apprendimento avvenga, alcuni insegnanti cercano un'aula silenziosa in ogni momento, anche quando un po' di rumore dalle interazioni sociali faciliterebbe l'apprendimento. L'uso della modifica del comportamento non è intrinsecamente né buono né cattivo. Può produrre un'aula silenziosa o promuovere iniziative sociali da parte di bambini introversi (Strain, Kerr, & Ragland, 1981). Come le tecniche stesse, gli obiettivi della modifica del comportamento devono essere pensati attentamente da coloro che implementano le procedure.
Cognitive Behavior Modification
I ricercatori hanno anche incorporato elementi cognitivi nelle procedure di modifica del comportamento. Nella modifica del comportamento cognitivo, i pensieri degli studenti (quando verbalizzati) funzionano come stimoli discriminativi e rinforzanti. Pertanto, gli studenti possono verbalmente istruire se stessi su cosa fare e quindi eseguire il comportamento appropriato. Le tecniche di modifica del comportamento cognitivo vengono spesso applicate con studenti con handicap (Hallahan, Kneedler, & Lloyd, 1983) e utilizzate per ridurre l'iperattività e l'aggressività (Robinson, Smith, Miller, & Brownell, 1999). L'addestramento auto-istruzionale di Meichenbaum (1977) è un esempio di modifica del comportamento cognitivo.
Autoregolamentazione
Il condizionamento operante affronta anche l'autoregolamentazione (Mace, Belfiore, & Hutchinson, 2001; Mace, Belfiore, & Shea, 1989). Questa prospettiva è trattata in dettaglio nel Capitolo 9. La teoria operante sostiene che il comportamento autoregolato implica la scelta tra corsi d'azione alternativi (Brigham, 1982), tipicamente differendo un rinforzo immediato a favore di un rinforzo futuro diverso, e di solito maggiore. Per esempio, Trisha resta a casa il venerdì sera per studiare per un esame invece di uscire con gli amici, e Kyle continua a lavorare su un compito accademico nonostante le prese in giro dei compagni nelle vicinanze. Stanno differendo il rinforzo immediato per l'anticipato rinforzo futuro, come fa John nel prossimo esempio.
John ha difficoltà a studiare. Nonostante le buone intenzioni, dedica poco tempo allo studio ed è facilmente distratto. Una chiave per cambiare il suo comportamento è stabilire stimoli discriminativi (indizi) per lo studio. Con l'assistenza del suo consulente scolastico, John stabilisce un tempo e un luogo definiti per lo studio (dalle 19:00 alle 21:00 nella sua stanza con una pausa di 10 minuti). Per eliminare gli indizi che distraggono, John accetta di non usare il cellulare, il lettore CD, il computer o la TV durante questo periodo. Per il rinforzo, John si assegnerà un punto per ogni notte in cui riesce a portare a termine con successo la sua routine. Quando riceve 10 punti, può prendersi una serata libera.
Da una prospettiva di condizionamento operante, si decide quali comportamenti regolare, si stabiliscono stimoli discriminativi per il loro verificarsi, si valuta la performance in termini di corrispondenza con lo standard e si somministra il rinforzo. Come discusso, i tre sottoprocessi chiave sono l'automontaggio (attenzione deliberata ad aspetti selezionati del proprio comportamento), l'auto-istruzione ( s che impostano l'occasione per l'auto-regolamentazione , portando a , e l'auto-rinforzo (rinforzarsi per l'esecuzione di una risposta corretta).