Operantní podmiňování: Teorie a aplikace v praxi

Úvod

Známou behaviorální teorií je operantní podmiňování, formulovaná B. F. (Burrhus Frederic) Skinnerem (1904–1990). Od 30. let 20. století Skinner publikoval řadu článků, které uváděly výsledky laboratorních studií se zvířaty, ve kterých identifikoval různé složky operantního podmiňování. Většinu této rané práce shrnul ve své vlivné knize The Behavior of Organisms (Skinner, 1938).

Skinner aplikoval své myšlenky na lidské problémy. Na začátku své kariéry se začal zajímat o vzdělávání a vyvinul výukové stroje a programované vyučování. The Technology of Teaching (Skinner, 1968) se zabývá výukou, motivací, disciplínou a kreativitou. V roce 1948, po obtížném období svého života, vydal Walden Two, který popisuje, jak lze behaviorální principy aplikovat na vytvoření utopické společnosti. Skinner (1971) se zabýval problémy moderního života a zasazoval se o aplikaci behaviorální technologie na navrhování kultur v Beyond Freedom and Dignity. Skinner a další aplikovali principy operantního podmiňování na takové oblasti, jako je školní učení a disciplína, vývoj dítěte, osvojování jazyka, sociální chování, duševní choroby, zdravotní problémy, zneužívání návykových látek a odborné vzdělávání (DeGrandpre, 2000; Karoly & Harris, 1986; Morris, 2003).

Jako mladý muž Skinner toužil být spisovatelem (Skinner, 1970):
Postavil jsem si malou pracovnu na půdě a pustil se do práce. Výsledky byly katastrofální. Promrhal jsem svůj čas. Bezcílně jsem četl, stavěl modely lodí, hrál na klavír, poslouchal nově vynalezené rádio, přispíval do humoristické rubriky místních novin, ale nenapsal jsem téměř nic jiného a uvažoval jsem o návštěvě psychiatra. (s. 6)

O psychologii se začal zajímat po přečtení Pavlovových (1927) Conditioned Reflexes a Watsonova (1924) Behaviorism. Jeho následná kariéra měla hluboký dopad na psychologii učení.

Navzdory svému přiznání, že “se mi nepodařilo stát se spisovatelem, protože jsem neměl nic důležitého, co bych řekl” (Skinner, 1970, s. 7), byl plodným spisovatelem, který své literární ambice nasměroval do vědeckého psaní, které trvalo šest desetiletí (Lattal, 1992). Jeho oddanost svému povolání je patrná z toho, že osm dní před svou smrtí přednesl pozvanou přednášku na sjezdu Americké psychologické asociace (Holland, 1992; Skinner, 1990). Asociace ho poctila speciálním vydáním svého měsíčníku American Psychologist (American Psychological Association, 1992). Ačkoli byla jeho teorie současnými teoretiky učení zdiskreditována, protože nedokáže adekvátně vysvětlit vyšší a komplexní formy učení (Bargh & Ferguson, 2000), jeho vliv pokračuje, protože principy operantního podmiňování se běžně používají ke zlepšení učení a chování studentů (Morris, 2003). V úvodním scénáři například Leo používá principy operantního podmiňování k potlačení nevhodného chování studentů. Emily a Shayna na druhé straně argumentují pro důležitost kognitivních faktorů.

Konceptuální rámec

Tato část pojednává o předpokladech operantního podmiňování, o tom, jak odráží funkční analýzu chování, a o důsledcích této teorie pro predikci a kontrolu chování. Teorie a principy operantního podmiňování jsou komplexní (Dragoi & Staddon, 1999); principy, které jsou nejrelevantnější pro lidské učení, jsou popsány v této kapitole.

Vědecké předpoklady

Pavlov lokalizoval místo učení do nervového systému a nahlížel na chování jako na projev neurologického fungování. Skinner (1938) nepopíral, že neurologické fungování doprovází chování, ale věřil, že psychologii chování lze chápat v jejích vlastních termínech bez odkazu na neurologické nebo jiné vnitřní události.

Skinner vznášel podobné námitky proti nepozorovatelným procesům a entitám navrhovaným moderními kognitivními pohledy na učení (Overskeid, 2007). Soukromé události neboli vnitřní reakce jsou přístupné pouze jedinci a lze je studovat prostřednictvím verbálních zpráv lidí, které jsou formami chování (Skinner, 1953). Skinner nepopíral existenci postojů, přesvědčení, názorů, tužeb a dalších forem sebepoznání (koneckonců je měl), ale spíše kvalifikoval jejich roli.

Lidé nezažívají vědomí nebo emoce, ale spíše svá vlastní těla a vnitřní reakce jsou reakcemi na vnitřní podněty (Skinner, 1987). Dalším problémem s vnitřními procesy je, že je obtížné je překládat do jazyka, protože jazyk zcela nezachycuje dimenze vnitřní zkušenosti (např. bolest). Většina toho, co se nazývá vědění, zahrnuje používání jazyka (verbální chování). Myšlenky jsou typy chování, které jsou vyvolány jinými podněty (vnějšími nebo soukromými) a které vedou k reakcím (zjevným nebo skrytým). Když jsou soukromé události vyjádřeny jako zjevné chování, lze určit jejich roli ve funkční analýze.

Funkční analýza chování

Skinner (1953) označil svůj způsob zkoumání chování jako funkční analýzu:
Vnější proměnné, jejichž funkcí je chování, poskytují to, co lze nazvat kauzální nebo funkční analýzou. Podnikáme kroky k predikci a kontrole chování jednotlivého organismu. Toto je naše “závislá proměnná” – efekt, pro který máme najít příčinu. Naše “nezávislé proměnné” – příčiny chování – jsou vnější podmínky, jejichž funkcí je chování. Vztahy mezi těmito dvěma – “vztahy příčiny a následku” v chování – jsou zákony vědy. Syntéza těchto zákonů vyjádřená v kvantitativních termínech poskytuje komplexní obraz organismu jako chovajícího se systému. (str. 35)

Učení je “přeskupení reakcí v komplexní situaci”; podmiňování se týká “posilování chování, které vyplývá z posílení” (Skinner, 1953, str. 65). Existují dva typy podmiňování: Typ S a Typ R. Typ S je pavlovovské podmiňování, charakterizované párováním posilujícího (nepodmíněného) podnětu s jiným (podmíněným) podnětem. S upozorňuje na důležitost podnětu při vyvolávání reakce od organismu. Reakce na vyvolávající podnět je známá jako respondentní chování.

Ačkoli typ S podmiňování může vysvětlit podmíněné emocionální reakce, většina lidského chování je vyvolána v přítomnosti podnětů, spíše než aby byla automaticky vyvolána. Reakce jsou kontrolovány jejich důsledky, nikoli předchozími podněty. Tento typ chování, který Skinner nazval Typ R, aby zdůraznil aspekt reakce, je operantní chování, protože působí na prostředí a produkuje efekt.

Skinner (1938, str. 21):
Pokud po výskytu operantu následuje prezentace posilujícího podnětu, síla se zvýší. . . . Pokud po výskytu operantu, který již byl posílen podmiňováním, nenásleduje posilující podnět, síla se sníží.

Operantní chování si můžeme představit jako “učení se praxí” a ve skutečnosti k velkému množství učení dochází, když provádíme chování (Lesgold, 2001). Na rozdíl od respondentního chování, které se před podmiňováním nevyskytuje, pravděpodobnost výskytu operantu není nikdy nulová, protože reakce musí být provedena, aby bylo poskytnuto posílení. Posílení mění pravděpodobnost nebo míru výskytu reakce. Operantní chování působí na své prostředí a stává se více či méně pravděpodobné, že se vyskytne kvůli posílení.

Základní procesy

Tato část se zabývá základními procesy operantního podmiňování: zpevňování, vyhasínání, primární a sekundární zpevňovače, Premackův princip, trest, schémata zpevňování, generalizace a diskriminace.

Zpevňování

Zpevňování je zodpovědné za posilování reakce – zvyšování frekvence reakcí nebo zvyšování pravděpodobnosti jejich výskytu. Zpevňovač (neboli zpevňující stimul) je jakýkoli stimul nebo událost následující po reakci, která vede k posílení této reakce. Zpevňovače (odměny) jsou definovány na základě svých účinků, které nezávisí na mentálních procesech, jako je vědomí, záměry nebo cíle (Schultz, 2006). Protože jsou zpevňovače definovány svými účinky, nelze je určit předem.

Skinner (1953, s. 72–73):
Jediný způsob, jak zjistit, zda je daná událost pro daný organismus za daných podmínek zpevňující, je provést přímý test. Pozorujeme frekvenci vybrané reakce, poté na ni navážeme danou událost a pozorujeme jakoukoli změnu frekvence. Pokud dojde ke změně, klasifikujeme událost jako zpevňující pro organismus za stávajících podmínek.

Zpevňovače jsou situačně specifické: Vztahují se na jedince v daném čase a za daných podmínek. Co je pro konkrétního studenta zpevňující při čtení nyní, nemusí být zpevňující při matematice nyní nebo při čtení později. Navzdory této specifičnosti lze stimuly nebo události, které zpevňují chování, do jisté míry předvídat (Skinner, 1953). Studenti obvykle považují za zpevňující události, jako je pochvala od učitele, volný čas, privilegia, nálepky a dobré známky. Nicméně nikdy nelze s jistotou vědět, zda je důsledek zpevňující, dokud není prezentován po reakci a my neuvidíme, zda se chování změní.

Základní operantní model podmiňování je třísložková kontingence:

Diskriminační stimul vytváří příležitost pro vyslání reakce (R), která je následována zpevňujícím stimulem ( , neboli zpevněním). Zpevňující stimul je jakýkoli stimul (událost, důsledek), který zvyšuje pravděpodobnost, že reakce bude v budoucnu vyslána, když je přítomen diskriminační stimul. V běžnějším pojetí bychom to mohli označit jako model A-B-C:

Pozitivní zpevňování zahrnuje prezentaci stimulu nebo přidání něčeho do situace po reakci, což zvyšuje budoucí pravděpodobnost výskytu této reakce v dané situaci. Pozitivní zpevňovač je stimul, který, když je prezentován po reakci, zvyšuje budoucí pravděpodobnost výskytu reakce v dané situaci. V úvodním scénáři Leo používá body jako pozitivní zpevňovače za dobré chování.

'U' odkazuje na učitele, 'Ž' na žáka:

Procesy zpevňování a trestání.
Diskriminační stimul Reakce Zpevňující (trestající) stimul
Pozitivní zpevnění (Prezentace pozitivního zpevňovače) - -
'U': dává čas na samostatné studium 'Ž': studuje 'U': chválí 'Ž' za dobrou práci
Negativní zpevnění (Odstranění negativního zpevňovače) - -
'U': dává čas na samostatné studium 'Ž': studuje 'U': říká 'Ž', že nemusí dělat domácí úkol
Trest (Prezentace negativního zpevňovače) - -
'U': dává čas na samostatné studium 'Ž': mrhá časem 'U': dává domácí úkol
Trest (Odstranění pozitivního zpevňovače) - -
'U': dává čas na samostatné studium 'Ž': mrhá časem 'U': říká 'Ž', že přijde o volný čas

Negativní zpevňování zahrnuje odstranění stimulu nebo odebrání něčeho ze situace po reakci, což zvyšuje budoucí pravděpodobnost, že se reakce v dané situaci objeví. Negativní zpevňovač je stimul, který, když je odstraněn reakcí, zvyšuje budoucí pravděpodobnost výskytu reakce v dané situaci. Některé stimuly, které často fungují jako negativní zpevňovače, jsou jasná světla, hlasité zvuky, kritika, otravní lidé a špatné známky, protože chování, které je odstraňuje, bývá zpevňující. Pozitivní a negativní zpevňování mají stejný účinek: zvyšují pravděpodobnost, že reakce bude v budoucnu provedena za přítomnosti stimulu.

Pro ilustraci těchto procesů předpokládejme, že učitel vede se třídou sezení s otázkami a odpověďmi. Učitel položí otázku ( neboli A), vyvolá dobrovolníka, který správně odpoví (R neboli B), a studenta pochválí ( neboli C). Pokud se dobrovolné hlášení tohoto studenta zvýší nebo zůstane na vysoké úrovni, je pochvala pozitivním zpevňovačem a jedná se o příklad pozitivního zpevňování, protože udělení pochvaly zvýšilo dobrovolné hlášení. Nyní předpokládejme, že poté, co student správně odpoví, učitel studentovi řekne, že nemusí dělat domácí úkol. Pokud se dobrovolné hlášení tohoto studenta zvýší nebo zůstane na vysoké úrovni, je domácí úkol negativním zpevňovačem a jedná se o příklad negativního zpevňování, protože odstranění domácího úkolu zvýšilo dobrovolné hlášení.

Pozitivní a negativní zpevňování

Učitelé mohou používat pozitivní a negativní zpevňování k motivaci studentů, aby si osvojili dovednosti a trávili více času plněním úkolů. Například při výuce pojmů v rámci přírodovědné lekce může učitel požádat studenty, aby vyplnili otázky na konci kapitoly. Učitel také může po místnosti rozmístit centra aktivit, která zahrnují praktické experimenty související s lekcí. Studenti by cirkulovali a prováděli experimenty v závislosti na úspěšném zodpovězení otázek z kapitoly (pozitivní zpevnění). Tato kontingence odráží Premackův princip poskytnutí příležitosti zapojit se do více ceněné aktivity (experimenty) jako zpevňovače pro zapojení se do méně ceněné aktivity (vyplňování otázek z kapitoly). Studenti, kteří správně zodpoví 80 % otázek a zúčastní se minimálně dvou experimentů, nemusí dělat domácí úkol. To by fungovalo jako negativní zpevnění do té míry, do jaké studenti vnímají domácí úkol jako negativní zpevňovač.

Školní poradce na druhém stupni, který pracuje se studentem na zlepšení chování ve třídě, by mohl nechat každého z učitelů studenta zaškrtnout „ano“ nebo „ne“ v souvislosti s chováním ve třídě pro daný den (přijatelné, nepřijatelné). Za každé „ano“ student získá 1 minutu v počítačové laboratoři na hraní počítačových her (pro tohoto studenta pozitivní zpevnění). Na konci týdne může student využít získaný čas na počítači po obědě. Dále, pokud student získá minimálně 15 minut v laboratoři, nemusí si domů nosit poznámku o chování k podpisu rodičům (to předpokládá, že student vnímá poznámku o chování jako negativní zpevňovač).

Vyhasínání

Vyhasínání zahrnuje pokles síly reakce v důsledku nezpevňování. Studenti, kteří se ve třídě hlásí, ale nikdy nejsou vyvoláni, se mohou přestat hlásit. Lidé, kteří posílají mnoho e-mailových zpráv stejné osobě, ale nikdy neobdrží odpověď, mohou nakonec přestat této osobě zprávy posílat.

Jak rychle k vyhasínání dochází, závisí na historii zpevňování (Skinner, 1953). K vyhasínání dochází rychle, pokud bylo zpevněno jen málo předchozích reakcí. Reagování je mnohem trvalejší s delší historií zpevňování. Vyhasínání není totéž co zapomínání. Reakce, které vyhasnou, mohou být provedeny, ale nejsou prováděny kvůli nedostatku zpevnění. V předchozích příkladech studenti stále vědí, jak se hlásit, a lidé stále vědí, jak posílat e-mailové zprávy. Zapomínání zahrnuje skutečnou ztrátu podmiňování v průběhu času, kdy nebyly přítomny příležitosti k reagování.

Primární a sekundární zpevňovače

Stimuly jako jídlo, voda a přístřeší se nazývají primární zpevňovače, protože jsou nezbytné pro přežití. Sekundární zpevňovače jsou stimuly, které se stávají podmíněnými prostřednictvím jejich spojení s primárními zpevňovači. Oblíbená sklenice na mléko se pro dítě stává sekundárně zpevňující díky jejímu spojení s mlékem (primární zpevňovač). Sekundární zpevňovač, který se spáruje s více než jedním primárním zpevňovačem, je generalizovaný zpevňovač. Lidé pracují dlouhé hodiny, aby si vydělali peníze (generalizovaný zpevňovač), které používají k nákupu mnoha zpevňovačů (např. jídlo, bydlení, televize, dovolené).

Operantní podmiňování vysvětluje vývoj a udržování mnoha sociálních chování pomocí generalizovaných zpevňovačů. Děti se mohou chovat způsoby, které přitahují pozornost dospělých. Pozornost je zpevňující, protože je spárována s primárními zpevňovači od dospělých (např. jídlo, voda, ochrana). Důležitými vzdělávacími generalizovanými zpevňovači jsou pochvala od učitele, dobré známky, privilegia, vyznamenání a tituly. Tyto zpevňovače jsou často spárovány s jinými generalizovanými zpevňovači, jako je souhlas (od rodičů a přátel) a peníze (vysokoškolský titul vede k dobrému zaměstnání).

Premackův princip

Připomeňme si, že behaviorální důsledek označujeme jako zpevňující až poté, co jej aplikujeme a vidíme, jak ovlivňuje budoucí chování. Je poněkud znepokojující, že při výběru zpevňovačů musíme používat zdravý rozum nebo metodu pokusu a omylu, protože nemůžeme předem s jistotou vědět, zda bude důsledek fungovat jako zpevňovač.

Premack (1962, 1971) popsal způsob uspořádání zpevňovačů, který umožňuje jejich předvídání. Premackův princip říká, že příležitost zapojit se do více ceněné aktivity zpevňuje zapojení se do méně ceněné aktivity, kde je „hodnota“ definována jako množství reakcí nebo čas strávený aktivitou v nepřítomnosti zpevnění. Pokud je uspořádána kontingence tak, že hodnota druhé (podmíněné) události je vyšší než hodnota první (instrumentální) události, očekává se nárůst pravděpodobnosti výskytu první události (předpoklad odměny). Pokud je hodnota druhé události nižší než hodnota první události, pravděpodobnost výskytu první události by se měla snížit (předpoklad trestu).

Předpokládejme, že si dítě může vybrat mezi prací na výtvarném projektu, návštěvou mediálního centra, čtením knihy ve třídě nebo prací na počítači. V průběhu 10 takových voleb dítě 6krát navštíví mediální centrum, 3krát pracuje na počítači, 1krát pracuje na výtvarném projektu a nikdy si nečte knihu ve třídě. Pro toto dítě je nejvíce ceněna příležitost jít do mediálního centra. Pro aplikaci Premackova principu by učitel mohl dítěti říci: „Až dočteš tuto knihu, můžeš jít do mediálního centra.“ Premackovy myšlenky podporuje značné množství empirických důkazů, zejména s ohledem na předpoklad odměny (Dunham, 1977).

Premackův princip nabízí vodítko pro výběr účinných zpevňovačů: pozorujte, co lidé dělají, když mají na výběr, a seřaďte tato chování podle pravděpodobnosti. Pořadí není trvalé, protože hodnota zpevňovačů se může měnit. Jakýkoli zpevňovač, pokud je aplikován často, může vést k nasycení a snížení reakcí. Učitelé, kteří používají Premackův princip, musí pravidelně kontrolovat preference studentů tím, že je pozorují a ptají se jich, co rádi dělají. Určení, které zpevňovače budou v dané situaci pravděpodobně účinné, je klíčové pro plánování programu změny chování (Timberlake & Farmer-Dougan, 1991).

Trest

Trest snižuje budoucí pravděpodobnost reakce na stimul. Trest může zahrnovat odebrání pozitivního zpevňovače nebo prezentaci negativního zpevňovače po reakci, jak je ukázáno v tabulce 'Procesy zpevňování a trestání.' Předpokládejme, že během sezení s otázkami a odpověďmi student opakovaně obtěžuje jiného studenta, když se učitel nedívá (učitel se nedívá neboli A; nevhodné chování = R neboli B). Učitel si nevhodného chování všimne a řekne: „Přestaň ho obtěžovat“ ( neboli C). Pokud student přestane obtěžovat druhého studenta, učitelova kritika funguje jako negativní zpevňovač a jedná se o příklad trestu, protože udělení kritiky snížilo nevhodné chování. Ale všimněte si, že z pohledu učitele se jedná o příklad negativního zpevňování (nevhodné chování = neboli A; kritika = R neboli B; konec nevhodného chování = neboli C). Protože byl učitel negativně zpevněn, je pravděpodobné, že bude i nadále kritizovat nevhodné chování studentů.

Místo kritiky studenta předpokládejme, že učitel řekne: „Dnes budeš muset zůstat o přestávce uvnitř.“ Pokud se nevhodné chování studenta zastaví, přestávka funguje jako pozitivní zpevňovač a jedná se o příklad trestu, protože ztráta přestávky zastaví nevhodné chování. Stejně jako předtím je ukončení nevhodného chování studenta pro učitele negativně zpevňující.

Trest potlačuje reakci, ale neodstraňuje ji; když je hrozba trestu odstraněna, potrestaná reakce se může vrátit. Účinky trestu jsou složité. Trest často vyvolává reakce, které jsou neslučitelné s potrestaným chováním a jsou dostatečně silné na to, aby ho potlačily (Skinner, 1953). Výprask dítěti za nevhodné chování může vyvolat pocit viny a strachu, což může nevhodné chování potlačit. Pokud se dítě v budoucnu chová nevhodně, podmíněný pocit viny a strachu se může znovu objevit a vést dítě k rychlému zastavení nevhodného chování. Trest také podmiňuje reakce, které vedou k úniku nebo vyhýbání se trestu. Studenti, jejichž učitel kritizuje nesprávné odpovědi, se brzy naučí vyhýbat se dobrovolnému odpovídání. Trest může podmiňovat maladaptivní chování, protože trest neučí, jak se chovat produktivněji. Trest může dále bránit učení tím, že vytváří konflikt, kdy jedinec váhá mezi jedním a druhým způsobem reakce. Pokud učitel někdy studenty za nesprávné odpovědi kritizuje a jindy ne, studenti nikdy nevědí, kdy kritika přijde. Takové proměnlivé chování může mít emocionální vedlejší produkty – strach, hněv, pláč – které zasahují do učení.

Trest se ve školách často používá k řešení rušivých projevů. Běžnými tresty jsou ztráta privilegií, vyloučení ze třídy, suspendování ve škole i mimo ni a vyloučení ze školy (Maag, 2001). Přesto existuje několik alternativ k trestu. Jednou z nich je změna diskriminačních stimulů pro negativní chování. Například student sedící v zadní části místnosti se může často chovat nevhodně. Učitelé mohou změnit diskriminační stimuly přesunutím rušivého studenta do přední části třídy. Další alternativou je nechat nežádoucí chování pokračovat, dokud se pachatel nenasytí, což je podobné Guthrieho metodě únavy. Rodič může nechat dítě, které má záchvat vzteku, pokračovat v něm, dokud se neunaví. Třetí alternativou je vyhasnout nežádoucí chování ignorováním. To může dobře fungovat u drobných projevů nevhodného chování (např. studenti si šeptají), ale když se třídy stanou rušivými, učitelé musí jednat jinak. Čtvrtou alternativou je podmínit neslučitelné chování pozitivním zpevňováním. Pochvala učitele za produktivní pracovní návyky pomáhá tyto návyky podmínit. Hlavní výhodou této alternativy oproti trestu je, že ukazuje studentovi, jak se chovat adaptivně.

Alternativy k trestu.
Alternativa Příklad
Změna diskriminačních stimulů Přesunutí nevhodně se chovajícího studenta od ostatních nevhodně se chovajících studentů.
Ponechání nežádoucího chování, aby pokračovalo Nechat studenta, který stojí, když by měl sedět, aby stál i nadále.
Vyhasnutí nežádoucího chování Ignorování drobného nevhodného chování, aby nebylo zpevňováno pozorností učitele.
Podmínění neslučitelného chování Zpevňování pokroku v učení, k němuž dochází pouze tehdy, když se student nechová nevhodně.

Schémata zpevňování

Schémata odkazují na to, kdy je zpevnění aplikováno (Ferster & Skinner, 1957; Skinner, 1938; Zeiler, 1977). Kontinuální schéma zahrnuje zpevnění každé správné reakce. To může být žádoucí při osvojování dovedností: studenti dostávají zpětnou vazbu po každé reakci týkající se správnosti jejich práce. Kontinuální zpevňování pomáhá zajistit, aby se nenaučili nesprávné reakce.

Intermitentní schéma zahrnuje zpevňování některých, ale ne všech správných reakcí. Intermitentní zpevňování je ve třídách běžné, protože pro učitele obvykle není možné zpevnit každého studenta za každou správnou nebo žádoucí reakci. Studenti nejsou vyvoláváni pokaždé, když se přihlásí, nejsou chváleni po vyřešení každého problému a není jim neustále říkáno, že se chovají vhodně.

Intermitentní schémata jsou definována z hlediska času nebo počtu reakcí. Intervalové schéma zahrnuje zpevnění první správné reakce po určitém časovém období. V schématu s pevným intervalem (FI) je časový interval konstantní od jednoho zpevnění k druhému. Schéma FI5 znamená, že zpevnění je poskytnuto za první reakci učiněnou po 5 minutách. Studenti, kteří dostanou 30 minut volného času každý pátek (podmíněno dobrým chováním během týdne), fungují podle schématu s pevným intervalem. V schématu s proměnlivým intervalem (VI) se časový interval mění od příležitosti k příležitosti kolem nějaké průměrné hodnoty. Schéma VI5 znamená, že v průměru je první správná reakce po 5 minutách zpevněna, ale časový interval se mění (např. 2, 3, 7 nebo 8 minut). Studenti, kteří dostávají 30 minut volného času (podmíněno dobrým chováním) v průměru jednou týdně, ale ne nutně každý týden ve stejný den, fungují podle schématu s proměnlivým intervalem.

Poměrové schéma závisí na počtu správných reakcí nebo frekvenci reakcí. V schématu s pevným poměrem (FR) je každá n-tá správná reakce zpevněna, kde n je konstantní. Schéma FR10 znamená, že každá 10. správná reakce obdrží zpevnění. V schématu s proměnlivým poměrem (VR) je každá n-tá správná reakce zpevněna, ale hodnota se mění kolem průměrného čísla n. Učitel může dát volný čas po každém pátém dokončeném úkolu v pracovním sešitě (FR5) nebo periodicky kolem průměru pěti dokončených úkolů (VR5).

Schémata zpevňování produkují charakteristické vzorce reakcí. Obecně platí, že poměrová schémata produkují vyšší frekvenci reakcí než intervalová schémata. Omezujícím faktorem v poměrových schématech je únava způsobená rychlým reagováním. Schémata s pevným intervalem produkují vroubkovaný vzor. Reagování klesá ihned po zpevnění, ale ke konci intervalu mezi zpevněními se zvyšuje. Schéma s proměnlivým intervalem produkuje stabilní frekvenci reakcí. Neohlášené testy fungují podle schémat s proměnlivým intervalem a obvykle udržují studenty v pravidelném studiu. Intermitentní schémata jsou odolnější vůči vyhasínání než kontinuální schémata: když je zpevňování přerušeno, reagování pokračuje déle, pokud bylo zpevňování intermitentní, nikoli kontinuální. Trvanlivost intermitentních schémat lze vidět na vytrvalosti lidí při činnostech, jako je hraní na automatech, rybaření a hledání výhodných nákupů.

Generalizace

Jakmile se určitá reakce pravidelně vyskytuje na daný stimul, může se tato reakce objevit i na jiné stimuly. Toto se nazývá generalizace (Skinner, 1953). Generalizace se pro operantní teorii zdá být problematická, protože reakce by neměla být provedena v situaci, ve které nikdy nebyla zpevněna. Skinner vysvětlil generalizaci tím, že poznamenal, že lidé provádějí mnoho chování, která vedou k finální (zpevněné) reakci. Tyto dílčí chování jsou často součástí řetězců chování různých úkolů, a proto jsou zpevňovány v různých kontextech. Když jsou lidé v nové situaci, je pravděpodobné, že provedou dílčí chování, která vedou k přesné reakci nebo rychlému osvojení správné reakce.

Například studenti s dobrými studijními návyky obvykle chodí na hodiny, věnují pozornost aktivitám a účastní se jich, dělají si poznámky, čtou povinnou literaturu a plní zadané úkoly. Tyto dílčí chování vedou k vysokým výsledkům a známkám. Když takoví studenti začnou navštěvovat nový kurz, není nutné, aby obsah byl podobný předchozím kurzům, které absolvovali. Spíše dílčí chování byla opakovaně zpevňována, a proto je pravděpodobné, že se generalizují na nové prostředí.

Generalizace však nenastává automaticky. O'Leary a Drabman (1971) poznamenali, že generalizace „musí být naprogramována jako jakákoli jiná změna chování“ (s. 393). Jedním z problémů mnoha programů modifikace chování je, že mění chování, ale nové chování se negeneralizuje mimo tréninkový kontext. O'Leary a Drabman (1971) nabízejí návrhy, jak generalizaci usnadnit.

Diskriminace

Diskriminace, doplňkový proces ke generalizaci, zahrnuje odlišné reagování (v intenzitě nebo frekvenci) v závislosti na stimulu nebo vlastnostech situace (Rilling, 1977). Ačkoli učitelé chtějí, aby studenti generalizovali to, co se naučili, na jiné situace, chtějí také, aby reagovali diskriminačně. Při řešení matematických slovních úloh mohou učitelé chtít, aby studenti přijali obecný přístup k řešení problémů, který zahrnuje kroky jako určení daných a potřebných informací, nakreslení obrázku a generování užitečných vzorců. Učitelé také chtějí, aby se studenti naučili rozlišovat typy problémů (např. plocha, čas-rychlost-vzdálenost, úroková sazba). Schopnost rychle identifikovat typ problému zvyšuje úspěšnost studentů.

Generalizace

Generalizace může podpořit rozvoj dovedností napříč předměty. Hledání hlavních myšlenek je relevantní pro jazykové umění, společenské vědy, matematiku (slovní úlohy) a další obsahové oblasti. Učitel jazykového umění může studentům poskytnout strategii pro hledání hlavních myšlenek. Jakmile si studenti tuto strategii osvojí, učitel vysvětlí, jak její použití upravit pro jiné akademické předměty, a požádá studenty, aby přemýšleli o jejím využití. Tím, že učitelé dobře vyučují strategii v jedné oblasti a usnadňují její potenciální aplikace v jiných oblastech, ušetří mnoho času a úsilí, protože nemusí strategii vyučovat v každé obsahové oblasti.

Výuka očekávaného chování (např. chůze po chodbě, zvednutí ruky při mluvení) může být také generalizována. Pokud se například všichni učitelé sedmého ročníku rozhodnou, že studenti budou používat stejný formát záhlaví na svých pracích, mohlo by to být vysvětleno v jedné třídě. Poté by mohli být studenti požádáni, aby používali stejný formát (s drobnými úpravami) v každé z jejich ostatních tříd.

Návrhy pro usnadnění generalizace.
Název Účel
Zapojení rodičů Zapojit rodiče do programů změny chování.
Vysoká očekávání Sdělit studentům, že jsou schopni podávat dobré výkony.
Sebehodnocení Učit studenty sledovat a hodnotit své chování.
Kontingence Odebrat umělé kontingence (např. body) a nahradit je přirozenými (privilegia).
Účast Umožnit studentům podílet se na specifikaci chování, které má být zpevňováno, a na kontingencích zpevňování.
Akademické výsledky Poskytnout dobrý akademický program, protože mnoho studentů s problémy v chování má akademické nedostatky.
Přínosy Ukázat studentům, jak jim změny v chování prospějí, spojením změn s aktivitami, které je zajímají.
Zpevňování Zpevňovat studenty v různých prostředích, aby se snížila diskriminace mezi zpevňovanými a nezpevňovanými situacemi.
Konzistence Připravit učitele v běžných třídách, aby pokračovali ve formování chování studentů ze speciálních tříd poté, co jsou zařazeni do běžného programu.

Spence (1936) navrhl, že pro výuku diskriminace by měly být žádoucí reakce zpevňovány a nežádoucí reakce vyhasínány nezpevňováním. Ve škole učitelé poukazují na podobnosti a rozdíly mezi podobným obsahem a zajišťují periodická opakování, aby se ujistili, že studenti správně diskriminují a používají správné metody řešení problémů.

Chyby jsou obecně považovány za rušivé a vedoucí k učení se nesprávným reakcím. To naznačuje, že by chyby studentů měly být minimalizovány. Zda je třeba všechny chyby eliminovat, je diskutabilní. Výzkum motivace ukazuje, že studenti, kteří se naučí s chybami zacházet adaptivním způsobem, následně déle vytrvají u obtížných úkolů než studenti, kteří zažili bezchybné učení (Dweck, 1975).

Změna chování

Posílení může být poskytováno za správné reakce pouze tehdy, když lidé vědí, co mají dělat. Často však operantní reakce neexistují v finální, vybroušené formě. Pokud učitelé čekají s poskytováním posílení, dokud žáci neprojeví správné reakce, mnoho žáků by nikdy posílení nedostalo, protože by se nikdy nenaučili reagovat. Nyní se zaměříme na diskusi o tom, jak dochází ke změně chování v operantním podmiňování, což má důležité důsledky pro učení.

Postupné aproximace (tvarování)

Základní metodou operantního podmiňování pro změnu chování je tvarování, neboli diferenciální posilování postupných aproximací k požadované formě nebo frekvenci chování (Morse & Kelleher, 1977). Pro tvarování chování se dodržuje následující posloupnost:

  • Identifikujte, co student umí nyní (počáteční chování)
  • Identifikujte požadované chování
  • Identifikujte potenciální posilovače v prostředí studenta
  • Rozdělte požadované chování na malé dílčí kroky, které se mají postupně zvládnout
  • Posuňte studenta od počátečního chování k požadovanému chování postupným posilováním každé aproximace k požadovanému chování

Tvarování je učení se činností s korektivní zpětnou vazbou. Přirozený příklad tvarování lze vidět u studenta, který se snaží střílet na koš z určitého bodu na hřišti. První střela nedosáhne koše. Student střílí silněji podruhé a míč se dotkne desky. Student nestřílí tak silně potřetí a míč se dotkne pravého okraje a odrazí se. Při čtvrtém pokusu student střílí stejně silně jako při třetím pokusu, ale míří doleva. Míč se dotkne levého okraje a odrazí se. Nakonec student střílí stejně silně, ale míří mírně doprava a míč vletí do koše. Postupně se střela zdokonalila do přesné formy.

Tvarování lze systematicky aplikovat u hyperaktivního studenta, který je schopen pracovat na úkolu pouze několik minut, než se rozptýlí. Cílem je vytvarovat chování studenta tak, aby mohl pracovat nerušeně po dobu 30 minut. Zpočátku učitel poskytuje posílení, když student pracuje produktivně po dobu 2 minut. Po několika úspěšných 2minutových intervalech se kritérium pro posílení zvýší na 3 minuty. Za předpokladu, že student pracuje nerušeně po dobu několika 3minutových intervalů, se kritérium zvýší na 4 minuty. Tento proces pokračuje až do cíle 30 minut, pokud student spolehlivě plní kritéria. Pokud se student v kterémkoli bodě setká s obtížemi, kritérium pro posílení se sníží na úroveň, na které je schopen úspěšně pracovat.

Akademická dovednost, kterou lze tvarovat, je naučit studenta násobilku čísla 6. V současné době zná pouze a Aby získal posílení, musí správně odříkat tyto dva plus Poté, co to dokáže spolehlivě, se kritérium pro posílení zvýší o Tento proces pokračuje, dokud přesně neodříká všechny faktory až do

Řetězení

Většina lidských akcí je složitá a zahrnuje několik tříčlenných kontingencí (A–B–C) postupně propojených. Například střelba na koš vyžaduje driblování, otáčení, zaujetí pozice, skákání a uvolnění míče. Každá reakce mění prostředí a tato změněná podmínka slouží jako podnět pro další reakci. Řetězení je proces vytváření nebo úpravy některých proměnných, které slouží jako podněty pro budoucí reakce (Skinner, 1953). Řetěz se skládá ze série operantů, z nichž každý připravuje půdu pro další reakce.

Řetězy se podobají Guthrieho aktům, zatímco jednotlivé tříčlenné kontingence se podobají pohybům. Některé řetězy získávají funkční jednotu; řetěz je integrovaná sekvence, takže úspěšná implementace definuje dovednost. Když jsou dovednosti dobře vybroušeny, provádění řetězu probíhá automaticky. Jízda na kole se skládá z několika diskrétních aktů, přesto zkušený jezdec tyto úkony provádí s malým nebo žádným vědomým úsilím. Taková automatizace je často přítomna u kognitivních dovedností (např. čtení, řešení matematických problémů). Řetězení hraje klíčovou roli při získávání dovedností (Gollub, 1977; Skinner, 1978).

Modifikace Chování

Modifikace chování (nebo behaviorální terapie) se týká systematické aplikace principů behaviorálního učení k usnadnění adaptivního chování (Ullmann & Krasner, 1965). Modifikace chování byla použita u dospělých i dětí v tak rozmanitých kontextech, jako jsou třídy, poradny, věznice a psychiatrické léčebny. Byla použita k léčbě fobií, dysfunkčního jazyka, rušivého chování, negativních sociálních interakcí, špatné výchovy dětí a nízké sebekontroly (Ayllon & Azrin, 1968; Becker, 1971; Keller & Ribes-Inesta, 1974; Ulrich, Stachnik & Mabry, 1966). Lovaas (1977) úspěšně použil modifikaci chování k výuce jazyka u autistických dětí.

Modifikace Chování

Modifikace chování u rušivých studentů je obtížná, protože tito studenti mohou vykazovat jen málo vhodných reakcí, které by mohly být pozitivně posíleny. Učitel by mohl použít formování (shaping) k řešení konkrétního nepříjemného chování. Kathy Stone má problémy s Erikem, který neustále strká a tlačí ostatní studenty, když se třída seřadí, aby někam šla v budově. Když jde třída jen krátkou vzdálenost, paní Stone by mohla Erikovi sdělit, že pokud zůstane v řadě bez strkání a tlačení, bude vedoucí řady na cestě zpět do třídy; pokud však strčí nebo zatlačí, bude okamžitě vyřazen z řady. Tento postup lze opakovat, dokud Erik nezvládne krátké vzdálenosti. Paní Stone mu pak může dovolit chodit se třídou na postupně delší vzdálenosti, dokud se nebude umět chovat v řadě na jakoukoli vzdálenost.

Sarah, další dítě ve třídě Kathy Stone, často odevzdává nepořádnou práci. Paní Stone by mohla použít generalizované posilovače, jako jsou speciální samolepky (vyměnitelné za různé výhody), aby pomohla Sarah, jejíž práce je obvykle špinavá, potrhaná a sotva čitelná. Sarah je informována, že pokud odevzdá čistý papír, může získat jednu samolepku; pokud není potrhaný, další samolepku; a pokud je písmo úhledné, třetí samolepku. Jakmile Sarah začne dělat pokroky, paní Stone může postupně přesunout odměny do jiných oblastí pro zlepšení (např. správná práce, dokončení práce včas).

Techniky

Mezi základní techniky modifikace chování patří posilování žádoucího chování a vyhasínání nežádoucího chování. Trest se používá zřídka, ale pokud se používá, častěji zahrnuje odstranění pozitivního posilovače než prezentaci negativního posilovače.

Při rozhodování o programu změny se modifikátoři chování obvykle zaměřují na následující tři otázky (Ullmann & Krasner, 1965):

  • Které z chování jedince jsou maladaptivní a které by měly být zvýšeny (sníženy)?
  • Jaké environmentální kontingence v současné době podporují chování jedince (ať už k udržení nežádoucího chování nebo ke snížení pravděpodobnosti provádění adaptivnějších reakcí)?
  • Jaké environmentální prvky lze změnit, aby se změnilo chování jedince?

Změna je nejpravděpodobnější, když se modifikátoři a klienti shodnou, že je potřeba změna, a společně se dohodnou na požadovaných cílech. Prvním krokem při vytváření programu je definovat problém v behaviorálních termínech. Například tvrzení: “Keith je příliš často mimo své sedadlo,” se vztahuje k zjevnému chování, které lze měřit: Lze vést záznam o tom, kolik času je Keith mimo své sedadlo. Obecné výrazy odkazující na nepozorovatelné věci (“Keith má špatný přístup”) neumožňují objektivní definici problému.

Dalším krokem je určení posilovačů, které udržují nežádoucí chování. Možná Keith získává pozornost učitele pouze tehdy, když vstane ze svého sedadla, a ne když sedí. Jednoduchý plán je, aby se učitel věnoval Keithovi, když sedí a věnuje se akademické práci, a ignoroval ho, když vstane ze svého sedadla. Pokud se počet případů, kdy je Keith mimo své sedadlo, sníží, pozornost učitele je pozitivní posilovač.

Program modifikace chování může využívat generalizované posilovače, jako jsou body, které si studenti vyměňují za záložní posilovače, jako jsou hmotné odměny, volný čas nebo výhody. Mít více než jednu zálohu zajišťuje, že alespoň jedna bude účinná pro každého studenta za všech okolností. Musí být stanoveno behaviorální kritérium pro získání posílení. Může být použit pětikrokový postup formování (popsaný dříve). Kritérium je zpočátku definováno na úrovni počátečního chování a postupuje v malých krocích směrem k požadovanému chování. Studentovi je udělen bod pokaždé, když je kritérium splněno. K vyhasnutí jakéhokoli nežádoucího chování u Keitha by mu učitel neměl věnovat příliš mnoho pozornosti, pokud vstane ze svého sedadla, ale spíše by ho měl soukromě informovat, že protože nesplňuje kritérium, nezískává bod.

Trest se používá zřídka, ale může být nutný, když se chování stane tak rušivým, že ho nelze ignorovat (např. rvačky). Běžným trestem je time-out (od posilování). Během time-outu je student odstraněn ze sociálního kontextu třídy. Tam student pokračuje v akademické práci bez sociální interakce s vrstevníky nebo možnosti získat posílení. Dalším trestem je odstranění pozitivních posilovačů (např. volný čas, přestávka, výhody) za nevhodné chování.

Kritici tvrdili, že modifikace chování formuje tiché a poslušné chování (Winett & Winkler, 1972). Ačkoli je rozumné množství ticha potřeba k zajištění učení, někteří učitelé usilují o tichou třídu za všech okolností, i když by určitý hluk ze sociálních interakcí učení usnadnil. Použití modifikace chování není samo o sobě ani dobré, ani špatné. Může vytvořit tichou třídu nebo podpořit sociální iniciace ze strany stažených dětí (Strain, Kerr & Ragland, 1981). Stejně jako samotné techniky, i cíle modifikace chování musí být pečlivě promyšleny těmi, kteří postupy implementují.

Kognitivní Modifikace Chování

Výzkumníci také začlenili kognitivní prvky do postupů modifikace chování. V kognitivní modifikaci chování fungují myšlenky studentů (při verbalizaci) jako diskriminační a posilující podněty. Studenti si tedy mohou verbálně instruovat, co mají dělat, a poté provést vhodné chování. Techniky kognitivní modifikace chování se často používají u studentů s postižením (Hallahan, Kneedler & Lloyd, 1983) a používají se ke snížení hyperaktivity a agresivity (Robinson, Smith, Miller & Brownell, 1999). Meichenbaumův (1977) autoinstrukční trénink je příkladem kognitivní modifikace chování.

Seberegulace

Operantní podmiňování se také zabývá seberegulací (Mace, Belfiore, & Hutchinson, 2001; Mace, Belfiore, & Shea, 1989). Tato perspektiva je podrobně popsána v kapitole 9. Operantní teorie tvrdí, že seberegulované chování zahrnuje výběr z alternativních postupů (Brigham, 1982), obvykle odložením okamžitého posílení ve prospěch odlišného a obvykle většího budoucího posílení. Například Trisha zůstává v pátek večer doma, aby se učila na zkoušku, místo aby šla ven s přáteli, a Kyle pokračuje v práci na akademickém úkolu navzdory posměšným vrstevníkům v okolí. Odkládají okamžité posílení pro očekávané budoucí posílení, stejně jako John v následujícím příkladu.

John má potíže s učením. Navzdory dobrým úmyslům tráví učením nedostatečný čas a snadno se rozptýlí. Klíčem ke změně jeho chování je stanovit diskriminativní stimuly (podněty) pro učení. S pomocí svého středoškolského poradce si John stanoví přesný čas a místo pro učení (od 19:00 do 21:00 ve svém pokoji s jednou 10minutovou přestávkou). Aby eliminoval rušivé podněty, John souhlasí s tím, že nebude během této doby používat svůj mobilní telefon, CD přehrávač, počítač nebo televizi. Za posílení si John udělí jeden bod za každou noc, kdy úspěšně splní svou rutinu. Když získá 10 bodů, může si vzít noc volna.

Z pohledu operantního podmiňování se člověk rozhoduje, které chování regulovat, stanovuje diskriminativní stimuly pro jejich výskyt, hodnotí výkon z hlediska toho, zda odpovídá standardu, a provádí posílení. Jak bylo uvedeno, tři klíčové subprocesy jsou sebemonitorování (záměrná pozornost věnovaná vybraným aspektům vlastního chování), sebepoučení ( s, které určují příležitost pro seberegulační , vedoucí k , a sebe-posílení (posilování sebe sama za provedení správné reakce).