Оперантне зумовлювання: принципи, процеси та модифікація поведінки

Вступ

Добре відомою поведінковою теорією є оперантне зумовлення, сформульоване Б. Ф. (Беррусом Фредеріком) Скіннером (1904–1990). Починаючи з 1930-х років, Скіннер опублікував серію робіт, в яких повідомляв про результати лабораторних досліджень на тваринах, в яких він ідентифікував різні компоненти оперантного зумовлення. Він узагальнив значну частину цієї ранньої роботи у своїй впливовій книзі «Поведінка організмів» (Skinner, 1938).

Скіннер застосував свої ідеї до людських проблем. На початку своєї кар'єри він зацікавився освітою та розробив навчальні машини та програмоване навчання. «Технологія навчання» (Skinner, 1968) розглядає навчання, мотивацію, дисципліну та творчість. У 1948 році, після важкого періоду в його житті, він опублікував «Уолден Два», в якій описується, як поведінкові принципи можуть бути застосовані для створення утопічного суспільства. Скіннер (1971) розглянув проблеми сучасного життя та виступав за застосування поведінкової технології до проєктування культур у «По той бік свободи та гідності». Скіннер та інші застосовували принципи оперантного зумовлення до таких галузей, як шкільне навчання та дисципліна, розвиток дитини, засвоєння мови, соціальна поведінка, психічні захворювання, медичні проблеми, зловживання психоактивними речовинами та професійне навчання (DeGrandpre, 2000; Karoly & Harris, 1986; Morris, 2003).

У молодості Скіннер прагнув бути письменником (Skinner, 1970):
Я збудував невеликий кабінет на горищі та взявся до роботи. Результати були катастрофічними. Я марнував свій час. Я безцільно читав, будував моделі кораблів, грав на піаніно, слухав нововинайдене радіо, дописував до гумористичної колонки місцевої газети, але майже нічого не писав, і думав про візит до психіатра. (стор. 6)

Він зацікавився психологією після прочитання «Умовних рефлексів» Павлова (1927) та «Біхевіоризму» Уотсона (1924). Його подальша кар'єра мала глибокий вплив на психологію навчання.

Незважаючи на його визнання, що «я зазнав невдачі як письменник, тому що мені не було чого важливого сказати» (Skinner, 1970, стор. 7), він був плідним письменником, який спрямував свої літературні прагнення у наукове письмо, яке охопило шість десятиліть (Lattal, 1992). Його відданість своїй професії очевидна в його запрошеній доповіді на конференції Американської психологічної асоціації за вісім днів до його смерті (Holland, 1992; Skinner, 1990). Асоціація вшанувала його спеціальним випуском свого щомісячного журналу «American Psychologist» (American Psychological Association, 1992). Хоча його теорія була дискредитована сучасними теоретиками навчання, оскільки вона не може адекватно пояснити вищі та складні форми навчання (Bargh & Ferguson, 2000), його вплив продовжується, оскільки принципи оперантного зумовлення зазвичай застосовуються для покращення навчання та поведінки студентів (Morris, 2003). У початковому сценарії, наприклад, Лео використовує принципи оперантного зумовлення для контролю за неналежною поведінкою студентів. Емілі та Шейна, з іншого боку, відстоюють важливість когнітивних факторів.

Концептуальна основа

У цьому розділі обговорюються припущення, що лежать в основі оперантного зумовлювання, як воно відображає функціональний аналіз поведінки та наслідки теорії для прогнозування та контролю поведінки. Теорія та принципи оперантного зумовлювання є складними (Dragoi & Staddon, 1999); ті принципи, які найбільш важливі для навчання людини, розглядаються в цьому розділі.

Наукові припущення

Павлов простежив місцезнаходження навчання до нервової системи і розглядав поведінку як прояв неврологічного функціонування. Скіннер (1938) не заперечував, що неврологічне функціонування супроводжує поведінку, але він вважав, що психологія поведінки може бути зрозуміла сама по собі, без посилання на неврологічні чи інші внутрішні події.

Скіннер висловив подібні заперечення щодо неспостережуваних процесів та сутностей, запропонованих сучасними когнітивними поглядами на навчання (Overskeid, 2007). Приватні події, або внутрішні реакції, доступні лише індивіду і можуть бути вивчені за допомогою усних звітів людей, які є формами поведінки (Skinner, 1953). Скіннер не заперечував існування установок, переконань, думок, бажань та інших форм самопізнання (адже він їх мав), а скоріше кваліфікував їх роль.

Люди відчувають не свідомість чи емоції, а скоріше власні тіла, і внутрішні реакції є відповідями на внутрішні стимули (Skinner, 1987). Подальшою проблемою з внутрішніми процесами є те, що перекласти їх на мову важко, оскільки мова не повністю відображає виміри внутрішнього досвіду (наприклад, біль). Значна частина того, що називається знанням, передбачає використання мови (вербальної поведінки). Думки - це типи поведінки, які викликаються іншими стимулами (зовнішніми чи приватними) і які породжують реакції (явні чи приховані). Коли приватні події виражаються як явні поведінки, їх роль у функціональному аналізі може бути визначена.

Функціональний аналіз поведінки

Скіннер (1953) називав свій спосіб вивчення поведінки функціональним аналізом:
Зовнішні змінні, від яких залежить поведінка, забезпечують те, що можна назвати причинним або функціональним аналізом. Ми беремо на себе зобов'язання прогнозувати та контролювати поведінку окремого організму. Це наша «залежна змінна» — ефект, для якого ми повинні знайти причину. Наші «незалежні змінні» — причини поведінки — це зовнішні умови, від яких залежить поведінка. Відносини між цими двома — «причинно-наслідкові зв'язки» в поведінці — є законами науки. Синтез цих законів, виражений у кількісних термінах, дає повну картину організму як діючої системи. (стор. 35)

Навчання - це «пересортування реакцій у складній ситуації»; зумовлювання відноситься до «посилення поведінки, яке виникає в результаті підкріплення» (Skinner, 1953, стор. 65). Існує два типи зумовлювання: Тип S і Тип R. Тип S - це павловське зумовлювання, що характеризується поєднанням підкріплюючого (безумовного) стимулу з іншим (умовним) стимулом. S звертає увагу на важливість стимулу у викликані реакції з боку організму. Реакція на викликаючий стимул відома як респондентна поведінка.

Хоча зумовлювання Типу S може пояснити зумовлені емоційні реакції, більшість людських поведінок виникають у присутності стимулів, а не автоматично викликаються ними. Реакції контролюються їх наслідками, а не попередніми стимулами. Цей тип поведінки, який Скіннер назвав Типом R, щоб підкреслити аспект реакції, є оперантною поведінкою, оскільки він впливає на навколишнє середовище, щоб створити ефект.

Скіннер (1938, стор. 21):
Якщо за виникненням операнта слідує представлення підкріплюючого стимулу, сила збільшується. . . . Якщо за виникненням операнта, вже посиленого зумовлюванням, не слідує підкріплюючий стимул, сила зменшується.

Ми можемо розглядати оперантну поведінку як «навчання через дію», і насправді значна частина навчання відбувається, коли ми виконуємо поведінку (Lesgold, 2001). На відміну від респондентної поведінки, яка до зумовлювання не відбувається, ймовірність виникнення операнта ніколи не дорівнює нулю, оскільки реакція повинна бути здійснена для забезпечення підкріплення. Підкріплення змінює ймовірність або швидкість виникнення реакції. Оперантні поведінки впливають на навколишнє середовище і стають більш-менш імовірними через підкріплення.

Основні процеси

У цьому розділі розглядаються основні процеси оперантного обумовлення: підкріплення, згасання, первинні та вторинні підкріплювачі, принцип Премака, покарання, режими підкріплення, генералізація та диференціація.

Підкріплення

Підкріплення відповідає за посилення реакції — збільшення частоти реакцій або підвищення ймовірності їх виникнення. Підкріплювач (або підкріплювальний стимул) — це будь-який стимул або подія, що слідує за реакцією та призводить до її посилення. Підкріплювачі (винагороди) визначаються на основі їхнього впливу, який не залежить від психічних процесів, таких як свідомість, наміри чи цілі (Schultz, 2006). Оскільки підкріплювачі визначаються за їхнім ефектом, їх неможливо визначити заздалегідь.

Скіннер (1953, с. 72–73):
Єдиний спосіб визначити, чи є певна подія підкріплювальною для даного організму за певних умов, — це провести прямий тест. Ми спостерігаємо за частотою обраної реакції, потім робимо подію залежною від неї та спостерігаємо за будь-якими змінами в частоті. Якщо зміна є, ми класифікуємо подію як підкріплювальну для організму за наявних умов.

Підкріплювачі є ситуативно специфічними: вони застосовуються до індивідів у певний час за певних умов. Те, що є підкріплювачем для конкретного учня під час читання зараз, може не бути таким під час занять математикою зараз або під час читання пізніше. Незважаючи на цю специфічність, стимули або події, що підкріплюють поведінку, певною мірою можна передбачити (Скіннер, 1953). Учні зазвичай вважають підкріплювальними такі події, як похвала вчителя, вільний час, привілеї, наклейки та високі оцінки. Тим не менш, ніколи не можна знати напевно, чи є наслідок підкріплювальним, доки його не буде представлено після реакції і ми не побачимо, чи зміниться поведінка.

Основна модель оперантного обумовлення — це тричленна послідовність:

Дискримінативний стимул створює умови для виникнення реакції (R), за якою слідує підкріплювальний стимул ( , або підкріплення). Підкріплювальний стимул — це будь-який стимул (подія, наслідок), що збільшує ймовірність виникнення реакції в майбутньому за наявності дискримінативного стимулу. У більш звичних термінах ми можемо назвати це моделлю A-B-C:

Позитивне підкріплення передбачає пред'явлення стимулу або додавання чогось до ситуації після реакції, що збільшує майбутню ймовірність виникнення цієї реакції в даній ситуації. Позитивний підкріплювач — це стимул, який, будучи пред'явленим після реакції, збільшує майбутню ймовірність виникнення реакції в цій ситуації. У вступному сценарії Лео використовує бали як позитивні підкріплювачі за хорошу поведінку.

'В' означає вчителя, 'У' — учня:

Процеси підкріплення та покарання.
Дискримінативний стимул Реакція Підкріплювальний (каральний) стимул
Позитивне підкріплення (Пред'явлення позитивного підкріплювача) - -
'В': надає час для самостійної роботи 'У': навчається 'В': хвалить 'У' за хорошу роботу
Негативне підкріплення (Усунення негативного підкріплювача) - -
'В': надає час для самостійної роботи 'У': навчається 'В': каже, що 'У' не потрібно робити домашнє завдання
Покарання (Пред'явлення негативного підкріплювача) - -
'В': надає час для самостійної роботи 'У': гає час 'В': дає домашнє завдання
Покарання (Усунення позитивного підкріплювача) - -
'В': надає час для самостійної роботи 'У': гає час 'В': каже, що 'У' пропустить вільний час

Негативне підкріплення передбачає усунення стимулу або видалення чогось із ситуації після реакції, що збільшує майбутню ймовірність виникнення цієї реакції в даній ситуації. Негативний підкріплювач — це стимул, який, будучи усуненим реакцією, збільшує майбутню ймовірність виникнення реакції в цій ситуації. Деякі стимули, що часто функціонують як негативні підкріплювачі, — це яскраве світло, гучні звуки, критика, надокучливі люди та низькі оцінки, оскільки поведінка, що їх усуває, має тенденцію до підкріплення. Позитивне та негативне підкріплення мають однаковий ефект: вони збільшують ймовірність того, що реакція буде здійснена в майбутньому за наявності стимулу.

Щоб проілюструвати ці процеси, припустимо, що вчитель проводить сесію запитань і відповідей з класом. Вчитель ставить запитання ( або A), викликає учня-добровольця, який дає правильну відповідь (R або B), і хвалить учня ( або C). Якщо активність цього учня зростає або залишається на високому рівні, похвала є позитивним підкріплювачем, і це є прикладом позитивного підкріплення, оскільки надання похвали збільшило активність. Тепер припустимо, що після того, як учень дає правильну відповідь, вчитель каже йому, що він не повинен робити домашнє завдання. Якщо активність цього учня зростає або залишається на високому рівні, домашнє завдання є негативним підкріплювачем, і це є прикладом негативного підкріплення, оскільки скасування домашнього завдання збільшило активність.

Позитивне та негативне підкріплення

Вчителі можуть використовувати позитивне та негативне підкріплення для мотивації учнів до оволодіння навичками та приділення більшої уваги виконанню завдань. Наприклад, під час вивчення понять у науковому блоці вчитель може попросити учнів відповісти на запитання в кінці розділу. Вчитель також може організувати в класі центри активності з практичними експериментами, пов'язаними з уроком. Учні будуть переходити між центрами та виконувати експерименти за умови успішної відповіді на запитання розділу (позитивне підкріплення). Ця залежність відображає принцип Премака, що полягає в наданні можливості займатися більш цінною діяльністю (експерименти) як підкріплення за участь у менш цінній (відповіді на запитання розділу). Учні, які правильно відповідають на 80% запитань і беруть участь у щонайменше двох експериментах, не повинні виконувати домашнє завдання. Це функціонуватиме як негативне підкріплення, якщо учні сприймають домашнє завдання як негативний підкріплювач.

Шкільний психолог середньої школи, який працює з учнем над покращенням поведінки в класі, може попросити кожного вчителя цього учня відзначати «так» або «ні» щодо поведінки на уроці за день (прийнятна, неприйнятна). За кожне «так» учень отримує 1 хвилину в комп'ютерному класі для гри в комп'ютерні ігри (позитивне підкріплення для цього учня). Наприкінці тижня учень може використати зароблений комп'ютерний час після обіду. Крім того, якщо учень заробляє мінімум 15 хвилин у лабораторії, йому не потрібно нести додому щоденник поведінки для підпису батьками (це припускає, що учень сприймає щоденник поведінки як негативний підкріплювач).

Згасання

Згасання передбачає зниження сили реакції через відсутність підкріплення. Учні, які піднімають руки в класі, але їх ніколи не викликають, можуть перестати піднімати руки. Люди, які надсилають багато електронних листів одній і тій самій особі, але ніколи не отримують відповіді, з часом можуть припинити надсилати повідомлення цій людині.

Швидкість згасання залежить від історії підкріплення (Скіннер, 1953). Згасання відбувається швидко, якщо було підкріплено небагато попередніх реакцій. Реагування є набагато стійкішим за наявності тривалішої історії підкріплення. Згасання — це не те саме, що забування. Реакції, що згасають, можуть бути виконані, але не виконуються через відсутність підкріплення. У попередніх прикладах учні все ще вміють піднімати руки, а люди все ще вміють надсилати електронні листи. Забування передбачає справжню втрату обумовлення з часом, коли можливості для реагування були відсутні.

Первинні та вторинні підкріплювачі

Стимули, такі як їжа, вода та притулок, називаються первинними підкріплювачами, оскільки вони необхідні для виживання. Вторинні підкріплювачі — це стимули, які стають умовними через їх асоціацію з первинними підкріплювачами. Улюблена склянка для молока дитини стає вторинним підкріплювачем через її асоціацію з молоком (первинний підкріплювач). Вторинний підкріплювач, який поєднується з більш ніж одним первинним підкріплювачем, є узагальненим підкріплювачем. Люди працюють довгі години, щоб заробити гроші (узагальнений підкріплювач), які вони використовують для купівлі багатьох підкріплювачів (наприклад, їжі, житла, телевізорів, відпусток).

Оперантне обумовлення пояснює розвиток і підтримку значної частини соціальної поведінки за допомогою узагальнених підкріплювачів. Діти можуть поводитися так, щоб привернути увагу дорослих. Увага є підкріплювальною, оскільки вона поєднується з первинними підкріплювачами від дорослих (наприклад, їжа, вода, захист). Важливими освітніми узагальненими підкріплювачами є похвала вчителя, високі оцінки, привілеї, відзнаки та наукові ступені. Ці підкріплювачі часто поєднуються з іншими узагальненими підкріплювачами, такими як схвалення (від батьків та друзів) та гроші (диплом коледжу веде до хорошої роботи).

Принцип Премака

Нагадаємо, що ми називаємо поведінковий наслідок підкріплювальним лише після того, як застосуємо його і побачимо, як він впливає на майбутню поведінку. Дещо турбує те, що ми повинні використовувати здоровий глузд або метод спроб і помилок при виборі підкріплювачів, оскільки не можемо знати напевно заздалегідь, чи буде наслідок функціонувати як підкріплювач.

Премак (1962, 1971) описав спосіб упорядкування підкріплювачів, що дозволяє їх прогнозувати. Принцип Премака стверджує, що можливість займатися більш цінною діяльністю підкріплює участь у менш цінній діяльності, де «цінність» визначається з точки зору кількості реакцій або часу, витраченого на діяльність за відсутності підкріплення. Якщо організовано залежність, за якої цінність другої (залежної) події вища за цінність першої (інструментальної) події, очікується збільшення ймовірності виникнення першої події (припущення про винагороду). Якщо цінність другої події нижча за цінність першої, ймовірність виникнення першої події повинна зменшитися (припущення про покарання).

Припустимо, дитині дозволено обирати між роботою над художнім проєктом, відвідуванням медіацентру, читанням книги в класі або роботою за комп'ютером. Протягом 10 таких виборів дитина 6 разів іде до медіацентру, 3 рази працює за комп'ютером, 1 раз працює над художнім проєктом і жодного разу не читає книгу в класі. Для цієї дитини можливість відвідати медіацентр є найціннішою. Щоб застосувати принцип Премака, вчитель може сказати дитині: «Після того, як ти дочитаєш цю книгу, зможеш піти до медіацентру». Значні емпіричні дані підтверджують ідеї Премака, особливо щодо припущення про винагороду (Dunham, 1977).

Принцип Премака пропонує керівництво для вибору ефективних підкріплювачів: спостерігайте, що люди роблять, коли мають вибір, і впорядковуйте ці види поведінки за ймовірністю. Цей порядок не є постійним, оскільки цінність підкріплювачів може змінюватися. Будь-який підкріплювач, якщо його застосовувати часто, може призвести до насичення та зниження реагування. Вчителям, які використовують принцип Премака, необхідно періодично перевіряти вподобання учнів, спостерігаючи за ними та запитуючи, що їм подобається робити. Заздалегідь визначити, які підкріплювачі, ймовірно, будуть ефективними в конкретній ситуації, є критично важливим при плануванні програми поведінкових змін (Timberlake & Farmer-Dougan, 1991).

Покарання

Покарання зменшує майбутню ймовірність реагування на стимул. Покарання може включати усунення позитивного підкріплювача або пред'явлення негативного підкріплювача після реакції, як показано в таблиці 'Процеси підкріплення та покарання.'Припустимо, що під час сесії запитань і відповідей учень неодноразово заважає іншому учневі, коли вчитель не дивиться (вчитель не дивиться або A; погана поведінка = R або B). Вчитель помічає погану поведінку і каже: «Припини йому заважати» ( або C). Якщо учень припиняє заважати іншому, критика вчителя діє як негативний підкріплювач, і це є прикладом покарання, оскільки висловлена критика зменшила погану поведінку. Але зауважте, що з точки зору вчителя, це є прикладом негативного підкріплення (погана поведінка = або A; критика = R або B; припинення поганої поведінки = або C). Оскільки вчитель отримав негативне підкріплення, він, ймовірно, продовжуватиме критикувати погану поведінку учнів.

Замість того, щоб критикувати учня, припустимо, вчитель каже: «Ти сьогодні залишишся в класі під час перерви». Якщо погана поведінка учня припиняється, перерва діє як позитивний підкріплювач, і це є прикладом покарання, оскільки втрата перерви припиняє погану поведінку. Як і раніше, припинення поганої поведінки учня є негативним підкріпленням для вчителя.

Покарання пригнічує реакцію, але не усуває її; коли загроза покарання зникає, покарана реакція може повернутися. Наслідки покарання є складними. Покарання часто викликає реакції, несумісні з покараною поведінкою, і достатньо сильні, щоб її пригнітити (Скіннер, 1953). Покарання дитини за погану поведінку може викликати почуття провини та страху, які можуть пригнітити погану поведінку. Якщо дитина в майбутньому поводитиметься погано, умовні почуття провини та страху можуть з'явитися знову і змусити дитину швидко припинити погану поведінку. Покарання також обумовлює реакції, що спонукають уникати покарання. Учні, чий вчитель критикує неправильні відповіді, незабаром навчаються уникати добровільних відповідей. Покарання може обумовлювати неадаптивну поведінку, оскільки покарання не вчить, як поводитися більш продуктивно. Покарання може ще більше перешкоджати навчанню, створюючи конфлікт, через який індивід вагається між однією чи іншою реакцією. Якщо вчитель іноді критикує учнів за неправильні відповіді, а іноді ні, учні ніколи не знають, коли очікувати критики. Така мінлива поведінка може мати емоційні побічні продукти — страх, гнів, плач, — що заважають навчанню.

Покарання часто використовується в школах для боротьби з порушеннями. Поширеними покараннями є позбавлення привілеїв, вилучення з класу, тимчасове відсторонення від занять у школі та за її межами, а також виключення (Maag, 2001). Проте існує кілька альтернатив покаранню. Одна з них — змінити дискримінативні стимули для негативної поведінки. Наприклад, учень, що сидить у задній частині кімнати, може часто погано поводитися. Вчителі можуть змінити дискримінативні стимули, пересадивши порушника на передню парту. Інша альтернатива — дозволити небажаній поведінці тривати, доки порушник не насититься, що схоже на метод втоми Гатрі. Батько може дозволити дитині, яка влаштувала істерику, продовжувати її, доки вона не втомиться. Третя альтернатива — згасити небажану поведінку, ігноруючи її. Це може добре спрацювати з незначними порушеннями (наприклад, учні шепочуться один з одним), але коли в класі починається безлад, вчителям потрібно діяти інакше. Четверта альтернатива — обумовити несумісну поведінку за допомогою позитивного підкріплення. Похвала вчителя за продуктивну роботу допомагає обумовити ці звички. Основна перевага цієї альтернативи над покаранням полягає в тому, що вона показує учневі, як поводитися адаптивно.

Альтернативи покаранню.
Альтернатива Приклад
Змінити дискримінативні стимули Пересадити учня, що погано поводиться, подалі від інших учнів з поганою поведінкою.
Дозволити небажаній поведінці тривати Змусити учня, який стоїть, коли повинен сидіти, продовжувати стояти.
Згасити небажану поведінку Ігнорувати незначну погану поведінку, щоб вона не підкріплювалася увагою вчителя.
Обумовити несумісну поведінку Підкріплювати навчальний прогрес, який відбувається лише тоді, коли учень не поводиться погано.

Режими підкріплення

Режими стосуються того, коли застосовується підкріплення (Ferster & Skinner, 1957; Skinner, 1938; Zeiler, 1977). Безперервний режим передбачає підкріплення кожної правильної реакції. Це може бути бажаним під час засвоєння навичок: учні отримують зворотний зв'язок після кожної реакції щодо точності своєї роботи. Безперервне підкріплення допомагає гарантувати, що неправильні реакції не будуть засвоєні.

Переривчастий режим передбачає підкріплення деяких, але не всіх правильних реакцій. Переривчасте підкріплення є поширеним у класних кімнатах, оскільки зазвичай вчителі не можуть підкріплювати кожного учня за кожну правильну або бажану реакцію. Учнів не викликають щоразу, коли вони піднімають руки, не хвалять після розв'язання кожної задачі, і їм не постійно говорять, що вони поводяться належним чином.

Переривчасті режими визначаються з точки зору часу або кількості реакцій. Інтервальний режим передбачає підкріплення першої правильної реакції після певного періоду часу. У режимі з фіксованим інтервалом (FI) часовий інтервал є постійним від одного підкріплення до наступного. Режим FI5 означає, що підкріплення надається за першу реакцію, зроблену через 5 хвилин. Учні, які отримують 30 хвилин вільного часу щоп'ятниці (за умови хорошої поведінки протягом тижня), діють за режимом з фіксованим інтервалом. У режимі зі змінним інтервалом (VI) часовий інтервал варіюється від випадку до випадку навколо деякого середнього значення. Режим VI5 означає, що в середньому перша правильна реакція через 5 хвилин підкріплюється, але часовий інтервал змінюється (наприклад, 2, 3, 7 або 8 хвилин). Учні, які отримують 30 хвилин вільного часу (за умови хорошої поведінки) в середньому раз на тиждень, але не обов'язково в один і той же день щотижня, діють за режимом зі змінним інтервалом.

Пропорційний режим залежить від кількості правильних реакцій або частоти реагування. У режимі з фіксованою пропорцією (FR) кожна n-на правильна реакція підкріплюється, де n є постійним. Режим FR10 означає, що кожна 10-та правильна реакція отримує підкріплення. У режимі зі змінною пропорцією (VR) кожна n-на правильна реакція підкріплюється, але значення n варіюється навколо середнього числа. Вчитель може надавати вільний час після кожного п'ятого виконаного завдання в робочому зошиті (FR5) або періодично, в середньому після п'яти виконаних завдань (VR5).

Режими підкріплення створюють характерні патерни реагування. Загалом, пропорційні режими призводять до вищої частоти реакцій, ніж інтервальні. Обмежуючим фактором у пропорційних режимах є втома через швидке реагування. Режими з фіксованим інтервалом створюють фестончастий патерн. Реагування спадає одразу після підкріплення, але посилюється до кінця інтервалу між підкріпленнями. Режим зі змінним інтервалом створює стабільну частоту реагування. Неоголошені контрольні роботи діють за режимами зі змінним інтервалом і зазвичай змушують студентів регулярно вчитися. Переривчасті режими більш стійкі до згасання, ніж безперервні: коли підкріплення припиняється, реагування триває довше, якщо підкріплення було переривчастим, а не безперервним. Стійкість переривчастих режимів можна побачити в наполегливості людей у таких заняттях, як гра в ігрові автомати, риболовля та пошук вигідних покупок.

Генералізація

Коли певна реакція регулярно виникає на даний стимул, вона також може виникати і на інші стимули. Це називається генералізацією (Скіннер, 1953). Генералізація здається проблематичною для оперантної теорії, оскільки реакція не повинна виникати в ситуації, в якій вона ніколи не підкріплювалася. Скіннер пояснив генералізацію, зазначивши, що люди виконують багато поведінкових актів, які ведуть до кінцевої (підкріпленої) реакції. Ці складові поведінки часто є частиною ланцюгів поведінки різних завдань і, отже, підкріплюються в різних контекстах. Коли люди опиняються в новій ситуації, вони, ймовірно, виконуватимуть складові поведінки, що призводить до точної реакції або швидкого засвоєння правильної реакції.

Наприклад, учні з хорошими академічними звичками зазвичай приходять на заняття, уважно слухають і беруть участь у заходах, роблять нотатки, читають обов'язкову літературу та встигають з завданнями. Ці складові поведінки призводять до високих досягнень та оцінок. Коли такі учні починають новий курс, не обов'язково, щоб його зміст був схожий на попередні курси, які вони відвідували. Радше, складові поведінки отримували неодноразове підкріплення і, таким чином, ймовірно, будуть генералізовані на нове середовище.

Однак генералізація не відбувається автоматично. О'Лірі та Драбман (1971) зазначили, що генералізація «повинна бути запрограмована, як і будь-яка інша поведінкова зміна» (с. 393). Однією з проблем багатьох програм модифікації поведінки є те, що вони змінюють поведінку, але нова поведінка не генералізується за межами навчального контексту. О'Лірі та Драбман (1971) пропонують шляхи сприяння генералізації.

Диференціація

Диференціація, доповнювальний до генералізації процес, передбачає різне реагування (за інтенсивністю або частотою) залежно від стимулу або особливостей ситуації (Rilling, 1977). Хоча вчителі хочуть, щоб учні генералізували вивчене на інші ситуації, вони також хочуть, щоб вони реагували диференційовано. При розв'язуванні текстових математичних задач вчителі можуть хотіти, щоб учні засвоїли загальний підхід до розв'язання проблем, що включає такі кроки, як визначення заданих і необхідних даних, створення малюнка та генерування корисних формул. Вчителі також хочуть, щоб учні навчилися розрізняти типи задач (наприклад, на площу, на швидкість-час-відстань, на відсоткову ставку). Здатність швидко визначати тип задачі підвищує успішність учнів.

Генералізація

Генералізація може сприяти розвитку навичок у різних предметних областях. Визначення основних ідей є актуальним для мови та літератури, суспільствознавства, математики (текстові задачі) та інших предметних галузей. Вчитель мови та літератури може надати учням стратегію для пошуку основних ідей. Коли учні оволодіють цією стратегією, вчитель пояснює, як її модифікувати для використання в інших навчальних предметах, і просить учнів подумати про сфери застосування. Добре навчивши стратегії в одній галузі та сприяючи її потенційному застосуванню в інших, вчителі економлять багато часу та зусиль, оскільки їм не потрібно навчати цієї стратегії в кожній предметній області.

Навчання очікуваної поведінки (наприклад, ходьба в коридорі, підняття руки для відповіді) також може бути генералізовано. Наприклад, якщо всі вчителі сьомого класу вирішать, що учні повинні використовувати однаковий формат для заголовка на своїх роботах, це можна пояснити в одному класі. Потім учнів можна попросити використовувати той самий формат (з незначними змінами) у кожному з інших класів.

Рекомендації щодо сприяння генералізації.
Назва Мета
Залучення батьків Залучати батьків до програм поведінкових змін.
Високі очікування Переконувати учнів, що вони здатні добре вчитися.
Самооцінка Навчати учнів контролювати та оцінювати свою поведінку.
Умовності Скасовувати штучні умовності (наприклад, бали) і замінювати їх природними (привілеями).
Участь Дозволяти учням брати участь у визначенні поведінки, що підкріплюється, та умовностей підкріплення.
Академічна програма Забезпечити хорошу академічну програму, оскільки багато учнів з проблемами поведінки мають академічні недоліки.
Переваги Показувати учням, яку користь принесуть їм поведінкові зміни, пов'язуючи зміни з цікавими для них видами діяльності.
Підкріплення Підкріплювати учнів у різних умовах, щоб зменшити диференціацію між ситуаціями з підкріпленням і без нього.
Послідовність Готувати вчителів у звичайних класах до продовження формування поведінки учнів зі спеціальних класів після їх переведення до звичайної програми.

Спенс (1936) припустив, що для навчання диференціації бажані реакції слід підкріплювати, а небажані — згашувати шляхом відсутності підкріплення. У школі вчителі вказують на схожість та відмінності між подібним змістом і проводять періодичні огляди, щоб переконатися, що учні правильно диференціюють та застосовують правильні методи розв'язання проблем.

Помилки зазвичай вважаються руйнівними і такими, що призводять до засвоєння неправильних реакцій. Це свідчить про те, що кількість помилок учнів слід звести до мінімуму. Чи потрібно усувати всі помилки — питання спірне. Дослідження мотивації показують, що учні, які навчаються адаптивно справлятися з помилками, згодом довше виявляють наполегливість у складних завданнях, ніж учні, які мали досвід безпомилкового навчання (Dweck, 1975)

Зміна поведінки

Підкріплення може надаватися за правильні відповіді лише тоді, коли люди знають, що робити. Однак часто оперантні реакції не існують у кінцевій, відшліфованій формі. Якщо вчителі чекатимуть, щоб надати підкріплення, поки учні не видадуть належні відповіді, багато учнів ніколи не отримають підкріплення, оскільки вони ніколи не набудуть цих відповідей. Зараз ми перейдемо до обговорення того, як відбувається зміна поведінки в оперантному обумовленні, що має важливі наслідки для навчання.

Послідовні наближення (формування)

Основним методом зміни поведінки в оперантному обумовленні є формування, або диференційоване підкріплення послідовних наближень до бажаної форми або швидкості поведінки (Morse & Kelleher, 1977). Щоб сформувати поведінку, слід дотримуватися наступної послідовності:

  • Визначте, що учень може робити зараз (початкова поведінка)
  • Визначте бажану поведінку
  • Визначте потенційні підкріплювачі в оточенні учня
  • Розбийте бажану поведінку на невеликі підпункти, які потрібно опанувати послідовно
  • Переведіть учня від початкової поведінки до бажаної, послідовно підкріплюючи кожне наближення до бажаної поведінки

Формування - це навчання через практику з коригувальним зворотним зв'язком. Природний приклад формування можна побачити в учня, який намагається кинути баскетбольний м'яч з певної точки на майданчику. Перший кидок не долітає до кошика. Учень кидає сильніше вдруге, і м'яч вдаряється об щит. Учень кидає не так сильно втретє, і м'яч вдаряється об правий обруч і відскакує. Під час четвертої спроби учень кидає так само сильно, як і під час третьої, але цілиться лівіше. М'яч вдаряється об лівий обруч і відскакує. Нарешті, учень кидає так само сильно, але цілиться трохи правіше, і м'яч потрапляє в кошик. Поступово кидок був доведений до точної форми.

Формування можна застосовувати систематично до гіперактивного учня, який може працювати над завданням лише кілька хвилин, перш ніж відволіктися. Мета полягає в тому, щоб сформувати поведінку учня так, щоб він міг працювати безперервно протягом 30 хвилин. Спочатку вчитель надає підкріплення, коли учень продуктивно працює протягом 2 хвилин. Після кількох успішних 2-хвилинних інтервалів критерій підкріплення підвищується до 3 хвилин. За умови, що він працює безперервно протягом кількох 3-хвилинних періодів, критерій підвищується до 4 хвилин. Цей процес триває до досягнення мети в 30 хвилин, якщо учень надійно виконує завдання на критеріальному рівні. Якщо учень стикається з труднощами в будь-який момент, критерій підкріплення знижується до рівня, на якому він може успішно виконувати завдання.

Академічна навичка, яку можна сформувати, - це навчання учня таблиці множення на 6. Наразі він знає лише і Щоб отримати підкріплення, він повинен правильно декламувати ці два плюс Після того, як він зможе робити це надійно, критерій підкріплення підвищується, щоб включити Цей процес триває до тих пір, поки він точно не декламує всі факти до

Ланцюг

Більшість людських дій є складними і включають кілька тричленних непередбачених обставин (A–B–C), пов'язаних послідовно. Наприклад, щоб закинути баскетбольний м'яч, потрібно дриблінг, поворот, зайняття позиції, стрибок і випуск м'яча. Кожна відповідь змінює навколишнє середовище, і ця змінена умова служить стимулом для наступної відповіді. Ланцюг - це процес виробництва або зміни деяких змінних, які служать стимулами для майбутніх відповідей (Skinner, 1953). Ланцюг складається з серії оперантів, кожен з яких створює умови для подальших відповідей.

Ланцюги подібні до актів Гатрі, тоді як окремі тричленні непередбачені обставини нагадують рухи. Деякі ланцюги набувають функціональної єдності; ланцюг - це інтегрована послідовність, в якій успішна реалізація визначає навичку. Коли навички добре відточені, виконання ланцюга відбувається автоматично. Їзда на велосипеді складається з кількох дискретних дій, але досвідчений велосипедист виконує їх майже або зовсім без свідомих зусиль. Така автоматичність часто присутня в когнітивних навичках (наприклад, читанні, розв'язуванні математичних задач). Ланцюг відіграє вирішальну роль у набутті навичок (Gollub, 1977; Skinner, 1978).

Модифікація поведінки

Модифікація поведінки (або поведінкова терапія) відноситься до систематичного застосування принципів навчання поведінки для сприяння адаптивній поведінці (Ullmann & Krasner, 1965). Модифікація поведінки застосовувалася до дорослих і дітей у таких різноманітних контекстах, як класні кімнати, консультаційні центри, в'язниці та психіатричні лікарні. Її використовували для лікування фобій, дисфункціональної мови, деструктивної поведінки, негативних соціальних взаємодій, поганого виховання дітей і низького самоконтролю (Ayllon & Azrin, 1968; Becker, 1971; Keller & Ribes-Inesta, 1974; Ulrich, Stachnik, & Mabry, 1966). Lovaas (1977) успішно застосував модифікацію поведінки для навчання мови дітей з аутизмом.

Модифікація поведінки

Модифікація поведінки для деструктивних учнів є складною, оскільки такі учні можуть демонструвати мало відповідних реакцій, які можна позитивно підкріпити. Вчитель може використовувати формування для вирішення конкретної дратівливої поведінки. Кеті Стоун має проблеми з Еріком, який постійно штовхає інших учнів, коли клас стає в чергу, щоб кудись піти в будівлі. Коли клас йде лише на невелику відстань, місіс Стоун може повідомити Еріку, що якщо він залишатиметься в черзі, не штовхаючись, він буде лідером черги на зворотному шляху до класу; однак, якщо він штовхнеться, його негайно виведуть з черги. Цю процедуру можна повторювати, поки Ерік не зможе подолати короткі відстані. Потім місіс Стоун може дозволити йому ходити з класом на дедалі більші відстані, поки він не зможе поводитися в черзі на будь-якій відстані.

Сара, інша дитина в класі Кеті Стоун, часто здає неохайну роботу. Місіс Стоун може використовувати узагальнені підкріплення, такі як спеціальні наклейки (які можна обміняти на різні привілеї), щоб допомогти Сарі, чия робота зазвичай брудна, порвана і ледь розбірлива. Сарі кажуть, що якщо вона здасть чистий папір, вона може заробити одну наклейку; якщо він не порваний, іншу наклейку; і якщо письмо акуратне, третю наклейку. Як тільки Сара почне робити покращення, місіс Стоун поступово може перемістити винагороди в інші сфери для покращення (наприклад, правильна робота, закінчення роботи вчасно).

Техніки

Основні техніки модифікації поведінки включають підкріплення бажаної поведінки та згасання небажаної. Покарання застосовується рідко, але, коли використовується, частіше передбачає видалення позитивного підкріплення, а не надання негативного підкріплення.

Приймаючи рішення щодо програми змін, ті, хто змінює поведінку, зазвичай зосереджуються на наступних трьох питаннях (Ullmann & Krasner, 1965):

  • Які з поведінок індивіда є неадаптивними, і які слід збільшити (зменшити)?
  • Які екологічні непередбачені обставини в даний час підтримують поведінку індивіда (або для підтримки небажаної поведінки, або для зменшення ймовірності виконання більш адаптивних реакцій)?
  • Які екологічні особливості можна змінити, щоб змінити поведінку індивіда?

Зміна є найбільш вірогідною, коли ті, хто змінює, і клієнти погоджуються з тим, що зміна необхідна, і спільно вирішують бажані цілі. Першим кроком у створенні програми є визначення проблеми в поведінкових термінах. Наприклад, твердження «Кіт надто часто встає зі свого місця» стосується відкритої поведінки, яку можна виміряти: можна вести облік часу, коли Кіт встає зі свого місця. Загальні вирази, що стосуються ненаглядових речей («Кіт має погане ставлення»), не дозволяють об'єктивно визначити проблему.

Наступним кроком є визначення підкріплень, які підтримують небажану поведінку. Можливо, Кіт отримує увагу вчителя лише тоді, коли встає зі свого місця, а не коли сидить. Простий план полягає в тому, щоб вчитель приділяв увагу Кіту, коли він сидить і займається навчальною роботою, і ігнорував його, коли він встає зі свого місця. Якщо кількість разів, коли Кіт встає зі свого місця, зменшується, увага вчителя є позитивним підкріпленням.

Програма модифікації поведінки може використовувати такі узагальнені підкріплення, як бали, які учні обмінюють на резервні підкріплення, такі як матеріальні винагороди, вільний час або привілеї. Наявність більше одного резервного підкріплення гарантує, що принаймні одне буде ефективним для кожного учня в будь-який час. Повинен бути встановлений поведінковий критерій для отримання підкріплення. Можна використовувати процедуру формування з п'яти кроків (обговорену раніше). Критерій спочатку визначається на рівні початкової поведінки і прогресує невеликими кроками до бажаної поведінки. Учень отримує бал щоразу, коли критерій задовольняється. Щоб погасити будь-яку небажану поведінку Кіта, вчитель не повинен приділяти йому надмірну увагу, якщо він встає зі свого місця, а скоріше повинен конфіденційно повідомити йому, що оскільки він не задовольняє критерій, він не отримує бал.

Покарання використовується нечасто, але може знадобитися, коли поведінка стає настільки руйнівною, що її неможливо ігнорувати (наприклад, бійка). Поширеним покаранням є тайм-аут (від підкріплення). Під час тайм-ауту учня виводять із класного соціального контексту. Там учень продовжує займатися навчальною роботою без соціальної взаємодії з однолітками або можливості заробити підкріплення. Іншим покаранням є позбавлення позитивних підкріплень (наприклад, вільний час, перерва, привілеї) за неналежну поведінку.

Критики стверджують, що модифікація поведінки формує тиху та покірну поведінку (Winett & Winkler, 1972). Хоча для забезпечення навчання необхідна розумна кількість тиші, деякі вчителі прагнуть до тихого класу в будь-який час, навіть коли певний шум від соціальних взаємодій сприятиме навчанню. Використання модифікації поведінки за своєю суттю не є ні хорошим, ні поганим. Воно може створити тихий клас або сприяти соціальним ініціативам у замкнутих дітей (Strain, Kerr, & Ragland, 1981). Як і самі методи, цілі модифікації поведінки повинні бути ретельно продумані тими, хто впроваджує ці процедури.

Когнітивна модифікація поведінки

Дослідники також включили когнітивні елементи в процедури модифікації поведінки. У когнітивній модифікації поведінки думки учнів (коли вони висловлені) функціонують як дискримінативні та підкріплюючі стимули. Таким чином, учні можуть вербально інструктувати себе, що робити, а потім виконувати відповідну поведінку. Методи когнітивної модифікації поведінки часто застосовуються до учнів з обмеженими можливостями (Hallahan, Kneedler, & Lloyd, 1983) і використовуються для зменшення гіперактивності та агресії (Robinson, Smith, Miller, & Brownell, 1999). Самоінструкційне навчання Meichenbaum (1977) є прикладом когнітивної модифікації поведінки.

Саморегуляція

Оперантне обумовлення також стосується саморегуляції (Mace, Belfiore, & Hutchinson, 2001; Mace, Belfiore, & Shea, 1989). Цей погляд детально розглядається в розділі 9. Оперантна теорія стверджує, що саморегульована поведінка передбачає вибір серед альтернативних способів дій (Brigham, 1982), зазвичай шляхом відкладання негайного підкріплення на користь іншого, і, як правило, більшого, майбутнього підкріплення. Наприклад, Тріша залишається вдома в п'ятницю ввечері, щоб підготуватися до іспиту, замість того, щоб піти з друзями, а Кайл продовжує працювати над академічним завданням, незважаючи на глузування однолітків поблизу. Вони відкладають негайне підкріплення заради очікуваного майбутнього підкріплення, як і Джон у наступному прикладі.

Джону важко навчатися. Незважаючи на добрі наміри, він приділяє недостатньо часу навчанню і легко відволікається. Ключем до зміни його поведінки є встановлення диференційних стимулів (сигналів) для навчання. За допомогою свого шкільного консультанта Джон встановлює певний час і місце для навчання (з 19:00 до 21:00 у своїй кімнаті з однією 10-хвилинною перервою). Щоб усунути відволікаючі сигнали, Джон погоджується не використовувати свій мобільний телефон, CD-плеєр, комп'ютер або телевізор протягом цього періоду. Для підкріплення Джон буде нараховувати собі один бал за кожну ніч, коли він успішно виконує свій розпорядок. Коли він отримає 10 балів, він може взяти вихідний.

З точки зору оперантного обумовлення, людина вирішує, яку поведінку регулювати, встановлює диференційні стимули для їх виникнення, оцінює виконання з точки зору того, чи відповідає воно стандарту, і застосовує підкріплення. Як обговорювалося, трьома ключовими підпроцесами є самомоніторинг (навмисна увага до обраних аспектів своєї поведінки), самоінструктаж ( и, що створюють умови для саморегуляції , що веде до , і самопідкріплення (підкріплення себе за виконання правильної відповіді).