Condicionamento Operante: Teoria e Aplicações Práticas

Introdução

Uma teoria comportamental bem conhecida é o condicionamento operante, formulado por B. F. (Burrhus Frederic) Skinner (1904–1990). A partir da década de 1930, Skinner publicou uma série de artigos relatando resultados de estudos de laboratório com animais, nos quais identificou os vários componentes do condicionamento operante. Ele resumiu grande parte deste trabalho inicial em seu influente livro, O Comportamento dos Organismos (Skinner, 1938).

Skinner aplicou suas ideias a problemas humanos. No início de sua carreira, interessou-se por educação e desenvolveu máquinas de ensino e instrução programada. A Tecnologia do Ensino (Skinner, 1968) aborda instrução, motivação, disciplina e criatividade. Em 1948, após um período difícil em sua vida, publicou Walden Two, que descreve como os princípios comportamentais podem ser aplicados para criar uma sociedade utópica. Skinner (1971) abordou os problemas da vida moderna e defendeu a aplicação de uma tecnologia comportamental ao projeto de culturas em Além da Liberdade e da Dignidade. Skinner e outros aplicaram princípios de condicionamento operante a domínios como aprendizado e disciplina escolar, desenvolvimento infantil, aquisição de linguagem, comportamentos sociais, doenças mentais, problemas médicos, abuso de substâncias e treinamento vocacional (DeGrandpre, 2000; Karoly & Harris, 1986; Morris, 2003).

Quando jovem, Skinner aspirava ser escritor (Skinner, 1970):
Construí um pequeno escritório no sótão e comecei a trabalhar. Os resultados foram desastrosos. Perdi meu tempo. Li sem rumo, construí modelos de navios, toquei piano, ouvi o rádio recém-inventado, contribuí para a coluna de humor de um jornal local, mas não escrevi quase nada mais e pensei em consultar um psiquiatra. (p. 6)

Ele se interessou por psicologia depois de ler os Reflexos Condicionados de Pavlov (1927) e o Behaviorismo de Watson (1924). Sua carreira subsequente teve um profundo impacto na psicologia da aprendizagem.

Apesar de sua admissão de que “Eu havia falhado como escritor porque não tinha nada importante a dizer” (Skinner, 1970, p. 7), ele foi um escritor prolífico que canalizou suas aspirações literárias para a escrita científica que durou seis décadas (Lattal, 1992). Sua dedicação à sua profissão é evidente em seu discurso convidado na convenção da American Psychological Association oito dias antes de sua morte (Holland, 1992; Skinner, 1990). A associação o homenageou com uma edição especial de seu jornal mensal, American Psychologist (American Psychological Association, 1992). Embora sua teoria tenha sido desacreditada pelos teóricos da aprendizagem atuais porque não consegue explicar adequadamente formas de aprendizagem de ordem superior e complexas (Bargh & Ferguson, 2000), sua influência continua à medida que os princípios do condicionamento operante são comumente aplicados para melhorar o aprendizado e o comportamento dos alunos (Morris, 2003). No cenário de abertura, por exemplo, Leo emprega princípios de condicionamento operante para controlar o mau comportamento dos alunos. Emily e Shayna, por outro lado, defendem a importância dos fatores cognitivos.

Estrutura Conceitual

Esta seção discute as premissas subjacentes ao condicionamento operante, como ele reflete uma análise funcional do comportamento e as implicações da teoria para a previsão e o controle do comportamento. A teoria e os princípios do condicionamento operante são complexos (Dragoi & Staddon, 1999); os princípios mais relevantes para a aprendizagem humana são abordados neste capítulo.

Pressupostos Científicos

Pavlov traçou o locus da aprendizagem para o sistema nervoso e via o comportamento como uma manifestação do funcionamento neurológico. Skinner (1938) não negou que o funcionamento neurológico acompanha o comportamento, mas acreditava que uma psicologia do comportamento pode ser compreendida em seus próprios termos, sem referência a eventos neurológicos ou outros eventos internos.

Skinner levantou objeções semelhantes aos processos e entidades não observáveis propostos pelas visões cognitivas modernas da aprendizagem (Overskeid, 2007). Eventos privados, ou respostas internas, são acessíveis apenas ao indivíduo e podem ser estudados por meio de relatos verbais das pessoas, que são formas de comportamento (Skinner, 1953). Skinner não negou a existência de atitudes, crenças, opiniões, desejos e outras formas de autoconhecimento (afinal, ele as tinha), mas sim qualificou seu papel.

As pessoas não experimentam consciência ou emoções, mas sim seus próprios corpos, e as reações internas são respostas a estímulos internos (Skinner, 1987). Um problema adicional com os processos internos é que traduzi-los em linguagem é difícil, porque a linguagem não captura completamente as dimensões de uma experiência interna (por exemplo, dor). Muito do que é chamado de saber envolve o uso da linguagem (comportamento verbal). Pensamentos são tipos de comportamento que são provocados por outros estímulos (ambientais ou privados) e que dão origem a respostas (abertas ou encobertas). Quando eventos privados são expressos como comportamentos abertos, seu papel em uma análise funcional pode ser determinado.

Análise Funcional do Comportamento

Skinner (1953) referiu-se a seus meios de examinar o comportamento como uma análise funcional:
As variáveis externas das quais o comportamento é uma função fornecem o que pode ser chamado de análise causal ou funcional. Propomo-nos prever e controlar o comportamento do organismo individual. Esta é a nossa “variável dependente”—o efeito para o qual devemos encontrar a causa. Nossas “variáveis independentes”—as causas do comportamento—são as condições externas das quais o comportamento é uma função. As relações entre as duas—as “relações de causa e efeito” no comportamento—são as leis de uma ciência. Uma síntese dessas leis expressa em termos quantitativos fornece uma imagem abrangente do organismo como um sistema comportamental. (p. 35)

A aprendizagem é “oa reorganização das respostas em uma situação complexa”; condicionamento refere-se ao “fortalecimento do comportamento resultante do reforço” (Skinner, 1953, p. 65). Existem dois tipos de condicionamento: Tipo S e Tipo R. O Tipo S é o condicionamento pavloviano, caracterizado pelo emparelhamento do estímulo reforçador (incondicionado) com outro estímulo (condicionado). O S chama a atenção para a importância do estímulo em elicitar uma resposta do organismo. A resposta dada ao estímulo elicitor é conhecida como comportamento respondente.

Embora o condicionamento do Tipo S possa explicar reações emocionais condicionadas, a maioria dos comportamentos humanos são emitidos na presença de estímulos, em vez de serem automaticamente eliciados por eles. As respostas são controladas por suas consequências, não por estímulos antecedentes. Este tipo de comportamento, que Skinner chamou de Tipo R para enfatizar o aspecto da resposta, é o comportamento operante porque opera sobre o ambiente para produzir um efeito.

Skinner (1938, p. 21):
Se a ocorrência de um operante é seguida pela apresentação de um estímulo reforçador, a força é aumentada. . . . Se a ocorrência de um operante já fortalecido através do condicionamento não for seguida pelo estímulo reforçador, a força é diminuída.

Podemos pensar no comportamento operante como “aprender fazendo”, e, de fato, muito aprendizado ocorre quando realizamos comportamentos (Lesgold, 2001). Ao contrário do comportamento respondente, que antes do condicionamento não ocorre, a probabilidade de ocorrência de um operante nunca é zero, porque a resposta deve ser dada para que o reforço seja fornecido. O reforço altera a probabilidade ou a taxa de ocorrência da resposta. Os comportamentos operantes atuam sobre seus ambientes e se tornam mais ou menos propensos a ocorrer devido ao reforço.

Processos Básicos

Esta seção examina os processos básicos no condicionamento operante: reforço, extinção, reforçadores primários e secundários, o Princípio de Premack, punição, esquemas de reforço, generalização e discriminação.

Reforço

O reforço é responsável pelo fortalecimento da resposta — aumentando a taxa de resposta ou tornando as respostas mais propensas a ocorrer. Um reforçador (ou estímulo reforçador) é qualquer estímulo ou evento que segue uma resposta que leva ao fortalecimento da resposta. Os reforçadores (recompensas) são definidos com base em seus efeitos, que não dependem de processos mentais como consciência, intenções ou objetivos (Schultz, 2006). Como os reforçadores são definidos por seus efeitos, eles não podem ser determinados com antecedência.

Skinner (1953, pp. 72–73):
A única maneira de dizer se um determinado evento é ou não reforçador para um determinado organismo sob determinadas condições é fazer um teste direto. Observamos a frequência de uma resposta selecionada, então tornamos um evento contingente a ela e observamos qualquer mudança na frequência. Se houver uma mudança, classificamos o evento como reforçador para o organismo sob as condições existentes.

Os reforçadores são especificamente situacionais: Eles se aplicam a indivíduos em determinados momentos sob determinadas condições. O que é reforçador para um determinado aluno durante a leitura agora pode não ser durante a matemática agora ou durante a leitura mais tarde. Apesar dessa especificidade, estímulos ou eventos que reforçam o comportamento podem, em certa medida, ser previstos (Skinner, 1953). Os alunos normalmente consideram reforçadores eventos como elogios do professor, tempo livre, privilégios, adesivos e notas altas. No entanto, nunca se pode saber com certeza se uma consequência é reforçadora até que seja apresentada após uma resposta e vejamos se o comportamento muda.

O modelo operante básico de condicionamento é a contingência de três termos:

Um estímulo discriminativo define a ocasião para uma resposta (R) ser emitida, que é seguida por um estímulo reforçador ( , ou reforço). O estímulo reforçador é qualquer estímulo (evento, consequência) que aumenta a probabilidade de que a resposta seja emitida no futuro quando o estímulo discriminativo estiver presente. Em termos mais familiares, podemos rotular isso como o modelo A-B-C:

O reforço positivo envolve apresentar um estímulo, ou adicionar algo a uma situação, seguindo uma resposta, o que aumenta a probabilidade futura de que essa resposta ocorra nessa situação. Um reforçador positivo é um estímulo que, quando apresentado após uma resposta, aumenta a probabilidade futura de que a resposta ocorra nessa situação. No cenário de abertura, Leo usa pontos como reforçadores positivos para bom comportamento.

'T' refere-se ao professor, 'L', ao aluno:

Processos de reforço e punição.
Estímulo Discriminativo Resposta Estímulo Reforçador (Punitivo)
Reforço Positivo (Apresentar reforçador positivo) - -
'T': dá tempo de estudo independente 'L': estuda 'T': elogia 'L': pelo bom trabalho
Reforço Negativo (Remover reforçador negativo) - -
'T': dá tempo de estudo independente 'L': estuda 'T': diz que 'L': não precisa fazer o dever de casa
Punição (Apresentar reforçador negativo) - -
'T': dá tempo de estudo independente 'L': perde tempo 'T': dá dever de casa
Punição (Remover reforçador positivo) - -
'T': dá tempo de estudo independente 'L': perde tempo 'T': diz que 'L': perderá o tempo livre

O reforço negativo envolve remover um estímulo, ou tirar algo de uma situação após uma resposta, o que aumenta a probabilidade futura de que a resposta ocorra nessa situação. Um reforçador negativo é um estímulo que, quando removido por uma resposta, aumenta a probabilidade futura de que a resposta ocorra nessa situação. Alguns estímulos que frequentemente funcionam como reforçadores negativos são luzes fortes, ruídos altos, críticas, pessoas irritantes e notas baixas, porque os comportamentos que os removem tendem a ser reforçadores. O reforço positivo e negativo têm o mesmo efeito: Eles aumentam a probabilidade de que a resposta seja feita no futuro na presença do estímulo.

Para ilustrar esses processos, suponha que um professor esteja realizando uma sessão de perguntas e respostas com a turma. O professor faz uma pergunta ( ou A), chama um aluno voluntário que dá a resposta correta (R ou B) e elogia o aluno ( ou C). Se o voluntariado desse aluno aumenta ou permanece em um nível alto, o elogio é um reforçador positivo e este é um exemplo de reforço positivo porque dar o elogio aumentou o voluntariado. Agora suponha que depois que um aluno dá a resposta correta, o professor diz ao aluno que ele ou ela não precisa fazer a tarefa de casa. Se o voluntariado desse aluno aumenta ou permanece em um nível alto, a tarefa de casa é um reforçador negativo e este é um exemplo de reforço negativo porque remover a tarefa de casa aumentou o voluntariado.

Reforço Positivo e Negativo

Os professores podem usar o reforço positivo e negativo para motivar os alunos a dominar as habilidades e passar mais tempo na tarefa. Por exemplo, ao ensinar conceitos em uma unidade de ciências, um professor pode pedir aos alunos que respondam a perguntas no final do capítulo. O professor também pode montar centros de atividades pela sala que envolvam experimentos práticos relacionados à lição. Os alunos circulariam e completariam os experimentos dependendo do sucesso em responder às perguntas do capítulo (reforço positivo). Essa contingência reflete o Princípio de Premack de fornecer a oportunidade de se envolver em uma atividade mais valorizada (experimentos) como um reforçador para se envolver em uma menos valorizada (completar as perguntas do capítulo). Os alunos que completam 80% das perguntas corretamente e que participam de um mínimo de dois experimentos não precisam fazer o dever de casa. Isso funcionaria como reforço negativo na medida em que os alunos percebem o dever de casa como um reforçador negativo.

Um conselheiro do ensino fundamental que trabalha com um aluno para melhorar o comportamento em sala de aula pode pedir a cada um dos professores do aluno que marque “sim” ou “não” em relação ao comportamento em sala de aula naquele dia (aceitável, inaceitável). Para cada “sim,” o aluno recebe 1 minuto no laboratório de informática para jogar jogos de computador (reforço positivo para este aluno). No final da semana, o aluno pode usar o tempo de computador ganho após o almoço. Além disso, se o aluno ganhar um mínimo de 15 minutos no laboratório, ele ou ela não precisa levar um bilhete de comportamento para casa para ser assinado pelos pais (isso pressupõe que o aluno perceba um bilhete de comportamento como um reforçador negativo).

Extinção

A extinção envolve o declínio da força da resposta devido à não reforçamento. Alunos que levantam as mãos na aula, mas nunca são chamados, podem parar de levantar as mãos. Pessoas que enviam muitas mensagens de e-mail para a mesma pessoa, mas nunca recebem uma resposta, podem eventualmente parar de enviar mensagens para essa pessoa.

A rapidez com que a extinção ocorre depende da história de reforçamento (Skinner, 1953). A extinção ocorre rapidamente se poucas respostas precedentes foram reforçadas. A resposta é muito mais durável com uma história mais longa de reforçamento. Extinção não é o mesmo que esquecimento. As respostas que se extinguem podem ser realizadas, mas não são por falta de reforçamento. Nos exemplos anteriores, os alunos ainda sabem como levantar as mãos e as pessoas ainda sabem como enviar mensagens de e-mail. O esquecimento envolve uma verdadeira perda de condicionamento ao longo do tempo em que as oportunidades de responder não estiveram presentes.

Reforçadores Primários e Secundários

Estímulos como comida, água e abrigo são chamados de reforçadores primários porque são necessários para a sobrevivência. Reforçadores secundários são estímulos que se tornam condicionados por meio de sua associação com reforçadores primários. O copo de leite favorito de uma criança se torna secundariamente reforçador por meio de sua associação com o leite (um reforçador primário). Um reforçador secundário que se torna emparelhado com mais de um reforçador primário é um reforçador generalizado. As pessoas trabalham longas horas para ganhar dinheiro (um reforçador generalizado), que usam para comprar muitos reforçadores (por exemplo, comida, moradia, TVs, férias).

O condicionamento operante explica o desenvolvimento e a manutenção de muito comportamento social com reforçadores generalizados. As crianças podem se comportar de maneiras para chamar a atenção dos adultos. A atenção é reforçadora porque é emparelhada com reforçadores primários dos adultos (por exemplo, comida, água, proteção). Reforçadores generalizados educacionais importantes são o elogio dos professores, notas altas, privilégios, honras e diplomas. Esses reforçadores são frequentemente emparelhados com outros reforçadores generalizados, como aprovação (de pais e amigos) e dinheiro (um diploma universitário leva a um bom emprego).

Princípio de Premack

Lembre-se de que rotulamos uma consequência comportamental como reforçadora somente depois que a aplicamos e vemos como ela afeta o comportamento futuro. É um tanto preocupante que devamos usar o bom senso ou a tentativa e erro na escolha de reforçadores, porque não podemos saber com certeza de antemão se uma consequência funcionará como um reforçador.

Premack (1962, 1971) descreveu um meio de ordenar os reforçadores que permite prever os reforçadores. O Princípio de Premack diz que a oportunidade de se envolver em uma atividade mais valorizada reforça o envolvimento em uma atividade menos valorizada, onde “valor” é definido em termos da quantidade de resposta ou tempo gasto na atividade na ausência de reforçamento. Se uma contingência é organizada de tal forma que o valor do segundo evento (contingente) é maior do que o valor do primeiro evento (instrumental), um aumento será esperado na probabilidade de ocorrência do primeiro evento (a suposição de recompensa). Se o valor do segundo evento é menor do que o do primeiro evento, a probabilidade de ocorrência do primeiro evento deve diminuir (a suposição de punição).

Suponha que uma criança possa escolher entre trabalhar em um projeto de arte, ir ao centro de mídia, ler um livro na sala de aula ou trabalhar no computador. Ao longo de 10 dessas escolhas, a criança vai ao centro de mídia 6 vezes, trabalha no computador 3 vezes, trabalha em um projeto de arte 1 vez e nunca lê um livro na sala de aula. Para esta criança, a oportunidade de ir ao centro de mídia é a mais valorizada. Para aplicar o Princípio de Premack, um professor pode dizer à criança: “Depois que você terminar de ler este livro, você pode ir ao centro de mídia.” Considerável evidência empírica apoia as ideias de Premack, especialmente com relação à suposição de recompensa (Dunham, 1977).

O Princípio de Premack oferece orientação para selecionar reforçadores eficazes: Observe o que as pessoas fazem quando têm uma escolha e ordene esses comportamentos em termos de probabilidade. A ordem não é permanente, pois o valor dos reforçadores pode mudar. Qualquer reforçador, quando aplicado com frequência, pode resultar em saciedade e levar à diminuição da resposta. Os professores que empregam o Princípio de Premack precisam verificar periodicamente as preferências dos alunos, observando-os e perguntando o que eles gostam de fazer. Determinar com antecedência quais reforçadores provavelmente serão eficazes em uma situação é fundamental no planejamento de um programa de mudança comportamental (Timberlake & Farmer-Dougan, 1991).

Punição

A punição diminui a probabilidade futura de responder a um estímulo. A punição pode envolver a retirada de um reforçador positivo ou a apresentação de um reforçador negativo após uma resposta, conforme mostrado na Tabela 'Processos de reforço e punição'. Suponha que durante uma sessão de perguntas e respostas, um aluno incomode repetidamente outro aluno quando o professor não está olhando (professor não olhando ou A; mau comportamento = R ou B). O professor vê o mau comportamento e diz: “Pare de incomodá-lo” ( ou C). Se o aluno parar de incomodar o outro aluno, a crítica do professor opera como um reforçador negativo e este é um exemplo de punição porque dar a crítica diminuiu o mau comportamento. Mas observe que, da perspectiva do professor, este é um exemplo de reforço negativo (mau comportamento = ou A; crítica = R ou B; fim do mau comportamento = ou C). Como o professor foi reforçado negativamente, é provável que o professor continue a criticar o mau comportamento do aluno.

Em vez de criticar o aluno, suponha que o professor diga: “Você terá que ficar dentro de casa durante o recreio hoje.” Se o mau comportamento do aluno parar, o recreio opera como um reforçador positivo e este é um exemplo de punição porque a perda do recreio interrompe o mau comportamento. Como antes, a cessação do mau comportamento do aluno é reforçadora negativamente para o professor.

A punição suprime uma resposta, mas não a elimina; quando a ameaça de punição é removida, a resposta punida pode retornar. Os efeitos da punição são complexos. A punição frequentemente traz respostas que são incompatíveis com o comportamento punido e que são fortes o suficiente para suprimi-lo (Skinner, 1953). Bater em uma criança por se comportar mal pode produzir culpa e medo, o que pode suprimir o mau comportamento. Se a criança se comportar mal no futuro, a culpa e o medo condicionados podem reaparecer e levar a criança a parar rapidamente de se comportar mal. A punição também condiciona respostas que levam a escapar ou evitar a punição. Alunos cujo professor critica respostas incorretas logo aprendem a evitar voluntariar respostas. A punição pode condicionar comportamentos desadaptativos, porque a punição não ensina como se comportar de forma mais produtiva. A punição pode ainda dificultar o aprendizado, criando um conflito de tal forma que o indivíduo vacila entre responder de uma forma ou de outra. Se o professor às vezes critica os alunos por respostas incorretas e às vezes não, os alunos nunca sabem quando a crítica está chegando. Tal comportamento variável pode ter subprodutos emocionais—medo, raiva, choro—que interferem no aprendizado.

A punição é usada com frequência nas escolas para lidar com interrupções. As punições comuns são perda de privilégios, remoções da sala de aula, suspensões dentro e fora da escola e expulsões (Maag, 2001). No entanto, existem várias alternativas à punição. Uma é mudar os estímulos discriminativos para o comportamento negativo. Por exemplo, um aluno sentado no fundo da sala pode se comportar mal com frequência. Os professores podem mudar os estímulos discriminativos movendo o aluno disruptivo para a frente da sala de aula. Outra alternativa é permitir que o comportamento indesejado continue até que o perpetrador fique saciado, o que é semelhante ao método de fadiga de Guthrie. Um pai pode permitir que uma criança fazendo uma birra continue a fazê-la até que ele ou ela fique fatigado. Uma terceira alternativa é extinguir um comportamento indesejado ignorando-o. Isso pode funcionar bem com pequenos maus comportamentos (por exemplo, alunos sussurrando uns aos outros), mas quando as salas de aula se tornam disruptivas, os professores precisam agir de outras maneiras. Uma quarta alternativa é condicionar o comportamento incompatível com o reforço positivo. O elogio do professor pelos hábitos de trabalho produtivos ajuda a condicionar esses hábitos. A principal vantagem desta alternativa sobre a punição é que ela mostra ao aluno como se comportar de forma adaptativa.

Alternativas à punição.
Alternativa Exemplo
Mudar os estímulos discriminativos Afastar o aluno que se comporta mal de outros alunos que se comportam mal.
Permitir que o comportamento indesejado continue Fazer com que o aluno que se levanta quando deveria estar sentado continue a se levantar.
Extinguir o comportamento indesejado Ignorar o pequeno mau comportamento para que ele não seja reforçado pela atenção do professor.
Condicionar um comportamento incompatível Reforçar o progresso do aprendizado, que ocorre apenas quando o aluno não está se comportando mal.

Esquemas de Reforço

Os esquemas se referem a quando o reforço é aplicado (Ferster & Skinner, 1957; Skinner, 1938; Zeiler, 1977). Um esquema contínuo envolve o reforço para cada resposta correta. Isso pode ser desejável enquanto as habilidades estão sendo adquiridas: Os alunos recebem feedback após cada resposta sobre a precisão de seu trabalho. O reforço contínuo ajuda a garantir que respostas incorretas não sejam aprendidas.

Um esquema intermitente envolve reforçar algumas, mas não todas as respostas corretas. O reforço intermitente é comum nas salas de aula, porque geralmente não é possível para os professores reforçar cada aluno por cada resposta correta ou desejável. Os alunos não são chamados toda vez que levantam as mãos, não são elogiados depois de trabalhar em cada problema e não são constantemente informados de que estão se comportando adequadamente.

Os esquemas intermitentes são definidos em termos de tempo ou número de respostas. Um esquema de intervalo envolve reforçar a primeira resposta correta após um período de tempo específico. Em um esquema de intervalo fixo (FI), o intervalo de tempo é constante de um reforço para o próximo. Um esquema FI5 significa que o reforço é entregue para a primeira resposta feita após 5 minutos. Os alunos que recebem 30 minutos de tempo livre toda sexta-feira (dependendo do bom comportamento durante a semana) estão operando sob um esquema de intervalo fixo. Em um esquema de intervalo variável (VI), o intervalo de tempo varia de ocasião para ocasião em torno de algum valor médio. Um esquema VI5 significa que, em média, a primeira resposta correta após 5 minutos é reforçada, mas o intervalo de tempo varia (por exemplo, 2, 3, 7 ou 8 minutos). Os alunos que recebem 30 minutos de tempo livre (dependendo do bom comportamento) em uma média de uma vez por semana, mas não necessariamente no mesmo dia a cada semana, estão operando sob um esquema de intervalo variável.

Um esquema de razão depende do número de respostas corretas ou da taxa de resposta. Em um esquema de razão fixa (FR), cada enésima resposta correta é reforçada, onde n é constante. Um esquema FR10 significa que cada 10ª resposta correta recebe reforço. Em um esquema de razão variável (VR), cada enésima resposta correta é reforçada, mas o valor varia em torno de um número médio n. Um professor pode dar tempo livre após cada quinta tarefa de livro de exercícios ser concluída (FR5) ou periodicamente em torno de uma média de cinco tarefas concluídas (VR5).

Os esquemas de reforço produzem padrões característicos de resposta. Em geral, os esquemas de razão produzem taxas de resposta mais altas do que os esquemas de intervalo. Um fator limitante nos esquemas de razão é a fadiga devido à resposta rápida. Os esquemas de intervalo fixo produzem um padrão em forma de vieira. A resposta diminui imediatamente após o reforço, mas aumenta em direção ao final do intervalo entre os reforços. O esquema de intervalo variável produz uma taxa constante de resposta. Os testes não anunciados operam em esquemas de intervalo variável e normalmente mantêm os alunos estudando regularmente. Os esquemas intermitentes são mais resistentes à extinção do que os esquemas contínuos: Quando o reforço é descontinuado, a resposta continua por mais tempo se o reforço foi intermitente em vez de contínuo. A durabilidade dos esquemas intermitentes pode ser vista na persistência das pessoas em eventos como jogar caça-níqueis, pescar e fazer compras em busca de pechinchas.

Generalização

Uma vez que uma certa resposta ocorre regularmente a um determinado estímulo, a resposta também pode ocorrer a outros estímulos. Isso é chamado de generalização (Skinner, 1953). A generalização parece problemática para a teoria operante, porque uma resposta não deve ser feita em uma situação em que nunca foi reforçada. Skinner explicou a generalização observando que as pessoas realizam muitos comportamentos que levam à resposta final (reforçada). Esses comportamentos componentes são frequentemente parte das cadeias de comportamento de diferentes tarefas e, portanto, são reforçados em diferentes contextos. Quando as pessoas estão em uma nova situação, é provável que realizem os comportamentos componentes, que produzem uma resposta precisa ou uma rápida aquisição da resposta correta.

Por exemplo, alunos com bons hábitos acadêmicos normalmente vêm para a aula, prestam atenção e participam das atividades, fazem anotações, fazem a leitura necessária e acompanham as tarefas. Esses comportamentos componentes produzem alto desempenho e notas. Quando esses alunos começam uma nova aula, não é necessário que o conteúdo seja semelhante às aulas anteriores em que eles se inscreveram. Em vez disso, os comportamentos componentes receberam reforço repetido e, portanto, é provável que se generalizem para o novo ambiente.

A generalização, no entanto, não ocorre automaticamente. O’Leary e Drabman (1971) observaram que a generalização “deve ser programada como qualquer outra mudança comportamental” (p. 393). Um problema com muitos programas de modificação de comportamento é que eles mudam os comportamentos, mas os novos comportamentos não se generalizam fora do contexto de treinamento. O’Leary e Drabman (1971) oferecem sugestões sobre maneiras de facilitar a generalização.

Discriminação

A discriminação, o processo complementar à generalização, envolve responder de forma diferente (em intensidade ou taxa) dependendo do estímulo ou das características de uma situação (Rilling, 1977). Embora os professores queiram que os alunos generalizem o que aprendem para outras situações, eles também querem que respondam discriminadamente. Ao resolver problemas de palavras matemáticas, os professores podem querer que os alunos adotem uma abordagem geral de resolução de problemas, compreendendo etapas como determinar as informações fornecidas e as necessárias, desenhar uma imagem e gerar fórmulas úteis. Os professores também querem que os alunos aprendam a discriminar os tipos de problemas (por exemplo, área, taxa de tempo-distância, taxa de juros). Ser capaz de identificar rapidamente o tipo de problema aumenta o sucesso dos alunos.

Generalização

A generalização pode avançar o desenvolvimento de habilidades em todas as áreas temáticas. Encontrar ideias principais é relevante para artes da linguagem, estudos sociais, matemática (problemas de palavras) e outras áreas de conteúdo. Um professor de artes da linguagem pode fornecer aos alunos uma estratégia para encontrar ideias principais. Uma vez que os alunos dominam esta estratégia, o professor explica como modificar o seu uso para outras disciplinas académicas e pede aos alunos para pensarem em usos. Ao ensinar bem a estratégia em um domínio e facilitar potenciais aplicações em outros domínios, os professores poupam muito tempo e esforço porque não têm de ensinar a estratégia em cada área de conteúdo.

Ensinar comportamentos esperados (por exemplo, andar no corredor, levantar a mão para falar) também pode ser generalizado. Por exemplo, se todos os professores da sétima série decidirem que os alunos usem o mesmo formato para o cabeçalho em seus trabalhos, isso pode ser explicado em uma aula. Então, pode ser pedido aos alunos para usar o mesmo formato (com pequenas alterações) em cada uma de suas outras aulas.

Sugestões para facilitar a generalização.
Nome Propósito
Envolvimento dos Pais Envolver os pais em programas de mudança comportamental.
Altas Expectativas Transmitir aos alunos que eles são capazes de ter um bom desempenho.
Autoavaliação Ensinar os alunos a monitorar e avaliar seus comportamentos.
Contingências Retirar contingências artificiais (por exemplo, pontos) e substituir por naturais (privilégios).
Participação Permitir que os alunos participem na especificação de comportamentos a serem reforçados e contingências de reforço.
Acadêmicos Fornecer um bom programa acadêmico porque muitos alunos com problemas de comportamento têm deficiências acadêmicas.
Benefícios Mostrar aos alunos como as mudanças comportamentais os beneficiarão, ligando as mudanças a atividades de interesse.
Reforço Reforçar os alunos em diferentes ambientes para reduzir a discriminação entre situações reforçadas e não reforçadas.
Consistência Preparar os professores em classes regulares para continuar a moldar os comportamentos dos alunos em classes especiais depois que eles são integrados ao programa regular.

Spence (1936) propôs que, para ensinar a discriminação, as respostas desejadas devem ser reforçadas e as respostas indesejadas extintas pela não reforçamento. Na escola, os professores apontam semelhanças e diferenças entre conteúdos semelhantes e fornecem revisões periódicas para garantir que os alunos discriminem adequadamente e apliquem métodos corretos de resolução de problemas.

Geralmente, pensa-se que os erros são disruptivos e produzem aprendizado de respostas incorretas. Isso sugere que os erros dos alunos devem ser mantidos no mínimo. Se todos os erros precisam ser eliminados é discutível. A pesquisa sobre motivação mostra que os alunos que aprendem a lidar com os erros de forma adaptativa persistem posteriormente por mais tempo em tarefas difíceis do que os alunos que experimentaram um aprendizado sem erros (Dweck, 1975)

Mudança Comportamental

O reforço pode ser dado para fazer respostas corretas somente quando as pessoas sabem o que fazer. Frequentemente, no entanto, as respostas operantes não existem em forma final e polida. Se os professores esperarem para fornecer reforço até que os alunos emitam as respostas adequadas, muitos alunos nunca receberiam reforço porque nunca adquiririam as respostas. Agora passamos a uma discussão sobre como a mudança comportamental ocorre no condicionamento operante, o que tem implicações importantes para a aprendizagem.

Aproximações Sucessivas (Modelagem)

O método básico de condicionamento operante de mudança comportamental é a modelagem, ou reforço diferencial de aproximações sucessivas à forma ou taxa desejada de comportamento (Morse & Kelleher, 1977). Para modelar o comportamento, deve-se aderir à seguinte sequência:

  • Identificar o que o aluno pode fazer agora (comportamento inicial)
  • Identificar o comportamento desejado
  • Identificar reforçadores potenciais no ambiente do aluno
  • Dividir o comportamento desejado em pequenas subetapas a serem dominadas sequencialmente
  • Mover o aluno do comportamento inicial para o comportamento desejado, reforçando sucessivamente cada aproximação ao comportamento desejado

A modelagem é aprender fazendo com feedback corretivo. Um exemplo natural de modelagem pode ser visto em um aluno tentando arremessar uma bola de basquete de um ponto na quadra. O primeiro arremesso não alcança a cesta. O aluno arremessa com mais força na segunda vez, e a bola bate na tabela. O aluno não arremessa tão forte na terceira vez, e a bola bate no aro direito e ricocheteia. Na quarta tentativa, o aluno arremessa com a mesma força da terceira tentativa, mas mira para a esquerda. A bola bate no aro esquerdo e ricocheteia. Finalmente, o aluno arremessa com a mesma força, mas mira ligeiramente para a direita, e a bola entra na cesta. Gradualmente, o arremesso foi aprimorado para uma forma precisa.

A modelagem pode ser aplicada sistematicamente com um aluno hiperativo que consegue trabalhar em uma tarefa por apenas alguns minutos antes de se distrair. O objetivo é modelar o comportamento do aluno para que ela consiga trabalhar ininterruptamente por 30 minutos. Inicialmente, o professor fornece um reforçador quando o aluno trabalha produtivamente por 2 minutos. Após vários intervalos bem-sucedidos de 2 minutos, o critério para reforço é elevado para 3 minutos. Assumindo que ela trabalhe ininterruptamente por vários períodos de 3 minutos, o critério é elevado para 4 minutos. Este processo continua até o objetivo de 30 minutos, desde que o aluno execute de forma confiável no nível de critério. Se o aluno encontrar dificuldade em algum ponto, o critério para reforço diminui para um nível em que ela possa executar com sucesso.

Uma habilidade acadêmica que pode ser modelada é ensinar a um aluno as tabuadas de multiplicação por 6. Atualmente, ele só sabe e Para ganhar reforço, ele deve recitar corretamente estes dois mais Depois que ele puder fazer isso de forma confiável, o critério para reforço é elevado para incluir Este processo continua até que ele recite com precisão todos os fatos até

Encadeamento

A maioria das ações humanas é complexa e inclui várias contingências de três termos (A–B–C) ligadas sucessivamente. Por exemplo, arremessar uma bola de basquete requer driblar, virar, posicionar-se, pular e soltar a bola. Cada resposta altera o ambiente, e essa condição alterada serve como estímulo para a próxima resposta. O encadeamento é o processo de produzir ou alterar algumas das variáveis que servem como estímulos para respostas futuras (Skinner, 1953). Uma cadeia consiste em uma série de operantes, cada um dos quais estabelece a ocasião para outras respostas.

As cadeias são semelhantes aos atos de Guthrie, enquanto as contingências individuais de três termos se assemelham a movimentos. Algumas cadeias adquirem uma unidade funcional; a cadeia é uma sequência integrada de tal forma que a implementação bem-sucedida define uma habilidade. Quando as habilidades são bem aprimoradas, a execução da cadeia ocorre automaticamente. Andar de bicicleta consiste em vários atos discretos, mas um ciclista experiente os executa com pouco ou nenhum esforço consciente. Essa automaticidade está frequentemente presente em habilidades cognitivas (por exemplo, ler, resolver problemas matemáticos). O encadeamento desempenha um papel crítico na aquisição de habilidades (Gollub, 1977; Skinner, 1978).

Modificação do Comportamento

A modificação do comportamento (ou terapia comportamental) refere-se à aplicação sistemática de princípios de aprendizagem comportamental para facilitar comportamentos adaptativos (Ullmann & Krasner, 1965). A modificação do comportamento tem sido empregada com adultos e crianças em contextos tão diversos como salas de aula, ambientes de aconselhamento, prisões e hospitais psiquiátricos. Tem sido usada para tratar fobias, linguagem disfuncional, comportamentos disruptivos, interações sociais negativas, criação inadequada de filhos e baixo autocontrole (Ayllon & Azrin, 1968; Becker, 1971; Keller & Ribes-Inesta, 1974; Ulrich, Stachnik, & Mabry, 1966). Lovaas (1977) empregou com sucesso a modificação do comportamento para ensinar linguagem a crianças autistas.

Modificação do Comportamento

A modificação do comportamento para alunos disruptivos é difícil porque tais alunos podem exibir poucas respostas apropriadas para serem positivamente reforçadas. Um professor pode usar o modelamento para abordar um comportamento incômodo específico. Kathy Stone está tendo problemas com Erik, que continuamente empurra e esbarra em outros alunos quando a classe se alinha para ir a algum lugar no prédio. Quando a classe está indo apenas uma curta distância, a Sra. Stone poderia informar a Erik que, se ele permanecer na fila sem empurrar e esbarrar, ele será o líder da fila no caminho de volta para a classe; no entanto, se ele empurrar ou esbarrar, ele será imediatamente removido da fila. Este procedimento pode ser repetido até que Erik possa lidar com curtas distâncias. A Sra. Stone pode então permitir que ele caminhe com a classe por distâncias progressivamente maiores até que ele possa se comportar na fila para qualquer distância.

Sarah, outra criança na classe de Kathy Stone, frequentemente entrega trabalhos desorganizados. A Sra. Stone pode usar reforçadores generalizados, como adesivos especiais (trocáveis por vários privilégios) para ajudar Sarah, cujo trabalho normalmente é sujo, rasgado e mal legível. Sarah é informada de que, se ela entregar um papel limpo, ela pode ganhar um adesivo; se não estiver rasgado, outro adesivo; e se a escrita for organizada, um terceiro adesivo. Uma vez que Sarah começa a fazer melhorias, a Sra. Stone pode gradualmente mover as recompensas para outras áreas de melhoria (por exemplo, trabalho correto, terminar o trabalho no prazo).

Técnicas

As técnicas básicas de modificação do comportamento incluem o reforço de comportamentos desejados e a extinção de comportamentos indesejados. A punição é raramente empregada, mas, quando usada, envolve mais frequentemente a remoção de um reforçador positivo do que a apresentação de um reforçador negativo.

Ao decidir sobre um programa de mudança, os modificadores de comportamento normalmente se concentram nas seguintes três questões (Ullmann & Krasner, 1965):

  • Quais dos comportamentos do indivíduo são desadaptativos e quais devem ser aumentados (diminuídos)?
  • Quais contingências ambientais atualmente sustentam os comportamentos do indivíduo (seja para manter comportamentos indesejáveis ou para reduzir a probabilidade de realizar respostas mais adaptativas)?
  • Quais características ambientais podem ser alteradas para mudar o comportamento do indivíduo?

A mudança é mais provável quando os modificadores e os clientes concordam que uma mudança é necessária e decidem em conjunto sobre os objetivos desejados. O primeiro passo para estabelecer um programa é definir o problema em termos comportamentais. Por exemplo, a afirmação: “Keith está fora de seu lugar com muita frequência” refere-se a um comportamento manifesto que pode ser medido: pode-se manter um registro da quantidade de tempo que Keith está fora de seu lugar. Expressões gerais que se referem a não observáveis (“Keith tem uma atitude ruim”) não permitem uma definição objetiva do problema.

O próximo passo é determinar os reforçadores que mantêm o comportamento indesejável. Talvez Keith esteja recebendo atenção do professor apenas quando ele sai de seu lugar e não quando está sentado. Um plano simples é fazer com que o professor preste atenção a Keith enquanto ele está sentado e envolvido em trabalho acadêmico e ignorá-lo quando ele sai de seu lugar. Se a quantidade de vezes que Keith sai de seu lugar diminuir, a atenção do professor é um reforçador positivo.

Um programa de modificação do comportamento pode empregar reforçadores generalizados, como pontos que os alunos trocam por reforçadores de apoio, como recompensas tangíveis, tempo livre ou privilégios. Ter mais de um apoio garante que pelo menos um será eficaz para cada aluno em todos os momentos. Um critério comportamental deve ser estabelecido para ganhar reforço. O procedimento de modelamento de cinco etapas (discutido anteriormente) pode ser empregado. O critério é inicialmente definido no nível do comportamento inicial e progride em pequenos incrementos em direção ao comportamento desejado. Um ponto é dado ao aluno cada vez que o critério é satisfeito. Para extinguir qualquer comportamento indesejável de Keith, o professor não deve dar-lhe muita atenção se ele sair de seu lugar, mas sim informá-lo em particular que, como ele não satisfaz o critério, ele não ganha um ponto.

A punição é usada infrequentemente, mas pode ser necessária quando o comportamento se torna tão perturbador que não pode ser ignorado (por exemplo, brigar). Uma punição comum é o tempo limite (do reforço). Durante o tempo limite, o aluno é removido do contexto social da classe. Lá, o aluno continua a se envolver em trabalho acadêmico sem interação social com os colegas ou a oportunidade de ganhar reforço. Outra punição é remover reforçadores positivos (por exemplo, tempo livre, recreio, privilégios) por mau comportamento.

Os críticos argumentaram que a modificação do comportamento molda comportamentos quietos e dóceis (Winett & Winkler, 1972). Embora uma quantidade razoável de silêncio seja necessária para garantir que a aprendizagem ocorra, alguns professores buscam uma sala de aula silenciosa em todos os momentos, mesmo quando algum ruído de interações sociais facilitaria a aprendizagem. O uso da modificação do comportamento não é inerentemente bom nem ruim. Pode produzir uma sala de aula silenciosa ou promover iniciações sociais por crianças retraídas (Strain, Kerr, & Ragland, 1981). Como as próprias técnicas, os objetivos da modificação do comportamento precisam ser cuidadosamente pensados por aqueles que implementam os procedimentos.

Modificação Cognitivo-Comportamental

Pesquisadores também incorporaram elementos cognitivos aos procedimentos de modificação do comportamento. Na modificação cognitivo-comportamental, os pensamentos dos alunos (quando verbalizados) funcionam como estímulos discriminativos e reforçadores. Assim, os alunos podem instruir-se verbalmente sobre o que fazer e, em seguida, realizar o comportamento apropriado. As técnicas de modificação cognitivo-comportamental são frequentemente aplicadas com alunos com deficiências (Hallahan, Kneedler, & Lloyd, 1983) e usadas para reduzir a hiperatividade e a agressão (Robinson, Smith, Miller, & Brownell, 1999). O treinamento auto instrucional de Meichenbaum (1977) é um exemplo de modificação cognitivo-comportamental.

Autorregulação

O condicionamento operante também aborda a autorregulação (Mace, Belfiore, & Hutchinson, 2001; Mace, Belfiore, & Shea, 1989). Essa perspectiva é abordada em profundidade no Capítulo 9. A teoria operante sustenta que o comportamento autorregulado envolve a escolha entre cursos de ação alternativos (Brigham, 1982), tipicamente adiando um reforçador imediato em favor de um reforçador futuro diferente e, geralmente, maior. Por exemplo, Trisha fica em casa na sexta-feira à noite para estudar para um exame em vez de sair com amigos, e Kyle continua trabalhando em uma tarefa acadêmica apesar dos colegas zombeteiros por perto. Eles estão adiando o reforço imediato para o reforço futuro antecipado, como John no próximo exemplo.

John está tendo dificuldades para estudar. Apesar das boas intenções, ele passa pouco tempo estudando e se distrai facilmente. Uma chave para mudar seu comportamento é estabelecer estímulos discriminativos (pistas) para estudar. Com a ajuda de seu conselheiro do ensino médio, John estabelece um horário e local definidos para estudar (das 19h às 21h em seu quarto com um intervalo de 10 minutos). Para eliminar pistas que distraiam, John concorda em não usar seu telefone celular, CD player, computador ou TV durante este período. Para reforço, John se dará um ponto para cada noite em que realizar com sucesso sua rotina. Quando receber 10 pontos, ele pode tirar uma folga.

De uma perspectiva de condicionamento operante, decide-se quais comportamentos regular, estabelece-se estímulos discriminativos para sua ocorrência, avalia-se o desempenho em termos de correspondência com o padrão e administra-se o reforço. Conforme discutido, os três subprocessos principais são o automonitoramento (atenção deliberada a aspectos selecionados do comportamento de alguém), autoinstrução ( s que estabelecem a ocasião para R_{s} auto-regulatório levando a , e auto-reforço (reforçar a si mesmo por executar uma resposta correta).