¿Que é o condicionamento operativo e como funciona?

Como o reforzo e o castigo modifican o comportamento

O condicionamento operativo (ás veces referido como condicionamento instrumental ) é un método de aprendizaxe que se produce a través de recompensas e castigos por comportamento. A través do condicionamento operativo, faise unha asociación entre un comportamento e unha consecuencia para ese comportamento.

Por exemplo, cando unha rata de laboratorio presiona un botón azul, recibe un pellet de comida como recompensa, pero cando presiona o botón vermello recibe unha descarga eléctrica leve.

Como resultado, aprende a presionar o botón azul pero evita o botón vermello.

Pero o condicionamento operativo non é só algo que ten lugar en escenarios experimentais mentres se adestran os animais do laboratorio; tamén desempeña un papel poderoso na aprendizaxe cotiá. O reforzo e o castigo ocorren case todos os días en ambientes naturais, así como en contextos máis estruturados como a clase ou as sesións de terapia.

Observemos de preto o xeito no que se descubriu o condicionamento operativo, o impacto que tiña sobre a psicoloxía e como se usa para cambiar as condutas antigas e ensinar novas.

A historia do condicionamento operante

O condicionamento operativo foi acuñado polo condutor BF Skinner , razón pola cal ocasionalmente pode escoitala referida como condicionamento Skinnerian. Como condutora, Skinner creu que non era realmente necesario ollar os pensamentos internos e as motivacións para explicar o comportamento. No seu canto, el suxeriu, debemos mirar só as causas externas e observables do comportamento humano.

A través da primeira parte do século XX, o behaviorismo converteuse nunha forza importante dentro da psicoloxía. As ideas de John B. Watson dominaron esta escola de pensamento no inicio. Watson centrábase nos principios do condicionamiento clásico , unha vez que suxire que supoña que podería tomar calquera persoa independentemente do seu antecedente e adestralas para que sexan calquera cousa que escolleu.

Cando os primeiros comportamentos centraron os seus intereses na aprendizaxe asociativa, Skinner estaba máis interesado en como as consecuencias das accións das persoas influenciaron o seu comportamento.

Skinner usou o termo operante para referirse a calquera "comportamento activo que opera sobre o medio ambiente para xerar consecuencias". Noutras palabras, a teoría de Skinner explicou como adquiríamos a variedade de comportamentos aprendidos que exhibimos todos os días.

A súa teoría estaba fuertemente influenciada polo traballo do psicólogo Edward Thorndike , quen propuxera o que chamou a lei de efecto . Segundo este principio, as accións que seguen os resultados desexables son máis propensos a repetirse, mentres que os seguidos por resultados non desexados son menos propensos a repetirse.

O condicionamento operativo baséase nunha premisa moi sinxela: as accións seguidas polo reforzo serán reforzadas e terán máis probabilidades de ocorrer de novo no futuro. Se contas unha historia divertida na clase e todo o mundo ría, probablemente terás máis probabilidades de contar esa historia no futuro. Se levantas a man para facer unha pregunta e o teu profesor eloxia o teu comportamento cortés, terás máis probabilidades de levantar a man a próxima vez que teñas unha pregunta ou comentario.

Debido a que o comportamento foi seguido dun reforzo ou un resultado desexable, as accións anteriores son reforzadas.

Por outra banda, as accións que resultan nun castigo ou consecuencias indesexables serán debilitadas e menos propensas a ocorrer de novo no futuro. Se contas outra vez a mesma historia noutra clase pero ninguén ría esta vez, terás menos probabilidades de repetir a historia no futuro. Se gritas unha resposta na aula e o teu profesor te regala, entón é posible que teña menos posibilidades de interromper a clase.

Tipos de comportamentos

Skinner distinguiu entre dous tipos diferentes de comportamentos

Aínda que o condicionamento clásico podería explicar os comportamentos entrevistados, Skinner decatouse de que non podía explicar unha gran aprendizaxe. En cambio, Skinner suxeriu que o condicionamento operante tiña unha importancia moito maior.

Skinner inventou distintos dispositivos durante a súa infancia e puxo estas habilidades para traballar durante os seus estudos sobre o condicionamento operativo.

El creou un dispositivo coñecido como unha cámara operante de acondicionamento, máis frecuentemente referida hoxe como unha caixa Skinner . A cámara era esencialmente unha caixa que podía soster un pequeno animal como unha rata ou unha pomba. A caixa tamén contiña unha barra ou tecla que o animal podería presionar para recibir unha recompensa.

Para seguir as respostas, Skinner tamén desenvolveu un dispositivo coñecido como un gravador acumulativo. O dispositivo gravou as respostas como un movemento ascendente dunha liña para que se puidesen ler as taxas de resposta mirando a inclinación da liña.

Compoñentes de condicionamento operativo

Hai varios conceptos clave no condicionamento operativo.

Reforzo en condicionamento operativo

O reforzo é calquera evento que fortalece ou aumenta o comportamento que segue. Existen dous tipos de reforzadores:

  1. Os reforzadores positivos son eventos favorables ou resultados que se presentan despois do comportamento. En situacións que reflicten o reforzo positivo, unha resposta ou comportamento refórzase coa adición de algo, como eloxios ou unha recompensa directa. Por exemplo, se fai un bo traballo no traballo e o seu administrador dálle unha bonificación.
  2. Os reforzadores negativos implican a eliminación dun evento ou resultado desfavorable despois da exhibición dun comportamento. Nestas situacións, a resposta é reforzada pola eliminación de algo que se considera desagradable. Por exemplo, se o seu fillo comeza a gritar no medio da supermercado, pero para unha vez que lle entregou un deleite, terá máis probabilidades de entregarlle unha delicia a próxima vez que comece a gritar. A súa acción levou á eliminación da condición desagradable (o neno gritando), reforzando negativamente o seu comportamento.

En ambos casos de reforzo, o comportamento aumenta.

Castigo en condicionamento operativo

O castigo é a presentación dun evento ou resultado adverso que provoca unha diminución do comportamento que segue. Existen dous tipos de castigos:

  1. O castigo positivo , ás veces referido como castigo por aplicación, presenta un evento ou resultado desfavorable para debilitar a resposta que segue. Nalgúns casos de mal comportamento é un exemplo de castigo por aplicación.
  2. O castigo negativo , tamén coñecido como castigo por eliminación, prodúcese cando un evento favorable ou o resultado elimínase despois de que ocorra un comportamento. Quitar o videojuego dun neno despois do mal comportamento é un exemplo de castigo negativo.

En ambos casos de castigo, o comportamento diminúe.

Horarios de reforzo

O reforzo non é necesariamente un proceso sinxelo e hai unha serie de factores que poden influír na rapidez e na aprendizaxe das cousas novas. Skinner descubriu que cando e con que frecuencia os comportamentos foron reforzados xogaron un papel na velocidade e na forza da adquisición. Dito doutro xeito, o tempo e a frecuencia do reforzo influenciaron como se aprenderon os comportamentos novos e se modificaron os vellos comportamentos.

Skinner identificou varios horarios de reforzo que afectan o proceso de condicionamento operativo:

  1. O reforzo continuo implica a entrega un reforzo cada vez que se produce unha resposta. A aprendizaxe tende a ocorrer relativamente rápido, pero a taxa de resposta é bastante baixa. A extinción tamén ocorre rapidamente unha vez que se detén o reforzo.
  2. Os horarios da razón fixa son un tipo de reforzo parcial. As respostas só se reforzan despois de que se produciu un número específico de respostas. Isto normalmente leva a unha taxa de resposta bastante estable.
  3. Os horarios de intervalo fixo son outra forma de reforzo parcial. O reforzo ocorre só despois dun determinado intervalo de tempo. As taxas de resposta mantéñense relativamente constantes e comezan a aumentar a medida que se achega o tempo de reforzo, pero é lento inmediatamente despois do reforzo.
  4. Os programas de proporcións variables tamén son un tipo de reforzo parcial que implica o comportamento de reforzo despois dun número variado de respostas. Isto leva tanto a unha alta taxa de resposta como a lentitude nas taxas de extinción.
  5. Os horarios dos intervalos variables son a forma final de refuerzo parcial descrito por Skinner. Este horario implica a entrega de reforzo despois de transcorridos un período de tempo variable. Isto tamén adoita levar a unha taxa de resposta rápida e unha taxa de extinción lenta.

Exemplos de condicionamento operativo

Podemos atopar exemplos de condicionamento operativo no traballo en torno a nós. Considere o caso de que os nenos cumpran os deberes para obter unha recompensa por parte dun pai ou profesor, ou os empregados que terminen proxectos para recibir eloxios ou promocións.

Algúns exemplos máis de condicionamento operativo en acción:

Nalgúns destes exemplos, a promesa ou a posibilidade de recompensas provoca un aumento no comportamento, pero o condicionamento operativo tamén se pode usar para diminuír un comportamento. A eliminación dun resultado desexable ou unha aplicación de resultado negativo pode usarse para diminuír ou previr comportamentos indesexables. Por exemplo, pódese dicir a un neno que perderá privilexios de recreo se falan de quenda en clase. Este potencial de castigo pode provocar unha diminución dos comportamentos disruptivos.

Unha palabra de

Aínda que o comportamento pode perder a maior parte do dominio que mantivo durante a primeira parte do século XX, o condicionamento operativo segue sendo unha ferramenta importante e moitas veces utilizada no proceso de aprendizaxe e modificación do comportamento. Ás veces, as consecuencias naturais nos levan a cambios no noso comportamento. Noutros casos, as recompensas e os castigos poden ser conscientes de que se poida crear un cambio.

O condicionamento operativo é algo que pode recoñecer de inmediato na súa propia vida, xa sexa no seu achegamento ao ensinar aos seus fillos o bo comportamento ou na formación do can da familia para deixar de masticar as súas zapatillas favoritas. O importante que hai que recordar é que con calquera tipo de aprendizaxe, ás veces pode levar tempo. Considere o tipo de reforzo ou castigo que pode funcionar mellor para a súa situación única e avaliar que tipo de calendario de reforzo pode levar aos mellores resultados.

> Fontes:

> Coon, D & Mitterer, JO. Psicoloxía: unha viaxe. Belmont, CA: Wadsworth; 2014.

> Domjan, M. Os Principios de Aprendizaxe e Comportamento, Séptima Edición. Stamford, CT; Cengage Learning; 2015.