¿Que é unha programación de reforzo?

¿Que impacto teñen os programas de reforzo sobre a aprendizaxe?

O condicionamento operativo é un proceso de aprendizaxe no que se adquiren e modifican novos comportamentos a través da súa asociación con consecuencias. Reforzar un comportamento aumenta a probabilidade de que ocorra de novo no futuro, mentres que castigar un comportamento diminúe a probabilidade de que se repita. No condicionamento operativo , os horarios de reforzo son un compoñente importante do proceso de aprendizaxe.

Cando e con que frecuencia reforzamos un comportamento, podemos ter un impacto dramático sobre a forza e a taxa da resposta.

¿Que é unha programación de reforzo?

Entón, cal é o calendario de reforzo e como funciona o proceso de acondicionamento? Un calendario de reforzo é basicamente unha regra onde se indican as instancias de comportamento que se reforzarán. Nalgúns casos, un comportamento pode ser reforzado cada vez que ocorre.

Ás veces, un comportamento pode non ser reforzado en absoluto.

Poderá utilizarse reforzo positivo ou reforzo negativo , dependendo da situación. En ambos os casos, o obxectivo do reforzo é sempre reforzar o comportamento e aumentar a probabilidade de que se produza de novo no futuro.

Pode obter unha mellor idea de como operan os horarios de reforzo pensando na aprendizaxe tanto nas situacións de aprendizaxe natural como nas situacións de formación máis estruturadas.

En contextos do mundo real, os comportamentos probablemente non se van a reforzar cada vez que se producen. Para situacións nas que intenta formar e reforzar unha acción, como na aula, en deportes ou en adestramento animal, pode optar por seguir un calendario de reforzo específico.

Como verás a continuación, algúns horarios son máis axeitados para determinados tipos de situacións de adestramento. Nalgúns casos, o adestramento pode requirir comezar cunha programación e pasar a outra unha vez que se ensina o comportamento desexado. Certos horarios de reforzo poden ser máis efectivos en situacións específicas.

Existen dous tipos de horarios de reforzo:

Horarios de reforzo continuo

No reforzo continuo, o comportamento desexado reforza cada vez que se produce. Este horario úsase mellor durante as etapas iniciais de aprendizaxe para crear unha forte asociación entre o comportamento ea resposta.

Por exemplo, imaxina que estás a ensinarlle a un can a sacudir a túa man. Durante as etapas iniciais de aprendizaxe, probablemente adhírese a un horario de reforzo continuo para ensinar e establecer o comportamento. Pode comezar pegando a pata do animal, realizando o movemento axitando, dicindo "Shake", e despois ofrecendo unha recompensa cada vez que realiza esta secuencia de pasos. Finalmente, o can comeza a realizar a acción por si mesmo e pode optar por seguir reforzando cada resposta correcta ata que o comportamento estea ben establecido.

Unha vez que a resposta se está firmemente adherida, o reforzo normalmente se cambia a un calendario parcial de reforzo.

Horarios de reforzo parcial

En reforzo parcial ou intermitente, a resposta refórzase só unha parte do tempo . Os comportamentos aprendidos adquiren máis lentamente con reforzo parcial, pero a resposta é máis resistente á extinción .

Por exemplo, pense no noso exemplo anterior onde estaba entrenando un can para sacudir. Aínda que inicialmente usou un horario continuo, reforzar cada instancia do comportamento pode non ser sempre realista. Finalmente, pode optar por cambiar a un calendario parcial onde proporciona reforzo despois de tantas respostas ou despois de transcorrer tanto tempo.

Hai catro horarios de reforzo parcial:

Os horarios da razón fixa son aqueles nos que a resposta só se reforza despois dun número específico de respostas. Este calendario produce unha elevada e constante velocidade de resposta con só unha breve pausa despois da entrega do reforzo. Un exemplo dun programa de relación fixo sería entregar un pellet de comida a unha rata despois de que preme unha barra cinco veces.

Os horarios das proporcións variables ocorren cando se reforza unha resposta tras un número imprevisible de respostas. Este calendario crea un alto ritmo constante de resposta. Os xogos de azar e lotería son bos exemplos dunha recompensa baseada nun horario de relación variable. Nunha configuración de laboratorio, isto pode implicar a entrega de pellets de alimentos a unha rata despois dunha barra de prensa, outra vez despois de catro presións de barra, e un terceiro pellet despois de dúas prensas de barra.

Os horarios de intervalo fixo son aqueles en que a primeira resposta é recompensada só despois de transcorrido un determinado período de tempo. Este calendario provoca altas cantidades de resposta ao final do intervalo, pero moito máis lentamente responde inmediatamente despois da entrega do reforzo. Un exemplo diso nunha configuración de laboratorio reforzaría unha rata cun pastel de laboratorio para a primeira barra de prensa despois de transcorrer un intervalo de 30 segundos.

Os horarios de intervalo variable ocorren cando unha recompensa é recompensada despois de transcorrer un tempo imprevisible. Este programa produce unha velocidade de resposta lenta e constante. Un exemplo diso sería entregar un pellet de comida a unha rata despois da primeira barra de prensa despois dun intervalo dun minuto, outro pellet para a primeira resposta despois dun intervalo de cinco minutos e un terceiro pellet de alimentos para a primeira resposta despois dun intervalo de tres minutos.

Como escolle unha programación de reforzo?

Decidir cando reforzar un comportamento pode depender dunha serie de factores. Nos casos nos que se trata específicamente de ensinar un comportamento novo, un horario continuo adoita ser unha boa opción.

Unha vez que se aprendeu o comportamento, o cambio a un calendario parcial adoita ser preferible.

Na vida diaria, os horarios parciais de reforzo danse moito máis que os continuos. Por exemplo, imaxine se recibiu algún tipo de recompensa cada vez que se presentou para traballar a tempo. En vez diso, tales recompensas son normalmente distribuídas nun calendario de reforzo parcial moito menos previsible. Non só estes horarios son moito máis realistas e máis fáciles de implementar, e tamén tenden a producir taxas de resposta máis altas e son menos susceptibles de extinción.

Realista, reforzar un comportamento cada vez que ocorre pode ser difícil e require unha gran atención e recursos. Os horarios parciais non só tenden a levar a comportamentos máis resistentes á extinción, tamén reducen o risco de que o suxeito se sacie. Se o reforzo que se está a utilizar xa non é desexado ou gratificante, o suxeito pode deixar de realizar o comportamento desexado.

Por exemplo, imaxine que estás a ensinarlle a un can a sentarse. Se está a usar comida como recompensa, o can pode deixar de realizar a acción unha vez que estea cheo. En tales casos, algo como o eloxio ou a atención pode ser un reforzo máis efectivo.

Unha palabra de

O condicionamento operativo pode ser unha poderosa ferramenta de aprendizaxe. O calendario de reforzo utilizado durante o proceso de adestramento e mantemento pode ter unha influencia importante na rapidez con que se adquire un comportamento, a forza da resposta e a frecuencia coa que se mostra o comportamento. Para determinar que horario é preferible, é importante considerar diferentes aspectos da situación, incluíndo o tipo de comportamento que se está a ensinar e o tipo de resposta que se require.

> Fontes:

> Cooper, J, Heron, T, & Heward, W. Análise de Comportamento Aplicado . Nova Jersey: Pearson Education; 2007.

> Nevid, JS. Esenciales da Psicoloxía: conceptos e aplicacións. Boston, MA: Cengage Learning; 2016.