Acondicionamento instrumental

Outro prazo para o condicionamento operativo

O condicionamento instrumental é outro termo para o condicionamento operativo , un proceso de aprendizaxe descrito por primeira vez por BF Skinner . No condicionamento instrumental, reforzo ou castigo úsanse para aumentar ou diminuír a probabilidade de que un comportamento se produza de novo no futuro.

Exemplos de condicionamento instrumental

Por exemplo, se un alumno é recompensado con eloxios cada vez que leva a man na aula, ten máis probabilidades de subirlle a man no futuro.

Se ela tamén é regañada cando fala fóra da súa volta, tórnase menos probable que interrompa a clase. Nestes exemplos, o profesor usa un reforzo para fortalecer o comportamento e o castigo de manexo para debilitar o comportamento de conversación.

O condicionamento instrumental adoita empregarse tamén no adestramento animal. Por exemplo, a formación dun can para darlle a man implica ofrecer unha recompensa cada vez que se produce o comportamento desexado.

Unha breve historia do condicionamento instrumental

O psicólogo EL Thorndike foi un dos primeiros en observar o impacto do reforzo nos experimentos con puzzles con gatos. Durante estes experimentos, Thorndike observou un proceso de aprendizaxe que el denominou aprendizaxe "trial-and-error".

Os experimentos consistían en poñer a un gato famento nunha caixa de rompecabezas e para liberarse, o gato debía descubrir como escapar. Thorndike entón observou o tempo que levaron os gatos a liberarse en cada xuízo experimental.

Inicialmente, os gatos implicados en métodos de escape ineficaces, rascar e cavar nos lados ou na parte superior da caixa. Finalmente, o xuízo e o erro levaría aos gatos a empuxar ou tirar con éxito a ruta de escape. Despois de cada xuízo sucesivo, os gatos comprometían cada vez menos os comportamentos de escape ineficaces e responderon con maior rapidez coas accións de escape correctas.

Thorndike referiuse ás súas observacións como a Lei de Efecto . A forza dunha resposta aumenta cando inmediatamente segue un "satisfeito" (reforzo). Doutra banda, as accións que son seguidas por efectos desagradables teñen máis probabilidades de debilitarse.

Nos experimentos de puzzles de Thorndike, escapar da caixa era o máis satisfactorio. Cada vez que os gatos escaparon con éxito á caixa, o comportamento que inmediatamente precedeu á fuga foi reforzado e reforzado.

O traballo de Thorndike tivo un tremendo efecto nas investigacións posteriores de BF Skinner sobre o condicionamento operativo . Skinner ata creou a súa propia versión dos caixóns rompecabezas de Thorndike aos que se refería como cámara operante, tamén coñecida como unha caixa Skinner .

Como funciona o condicionamento instrumental

Skinner identificou dous tipos principais de comportamentos. O primeiro tipo é comportamentos entrevistados. Estas son simplemente accións que se producen reflexivamente sen ningunha aprendizaxe. Se tocas algo quente, inmediatamente volverás a responder a túa man. O condicionamento clásico céntrase nestes comportamentos entrevistados. Nos experimentos clásicos de Pavlov cos cans , o salivado á presentación dos alimentos foi o comportamento dos entrevistados. Ao formarse unha asociación entre o son dunha campá e a presentación de comida, con todo, Pavlov conseguiu adestrar cans para salivar de xeito real ao soar da campá.

Skinner comprendeu que, aínda que o condicionamento clásico podería explicar como os comportamentos con respostas poden levar á aprendizaxe, non podería explicar todo tipo de aprendizaxe. En lugar diso, el suxeriu que foron as consecuencias das accións voluntarias que conducen á maior cantidade de aprendizaxe.

O segundo tipo de comportamentos é o que Skinner denominou como comportamentos operantes. El definiu estes como calquera e calquera comportamento voluntario que actúa sobre o medio ambiente para crear unha resposta. Estes son os comportamentos voluntarios que están baixo o noso control consciente. Estas son tamén accións que se poden aprender. As consecuencias das nosas accións desempeñan un papel importante no proceso de aprendizaxe.

Reforzo e castigo

Skinner identificou dous aspectos clave do proceso de condicionamento operativo. O reforzo serve para aumentar o comportamento mentres que o castigo serve para diminuír o comportamento.

Hai tamén dous tipos diferentes de reforzo e dous tipos diferentes de castigos. O reforzo positivo implica presentar un resultado favorable, como darlle a un neno un trato despois de que limpa o seu cuarto. O refuerzo negativo implica a eliminación dun estímulo desagradable, como dicir a un neno que, se come todas as patacas, non terá que comer o brócoli. Unha vez que o neno considera o brócoli unha consecuencia desagradable e comer as patacas leva á eliminación desta consecuencia indesexable, comer as patacas é entón reforzada negativamente.

O castigo positivo significa aplicar un evento desagradable despois dun comportamento. Nalgadas, por exemplo, é un exemplo común de castigo positivo. Este tipo de castigo é frecuentemente referido como castigo por aplicación. A consecuencia negativa aplícase directamente para reducir o comportamento non desexado.

O castigo negativo implica sacar algo agradable despois de que ocorra un comportamento. Por exemplo, se un fillo non consegue limpar o cuarto, os seus pais poderían dicirlle que non pode ir ao centro comercial cos seus amigos. Ao eliminar a actividade desexable actúa como un punisher negativo sobre o comportamento anterior.