Was ist Operant Conditioning und wie funktioniert es?

by Kendra Kirsche; Bewertet von Steven Gans, MD

Wie Verstärkung und Bestrafung das Verhalten ändern

Operante Konditionierung (manchmal auch als instrumentale Konditionierung bezeichnet ) ist eine Methode des Lernens, die durch Belohnungen und Bestrafungen für das Verhalten geschieht. Durch operante Konditionierung wird ein Zusammenhang zwischen einem Verhalten und einer Konsequenz für dieses Verhalten hergestellt.

Zum Beispiel, wenn eine Laborratte einen blauen Knopf drückt, erhält er als Belohnung ein Futterpellet, aber wenn er den roten Knopf drückt, erhält er einen leichten elektrischen Schock.

Als Ergebnis lernt er, den blauen Knopf zu drücken, aber den roten Knopf zu vermeiden.

Aber operante Konditionierung ist nicht nur etwas, das in Versuchsaufbauten stattfindet, während man Labortiere trainiert; Es spielt auch eine starke Rolle im täglichen Lernen. Verstärkung und Bestrafung finden fast jeden Tag in natürlichen Umgebungen sowie in strukturierteren Umgebungen wie dem Unterricht oder Therapiesitzungen statt.

Schauen wir uns einmal genauer an, wie operante Konditionierung entdeckt wurde, welchen Einfluss sie auf die Psychologie hatte und wie sie verwendet wird, um alte Verhaltensweisen zu ändern und neue zu lehren.

Die Geschichte der Operantenkonditionierung

Operant Conditioning wurde vom Behavioristen BF Skinner geprägt , weshalb man gelegentlich auch von Skinner-Konditionierung spricht. Als Behaviorist glaubte Skinner, dass es nicht wirklich notwendig sei, interne Gedanken und Motivationen zu betrachten, um das Verhalten zu erklären. Statt dessen sollten wir nur die äußeren, beobachtbaren Ursachen menschlichen Verhaltens betrachten.

Während der ersten Hälfte des 20. Jahrhunderts war der Behaviorismus zu einer wichtigen Kraft in der Psychologie geworden. Die Ideen von John B. Watson beherrschten diese Denkrichtung schon früh. Watson konzentrierte sich auf die Prinzipien der klassischen Konditionierung . Früher schlug er vor, dass er jede Person unabhängig von ihrem Hintergrund nehmen und sie zu etwas ausbilden könnte, das er wählte.

Wo die frühen Behavioristen ihre Interessen auf assoziatives Lernen konzentriert hatten, interessierte Skinner mehr daran, wie die Konsequenzen der Handlungen der Menschen ihr Verhalten beeinflussten.

Skinner verwendete den Begriff operant, um sich auf jedes "aktive Verhalten zu beziehen, das auf die Umwelt wirkt, um Konsequenzen zu erzeugen". Mit anderen Worten, Skinners Theorie erklärte, wie wir die Palette gelernter Verhaltensweisen, die wir jeden Tag zeigen, erwerben.

Seine Theorie wurde stark von der Arbeit des Psychologen Edward Thorndike beeinflusst , der das vorgeschlagen hatte, was er das Gesetz des Effekts nannte . Nach diesem Prinzip werden die Maßnahmen, denen erwünschte Ergebnisse folgen, häufiger wiederholt, während die mit unerwünschten Ergebnissen einhergehenden Maßnahmen seltener wiederholt werden.

Die Konditionierung von Operanten beruht auf einer ziemlich einfachen Prämisse - Aktionen, die von einer Verstärkung gefolgt werden, werden verstärkt und werden in Zukunft wahrscheinlich wieder auftreten. Wenn du im Unterricht eine lustige Geschichte erzählst und alle lachen, wirst du diese Geschichte wahrscheinlich in Zukunft noch öfter erzählen. Wenn Sie Ihre Hand heben, um eine Frage zu stellen, und Ihr Lehrer Ihr höfliches Verhalten lobt, werden Sie eher die Hand heben, wenn Sie das nächste Mal eine Frage oder einen Kommentar haben.

Weil dem Verhalten eine Verstärkung oder ein wünschenswertes Ergebnis folgte, werden die vorhergehenden Aktionen verstärkt.

Umgekehrt werden Handlungen, die zu Bestrafungen oder unerwünschten Folgen führen, abgeschwächt und werden in Zukunft seltener auftreten. Wenn Sie in einer anderen Klasse die gleiche Geschichte noch einmal erzählen, aber diesmal niemand lacht, werden Sie die Geschichte wahrscheinlich in Zukunft nicht mehr wiederholen. Wenn Sie im Unterricht eine Antwort rufen und Ihr Lehrer Sie schimpft, ist es weniger wahrscheinlich, dass Sie den Unterricht wieder unterbrechen.

Arten von Verhaltensweisen

Skinner unterscheidet zwischen zwei verschiedenen Arten von Verhaltensweisen

Befragungsverhalten sind solche, die automatisch und reflexartig auftreten, z. B. wenn Sie Ihre Hand von einem heißen Herd zurückziehen oder Ihr Bein zucken, wenn der Arzt auf Ihr Knie klopft. Sie müssen diese Verhaltensweisen nicht lernen, sie treten einfach automatisch und unfreiwillig auf.
Operative Verhaltensweisen hingegen sind jene unter unserer bewussten Kontrolle. Einige können spontan und andere absichtlich auftreten, aber es sind die Konsequenzen dieser Handlungen, die dann beeinflussen, ob sie in Zukunft wieder auftreten oder nicht. Unsere Maßnahmen für die Umwelt und die Folgen dieser Maßnahmen sind ein wichtiger Teil des Lernprozesses .

Während die klassische Konditionierung das Verhalten der Befragten erklären konnte, erkannte Skinner, dass es nicht viel lernen konnte. Stattdessen schlug Skinner vor, dass operante Konditionierung eine viel größere Bedeutung hatte.

Skinner erfand während seiner Kindheit verschiedene Geräte und brachte diese Fähigkeiten während seines Studiums der operanten Konditionierung zum Einsatz.

Er schuf eine Vorrichtung, die als operante Konditionierungskammer bekannt ist und heute oft als Skinner-Box bezeichnet wird . Die Kammer war im Wesentlichen eine Kiste, die ein kleines Tier wie eine Ratte oder eine Taube halten konnte. Die Box enthielt auch eine Leiste oder einen Schlüssel, auf den das Tier drücken konnte, um eine Belohnung zu erhalten.

Um Antworten zu verfolgen, entwickelte Skinner auch ein Gerät, das als kumulativer Recorder bekannt ist. Die Vorrichtung zeichnete die Antworten als eine Aufwärtsbewegung einer Linie auf, so dass die Ansprechraten durch Betrachten der Steigung der Linie abgelesen werden konnten.

Komponenten der Betriebssystemkonditionierung

Es gibt einige Schlüsselkonzepte in der operanten Konditionierung.

Verstärkung in der Operantenkonditionierung

Verstärkung ist jedes Ereignis, das das Verhalten, dem es folgt, verstärkt oder verstärkt. Es gibt zwei Arten von Verstärkern:

Positive Verstärker sind günstige Ereignisse oder Ergebnisse, die nach dem Verhalten präsentiert werden. In Situationen, die positive Verstärkung widerspiegeln, wird eine Reaktion oder ein Verhalten durch die Hinzufügung von etwas, wie Lob oder eine direkte Belohnung, verstärkt. Zum Beispiel, wenn Sie einen guten Job bei der Arbeit machen und Ihr Manager Ihnen einen Bonus gibt.
Negative Verstärker beinhalten die Beseitigung ungünstiger Ereignisse oder Ergebnisse nach der Anzeige eines Verhaltens. In diesen Situationen wird eine Reaktion verstärkt, indem etwas als unangenehm angesehen wird. Zum Beispiel, wenn Ihr Kind in der Mitte des Supermarktes zu schreien beginnt, aber stoppt, sobald Sie ihm eine Belohnung geben, werden Sie eher eine Belohnung geben, wenn er das nächste Mal anfängt zu schreien. Ihre Aktion führte zur Beseitigung des unangenehmen Zustands (das Kind schreit), was Ihr Verhalten negativ verstärkt.

In beiden Fällen der Verstärkung erhöht sich das Verhalten.

Bestrafung in Operant Konditionierung

Bestrafung ist die Darstellung eines unerwünschten Ereignisses oder Ergebnisses, das eine Verringerung des Verhaltens, dem es folgt, verursacht. Es gibt zwei Arten der Bestrafung:

Positive Bestrafung , die manchmal als Bestrafung durch Anwendung bezeichnet wird, stellt ein ungünstiges Ereignis oder Ergebnis dar, um die darauf folgende Reaktion zu schwächen. Spanking für Fehlverhalten ist ein Beispiel für Bestrafung durch Anwendung.
Negative Bestrafung , auch Bestrafung durch Entfernung genannt, tritt auf, wenn ein günstiges Ereignis oder Ergebnis nach Auftreten eines Verhaltens entfernt wird. Das Videospiel eines Kindes nach einem Fehlverhalten zu nehmen, ist ein Beispiel für eine negative Bestrafung.

In beiden Fällen der Bestrafung nimmt das Verhalten ab.

Verstärkungspläne

Verstärkung ist nicht notwendigerweise ein einfacher Prozess und es gibt eine Reihe von Faktoren, die beeinflussen können, wie schnell und wie gut neue Dinge gelernt werden. Skinner fand heraus, dass wann und wie oft Verhaltensweisen verstärkt wurden, eine Rolle bei der Geschwindigkeit und Stärke des Erwerbs spielten. Mit anderen Worten, der Zeitpunkt und die Häufigkeit der Verstärkung beeinflussten, wie neue Verhaltensweisen erlernt und wie alte Verhaltensweisen verändert wurden.

Skinner identifizierte verschiedene Zeitpläne der Verstärkung , die den operanten Konditionierungsprozess beeinflussen:

Die kontinuierliche Verstärkung beinhaltet die Lieferung einer Verstärkung jedes Mal, wenn eine Antwort auftritt. Das Lernen findet relativ schnell statt, die Antwortrate ist jedoch relativ gering. Die Löschung tritt auch sehr schnell auf, sobald die Verstärkung gestoppt ist.
Fixed-Ratio-Pläne sind eine Art Teilverstärkung. Antworten werden erst verstärkt, nachdem eine bestimmte Anzahl von Antworten stattgefunden hat. Dies führt typischerweise zu einer ziemlich konstanten Antwortrate.
Feste Intervallpläne sind eine andere Form der Teilverstärkung. Die Verstärkung erfolgt erst nach Ablauf eines bestimmten Zeitintervalls. Die Antwortquoten bleiben ziemlich konstant und beginnen zuzunehmen, wenn die Dauer der Verstärkung nahe ist, aber langsam, unmittelbar nachdem die Verstärkung geliefert wurde.
Variable-Ratio-Pläne sind auch eine Art von Teilverstärkung, die Verstärkungsverhalten nach einer variierten Anzahl von Antworten beinhalten. Dies führt sowohl zu einer hohen Ansprechrate als auch zu langsamen Extinktionsraten.
Variable Intervallpläne sind die letzte Form der Teilverstärkung Skinner beschrieben. Dieser Zeitplan umfasst die Bereitstellung der Verstärkung nach Ablauf einer variablen Zeit. Dies führt auch zu einer schnellen Ansprechrate und einer langsamen Extinktionsrate.

Beispiele für Operantenkonditionierung

Wir können Beispiele für operante Konditionierung bei uns finden. Betrachten Sie den Fall, dass Kinder Hausaufgaben machen, um eine Belohnung von einem Elternteil oder Lehrer zu erhalten, oder Mitarbeiter, die Projekte abschließen, um Lob oder Beförderungen zu erhalten.

Einige Beispiele operanter Konditionierung in Aktion:

Wenn Ihr Kind während eines Einkaufsausflugs ausgeht, könnten Sie ihm einen Leckerbissen geben, damit er ruhig ist. Weil Sie das Fehlverhalten positiv verstärkt haben, wird er wahrscheinlich in der Zukunft eher wieder ausagieren, um ein anderes Vergnügen zu bekommen.
Nachdem Sie in einem Theaterstück gespielt haben, erhalten Sie Applaus vom Publikum. Dies wirkt als positiver Verstärker, der Sie dazu inspiriert, mehr Rollen zu spielen.
Sie trainieren Ihren Hund zu holen, indem Sie ihm Lob und einen Klaps auf den Kopf geben, wenn er das Verhalten richtig ausführt.
Ein Professor sagt den Studenten, dass sie, wenn sie das ganze Semester über perfekte Anwesenheit haben, keine abschließende umfassende Prüfung ablegen müssen. Durch das Entfernen eines unangenehmen Reizes (der letzte Test) werden die Schüler negativ verstärkt, um regelmäßig am Unterricht teilzunehmen.
Wenn Sie ein Projekt nicht pünktlich abgeben, wird Ihr Chef wütend und beschimpft Ihre Leistung vor Ihren Kollegen. Dies wirkt sich positiv aus und macht es weniger wahrscheinlich, dass Sie Projekte in der Zukunft abschließen werden.
Ein Teenager-Mädchen räumt nicht auf, als sie gefragt wurde, also nehmen ihre Eltern den Rest des Tages ihr Telefon weg. Dies ist ein Beispiel für eine negative Bestrafung, bei der ein positiver Reiz weggenommen wird.

In einigen dieser Beispiele bewirkt das Versprechen oder die Möglichkeit von Belohnungen eine Zunahme des Verhaltens, aber operante Konditionierung kann auch verwendet werden, um ein Verhalten zu verringern. Die Entfernung eines erwünschten Ergebnisses oder einer negativen Ergebnisanwendung kann verwendet werden, um unerwünschtes Verhalten zu verringern oder zu verhindern. Zum Beispiel kann einem Kind gesagt werden, dass es Pausenprivilegien verlieren wird, wenn sie in der Klasse außerhalb der Reihe sprechen. Dieses Bestrafungspotential kann zu einer Verringerung von Störverhalten führen.

Ein Wort von

Während der Behaviorismus möglicherweise viel von der Dominanz, die er zu Beginn des 20. Jahrhunderts innehatte, verloren hat, bleibt die operante Konditionierung ein wichtiges und oft genutztes Werkzeug im Lern- und Verhaltensmodifikationsprozess. Manchmal führen natürliche Konsequenzen zu Veränderungen in unserem Verhalten. In anderen Fällen können Belohnungen und Bestrafungen bewusst ausgegeben werden, um eine Veränderung herbeizuführen.

Operante Konditionierung ist etwas, das Sie sofort in Ihrem eigenen Leben erkennen können, sei es in Ihrem Ansatz, Ihren Kindern ein gutes Verhalten beizubringen, oder darin, den Familienhund so zu trainieren, dass er nicht mehr an Ihren Lieblingsschuhen kaut. Die wichtige Sache, an die man sich erinnert, ist, dass es mit jeder Art von Lernen manchmal Zeit brauchen kann. Berücksichtigen Sie die Art der Verstärkung oder Bestrafung, die für Ihre einzigartige Situation am besten geeignet ist, und beurteilen Sie, welche Art von Bewehrungsplan zu den besten Ergebnissen führt.

> Quellen:

> Coon, D & Mitterer, JO. Psychologie: Eine Reise. Belmont, Kalifornien: Wadsworth; 2014.

> Domjan, M. Die Prinzipien des Lernens und des Verhaltens, Siebte Ausgabe. Stamford, CT; Cengage-Lernen; 2015.

Die Geschichte der Operantenkonditionierung

Arten von Verhaltensweisen

Komponenten der Betriebssystemkonditionierung

Beispiele für Operantenkonditionierung

Ein Wort von

Related Content

Fresh articles

Intresting articles