- Vorboten der operanten Konditionierung
- Grundbegriffe der operanten Konditionierung
- - Verstärkung
- Positive Verstärkung
- Negative Verstärkung
- Primärverstärker
- Sekundärverstärker
- - Drei-Zeit-Eventualverbindlichkeiten
- - Bestrafung
- Positive Bestrafung
- Negative Bestrafung
- - Aussterben
- - Verallgemeinerung
- - Diskriminierung
- Verstärkungsprogramme
- Kontinuierliche Verstärkungsprogramme
- Intermittierende Verstärkungsprogramme
- Programme mit festem Verhältnis
- Programme mit variablem Verhältnis
- Feste Intervallprogramme
- Programme mit variablem Intervall
- Verhaltensänderung
- Aufeinanderfolgende Ansätze oder Gestaltung
- Verkettung
- Verweise
Die operante Konditionierung oder instrumentelle Konditionierung ist eine Art des Lernens, bei der das Verhalten mit den Konsequenzen gesteuert wird. Es basiert auf der Idee, dass Verhaltensweisen, die verstärkt werden, häufiger auftreten, während Verhaltensweisen, die bestraft werden, ausgelöscht werden.
Was ist der Unterschied zwischen operanter Konditionierung und klassischer Konditionierung? Bei der operanten Konditionierung folgt auf eine freiwillige Reaktion ein Verstärker. Auf diese Weise ist es wahrscheinlicher, dass in Zukunft eine freiwillige Reaktion (z. B. das Studium für eine Prüfung) erfolgt.
Skinner Box
Im Gegensatz dazu löst bei der klassischen Konditionierung ein Reiz automatisch eine unwillkürliche Reaktion aus. Zum Beispiel bewirkt das Futter, das ein Hund sieht, dass er Speichel produziert.
Operante Konditionierung kann als ein Prozess beschrieben werden, der versucht, das Verhalten durch die Verwendung von positiver und negativer Verstärkung zu ändern. Durch operante Konditionierung stellt ein Individuum eine Assoziation zwischen einem bestimmten Verhalten und einer Konsequenz her. Beispiele:
- Eltern belohnen die guten Noten eines Kindes mit Süßigkeiten oder einer anderen Belohnung.
- Ein Lehrer belohnt die Schüler, die ruhig und höflich sind. Die Schüler stellen fest, dass sie durch dieses Verhalten mehr Punkte erhalten.
- Jedes Mal, wenn ein Hebel gedrückt wird, wird einem Tier ein Futter gegeben.
BF Skinner (1938) prägte den Begriff operante Konditionierung. Skinner identifizierte drei Arten von Antworten oder Operanten:
- Neutrale Operatoren : Antworten aus der Umgebung, die die Wahrscheinlichkeit, dass sich ein Verhalten wiederholt, weder erhöhen noch verringern.
- Verstärker : Reaktionen aus der Umgebung, die die Wahrscheinlichkeit erhöhen, ein Verhalten zu wiederholen. Verstärker können positiv oder negativ sein.
- Bestrafungen : Antworten aus der Umgebung, die die Wahrscheinlichkeit verringern, dass sich ein Verhalten wiederholt. Bestrafung schwächt das Verhalten.
Vorboten der operanten Konditionierung
Thorndike erkannte als erster, dass Konditionierung mehr als nur eine Reaktion und eine Verstärkung beinhaltet. Die Reaktion tritt bei Vorhandensein bestimmter Reize auf, wobei drei Ereignisse berücksichtigt werden: der Reiz, die Reaktion und die Konsequenz der Reaktion oder des Verstärkers.
Edward Thorndike. Von: Popular Science Monthly Volume 80
Diese Struktur erleichtert die Assoziation zwischen Reiz und Reaktion. In seinem Wirkungsgesetz stellte Thorndike fest, dass Reaktionen, denen verstärkende Konsequenzen folgen, eine höhere Wahrscheinlichkeit des Auftretens haben, wenn der Reiz wieder auftritt.
Im Gegenteil, diejenigen Reaktionen, auf die negative Konsequenzen folgen, haben eine geringere Wahrscheinlichkeit des Auftretens, wenn der Reiz wieder auftritt. Das Wirkungsgesetz ist der Vorläufer der operanten oder instrumentellen Konditionierung, wie es von Thorndike benannt wurde.
Für Skinner, einen Verhaltenspsychologen, war Konditionierung die Stärkung des Verhaltens entsprechend den zuvor erzielten Konsequenzen.
Skinner
In diesem Sinne gibt es zwei Formen der Konditionierung:
- Der Klassiker oder Pawlowsche: Er basiert auf der Assoziation von unkonditionierten und konditionierten Reizen, wobei die Reaktionen durch die vorangegangenen Reize gesteuert werden.
- Operante Konditionierung: Konsequente oder verstärkende Reize bewirken die Abgabe eines bestimmten Verhaltens. Skinner erklärt, dass wenn dem Verhalten ein positiver Verstärker folgt, dies die Wahrscheinlichkeit der Emission dieses Verhaltens in Zukunft erhöhen würde. Im Gegenteil, wenn auf eine Antwort kein Verstärker folgt oder dieser Verstärker negativ ist, ist die Wahrscheinlichkeit geringer, dass dieses Verhalten in Zukunft abgegeben wird.
Skinners Boxratte
Grundbegriffe der operanten Konditionierung
- Verstärkung
Es ist verantwortlich für die Ausgabe von Antworten, dh für die Wahrscheinlichkeit, dass sie eintreten, sei es in Zukunft höher oder niedriger. Es ist ein verstärkender und konsequenter Reiz, da er auftritt, sobald die Reaktion aufgetreten ist.
Es ist unmöglich zu wissen, ob ein bestimmter Verstärker das Verhalten beeinflusst, bis er von einer Reaktion abhängig ist und sich das Verhalten als Folge des Verstärkers ändert.
Es gibt zwei Arten der Verstärkung: positive und negative. Beide haben den gleichen Zweck, die Wahrscheinlichkeit zu erhöhen, dass die Antwort in zukünftigen Situationen ausgegeben wird. Darüber hinaus werden Verstärker für Skinner durch beobachtbare und messbare Verhaltensweisen definiert.
Positive Verstärkung
Positive Verstärkung verstärkt ein Verhalten, indem sie eine Konsequenz liefert, die eine Person als lohnend empfindet. Zum Beispiel einen Hund füttern, nachdem er sich gesetzt hat. In diesem Fall würde das Sitzverhalten verstärkt.
Negative Verstärkung
Das Entfernen eines unangenehmen Verstärkers kann auch ein Verhalten verstärken. Dies wird als negative Verstärkung bezeichnet, da durch die Beseitigung eines nachteiligen Stimulus für das Tier oder die Person das Verhalten konditioniert wird.
Negative Verstärkung verstärkt das Verhalten, indem sie eine unangenehme Erfahrung stoppt oder beseitigt.
Wenn zum Beispiel ein Kind zu Hause missbraucht wird und wenn es auf die Straße geht, wird es nicht missbraucht, wird das Verhalten, nach draußen zu gehen, verstärkt.
Primärverstärker
Sie wären all jene Grundverstärker, die keine Vorgeschichte einer vorherigen Konditionierung benötigen, um als solche zu funktionieren. Einige Beispiele wären Wasser, Essen und Sex.
Sekundärverstärker
Sekundärverstärker würden dank der Assoziation mit nicht konditionierten Reizen auf früheren Konditionierungsgeschichten basieren. Einige Beispiele wären Geld und Qualifikationen.
- Drei-Zeit-Eventualverbindlichkeiten
Quelle: Joshua Seong / Verywell
Es ist das Grundmodell der operanten Konditionierung und besteht aus drei Komponenten: dem diskriminierenden Stimulus, der Reaktion und dem verstärkenden Stimulus.
Ein diskriminierender Stimulus wäre ein Stimulus, der dem Subjekt anzeigt, dass der Verstärker verfügbar ist, und anzeigt, dass er den Verstärker erhalten kann, wenn er ein bestimmtes Verhalten ausführt. Im Gegensatz dazu haben wir den Delta-Stimulus oder die Delta-Stimuli, die darauf hinweisen, dass das Verhalten nicht dazu führt, dass irgendeine Art von Verstärker erhalten wird.
Die Antwort wäre das Verhalten, das das Subjekt ausführen wird, dessen Ausführung dazu führen wird, dass der verstärkende Reiz erhalten wird oder nicht.
Ein verstärkender Reiz ist für die Emission des Verhaltens verantwortlich, da dank seines Auftretens die Wahrscheinlichkeit der Emission einer Reaktion in Zukunft zunehmen oder abnehmen wird.
- Bestrafung
Die Bestrafung wird auch an ihren Auswirkungen auf das Verhalten des Subjekts gemessen. Im Gegensatz zur Verstärkung ist stattdessen die Reduzierung oder Unterdrückung eines bestimmten Verhaltens beabsichtigt.
Eine Bestrafung verringert die Wahrscheinlichkeit, in späteren Situationen ein Verhalten zu zeigen. Die Reaktion wird jedoch nicht beseitigt, da das Verhalten möglicherweise erneut auftritt, wenn die Gefahr einer Bestrafung abnimmt.
Bei der Bestrafung gibt es auch zwei verschiedene Arten oder Verfahren: positive Bestrafung und negative Bestrafung.
Positive Bestrafung
Dies impliziert die Präsentation eines aversiven Stimulus nach Durchführung eines bestimmten Verhaltens. Es wird in einer bedingten Weise auf die Antwort des Subjekts gegeben.
Zum Beispiel, wenn Flüssigkeit auf die Nägel von Kindern aufgetragen wird, um eine Onychophagie zu verhindern. Das Kind schätzt den schlechten Geschmack der Flüssigkeit (positive Bestrafung) und die Wahrscheinlichkeit, dass es erneut in die Nägel beißt, wird verringert.
Negative Bestrafung
Es besteht aus der Beseitigung eines Reizes als Folge eines bestimmten Verhaltens, dh der Rücknahme eines positiven Reizes nach Durchführung eines bestimmten Verhaltens.
Zum Beispiel, wenn ein Kind von der Benutzung der Spielekonsole zurückgezogen wird, nachdem es eine Prüfung nicht bestanden hat.
- Aussterben
Beim Aussterben wird eine Reaktion gestoppt, da der Verstärker nicht mehr erscheint. Dieser Prozess basiert darauf, dass nicht der entsprechende Verstärker bereitgestellt wird, der voraussichtlich erreicht wird und der dazu geführt hat, dass dieses Verhalten im Laufe der Zeit beibehalten wird.
Wenn eine Antwort gelöscht wird, wird der diskriminierende Stimulus zum Extinktionsstimulus. Dieser Prozess sollte nicht mit dem Vergessen verwechselt werden, das auftritt, wenn die Stärke eines Verhaltens abnimmt, wenn es in einem bestimmten Zeitraum nicht emittiert wurde.
Wenn beispielsweise einem Kind trotz ständiger Beschwerden kein Geld gegeben wird, erlischt das Beschwerdeverhalten.
- Verallgemeinerung
Angesichts einer bestimmten Situation oder eines bestimmten Stimulus wird eine Reaktion konditioniert, die vor anderen Stimuli oder ähnlichen Situationen auftreten kann.
- Diskriminierung
Dieser Prozess ist das Gegenteil von Generalisierung, er reagiert je nach Reiz und Kontext unterschiedlich.
Verstärkungsprogramme
Skinner hat durch seine Forschung auch verschiedene Verstärkungsprogramme eingerichtet, darunter kontinuierliche Verstärkungsprogramme und intermittierende Verstärkungsprogramme.
Kontinuierliche Verstärkungsprogramme
Sie basieren auf der ständigen Verstärkung der Reaktion bei jedem Auftreten, dh jedes Mal, wenn das Subjekt das gewünschte Verhalten ausführt, erhalten sie einen verstärkenden oder positiven Reiz.
Intermittierende Verstärkungsprogramme
Andererseits erhält das Subjekt hier nicht immer den Verstärker, indem es das gewünschte Verhalten ausführt. Diese werden basierend auf der Anzahl der gegebenen Antworten oder dem Zeitintervall zwischen den Antworten definiert, was zu unterschiedlichen Verfahren führt.
Programme mit festem Verhältnis
In diesen Programmen wird der Verstärker bereitgestellt, wenn das Subjekt feste und konstante Antworten erzeugt. Zum Beispiel erhält die Person in einem Programm mit Verhältnis 10 den Verstärker, nachdem sie zehn Antworten gegeben hat, wenn der Reiz präsentiert wird.
Programme mit variablem Verhältnis
Dies ist genauso aufgebaut wie das vorherige, aber in diesem Fall ist die Anzahl der Antworten, die das Subjekt geben muss, um den Verstärker zu erhalten, variabel.
Der Verstärker würde weiterhin von der Anzahl der vom Subjekt abgegebenen Antworten abhängen, jedoch mit einem variablen Verhältnis, wodurch das Subjekt daran gehindert wird, vorherzusagen, wann der Verstärker erhalten wird.
Feste Intervallprogramme
In Intervallprogrammen hängt das Erhalten des Verstärkers nicht von der Anzahl der Antworten ab, die das Subjekt gibt, sondern wird durch die verstrichene Zeit bestimmt. Folglich wird die erste Antwort, die nach Ablauf einer bestimmten Zeitspanne erzeugt wird, verstärkt.
In Programmen mit festen Intervallen ist die Zeit zwischen Enhancer und Enhancer immer gleich.
Programme mit variablem Intervall
In diesen Programmen wird die Verstärkung nach einer bestimmten Zeit erhalten, obwohl die Zeit für jede empfangene Verstärkung unterschiedlich ist.
Verhaltensänderung
Aufeinanderfolgende Ansätze oder Gestaltung
Moulding besteht aus Verhaltensänderungen durch Modellierung von Verhaltensweisen oder die differenzierte Verstärkung aufeinanderfolgender Ansätze.
Eine Reihe von Schritten wird befolgt, um ein bestimmtes Verhalten zu formen. Zunächst wird das anfängliche Verhalten identifiziert, das geformt werden soll, um zu wissen, was man erreichen möchte.
Anschließend werden die möglichen zu verwendenden Verstärker abgegrenzt und der Prozess zum Erreichen des endgültigen Verhaltens in Schritte oder Stufen unterteilt, wobei jede aufeinanderfolgende Stufe oder jeder Ansatz bis zum Erreichen der letzten Stufe verstärkt wird.
Mit diesem dynamischen Verfahren werden sowohl Verhaltensweisen als auch deren Folgen transformiert. In diesem Sinne werden sukzessive Ansätze für ein objektives Verhalten verstärkt.
Damit dies jedoch durchgeführt werden kann, muss von einem früheren Verhalten ausgegangen werden, das das Subjekt bereits ausführt, um sein Verhalten schrittweise zu verstärken, bis es das Ziel erreicht.
Verkettung
Damit wird aus der Zerlegung in einfachere Schritte oder Sequenzen ein neues Verhalten gebildet, das jede in jedem der Schritte gegebene Antwort verstärkt, um so zu einer komplexeren Antwort im Verhaltensrepertoire des Subjekts zu führen.
Lange Ketten von Antworten können unter Verwendung von konditionierten Verstärkern gebildet werden, wobei eine funktionale Einheit angenommen wird und deren Einrichtung zum Erwerb und zur Definition einer bestimmten Fähigkeit führt.
Verweise
- Operante Konditionierung. Von wikipedia.org wiederhergestellt
- Operante Konditionierung. Von e-torredebabel.com wiederhergestellt.
- Von biblio3.url wiederhergestellt.
- Wirkungsgesetz. Von wikipedia.org wiederhergestellt.
- Aussterben. Von wikipedio.org wiederhergestellt.
- Domjan, M. Prinzipien des Lernens und Verhaltens. Auditorium. 5. Auflage.