オペラント条件付け：機能、プログラム、例 - エコノミア

オペラント条件付けや楽器の調整は行動が結果で制御された学習のタイプです。これは、強化された行動はより頻繁に現れる傾向があるという考えに基づいていますが、処罰された行動は消滅します。

オペラント条件付けと古典的条件付けの違いは何ですか？オペラント条件付けでは、自発的応答の後に強化子が続きます。このように、自主的な回答（たとえば、試験のための勉強）は、将来行われる可能性が高くなります。

スキナーボックス

対照的に、古典的な条件付けでは、刺激が自動的に不随意の反応を引き起こします。たとえば、犬が目にする食べ物は、唾液を生成させます。

オペラント条件付けは、ポジティブおよびネガティブ強化を使用して行動を修正しようとするプロセスとして説明できます。オペラント条件付けを通じて、個人は特定の行動と結果との間の関連付けを行います。例：

親はお菓子や他の報酬で子供の良い成績に報酬を与えます。
教師は穏やかで礼儀正しい生徒に報いる。生徒は、このように行動することで、より多くのポイントを獲得できることに気付きます。
レバーを押すたびに餌が動物に与えられます。

BF Skinner（1938）は、オペラント条件付けという用語を作り出しました。Skinnerは3つのタイプの応答またはオペラントを識別しました。

ニュートラル演算子：動作が繰り返される確率を増加も減少もしない環境からの応答。
強化剤：行動を繰り返す確率を高める環境からの反応。補強子は、ポジティブにもネガティブにもできます。
罰：行動が繰り返される可能性を減らす環境からの応答。罰は行動を弱める。

オペラント条件付けの前例

ソーンダイクは、コンディショニングには単なるレスポンスと補強以外のものが含まれることを認識した最初の人物でした。応答は、3つのイベントを考慮して、特定の刺激の存在下で発生します：刺激、応答、および応答または強化子の結果。

エドワードソーンダイク。レビュアー：Popular Science Monthly Volume 80

この構造は、刺激と応答の間の関連付けを容易にします。ソーンダイクは、彼の効果法則の中で、結果が強化された後の反応は、刺激が再び現れるときに発生する確率が高くなると述べています。

逆に、否定的な結果が続くこれらの応答は、刺激が再び現れるときに発生する確率が低くなります。効果法則は、ソーンダイクによって名付けられたオペラント条件付けまたは器械条件付けの前身です。

行動心理学者のスキナーにとって、条件付けは以前に得られた結果による行動の強化でした。

スキナー

これらの線に沿って、条件付けには2つの形式があります。

-クラシックまたはパブロフ：これは、条件付けされていない刺激と条件付けされた刺激の関連付けに基づいており、応答は先行刺激によって制御されています。

-オペラント条件付け：結果的または強化的な刺激により、特定の行動が発せられます。スキナーは、行動の後にポジティブな補強子が続く場合、将来その行動が発せられる確率が高まると説明しています。反対に、応答に補強子が付いていない場合、またはその補強子が負である場合、将来その動作が発生する可能性は低くなります。

スキナーの箱入りラット

オペラント条件付けの基本概念

-補強

これは、応答の発行、つまり、それが将来発生する可能性が高いか低いかに関係なく発生する確率に責任があります。これは、応答が発生すると発生するため、強化および結果として生じる刺激です。

特定の補強子が応答に依存し、補強子の結果として動作が変化することが示されるまで、特定の補強子が動作に影響を与えるかどうかを知ることは不可能です。

補強には、ポジティブとネガティブの2つのタイプがあります。どちらも、将来の状況で応答が発行される可能性を高めるという同じ目的を持っています。さらに、スキナーの場合、強化子は観察可能で測定可能な動作によって定義されます。

正の補強

正の強化は、個人がやりがいを感じる結果を提供することにより、行動を強化します。たとえば、座った後に犬に餌をやる。この場合、座り行動が強化されます。

負の補強

不快な強化子を削除すると、動作も強化されます。これは、行動を調整する原因となる動物または人への有害な刺激の除去であるため、ネガティブ強化として知られています。

負の強化は、不快な経験を停止または排除することにより、行動を強化します。

たとえば、子供が家で虐待され、通りに出たときに虐待されていない場合、外に出る行動は強化されます。

一次補強剤

それらは、そのように機能するために事前の条件付けの履歴を必要としないすべての基本的な強化子です。例としては、水、食べ物、性別などがあります。

二次補強剤

二次強化剤は、条件付けされていない刺激との関連のおかげで条件付けの以前の話に基づいています。いくつかの例はお金と資格です。

-3期間の不測の事態

出典：Joshua Seong / Verywell

それはオペラント条件付けの基本モデルであり、3つのコンポーネントで構成されています：識別刺激、応答、および強化刺激。

差別的刺激は、強化者が利用可能であることを被験者に示す刺激であり、彼が特定の行動を実行した場合に、その強化者を獲得できることを示します。対照的に、私たちは、その行動がいかなるタイプの補強子の獲得につながらないことを示す1つまたは複数のデルタ刺激を持っています。

答えは、被験者が実行する行動であり、その実行は強化刺激を獲得するかどうかを導きます。

その出現のおかげで応答の放出の確率は将来増加または減少するため、強化刺激は行動の放出に責任があります。

-罰

罰はまた、被験者の行動への影響によっても測定されます。代わりに、強化とは異なり、意図されているのは特定の動作の削減または抑制です。

罰則は、その後の状況で行動を起こす可能性を減らします。ただし、罰の脅威が減少した場合、行動が再現する可能性があるため、対応は排除されません。

罰には、2つの異なるタイプまたは手順、肯定的な罰と否定的な罰もあります。

積極的な罰

これは、特定の動作を実行した後に嫌悪刺激を提示することを意味します。それは主題によって与えられた答えに条件付きで与えられます。

例えば、液体を子供たちの爪につけて、爪周囲炎を防ぐとき。子供は液体の悪い味を味わい（積極的な罰）、彼が再び爪を噛む可能性が低くなります。

否定的な罰

これは、特定の行動の結果としての刺激の除去から構成されます。つまり、特定の行動を実行した後の肯定的な刺激の撤回から構成されます。

たとえば、子供が試験に不合格だった後にゲームコンソールの使用を中止した場合です。

-絶滅

消滅すると、強化子が表示されなくなるため、応答は停止します。このプロセスは、達成されることが期待され、その動作が長期にわたって維持される原因となった対応する補強子を提供できないことに基づいています。

応答が消えると、識別刺激が消滅刺激になります。このプロセスを忘却と混同しないでください。これは、一定期間放出されなかったために行動の強さが低下したときに発生します。

たとえば、子供が不平を言い続けてもお金が与えられない場合、不平を言う行動は消滅します。

-汎化

与えられた状況または刺激に直面すると、応答が条件付けられ、他の刺激または同様の状況の前に現れることがあります。

-差別

このプロセスは一般化とは逆であり、刺激とコンテキストに応じて反応が異なります。

強化プログラム

スキナーはまた、継続的な強化プログラムや断続的な強化プログラムなど、彼の研究を通じてさまざまな強化プログラムを確立しました。

継続的な強化プログラム

それらは、それが発生するたびに、つまり被験者が所望の行動を実行するたびに、応答の一定の強化に基づいており、強化または肯定的な刺激を取得します。

断続的な強化プログラム

一方、ここでは、サブジェクトは必ずしも望ましい動作を実行することによって強化子を取得するわけではありません。これらは、与えられた応答の数または応答間の時間間隔に基づいて定義され、異なる手順につながります。

固定比率プログラム

これらのプログラムでは、被験者が固定された一定の応答を生成するときに強化子が提供されます。たとえば、比率10のプログラムでは、刺激が提示されたときに10回の応答を行った後、その人は強化子を取得します。

可変比率プログラム

これは前のものと同じように構成されていますが、この場合、被験者が強化子を取得するために必要な応答の数は可変です。

強化子は、被験者が発した反応の数に引き続き依存しますが、比率が可変であるため、強化子がいつ取得されるかを被験者が予測できないようにしています。

固定間隔プログラム

インターバルプログラムでは、強化子を取得することは、被験者が与える応答の数に依存しませんが、経過時間によって決定されます。その結果、一定の時間が経過した後に生成される最初の応答が強化されます。

固定間隔プログラムでは、エンハンサーとエンハンサーの間の時間は常に同じです。

可変間隔プログラム

これらのプログラムでは、受信した補強子ごとに時間が異なりますが、補強子はしばらくしてから取得されます。

行動の変化

継続的なアプローチまたは形成

成形は、行動のモデリングによる行動の変化、または連続したアプローチの差別的な強化で構成されます。

一連のステップに従って、特定の動作を形成します。そもそも、到達したいものを知るために、成形を目的とした初期動作が特定されます。

その後、使用される可能性のある強化子が区切られ、最終的な動作に到達するプロセスがステップまたはステージに分割され、最後のステージに到達するまで、連続する各ステージまたはアプローチが強化されます。

この動的な手順により、動作とその結果の両方が変換されます。この意味で、客観的な行動に対する継続的なアプローチが強化されます。

しかしながら、それが実行されるためには、彼らが目標に到達するまで彼らの行動を徐々に強化するために、被験者が既に実行した以前の行動から始めることが必要です。

連鎖

これにより、より単純なステップまたはシーケンスへの分解から新しい動作が形成され、各ステップで与えられた各応答が強化されて、対象の行動レパートリーにおけるより複雑な応答の確立につながります。

条件付き強化子を使用して応答の長いチェーンを形成できます。機能単位を採用すると、特定のスキルの習得と定義につながります。

参考文献

オペラント条件付け。wikipedia.orgから復元
オペラント条件付け。e-torredebabel.comから復元されました。
biblio3.urlから復元されました。
効果の法則。wikipedia.orgから回復。
絶滅。wikipedio.orgから回復。
Domjan、M.学習と行動の原則。講堂。第5版。

オペラント条件付け：機能、プログラム、例 - エコノミア - 2026