オペラント条件付け【図解・具体例付き】結果の賞罰が行動の強弱を左右する学習効果

オペラント条件付けとは

オペラント条件付けとは、報酬や罰といった”結果”を得ることによって、自発的に”行動”を取るようになる「学習」のことです。

ここでの「学習」とは、勉強のことではなく、人間を含むすべての動物が経験を通して行動を変容させる過程、を指す学習心理学における専門用語です。

名前の由来は「operate(動作する)」から来ています。1898年に、エドワード・L・ソーンダイク(アメリカの心理学者・教育学者)が行った試行錯誤学習に関する実験にて命名されました。

スキナー箱の実験

オペラント条件付けの本格的な研究は、1938年に、バラス・スキナー(アメリカの心理学者・行動分析学の創始者)によるものが知られています。

スキナーは絶食させたネズミを使い、以下のような実験を行いました。

スキナーによるオペラント条件付け実験
  1. ブザーが鳴っているときに、レバーを押すと、餌が出るケージにネズミを入れる
  2. ネズミは、ブザーが鳴ったときにボタンを押して餌が出てくる経験をする
  3. 餌が欲しいネズミは、ブザーが鳴ったときにボタンを押すようになる

このように「エサが出てくること(結果)」を求めて「レバーを押すこと(行動)」が強化されることから、条件付け(学習)がなされたことが示されています。

オペラント条件付けは「三項随伴性」の性質を持つ

オペラント条件付け」の学習メカニズムを見ると、行動分析学における「三項随伴性」の性質を持ち合わせていることが特徴です。

この三項随伴性とは【刺激→行動→結果】の3項目で成り立つ連鎖(関係性そのもの)のことで、それぞれの頭文字からABC分析とも呼ばれています。

随伴性とは「ある行動が、ある結果をもたらす」という関係性を示している心理学用語です。中でも、三項随伴性(刺激→行動→結果という3項目の連鎖)が広く知られています。

三項随伴性のABC
  1. 刺激(Antecedent)
  2. 行動(Behavior)
  3. 結果(Consequence)

このように「C.結果」によって「A.先行刺激」がある状態での「B.行動」に強化・弱化が起こる関係性を「随伴性がある」と言います。

そして、『刺激→行動→結果』の三項で「随伴性」の性質を持っている条件付け(学習)を「オペラント条件付け」と言い、この時の行動を「オペラント行動」と言います。

オペラント条件付けの具体例(4分類別)

ここまで紹介してきたオペラント条件付けには「結果の正/負」と「行動の強化/弱化」の組み合わせで4パターン存在し、総称して行動随伴性と呼ばれています。

行動随伴性
の4分類
オペラント行動
強化
(行動が増える)
弱化
(行動が減る)
結果
(得る)
①正の強化
結果を得て(+)、行動が増える(+)
②正の弱化
結果を得て(+)、行動が減る(−)

(失う)
③負の強化
結果を失い(−)、行動が増える(+)
④負の弱化
結果を失い(−)、行動が減る(−)

ちなみに、行動の強化を促した結果のことを「好子(こうし)」と呼び、弱化を促した結果のことを「嫌子(けんし)」と呼びます。

それぞれ具体例を見ていきましょう。

①正の強化

結果を得る(+)ことで、行動が増えた(+)ケースです。

  • A.暑い(先行刺激)
  • B.プールで泳ぐ(行動)
  • C.気持ちが良い(結果)

この場合、「C.気持ち良い」という結果を得る(+)ため「正」に該当し、「A.暑い」という先行刺激を受けて「B.プールで泳ぐ」という行動が増加(+)するので、「正の強化」に該当します。

②正の弱化(正の罰)

結果を得る(+)ことで、行動が減った(−)ケースです。

  • A.犬を見る(先行刺激)
  • B.触る(行動)
  • C.吠えられて恐怖を感じる(結果)

この場合、「C.恐怖」という結果を得る(+)ため「正」に該当し、「A.犬を見る」という先行刺激を受けて「B.触る」という行動は減少(−)するので、「正の弱化」に該当します。

③負の強化

結果を失う(−)ことで、行動が増えた(+)ケースです。

  • A.かゆい(先行刺激)
  • B.掻く(行動)
  • C.かゆみが減った(結果)

この場合、「C.かゆみ」を失った(−)ため「負」に該当し、「A.かゆい」という先行刺激を受けて「B.掻く」という行動は増加(+)するので、「負の強化」に該当します。

④負の弱化(負の罰)

結果を失う(−)ことで、行動が減った(−)ケースです。

  • A.嫌いな食べ物(先行刺激)
  • B.残す(行動)
  • C.おやつ抜き(結果)

この場合、「C.おやつ」を失った(−)ため「負」に該当し、「A.嫌いな食べ物」という先行刺激を受けて「B.残す」という行動は減少(−)するので、「負の弱化」に該当します。

ここまでのまとめ

行動随伴性の4分類
  1. 正の強化
    結果を得て(+)、行動が増える(+)
  2. 正の弱化(別名:正の罰)
    結果を得て(+)、行動が減る(−)
  3. 負の強化
    結果を失い(−)、行動が増える(+)
  4. 負の弱化(別名:負の罰)
    結果を失い(−)、行動が減る(−)

オペラント条件付けと古典的条件付け

「オペラント条件付け」と並ぶくらいに代表的な条件付けに「古典的条件付け」というものがあります。ここでは、その違いを見ていきましょう。

古典的条件付けの特徴&具体例

古典的条件付けとは、中性刺激(特に意味のない刺激)のあとに、条件刺激(何か反射を誘発する刺激)の提示を繰り返すことで、中性刺激によって反射が誘発されるようになる現象です。

例えば「梅干しを見ただけで、食べていなくても、唾液が出る」ですね。

もし、スキナー箱の実験で「ブザーが鳴ると、よだれが出る」という条件付けがなされたのであれば、これも古典的条件付けに当てはまります。

オペラント条件付けと古典的条件付けの違い

オペラント条件付けは「行動の強/弱」に関する理論であるのに対して、古典的条件付けは「条件反射」に関する理論です。主体的か受動的かという点で大きな違いがあります。

それぞれの違いをまとめると下記の通りになりますね。

【違い】二つの代表的な条件付け
  • オペラント条件付け(結果に伴い、行動の強弱が起きる学習のこと)
    学習前:行動→結果
    学習後:行動(強化or弱化)→結果
  • 古典的条件付け(条件刺激がなくても、条件反射が起こる学習のこと)
    学習前:中性刺激→条件刺激→条件反射
    学習後:中性刺激→(なし)→条件反射

このように、オペラント条件付けは「結果に伴い、行動の強弱が起きる学習」であり、古典的条件付けは「条件刺激がなくても条件反射が起きる学習」です。

この2つの条件付けは併発することもある

オペラント条件付けと古典的条件付けは、同時に学習されるケースがあります。スキナー箱のネズミを例に挙げると、下記のような状況ですね。

  • ブザーが鳴って、唾液が出た(古典的条件付け)
  • ブザーが鳴った後、餌を出すために、レバーを押した(オペラント条件付け)

オペラント条件付けの活用方法

オペラント条件付けでは「自発的な行動の強/弱」がなされるので、良い習慣をつけたい場合、あるいは悪い習慣を改めたい場合に有効です。

一般的には、子どもやペットの教育において使われるケースが多いですね。

良い習慣をつけたい

オペラント条件付けを用いることで、良い習慣を身につけることが可能です。

良い習慣をつける条件付けの例
  • 勉強する(行動)→お菓子がもらえる(結果)
  • 運動する(行動)→ジュースを飲める(結果)
  • 人に優しくする(行動)→褒められる(結果)

上記のいずれでも「結果」を得るために「行動」が強化されるはずです。

悪い習慣を改めたい

オペラント条件付けを用いることで、悪い習慣を改めることが可能です。

悪い習慣を改める条件付けの例
  • 宿題をサボる(行動)→怒られる(結果)
  • イジワルする(行動)→怒られる(結果)

上記のいずれでも「結果」を得ないために「行動」が弱化されるはずです。

最後に

この記事のまとめ
  • オペラント条件付けとは
    報酬や罰といった”結果”を得ることによって、自発的に”行動”を取るようになる「学習」のこと
  • 良い習慣をつけたり、悪い習慣を改めたりに有効
    「自発的な行動の強/弱」がなされるので、良い習慣をつけたい場合、あるいは悪い習慣を改めたい場合に有効

ぜひこれを機に、良い習慣を作ってみましょう。

このページを読んだあなたの人生が、より豊かなものとなることを祈っております。