出典(authority):フリー百科事典『ウィキペディア(Wikipedia)』「2015/08/03 16:06:33」(JST)
オペラント条件づけ(オペラントじょうけんづけ、operant conditioning)とは、報酬や嫌悪刺激(罰)に適応して、自発的にある行動を行うように、学習することである。行動主義心理学の基本的な理論である
1898年のエドワード・ソーンダイクによる実験がはじめてであるが、1938年にはバラス・スキナーがマウスやハトを用いて体系的な研究を開始した[1]。スキナー箱とは、マウスが餌が出るレバーを押すように自発的に行動(operate)するようになることを観察する代表的な実験装置である[1]。道具的条件づけやスキナー型条件づけ[1]、オペラント学習とも呼ばれる。
イワン・パブロフによる古典的条件付けは、オペラント条件付けに対する条件付けである[1]。こちらは、遺伝的に組み込まれた反応と、無関係な反応とを結びつけることである。
ヒトを含む動物が自発する広範な行動が条件づけの対象となり、日常生活の中のいたるところで偶発的に生じている。また経験則として、子どものしつけや飼育動物の訓練などに古くから用いられてきた。スキナーとその後継者によって行動療法やプログラム学習などの応用領域が開拓され、現在では、動作や運転などの技能訓練、嗜癖や不適応行動の改善、障害児の療育プログラム、身体的・社会的リハビリテーション、e-ラーニングなど、幅広い領域で自覚的で洗練された応用がなされている。
しかしながら、コンラート・ローレンツに発見された刷り込みはいかなる条件付けもなく、きわめて強固に学習が行われる。エドワード・L・デシ(英語: Edward L. Deci)による内発的動機づけの研究は、外部からの報酬や罰を随伴させなくても行動が動機づけられることを明らかにしてきたし、外から与えられる動機づけは、創造性や責任感といった点で、内発的動機付けに劣ることを実証し自己決定理論(英語: Self-determination theory)が提唱されてきた。アルバート・バンデューラは、他者を観察し模倣して学習するモデリングについての社会的学習理論を提唱した。
オペラント行動とは、その行動が生じた直後の、刺激の出現もしくは消失といった環境の変化に応じて、頻度が変化する行動をいう。
オペラント条件づけは、オペラント行動が自発的に行動された直後の環境の変化に応じて、その後の自発頻度が変化する学習をいう。
古典的条件付けとは異なり、オペラント行動には行動を“誘発する”生得的な刺激(無条件誘発刺激)は存在しない。オペラント行動では、生物が自発的に行動する。
また、オペラント (operant) とはオペレート(動作する operate)からのスキナーによる造語である。
強化(reinforcement)
弱化(punishment)
好子(強化子 reinforcer、正の強化子、強化刺激ともいう)
嫌子(罰子 punisher、負の強化子、嫌悪刺激ともいう)
行動随伴性(behavior contingency)とはオペラント行動の自発頻度の変化とそれが自発された直後の環境の変化との関係をいう。行動随伴性には4種類がある。
また、行動随伴性というメガネを通して行動の分析を試みる事こそ行動分析学の根幹である。
たとえばスキナー箱に絶食させておいたネズミを入れ、ブザーが鳴ったときレバーを押すとエサがもらえるようにしておくと、やがて、ネズミはブザーの音に反応してレバーを押すようになり、ブザーが鳴った直後にネズミがレバーを押す頻度(確率)が増加していく。これが正の強化の一例である。
貨幣、引換券、点数など、集めることによって他の好子と交換できる(交換可能性を持つ)好子をトークンと呼ぶ。
たとえば、課題の動作を重ねて行なうと手に入る引換券によってエサが得られるようにしておくと、チンパンジーはこの課題を遂行するようになる。
全文を閲覧するには購読必要です。 To read the full text you will need to subscribe.
リンク元 | 「道具的学習」「instrumental conditioning」「オペラント行動」 |
関連記事 | 「オペ」「条件」「条件づけ」 |