Successive Approximations

逐次近似を説明するために「整形」の定義を使って説明しましょう。 私たちの「シェイピング」の定義は “望ましい反応に近い反応を強化することによって、特定の反応を実行するように生物を徐々に成形または訓練することを指す行動用語 “です。
例えば、研究者は、実験中にレバーを押すようにラットを訓練するためにシェーピングを使用することができます(ラットは実験中にケージ内のレバーを押す本能を持って生まれていないため)。 まず、ラットがレバーの方向に少しでも動いたら、ご褒美を与える。 そして、実際にレバーの方向に一歩でも動けばご褒美がもらえます。 そして、レバーに近づくとご褒美がもらえるようになり(レバーに近づいてもご褒美はもらえません)、レバーを押すだけでご褒美がもらえるようになるのです。 この例では、ネズミが報酬を受けるたびに、「連続的な近似」、つまり望ましい行動にどんどん近づいていくような行動に対して報酬が与えられているのです。

コメントを残す

メールアドレスが公開されることはありません。