脳:ヒトの報酬追求行動はドーパミン依存的予測誤差に支えられている

Nature 442, 1042-1045(31 August 2006)
Dopamine-dependent prediction errors underpin reward-seeking behaviour in humans
Mathias Pessiglione, Ben Seymour, Guillaume Flandin, Raymond J. Dolan and Chris D. Frith

道具的学習の理論の焦点は、成功と失敗の経験によってその後の意思決定がどのように改善されるかを知ることにある。これらの理論では、とりうる行動に付随する価値を更新するうえで、報酬の予測誤差が中心的役割を果たすことが強調されている。動物では、この型の学習において、神経伝達物質であるドーパミンが皮質-線条体シナプス伝達効率を調節する能力を介して重要な機能を果たしている可能性を示す重要な証拠が得られている。しかしヒトでは、ドーパミン線条体神経活動と行動選択とを関連づける直接的な証拠はまだ得られていない。本論文では、道具的学習の際、線条体活動に表現される報酬予測誤差の大きさが、ドーパミン作動性機能を増進させる薬物(3,4-ジヒドロキシ-L-フェニルアラニン;L-ドーパ)、または低下させる薬物(ハロペリドール)の投与によって変化することを示す。その結果、L-ドーパを投与された被験者は、ハロペリドールを投与された被験者に比べて、報酬が最大となる行動を選ぶ傾向が強くなる。さらに、予測誤差の大きさを標準的な行動-価値学習アルゴリズムに組み込むことで、さまざまな投薬条件下での被験者の行動選択を、正確に再現することができた。したがって我々は、ヒト脳が報酬予測誤差を用いてその後の行動を改善する仕組みは、線条体活動のドーパミン依存的な調節によって説明づけることができると考える。