Contents
概要
ドーパミンはモノアミン神経伝達物質の一つで、中脳の腹側被蓋野と黒質緻密部に集中するニューロンから広範な皮質下・皮質領域へ投射する。
中脳皮質辺縁系経路は報酬学習と動機づけを、黒質線条体経路は運動制御を担う。パーキンソン病や依存症、統合失調症はこれら回路の機能不全と関連づけられてきた。
「快感の脳内物質」という俗流理解は、現在の神経科学的知見とは大きくずれている。
メカニズム
サルの単一細胞記録から、ドーパミンニューロンは予想外の報酬で発火し、予測できた報酬ではさほど発火せず、期待した報酬が得られない時は抑制されることが示された。これは報酬予測誤差と呼ばれ、強化学習の理論信号とよく対応する。
この信号はシナプス可塑性を介して、どの刺激や行動が報酬につながるかの学習を促す。前頭前野との相互作用は、長期目標に向けた努力と抑制を支える。
慢性的な過剰刺激は受容体感受性を下げ、同じ刺激では満足しなくなる耐性現象を生みうる。
意義
ドーパミン研究は、学習の生理学的基盤を予測誤差による更新として定式化した。これは機械学習の強化学習とも呼応し、生物学と計算論の架け橋となっている。
一方、単純化された「ドーパミン=快楽」という図式は過剰な一般化を招いてきた。欲求(wanting)と快楽(liking)は回路レベルで区別されるという知見は、その過剰な一般化への修正でもある。
現代への示唆
予測誤差を前提に制度を設計する
定期昇給や予定されたボーナスは、予測誤差を生まない分、動機づけ信号としては弱くなりやすい。非予期の承認と意味づけを設計に織り込むことが、金銭報酬だけでは届かない部分を補う。
欲求と満足の乖離
通知・承認・数値ダッシュボードは、欲求は強めるが満足を十分には与えない。個人の集中と組織の健全さのために、引き金の数を減らす設計が求められる。
報酬の射程を伸ばす
短期的な成果指標ばかりを強化すると、脳も組織も近視眼的に最適化される。長期目標への報酬予測を維持できるような物語と節目の設計が、戦略遂行の神経的な足場となる。
関連する概念
- [扁桃体と情動]( / articles / amygdala-emotion)
- 前頭前野と意思決定
- 強化学習
- 依存
- 動機づけ
参考
- Schultz, W. “Predictive Reward Signal of Dopamine Neurons”, Journal of Neurophysiology, 80(1), 1998
- Berridge, K. C. & Robinson, T. E. “Liking, wanting, and the incentive-sensitization theory of addiction”, American Psychologist, 71(8), 2016