科学 2026.04.15

ドーパミン報酬系

ドーパミン作動性ニューロンを核とする脳の報酬・動機づけ系。予測誤差を信号として学習を駆動する。

Contents

概要

ドーパミンはモノアミン神経伝達物質の一つで、中脳の腹側被蓋野と黒質緻密部に集中するニューロンから広範な皮質下・皮質領域へ投射する。

中脳皮質辺縁系経路は報酬学習と動機づけを、黒質線条体経路は運動制御を担う。パーキンソン病や依存症、統合失調症はこれら回路の機能不全と関連づけられてきた。

「快感の脳内物質」という俗流理解は、現在の神経科学的知見とは大きくずれている。

メカニズム

サルの単一細胞記録から、ドーパミンニューロンは予想外の報酬で発火し、予測できた報酬ではさほど発火せず、期待した報酬が得られない時は抑制されることが示された。これは報酬予測誤差と呼ばれ、強化学習の理論信号とよく対応する。

この信号はシナプス可塑性を介して、どの刺激や行動が報酬につながるかの学習を促す。前頭前野との相互作用は、長期目標に向けた努力と抑制を支える。

慢性的な過剰刺激は受容体感受性を下げ、同じ刺激では満足しなくなる耐性現象を生みうる。

意義

ドーパミン研究は、学習の生理学的基盤を予測誤差による更新として定式化した。これは機械学習の強化学習とも呼応し、生物学と計算論の架け橋となっている。

一方、単純化された「ドーパミン＝快楽」という図式は過剰な一般化を招いてきた。欲求（wanting）と快楽（liking）は回路レベルで区別されるという知見は、その過剰な一般化への修正でもある。

現代への示唆

予測誤差を前提に制度を設計する

定期昇給や予定されたボーナスは、予測誤差を生まない分、動機づけ信号としては弱くなりやすい。非予期の承認と意味づけを設計に織り込むことが、金銭報酬だけでは届かない部分を補う。

欲求と満足の乖離

通知・承認・数値ダッシュボードは、欲求は強めるが満足を十分には与えない。個人の集中と組織の健全さのために、引き金の数を減らす設計が求められる。

報酬の射程を伸ばす

短期的な成果指標ばかりを強化すると、脳も組織も近視眼的に最適化される。長期目標への報酬予測を維持できるような物語と節目の設計が、戦略遂行の神経的な足場となる。

関連する概念

[扁桃体と情動]( / articles / amygdala-emotion)
前頭前野と意思決定
強化学習
依存
動機づけ

参考

Schultz, W. “Predictive Reward Signal of Dopamine Neurons”, Journal of Neurophysiology, 80(1), 1998
Berridge, K. C. & Robinson, T. E. “Liking, wanting, and the incentive-sensitization theory of addiction”, American Psychologist, 71(8), 2016

脳科学動機づけ学習報酬

Newsletter

新着の論考を、メールでお届けします。