本要約【「心の病」がみえる脳科学講義精神疾患・発達障害を持つ人の頭の中で何が起きているのか】加藤忠史 #2625

#心の病がみえる脳科学講義
リワード・キュリオシティモデルでは報酬+好奇心×情報量で意思決定している

ASDマウスはシナプスができやすいが、消えやすい

110歳まで生きれば、ほぼ間違いなく認知症になる
立体構造を持って働いているタンパク質が崩れて繊維状に固まってしまうhttps://t.co/4EnIqEnUYT
— 未熟なリバタリアンがAIソクラテスと思考実験してみた (@bluesbookblog) February 11, 2026

AIソクラテスと思考実験してみた
あなたも読書を始めよう

AIソクラテスと思考実験してみた

- YouTube

YouTube でお気に入りの動画や音楽を楽しみ、オリジナルのコンテンツをアップロードして友だちや家族、世界中の人たちと共有しましょう。

Q1: リワード・キュリオシティモデルとは何か？

意思決定は「報酬＋好奇心×情報量」で動くと考えられる。報酬とは快楽や安心のような直接的な価値であり、好奇心は未知を知ろうとする動機、情報量はその体験から得られる新しさや学習の大きさを指す。たとえば高級レストランに行く選択は、味という報酬に加えて、未知の料理体験という情報量が上乗せされることで魅力が高まる。一方、慣れた店は報酬は安定しているが情報量は小さい。そのため、情報の価値づけが高い人ほど新規性を求めやすくなる。この枠組みでは、行動は単なる快楽追求ではなく、学習効率の最大化として理解できる点が重要になる。

Q2: ASD特性とシナプス可塑性はどう関係する？

ASDモデルマウスでは「シナプスができやすいが消えやすい」という特徴が報告されている。この性質は、内部モデルの更新が過敏かつ不安定になりやすいことを示唆する。神経回路が頻繁に書き換わると、同じ環境でも表現が揺れ、不確実性が残りやすい。その結果、予測誤差の扱い方が変わると考えられる。情報を取りに行けば改善すると判断すれば探索が増え、逆に情報がノイズになると判断すれば既知に固着しやすい。実証研究でも探索傾向は一方向に定まらず、スペクトラムとして多様性が見られる。可塑性の高さは強みにも不安定さにもなりうる。

Q3: 探索と活用のバランスはなぜ揺れる？

探索とは未知を試す行動、活用とは既知の選択を繰り返す行動を指す。このバランスは予測誤差の大きさと、不確実性への耐性によって揺れやすい。予測誤差が大きい状況では情報量が増えるが、同時に負荷も増す。情報が報酬として働くか、コストとして働くかで戦略は変わる。感覚入力が強すぎる場合、情報は魅力ではなく疲労になる。そのとき探索は抑制される。一方、誤差が学習につながると感じられる場合は探索が促進される。この揺れは性格だけでなく、その時の神経状態や環境条件にも左右されるため、一定の方向に固定されにくい。

Q4: 感情や好奇心に閾値は存在するのか？

感情や好奇心は連続的に働く場合もあれば、一定の閾値を超えたときに急激に高まる場合もあると考えられる。センサーの感度が均一であれば小さな刺激にも反応できるが、特定のレンジが鈍い場合は強い刺激でなければ動機が生まれにくい。その結果、急激な興奮や突然の飽きが起こる。会話が想定より早く退屈に感じられたり、逆に想定以上に長く楽しめたりするのは、内部モデルの精度が不安定なためと解釈できる。閾値の存在は意志の弱さではなく、感度特性の違いとして理解される必要がある。

Q5: 快楽の尺度が伸びると何が起こる？

強い体験を重ねると、脳の基準点が上がりやすい。高級料理や極限スポーツのような高刺激体験は、一時的に快楽の尺度を引き伸ばす。その結果、日常の食事や穏やかな娯楽が物足りなく感じられることがある。これはドーパミン系のコントラスト効果で説明できる。刺激が大きいほど比較対象が弱く見えるためである。しかし、極端な振れ幅は持続しにくく、反動で簡素な生活を選ぶ傾向も生まれる。野菜や納豆、サバ缶のような最小限の食事に満足する方向へ振れるのは、基準点を下げ直す試みとも解釈できる。

Q6: 情報量最大化の戦略は合理的か？

限られた時間と集中力を情報量の高い体験に集中させる戦略は、学習効率の観点では合理的と考えられる。未知の挑戦は短時間で多くの予測誤差を生み、内部モデルを大きく更新する。バンジージャンプやスカイダイビングのような極端な経験は、その典型例である。ただし、情報量が高い体験はエネルギー消費も大きい。常にピークを求めると疲労が蓄積し、回復の余地がなくなる可能性がある。そのため、情報量の追求と回復期間の設計を両立させる必要が生じる。最大化には持続可能性の視点が欠かせない。

Q7: 快楽と満足はどう区別できる？

快楽は瞬間的な強度、満足は時間的な安定感として区別できる。強い刺激は快楽を急上昇させるが、持続性は低い。一方、穏やかな活動や深い対話は快楽の強度は小さくても、満足を積み重ねやすい。幸福度を二軸で測ると、両者のバランスが重要になる。快楽のみを追うと基準点が上がり続け、満足が置き去りになる可能性がある。逆に刺激を完全に避けると学習機会が減少する。したがって、快楽のピークと満足の持続を意識的に組み合わせる設計が、全体的な幸福感を高める方向に働く。

Q8: 神経回路は固定的か、それとも変えられるか？

神経回路には生得的な特性が存在するが、可塑性も同時に備わっている。感度の偏りがある場合でも、経験を通じて補正が起こる可能性がある。ただし、完全に均質化することは難しい。むしろ特性を前提に戦略を設計する方が現実的である。たとえば刺激後に静かな期間を設ける、予測と実際の満足度を記録するなどの工夫は、内部モデルの精度向上につながる。回路の傾向を否定するよりも、振れ幅を管理する方向が実践的と考えられる。

Q9: 長期的報酬とのトレードオフはどう考える？

情報量の高い体験は短期的な満足をもたらすが、人間関係や健康のような遅延報酬はゆっくり効いてくる。これらを軽視すると、総体的な幸福度が低下する恐れがある。長期的報酬は目立たないが、土台として機能する。強い刺激を年に数回に限定し、日常では身体感覚や対話を深める活動を育てる方法は、両立の一案となる。ピーク体験の後に減衰期間を設けることで基準点を戻す工夫も有効である。短期と長期の資源配分を意識することが安定につながる。

Q10: 情報とどう向き合う態度が望ましい？

情報は常に報酬にもコストにもなりうる。魅力として機能する場合もあれば、負荷として働く場合もある。そのため、状況依存で価値づけが変わることを前提にする姿勢が重要になる。極端な全肯定や全否定ではなく、振れ幅を観察しながら選択を調整する態度が求められる。好奇心を抑え込むのではなく、配置を設計する発想が有効である。強い体験と静かな時間を組み合わせ、快楽と満足を同時に育てることが、長期的な幸福に近づく道と考えられる。