レジュメ:メタ認知研究の未来:構成概念の幅広さと測定の厳密さのバランス

Katyal, S., & Fleming, S. M. (2024).
The future of metacognition research: Balancing construct breadth with measurement rigor.
Cortex, 171, 223-234.
https://doi.org/10.1016/j.cortex.2023.11.002

概要
 本論文は、メタ認知研究において進展してきた信頼度評価の計算モデルや神経科学的アプローチの厳密性を高く評価しつつも、それが従来心理学で扱っていたメタ認知の多様な側面(知識、社会的相互作用、情動など)を狭めてしまう危険を指摘する。著者らは、測定の精緻化と構成概念の幅広さのバランスを取るべきだと主張し、メタ認知研究の今後の方向性を提案している。

主な論点と構成
1. はじめに
 • メタ認知は自己の認知活動を評価・制御する能力であり、適応的行動に不可欠。
 • 現代では、信頼度や自己評価の正確性を測定する精密なモデルが中心的研究対象。
2. メタ認知研究の射程
 • 初期の研究ではメタ認知的「知識」と「経験」の区別が重視された。
 • 教育や発達、社会的判断における応用も多く、広い範囲で研究されていた。
3. メタ認知測定の歴史
 • 自己報告から始まり、タスクベースの測定、信号検出理論(SDT)による meta-d′、Mratio などのモデルが開発。
 • 精度は上がったが、構成概念の一部(例:長期的信念、情動の評価など)は扱いにくいという限界も。
4. 構成概念の狭まりとリスク
 • 信頼度モデルに依存しすぎると、他の重要な側面(社会性、感情、長期的評価)が切り捨てられる可能性。
 • 精密な測定だけでなく、外的妥当性を持つ理論モデルの再構築が必要。
5. 射程を広げるための3つの提案
 1. 局所的 vs グローバルなメタ認知
  • 試行ごとの評価(局所)と長期的・統合的な自己信念(グローバル)は階層的に結びつく。
  • グローバル評価の形成過程をモデル化し、精神症状との関連も示唆。
 2. 自己 vs 他者評価
  • 自己メタ認知と他者の心的状態推定(メンタライジング)は共通の認知資源を共有。
  • 自己他者評価を統一的にモデル化する可能性。
 3. 情動のメタ認知
  • 感情状態に対する信頼度評価や自己認識の精度もメタ認知の一種。
  • 不安・うつなどとの関連や、内受容メタ認知の重要性が強調される。
6. 結論
 • 信頼度の測定モデルは重要だが、それだけではメタ認知の全体像を捉えきれない。
 • より幅広い構成概念を回復しつつ、測定の厳密性を保持することで、基礎・応用の両面においてメタ認知研究を前進させられる。

要旨(Abstract)

 メタ認知心理学の基礎的研究は、「メタ認知的知識」(自分の能力に関する安定した信念)と「メタ認知的経験」(遂行に対する局所的評価)との区別を明らかにした。近年では、パフォーマンスに対する瞬間的な信頼度の推定からメタ認知能力を特定し、メタ認知の失敗を精密に記述する計算モデルの開発に焦点が当てられている。しかしながら、メタ認知判断のモデル化が進展する一方で、メタ認知心理学におけるより広範な要素――たとえば、安定したメタ知識がどのように形成されるか、社会的認知とメタ認知がどのように相互作用するか、また、明確な「正解」が存在しない情動状態をどのように評価するか――が無視される可能性も生じている。我々は、メタ認知研究において構成概念の幅広さを回復しつつ、測定の厳密性も維持できると提案し、メタ認知研究の射程を拡張するための有望な方向性を示す。本論で提案する研究プログラムは、信頼度やパフォーマンスモニタリングにおける心理物理学的な厳密性を保持しながら、メタ認知的知識や経験の質的側面を再び捉えるための好機を提供する。

1. はじめに(Introduction)

 メタ認知とは、意思決定、記憶、知覚といった一次的な認知プロセスを内省し、評価し、制御する能力を指す。メタ認知の正確性――しばしば主観的な自信が客観的なパフォーマンスをどれだけ反映しているかによって評価される――は、さまざまな状況における柔軟で適応的な行動の基盤とされており、メタ認知の機能不全は、教育や臨床、社会的協調において悪影響を及ぼすことが知られている。
 メタ認知の神経科学研究は近年急速に進展しており、自己評価に関与する下位レベルのメカニズムに関する知見が増えてきている。この領域では、自信(あるいは逆に誤りの認識)の形成が、一次的なパフォーマンスを追跡する典型的なメタ認知操作と見なされている。たとえば1980年代には、単純な記憶課題におけるパフォーマンスに関して、メタ認知が損なわれているにもかかわらず記憶自体の成績は保たれているという患者の症例が報告され、メタ認知能力には特有の神経的基盤が存在することが示唆された(Janowsky, Shimamura, & Squire, 1989; Shimamura & Squire, 1986)。
 2000年代初頭以降、機能的脳画像法や動物モデルを用いた自信に関する研究が発展し、メタ認知とパフォーマンスモニタリングに関与する神経的・計算的プロセスへの関心が急増した(Rouault, McWilliams, Allen, & Fleming, 2018; Fleming & Dolan, 2012; Kepecs & Mainen, 2012; Meyniel, Sigman, & Mainen, 2015 を参照)。
 本論の目的は、この広大な文献を網羅的にレビューすることではなく、メタ認知の神経科学の厳密な探求が、元来のメタ認知概念に含まれていた興味深い側面のいくつかを無意識のうちに捨象してしまっている可能性を批判的に論じることである。まず、メタ認知の測定に関する歴史的な視点を簡単に紹介し、測定法の進歩がいかにして新たな神経科学的知見をもたらしたかを概観する。そのうえで、測定の厳密性が、メタ認知神経科学における問いの射程を狭めてしまっていないかを批判的に検討する。最後に、現代の信頼度やパフォーマンスモニタリング研究を特徴づける心理物理学的厳密性を保持しつつ、元来の心理学的構成概念としてのメタ認知的知識と経験の質的特徴を再び捉えるための方法を提案する。

2. メタ認知研究の射程(The scope of metacognition research)
 メタ認知の研究は、1970年代から80年代にかけて、発達、教育心理学、神経心理学の文脈の中で注目を集めた(レビューは Flavell, 1979; Metcalfe, Metcalfe, & Shimamura, 1994; Nelson & Narens, 1990 を参照)。これは、子どもたちが自分の能力をどのように評価するかが学習の指針となること、そしてその自己評価がしばしば成人よりも正確ではないことが認識されたことに起因している。
 たとえば Flavell(1979)は、その著名な論文「Metacognition and Cognitive Monitoring: A new area of cognitive-developmental inquiry」の冒頭で次のような教室でのエピソードを紹介している。「…年長の生徒はある程度勉強した後、『準備ができた』と言い、実際に完璧な再生ができることが多かった。一方、年少の子どもは同様に『準備ができた』と言っても、実際にはそうでないことが多かった」。このエピソードが示すように、メタ認知の中核的特徴は、個人が現在の遂行状況に関して信念を抱くことであり、その信念が次に取る行動に影響を与えるという点にある。
 このように考えると、メタ認知は人間の精神生活における広範な側面を成し、一次的な認知プロセスを補完する役割を果たしている。この視点に立てば、正確なメタ認知は広範な機能的利点を伴うべきであると考えられる(Nelson & Narens, 1990)。たとえば、ある科目の試験準備をするとき、学生がどれだけ時間と労力を注ぐかは、彼らのその科目に対する熟達度や記憶保持能力に関する信念(他の要因と共に)によって左右される。逆に、勉強が十分だと誤って信じてしまえば、実際の能力は足りていても、過剰な自信によって試験で失敗する可能性がある。
 こうした観点から、最近の研究では、メタ認知操作の正確性と流動性知能テストでの成功との間に繊細な相互関係があることが強調されている(Bocanegra, Poletiek, Ftitache, & Clark, 2019; Bulley & Schacter, 2020; Fandakova et al., 2017)。
 Flavell(1979)はさらに、「メタ認知的知識(または信念)」――「自分自身や他者がどのような認知的処理者であるかについて、信じ得るすべてのこと」――と、「メタ認知的経験」――自己の認知過程に対するオンラインの感覚や意識的経験――を区別するという理論的枠組みを提案した。メタ認知的知識は、個人要因(例:自分は兄よりテニスが上手いという信念)と課題要因(例:自分はゴルフよりテニスが得意だという信念)に分けて考えられる。さらに Flavell は、知識と経験の間には繊細な相互作用があると述べている。たとえば、物理の試験中にある問題に答えられないという「不流暢さ」や「自信のなさ」を経験したことで、自分の物理に対する適性に関する信念(知識)を更新し、将来的に物理を選択しないという判断に至る可能性がある(これはメタ認知的制御の一例である)。
 このあとのセクションでは、メタ認知的評価――メタ認知的知識と経験の両方を広く含む概念――に焦点を当てる。この評価は、近年になって実証的測定法が急速に発展してきたものである。なお、我々はここではメタ認知的制御――行動の指針としてのメタ認知的評価の役割――については扱わないが、これはメタ認知研究のより広範な分野において同様に重要な研究対象である。

3. メタ認知測定の簡単な歴史(A brief history of metacognitive measurement)
 メタ認知判断を引き出す自然な方法のひとつが、自己報告式の質問票である。こうした手法は、自己の遂行能力に関する全般的な信念を評価するものであり、たとえば Metamemory in Adulthood(MIA)や Memory Functioning Questionnaire(MFQ)は、記憶能力に関する自己信念の記録に使われる(Dixon, Hultsch, & Hertzog, 1988; Gilewski, Zelinski, & Schaie, 1990)。しかしながら、こうした自己報告方式は、測定しようとしているメンタル機能に対するメタ認知的自覚を前提とするため、メタ認知能力そのもの――すなわち、自分の評価が実際のパフォーマンスをどれだけ正確に反映しているかという第二次的性質――を測定するには不安定である。
 たとえば、MIA には「1年前と比べて自分の記憶はどうですか?」というような質問が含まれている。こうした質問に対しては、記憶力が良くメタ認知も正確な人だけでなく、記憶力もメタ認知能力も低い人からも高い自己評価が得られる可能性がある。なぜなら、後者のような人は自分の低い記憶能力を正確に評価できないため、定義上、そのような自己評価をしてしまうからである。
 このような問題を避けるための別のアプローチとしては、自己のパフォーマンスに関する一度きりの評価と、実際のパフォーマンス(あるいは臨床研究では介護者による評価)とを比較する方法がある。しかし、この「乖離スコア」では、評価のバイアス(たとえば自己評価の平均が高い傾向)とパフォーマンス感度(実際の成績と評価の対応度)を区別することができない(Fleming & Lau, 2014)。つまり、もし誰かが記憶能力を大幅に過大評価している場合、それがメタ認知の低さによるのか、あるいは単に高い評価をつける傾向があるだけなのかは不明である。そのため、メタ認知能力を測定するには、一次的パフォーマンスが測定・制御されている間接的かつ課題ベースの手法が必要である。
 メタ記憶に関する初期研究では、課題ベースのメタ認知の定量化が進められ、被験者のメタ認知判断(たとえば自信評価や「知っている感覚」)と一次的パフォーマンスの関係を、複数の試行を通じて評価する手法が開発された(Clarke, Birdsall, & Tanner, 1959; Hart, 1965)。なお、心理物理学の伝統においては、このような信頼度を課題として扱う以前から、同様の評価が研究されていた(Henmon, 1911; Peirce & Jastrow, 1884)。
 これらの研究では、被験者が複数回にわたって自己評価を行うことで、低い/高い自信と客観的パフォーマンスの関係性が統計的に明らかにされる。Nelson & Narens(1990)はこのような方法論について、「人間は自らの内的プロセスを測定する不完全な測定器としてみなされる」と述べている。
 こうした手法により、「知っている感覚(FOKs)」、「学習の見込み判断(JOLs)」、および第一次判断に対する「遡及的な自信評価」など、さまざまな種類のメタ認知判断の正確性を定量化することが可能になった。その後、これらの多くの判断タイプは、別の認知過程に対する信頼度の「前向き」または「後ろ向き」判断として計算モデルにより形式化できることが認識された(Fleming & Dolan, 2012; Kepecs & Mainen, 2012; Meyniel et al., 2015; Pouget, Drugowitsch, & Kepecs, 2016; Yeung & Summerfield, 2012)。こうして、「信頼度」はメタ認知研究における中心的変数となった。
 このようにして、「信頼度に基づくメタ認知アプローチ」と、「心理物理学に基づく詳細なパフォーマンス制御アプローチ」が結びつき、新たな研究の潮流が生まれた。心理物理学が視覚研究に重点を置いてきたことから、「視覚的メタ認知」という新たな分野が形成された(Mamassian, 2016; Rahnev et al., 2022)。ただし、ここで開発された手法は、聴覚、嗅覚、触覚、内受容、記憶、意思決定など、他の領域にも応用可能であり、実際に幅広く使われつつある(De Martino, Fleming, Garrett, & Dolan, 2013; Faivre, Filevich, Solovey, Kühn, & Blanke, 2018; Gardelle, Corre, & Mamassian, 2016; Legrand et al., 2022; Harrison et al., 2021; Jönsson & Olsson, 2003)。ここで重要なのは、信頼度判断の統計的性質とそれが客観的パフォーマンスとどのように関係するかを記述する新たな枠組みが急速に発展したという点である。
 メタ認知の測定における中心的な課題は、他の交絡要因に影響されない「純粋な」メタ認知指標をどのように確保するかという点である。これは特に困難である。なぜなら、メタ認知は本質的に、完全には制御されていない一次的認知プロセスの影響を受けるからである(Peters, 2022)。したがって、メタ認知過程に関する確実な推論を行うには、たとえば知覚や学習に関する実験と同様に刺激入力を制御するだけでなく、一次的パフォーマンスの変動も適切に制御・モデル化する必要がある。実際、過去15年間の方法論的進展は、まさにこのパフォーマンス交絡の精密な制御を追求するものであった。
 初期の課題ベース手法では、精度と信頼度の相関を示す phi(φ)係数や、Goodman-Kruskal のガンマ係数(Goodman & Kruskal, 1979; Nelson, 1984)といった相関指標が用いられていた。これらの相関係数の利点は、どのような課題にも適用できることである。ただし、これらの指標は、メタ認知能力(以降「メタ認知感度」と呼ぶ)と一次的パフォーマンスや信頼度バイアス(平均的に高い/低い信頼度をつける傾向)の変化を区別できないという問題を抱えている(Fleming & Lau, 2014; Masson & Rotello, 2009)。
 この問題を克服する進展として、信号検出理論(SDT)に基づいた ROC(受信者動作特性)解析が導入された。標準的な(タイプ1)ROC 曲線の下の面積(AUROC)が、被験者の反応が2つの世界状態(例:刺激の有無)をどれだけ識別できているかを示すのと同様に、タイプ2 ROC の下の面積(AUROC2)は、信頼度が正誤の試行をどれだけ識別できるかを示す(Clarke et al., 1959; Galvin, Podd, Drga, & Whitmore, 2003)。AUROC2 は、バイアスのないメタ認知感度の簡潔な指標であり、1つの数値で被験者のメタ認知感度を示すことができる。
 ただし、AUROC2 は信頼度バイアスには依存しない一方で、一次的パフォーマンスの変化には依然として感受性を持っている。そのため、AUROC2 をメタ認知の指標として使用する際には、条件間または被験者間でパフォーマンスを慎重に一致させる必要がある(Fleming, Weil, Nagy, Dolan, & Rees, 2010; Song et al., 2011)。
 この問題をさらに克服した大きな進展が、Maniscalco & Lau(2012)による meta-d′ モデルの開発である。このモデルでは、被験者の AUROC2 に最適に適合する感度パラメータを信号検出理論に基づいて推定する。このパラメータは一次的パフォーマンスではなく信頼度評価に基づいているため、meta-d′ と呼ばれる。AUROC2 の値が高いほど、meta-d′ の値も高くなる。
 このアプローチの優れた点は、meta-d′ が一次的パフォーマンスの感度指標である d′ と同じ単位であるため、それらの比(meta-d′/d′)によって、パフォーマンスに依存しないメタ認知能力――「メタ認知効率(metacognitive efficiency)」――が得られる点にある。この比率は通常 Mratio と呼ばれ、ゴールドスタンダードな指標として、多くの実証研究で使用されている。たとえば、メタ認知の神経相関の特定(Fleming, Ryu, Golfinos, & Blackmon, 2014; McCurdy et al., 2013; Shekhar & Rahnev, 2018; Ye et al., 2018; Zheng et al., 2021)、メタ認知効率のドメイン一般性の研究(Fitzgerald, Arvaneh, & Dockree, 2017; Mazancieux, Fleming, Souchay, & Moulin, 2020; Morales, Lau, & Fleming, 2018)、メタ認知訓練の効果の定量化(Carpenter et al., 2019; Rouy et al., 2022)などが挙げられる。
 さらに近年では、meta-d′ モデルの階層的バージョンも開発され、臨床研究など個々の被験者あたりのデータが限られている場合でも、より正確な群レベル推論が可能になっている(Fleming, 2017)。
 これらの指標やモデルの洗練は現在も続いている。たとえば、Mratio が信頼度バイアス(平均的な自信レベル)の影響を受けないという前提は、近年の研究によって疑問視されている。すなわち、より高い信頼度評価を用いることで Mratio の値が人為的に高まってしまう可能性がある(Shekhar & Rahnev, 2021b; Xue, Shekhar, & Rahnev, 2021)。
 同様に、Mratio が一次的パフォーマンスとは無関係であるという前提も、シミュレーションおよび実証研究の両方で検証されており、この関係に非線形性が存在することから、より安定した心理測定的特性を持つ新しいモデルベース指標が開発されている(Barrett, Dienes, & Seth, 2013; Guggenmos, 2021, 2022)。
 さらに、一次的パフォーマンスを制御するために広く用いられるステアケース手法が、Mratio を人為的に高めてしまうことも指摘されている(Rahnev & Fleming, 2019)。これは、タスクの難易度に変化を与えることで、その変化自体が信頼度判断の手がかりとして利用されてしまい、内発的なメタ認知効率の推定を妨げるためである。
 また、meta-d′ フレームワークは、信頼度評価がどのように生成されるかという過程モデルではないため、メタ認知的非効率性の原因を区別することができないという限界もある(Shekhar & Rahnev, 2021a)。これは、視覚科学者が特定の d′ をもたらす構成過程を探るのと同様に、メタ認知研究者も信頼度形成に関わる段階を分解するため、より豊かな計算モデルへと向かいつつあることを意味している(Bang & Fleming, 2018; Boundy-Singer, Ziemba, & Goris, 2022; Guggenmos, 2022; Shekhar & Rahnev, 2018)。
 ここで注目すべきなのは、信頼度が、意思決定基準や境界からの距離といったヒューリスティックを反映しているのか(Kepecs et al., 2008; Vickers, 1979)、それとも感覚的不確実性に敏感なベイズ的または準ベイズ的処理であるのか(Adler & Ma, 2018; Aitchison & Lengyel, 2017; Denison et al., 2018; Li & Ma, 2020)という点である。
 これらの文献を本稿で網羅的にレビューすることは目的ではないが、信頼度形成に関わる多様な処理段階を考慮し、それらの精度からメタ認知能力(meta-d′など)を説明するアプローチが今後の有望な方向性とされている(Boundy-Singer et al., 2022; Geurts et al., 2022; Bang & Fleming, 2018; Desender et al., 2021; Fleming & Daw, 2017)。
 最後に、局所的な信頼度形成が時間とともにどのように展開されるか、またその過程に影響を与えるグローバルな事前信念がどう構成されるかという研究(Desender et al., 2022; Marcke et al., 2022; Pleskac & Busemeyer, 2010)も進んでいる。こうした処理段階を解明し、より詳細な計算論的なメタ認知モデルを確立することが、今後の主要な目標となっている(Rahnev et al., 2022)。

4. メタ認知神経科学における構成概念の広がり

 前節の簡潔な歴史的レビューから明らかなように、メタ認知研究の分野は、この15年ほどで、行動レベルの信頼度から比較的「純粋な」メタ認知能力の指標を導き出すことに成功し、それをもとに、計算的・神経的な水準でこの能力を支えるプロセスモデルの開発へと進んできた。これは、極めて印象的な成果であり、急速な進展によって可能となったものである。
 我々はこの進展を全面的に支持しており、実際に上述した方法やモデルの開発に深く関わってきた。しかし同時に、研究が深く掘り下げられるにつれて、「掘る井戸」が狭くなりすぎないよう注意すべきだと警鐘を鳴らしたい。
 メタ認知の定量化が洗練されるにつれ、元来、社会心理学や発達心理学の文献で強調されてきたメタ認知の多様性や機能のいくつかが、失われてしまう危険がある。また、心理学的構成概念がある特定の課題や測定指標において操作的に定義されると、その時点で「構成概念の科学」から「課題や指標の科学」へと変質してしまう可能性がある。これにはいくつかの問題がある。
 まず1つは、機会費用である。研究者は、信頼度のモデル化にますます多くの時間と資源を費やすことで、メタ認知の他の未開拓な側面を無視してしまうかもしれない。もう1つは、**概念のスリップ(conceptual slippage)**である。たとえば meta-d′ のようなモデルや指標を、実際にはそれらによって適切に測定されない別のメタ認知側面の評価に用いてしまうことで、誤った推論が導かれる可能性がある。
 より広く言えば、精密かつ明確に定義されたメタ認知の1側面だけに理論的焦点を当て続けると、理論そのものが偏狭になり、メタ認知研究の外的妥当性が損なわれる恐れがある。我々は、信頼度形成モデルに基づく研究の進展を否定するつもりは全くないし、以下ではその利用価値を積極的に擁護する。ただし、現在の手法では、人間のメタ認知が持つ豊かさの多くがまだ捉えられていないことも確かであり、これは新たな研究機会につながる。
 では、なぜ信頼度(およびその感度指標である meta-d′)はメタ認知研究においてこれほどまでに重要な変数とされてきたのか?その単純な理由は、信頼度や不確実性は、別の(一時的な)量に対する二次的な性質であり、自己の疑念や確信の強さを表すという点にある。
 この「疑念」はしばしば外部の出来事に関するものである。たとえば、「マンチェスター・ユナイテッドがプレミアリーグで優勝するかどうか」「今年中に金利が上がるかどうか」といったことに対する自信度である。しかし、信頼度が自己の認知的・身体的行動に向けられる場合、それは自己に対する疑念となり、自己の判断に対する判断――すなわち典型的なメタ認知的操作――となる。

Peter Carruthers はこのことを次のように説明している:

「私は画面上の9本の線の中で最も長いのは左端の線だと判断したが、同時に私はそれについて確信が持てないとも判断している。このことは、『左端が最長かどうか分からない』という無知を意味するわけではない。なぜなら、私はそれが最長だと今まさに判断しているからである。むしろ、これは『その判断自体が間違っている可能性がある』と自分で判断していることになる」

(Carruthers, 2011, p. 283)

 このように、自分自身の遂行に関する明示的な信頼度判断は、まさに「自己の判断を判断する」メタ認知的操作の典型であり、それがパフォーマンスとどれほど連動しているか(メタ認知感度)という点は、メタ認知能力を評価するうえで非常に有用な指標となる。
 このように、メタ認知を「信頼度」として操作化し、meta-d′ のような指標で評価することには明確な利点がある。しかしこのアプローチには限界もあり、特に以下のような側面には対応しきれていない:
 • より長期的なスケールで形成されるメタ認知的判断
 • 一次プロセスに明確な「正解」が存在しないような状況(たとえば情動状態)におけるメタ認知評価

この限界に対処するため、次節ではメタ認知研究の射程を拡張するための新しいアプローチを提案する。

図1の説明:メタ認知の広がり(Fig. 1 – The breadth of metacognition)
 図1 は、メタ認知の評価が持つ多次元的な構造を視覚的に表したものである。図には以下の要素が示されている:
• 局所的評価(local)とグローバルな評価(global)
 緑の矢印は、特定のタスクの1つのインスタンスに対する局所的な信頼度判断を示す。これに対してオレンジの矢印は、より長期間にわたる自己パフォーマンスの統合的評価、すなわちグローバルな自己信念を表している。
• 時間軸(prospective vs. retrospective)
 矢印のスタイル(実線 vs. 点線)は、評価が将来に向けた予測(前向き)か、過去のパフォーマンスに対する評価(後ろ向き)かを区別している。
• 他者評価(other-evaluation)
 青い矢印は、他者に対するメタ認知評価――つまり、他者の意思決定や感情、能力に対する信頼度の評価――を表している。
• 影響要因(contextual factors)
 図内のテキストボックスには、メタ認知評価に影響を与える要因(たとえば動機づけ、感情状態、記憶など)が記されており、これらの要因が自己および他者への評価に影響する可能性が示唆されている。

この図は、メタ認知が単なる一時的な信頼度評価にとどまらず、時間、対象(自己/他者)、スコープ(局所/全体)といった複数の次元をまたいで展開されることを強調している。

5.1. 局所的メタ認知とグローバルなメタ認知(Local and global metacognition)

 ほとんどの信頼度研究では、個々の試行やタスクのインスタンスにおける「局所的(local)」な遂行判断に焦点が当てられてきた。これに対し、社会心理学や判断・意思決定の研究では、人々が自分自身をよりグローバルにどのように評価するか――たとえば、自分の運転スキルや知的能力の相対的ランクづけ――が問題とされてきた(Bandura, 1977; Dunning, Heath, & Suls, 2004)。こうしたグローバルな推定は、より長期間にわたる遂行に基づく自己信念であり、Flavell のいう「メタ認知的知識」に近い。
 しかし現在、メタ認知的知識の研究においては、理論的枠組みやツールキットの整備が遅れている。我々は、こうした発展を、信頼度(局所的なメタ認知経験)に関する理解の進展と統合する形で進めるべきだと主張する。なぜなら、局所的な経験が、豊かなメタ認知的知識の形成に寄与する可能性があるからである。
 最近 Seow, Rouault, Gillan, & Fleming(2021)は、局所的メタ認知とグローバルなメタ認知は別個のものではなく、階層構造の中で相互作用するものとして捉えるべきだと提案した。たとえば、ある学生がテスト中の特定の問題に自信を持てた場合(局所的判断)、その感覚が全体の出来に関する評価(グローバルな判断)に影響を与え、それがさらに自分の学力(さらにグローバルな判断)に対する信念に影響を及ぼすという具合である。
 グローバルメタ認知の欠如と関連付けられてきた有名な現象に、ダニング=クルーガー効果(Dunning-Kruger effect) がある(Kruger & Dunning, 1999)。この効果では、パフォーマンスが低い人ほど、自分の成績を過大評価する傾向がある。この現象の一因としては、局所的なパフォーマンスの変動をうまく捉えるスキルがないことが挙げられている。
 この仮説は最近、局所的な信頼度形成とグローバルな成績評価を結びつける計算的アプローチを通して検証されている(Jansen, Rafferty, & Griffiths, 2021; McIntosh, Moore, Liu, & Della Sala, 2022)。Jansenら(2021)は、被験者が正誤をノイズのある表現として保持するベイズモデルを開発し、パフォーマンスが低い人はベースラインへの回帰により自己評価が高めに出ること、すなわちメタ認知的欠陥がなくてもダニング=クルーガー効果が生じることを示した。加えて、パフォーマンスとメタ認知ノイズの関係に非線形性があることも報告された。
 また、McIntoshら(2022)は、局所的なメタ認知効率を測定するタスクベース手法を用い、メタ認知能力の個人差がダニング=クルーガー効果に一部関与しているが、それだけでは説明しきれないことを示した。
 最近では、局所的およびグローバルな信頼度の相互作用を研究するための実験課題も開発されている(Cavalan, Vergnaud, & de Gardelle, 2023; Lee, de Gardelle, & Mamassian, 2021; Rouault, Dayan, & Fleming, 2019)。たとえば Rouaultら(2019)は、知覚課題中の局所的信頼度の変動が、ブロック終了時のグローバルな自己評価を予測することを発見した。特に、信頼度はグローバル判断の必要十分条件であり、信頼度を考慮したあとは、正答率や反応時間の変化はグローバル評価に影響しなくなった。
 fMRI を用いた Rouault & Fleming(2020)の研究では、腹側線条体(ventral striatum)の活動がグローバルな自己信念を反映し、一方で ventromedial prefrontal cortex(vmPFC)は局所的信頼度と、グローバル信念のレベルに応じた変調を示した。これは、vmPFC が局所的信頼度を時間的に統合し、全体的な自己評価を形成する役割を持つことを示唆しており、他の研究結果とも一致している(Wittmann et al., 2016)。
 他の研究では、特に強迫行動のような精神症状との関連において、局所的メタ認知とグローバルメタ認知の間に興味深い乖離があることが示されている。たとえば Hoven, Luigjes, Denys, Rouault, & van Holst(2023)は、強迫傾向の度合いが局所的な信頼度とは正の関係にある一方で、グローバルな信頼度とは負の関係にあることを見出した。これは Rouault, Seow, Gillan, & Fleming(2018)の研究を再現する形で、強迫性障害(OCD)が過剰な局所的自信過小なグローバル自信の組み合わせで特徴づけられるという先行知見と一致している。
 こうした結果は、精神的健康に関連する症状がメタ認知の異なる側面(局所 vs. グローバル)に対して異なる影響を及ぼしうることを示唆している。
 さらに、グローバルなメタ認知階層の上位レベルは、時間的に拡張されているだけでなく、複数の認知過程・能力を統合するという幅広いスコープも持ちうる。つまり、階層の上に行くほど、信頼度評価は異なる感覚モダリティや課題領域をまたいで統合される可能性がある。
 その結果、内受容処理(interoceptive processing)の変化が、他の知覚や認知領域に対する(グローバルな)自己信頼感に影響を及ぼすこともある(Allen et al., 2016; Stephan et al., 2016)。同時に、グローバルな自己信念の変化が、タスク間での信頼度の「漏れ(leak)」――あるタスクでの自信が別のタスクでの自信に影響を与えること――を媒介する可能性もある(Rahnev et al., 2015)。
 階層のさらに上位レベルでは、より幅広く、ドメインに特化しない自己信念が、自己肯定感や自己価値感といった感情的な自己評価に影響を与えると考えられる(Rouault, Will, Fleming, & Dolan, 2022)。
 このように、局所的およびグローバルなメタ認知に関する研究は、Flavell もかつて指摘したように、メタ認知的経験とメタ認知的知識が必ずしも完全に分離された構成要素ではなく、むしろ連続体である可能性を示唆している。より安定した自己信念(メタ認知的知識)は、局所的な信頼度評価を長期間にわたって統合することによって形成されるのかもしれない。
 こうした信念の階層的保持は、「予測処理(predictive processing)」に基づく階層モデルにおいて自然な帰結である。予測処理モデルでは、階層の上位はより遅く変化する事前信念を提供し、下位の階層(感覚入力と密接に結びつく)を調整する。こうした階層においては、それぞれの信念の**精度(confidence)**もまた推定される必要がある。これは、トップダウンとボトムアップのバランスを調整するためである(Yon & Frith, 2021)。
 この観点からは、上位階層での精度推定こそが、ドメインを超えた自己信念――たとえば自己の運動能力や知覚精度に対する信頼感――を構成するという仮説も立てられる。とはいえ、こうした仮説的なメタ認知階層の各レベルがどのように関係しあっているかという精密なメカニズムや計算モデルは、まだ確立されていない。
 この目標に向けた一歩として、Rouault et al.(2019)は、グローバルな自己評価を、複数の局所的信頼度やフィードバックを確率的に統合するモデルとして定式化した。このモデルによれば、グローバル評価と真のパフォーマンスの乖離は、局所的なタスク経験の不足に起因する不確実性から生じる。したがって、局所的な試行数が増えれば、グローバル評価の精度も向上するはずである。
 こうしたモデルは、自己報告方式の測定における循環的な限界を克服できる。ここでは、グローバルなメタ認知能力を、真の遂行(統合的なパフォーマンス)に対する自己評価の不確実性として推定する(Cavalan et al., 2023; Katyal, Huys, Dolan, & Fleming, 2023; Lee et al., 2021; Rouault et al., 2019)。
 さらにこれらのモデルは、グローバルメタ認知の形成におけるさまざまなバイアスや歪みも説明可能である。たとえば我々は最近、このモデルを拡張し、不安・抑うつ傾向を持つ個人において、グローバルな自己信頼の過小評価がどのように維持されるのかを調べた(Hoven et al., 2023; Rouault, Seow, et al., 2018)。
 パフォーマンスフィードバックを操作することで、グローバルな自己信頼の低下が以下のどの要因によるかを検証した:
 • ポジティブなフィードバックよりネガティブなフィードバックに強く反応する(a)
 • 高い信頼度より低い信頼度に強く反応する(b)
 • 単純なネガティブな反応バイアス(c)

 その結果、不安・抑うつ傾向が高い人は、(a)や(c)ではなく、局所的な低信頼度に対して過敏であることが、グローバルな信頼評価の形成における歪みと関連していた。つまり、精神症状は局所的・グローバルなメタ認知の相互作用の歪みによって説明できる可能性がある。
 今後は、こうしたモデルをさらに拡張し、異なる課題や認知領域間での統合(例:複数タスクを横断するグローバル信念)を取り込むことで、人格特性や精神的健康に関連する自己信念の歪みを計算論的に説明できる可能性がある。

5.2. 自己評価と他者評価の対称性(Symmetries between self- and other-evaluation)

 メタ認知的知識のより広い側面を探究する上で魅力的な方向性のひとつが、「自己に対する知識形成」と「他者に対する知識形成」に関わるプロセスの対称性(あるいは非対称性)を検討することである。
 社会心理学には、他者の特性や心的状態をどのように表象するかという豊かな研究の伝統がある(Baron-Cohen, 1991; Gallagher & Frith, 2003)。そしてこれまでに、「自己に向けられるメタ認知は、他者に関する知識を維持・更新するための心の理論(theory of mind)能力に部分的に依拠している」という仮説がたびたび提案されてきた(Carruthers, 2009, 2011; Vaccaro & Fleming, 2018)。
 この見方を間接的に支持する証拠として、発達心理学の研究がある。これらの研究では、自分自身のパフォーマンスを信頼度で明示的にモニタリングする能力は、子どもが心の理論テストに合格し始める4〜5歳頃に獲得されることが報告されている(Hembacher & Ghetti, 2014; Lockl & Schneider, 2007)。
 さらに最近の研究では、自閉スペクトラム症(ASD)を持つ被験者が、他者の心を読む(メンタライジング)課題と、自己に向けられたメタ認知効率を測定する課題の両方で困難を示すことが明らかにされている(Johnstone, Friston, Rees, & Lawson, 2022; Nicholson, Williams, Lind, Grainger, & Carruthers, 2021; van der Plas et al., 2021)。ただし、Embon et al.(2022)のようにその関連を否定する研究もある。
 たとえば、Nicholson et al.(2021)は、被験者が同時に2つの課題をこなす場面で、メンタライジング課題(他者の心を読む)は自己メタ認知課題における信頼度判断の精度を低下させる一方で、同程度の認知負荷を持つ非メンタライジング課題ではそのような干渉が見られないことを示した。これは、自己メタ認知と他者の心を読む能力が共通の認知資源を共有していることを示唆している。
 とはいえ、これまでの研究の多くは、メンタライジングとメタ認知効率を**それぞれ独立に測定する指標(off-the-shelf metrics)**を使用しており、両者に共通する計算的基盤を明示的に検討する試みは限られている(ただし、Bang et al., 2022; Patel et al., 2012; Trudel et al., 2021 を参照)。
 今後の有望な研究方向として、我々自身と他者のパフォーマンスに関して、局所的およびグローバルなメタ認知評価を複数の異なる領域にまたがってどのように構築するのかを検討することが挙げられる。
 局所的な信頼度判断の形成には、刺激の不確実性や反応の流暢さといった個人的・内的な手がかりへの直接的アクセスが必要であるため、他者に対する判断ではこれらの情報が利用できず、自己と他者では信頼度形成のメカニズムが大きく異なる可能性がある(Bang et al., 2022)。
 一方で、反応時間のような外部に観察可能な手がかりは、自己・他者の両方に対するメタ認知に共通して用いられる可能性があり、この場合には、自己評価と他者評価に共通する処理が存在する可能性がある(Patel et al., 2012)。

5.3. 情動に関するメタ認知(Affective metacognition)

 メタ認知研究の射程を拡張するためのもうひとつの方向性は、知覚や記憶、意思決定といったタスク主導の認知ドメインから離れ、内的状態――とくに情動――に関するメタ認知を扱うことである。こうした状態においては、自己評価には正解や間違いが存在しない。そのため、感情や情動に関するメタ認知判断を測定することは特に困難である。
 たとえば、「私はいま不安だ」と感じることはメタ認知的判断であるが、それがどれほど正確かを評価するための**客観的な基準(ground truth)**は存在しない。さらに、被験者は自分の情動状態を報告する際に、正確なメタ認知的知識を有していない可能性もある(Kircanski, Lieberman, & Craske, 2012)。
 それでも、メタ認知的自己評価がこうした状態にも及ぶことは明らかである。たとえば、「私は何に対しても興味が持てない」、「私は自分の気分をうまくコントロールできない」というような判断は、まさにグローバルなメタ認知的自己信念である。
 精神疾患の多くは、こうした情動に対する自己信念の歪みに関係しているとされる(Beck, 1967; Clark, Beck, & Alford, 1999)。うつ病や不安障害では、ネガティブな自己評価が反復的に生じる。これは、「感情に関するメタ認知(affective metacognition)」の重要な構成要素である。
 臨床心理学においても、情動のメタ認知が重要視されている。たとえば、「自分の心配が制御不能である」「自分の不安が永続する」といったメタ認知的信念は、不安障害や強迫性障害に特徴的である(Wells, 2000)。
 さらに、「感情認識の精度(emotional granularity)」――自分の情動状態を細かく区別して記述する能力――は、より良い情動調整や心理的適応に関連することが示されている(Barrett, 2004; Kashdan, Barrett, & McKnight, 2015)。
 近年の研究では、情動状態に関する信頼度の定量化を試みたものもある。たとえば、Rouault, Seow, et al.(2022)は、被験者に特定の不安誘発的刺激を提示し、それに対する主観的な「不安レベル」の評価と、その評価に対する信頼度を同時に報告させるという手法を用いた。
 その結果、一般的に人々は情動状態に対する信頼度評価を可能であり、さらにこの能力には個人差が存在し、それが情動調整スキルや不安傾向と関連していることが分かった。
 また、感情に関する信頼度判断も、信号検出理論的枠組みで定量化できる可能性がある。すなわち、ある刺激に対する「不安」や「嫌悪」などの判断と、それに対する信頼度の関係をモデル化することができる(Rouault, Seow, et al., 2022)。
 この研究は、**「内受容メタ認知(interoceptive metacognition)」**という新たな研究領域にもつながっている。これは、心拍、呼吸、内臓感覚などの身体内部感覚に関する自己評価や信頼度判断を扱う分野である(Garfinkel, Seth, Barrett, Suzuki, & Critchley, 2015; Harrison, Garfinkel, Marlow, Finnegan, & Critchley, 2021)。
 内受容メタ認知の正確性は、情動調整や精神的健康の維持と密接に関係しており、たとえばパニック障害や心身症ではこの能力の低下が報告されている(Smith, Kuplicki, Feinstein, Forthman, & Paulus, 2021)。
 今後の研究では、情動や内受容におけるメタ認知の正確性を、課題ベースでモデル化し、神経基盤を特定する試みが期待されている。

6. 結論(Conclusion)

 メタ認知の神経科学は、計算的および心理物理学的な厳密性に基づいて飛躍的に進展してきた。この進展によって、意思決定における自信の構成メカニズムに関する理解が深まり、自己評価能力を支える神経回路や計算原理が明らかにされてきた。
 しかし同時に、この厳密性の追求は、メタ認知が元来持っていた**幅広い構成概念(construct breadth)**の一部を見失う危険性もはらんでいる。我々は、信頼度を中心とした「メタ認知経験」の計測の洗練と同時に、「メタ認知的知識」――とくに、自己および他者に関するグローバルな自己信念や、感情状態に関する評価――を取り戻す必要があると主張する。
 本稿では、局所的およびグローバルなメタ認知、自己および他者に向けられたメタ認知、さらに情動的・内受容的状態に関するメタ認知といった、構成概念の多様性を回復するための研究の道筋を示した。
 我々の主張は、従来のメタ認知測定法を否定するものではなく、それらを土台としたうえで、さらに拡張された枠組みの中に位置づけようとするものである。信頼度の心理物理学的厳密性を保持しつつも、その理論的適用範囲を広げ、自己の多様な側面(記憶、意思決定、情動など)にわたって一貫した自己評価がどのように形成されるのかを解明する必要がある。
 こうした研究プログラムは、メタ認知研究にとって重要な基礎を提供するだけでなく、精神的健康、教育、社会的意思決定といった応用分野にも直接的な貢献をもたらす可能性がある。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です