レジュメ:質的インタビュー研究におけるサンプルサイズ:情報力に基づく指針

Malterud K, Siersma VD, Guassora AD. Sample Size in Qualitative Interview Studies: Guided by Information Power. Qual Health Res. 2016 Nov;26(13):1753-1760. doi: 10.1177/1049732315617444. Epub 2016 Jul 10. PMID: 26613970.

背景(Background)

質的研究者は、研究計画段階、研究プロセス中、そして最終的な分析や出版において、サンプルサイズを評価するためのツールを必要としている。量的研究では、統計的パワー計算によって必要なサンプルサイズが決定されるが、質的面接研究には同様の標準は存在しない。

既存のレビューによれば、質的研究におけるサンプルサイズやその根拠の説明は透明性が低く、多くの場合は「飽和(saturation)に達した」とだけ記述され、その評価方法が明示されないことが多い。飽和という概念は本来、グラウンデッド・セオリー(GT)の中で新たな観察が過去の分析と比較され、差異や共通点がなくなるまで続ける手法として定義された。しかし、他の分析手法を用いた研究でも説明なしに用いられている。

一般的な原則としては「研究目的を明らかにするのに十分な大きさと多様性を持つこと」が言われるが、具体的な計画の指針にはならない。経験豊富な研究者は、過去の類似研究の経験則でおおよその人数を決めているのが実情である。著者らは、質的研究の方法論をより堅固で防御可能なものにする必要があると考え、本論文で新たな枠組みを提示する。


概要(Abstract)

質的研究においてもサンプルサイズの妥当性は評価されるべきだが、その方法は量的研究とは異なる。従来の基準は「飽和」であるが、この概念は特定の方法論に強く依存し、適用は一貫していない。著者らは、質的研究におけるサンプルサイズ評価のために「情報力(information power)」という概念を提案する。情報力とは、サンプルが研究に関連する情報を多く含むほど、必要な参加者数が少なくて済むという考え方である。情報力は、(a)研究目的、(b)サンプルの特異性、(c)既存理論の利用、(d)対話の質、(e)分析戦略の5要素によって決まる。本論文では、このモデルの構造と適用法について論じる。


背景(続き)

著者らは、研究計画においておおよそのサンプルサイズを見積もることが必要である一方で、最終的なサンプルサイズの妥当性は研究プロセスの中で継続的に評価されるべきだと考えている。質的研究のサンプルサイズは、数式や単なる冗長性(redundancy)では予測できない。

サンプルサイズを決めるためのツールは、特定の分析手法の手順に依存するのではなく、事象や参加者数の妥当性を見積もるための共通の方法論的原則に基づくべきである。そのため、著者らは「情報力」という概念を提案する。サンプルが持つ情報力が大きければ必要な参加者数は少なくなり、その逆もまた然りである。本論文では、この情報力の概念を質的面接研究の文脈に適用することに焦点を当てる。

本稿の目的は、質的研究において必要な情報力をどのように確保するかを検討しながら、サンプルサイズを評価するための実践的モデルを提示し、議論することである。


方法(Method)

著者らは、まず架空の研究事例を作成し、それを出発点に議論を行った。この事例は実際には計画も実施もされていないが、モデルを発展させるための具体的な参照点として機能した。このケースを基に、情報力とサンプルサイズに影響を与えると考えられる条件を洗い出し、それらの項目と次元をモデルとして概念化した。このモデルは特定の事例にとどまらず、幅広い面接研究に応用できることを意図している。

作業は、著者間の実践的なフォーカスグループ的議論として進められ、これまでの経験を踏まえてケースを構築した。議論の中で、サンプルサイズに論理的に影響する重要な項目を優先順位づけし、並行して「情報力」という概念についても議論した。この過程では、質的研究におけるサンプルサイズに関する現状やその弱点についての文献も参照した。


ケース例:糖尿病性足潰瘍の経験に関する面接研究の計画

ケースは、自己管理理論への貢献と患者の実践を医療従事者に示すことを目的とする博士課程研究の第1サブプロジェクトとして設定された。本サブプロジェクトの目的は、糖尿病性足潰瘍患者の自己管理を、実施されている活動とその動機づけの両面から明らかにすることである。

研究者(博士課程の若手医師)は以前に質的研究の経験があり、糖尿病外来で初めて潰瘍を診断された患者を対象に、半構造化面接でデータ収集を行う計画だった。参加者の募集停止時期の判断は初心者には難しいため、助成金申請時には事前におおよその面接回数を見積もる必要があった。指導教員は過去の経験から人数の目安を持っていたが、学生はサンプル数を判断するための基準が欲しいと考えていた。そこで著者らは、情報力を決める5つの主要項目に基づいてサンプルサイズを評価するモデルを提示することにした。


1. 研究目的(Study Aim)—狭いか広いか

情報力は研究目的の広さと関連する。研究目的が広い場合、現象が包括的であるため、十分な情報力を得るにはより多くの参加者が必要となる。一方、目的が狭ければ少人数でも十分な情報力が得られる。

例えば、「初めて糖尿病性足潰瘍を発症した患者がどのように包帯を交換しているか」を探る研究は、より多くの自己管理の側面を扱う研究よりも参加者数が少なくて済む。

また、目的が非常に特定的または稀な経験(例:盲目の糖尿病性足潰瘍患者の自己管理)であれば、対象となる患者数自体が限られ、少人数でも十分な情報力が得られる場合がある。逆に、目的を広くすると参加者数を増やさなければならない。目的設定は、得られる知見の移転可能性(transferability)にも影響する。


2. サンプル特異性(Sample Specificity)—濃いか薄いか

情報力は、参加者が持つ経験・知識・特性の特異性にも依存する。研究目的に対して特異性が高いサンプルであれば、少人数でも十分な情報力を得られるが、特異性が低い場合はより多くの参加者が必要となる。

例えば、対象者が「糖尿病性足潰瘍の自己管理に成功した/失敗した」という多様な経験を持つように選べば、情報力が高まる。反対に、便宜的抽出(都合のつく参加者をそのまま採用)では特異性が確保されにくく、より多くの参加者が必要となる。

ただし、偶然多様な経験を持つ参加者が集まる場合もあり、特異性は必ずしも事前に予測できない。そのため、募集戦略によって特異性を高める努力が必要である。


3. 既存理論の使用(Established Theory)—活用するか否か

既存理論を活用して研究を設計・分析する場合、理論的枠組みが知識を統合・拡張するため、少人数でも十分な情報力を得やすい。例えば、「医療専門職が行使する権威」といった社会科学理論を背景に持つと、患者が権威に対抗して自己管理を行う戦略を小規模サンプルからも見出せる可能性がある。

一方、理論的基盤を持たずにゼロから枠組みを作る場合は、知見の根拠を構築するためにより多くの参加者が必要になる。理論は、経験的データの異なる側面を関連づけて説明するためのモデルや概念を提供し、極端に少ないサンプルからでも重要な理論的貢献を導くことができる。


4. 対話の質(Quality of Dialogue)—強いか弱いか

情報力は、研究者と参加者の間で交わされるインタビュー対話の質にも左右される。明確で深みのある対話ができれば、少人数でも十分な情報力が得られる。一方、曖昧で焦点の定まらない対話では、より多くの参加者が必要になる。

質的研究のデータは、研究者と参加者の相互作用によって共同構築される。そのため、インタビュアーのスキル、参加者の表現力、両者の相性が重要であり、事前に予測するのは難しい。

ケースの博士課程学生は、糖尿病性足潰瘍に関する豊富な知識と現場経験を持っており、テーマにすぐ入れる一方、性格的にやや内気で信頼関係の構築に時間がかかる傾向があった。そのため、追加の面接トレーニングを行うか、参加者数を増やす必要があるかもしれない。対話が緊張や対立を含む場合、詳細な情報を得るための信頼が損なわれることがあるが、逆に全く挑戦的でないやり取りでは既知の事実の再生産にとどまり、情報力が低くなるリスクがある。


5. 分析戦略(Analysis Strategy)—事例分析か横断分析か

情報力は、選択された分析戦略にも依存する。複数事例の横断的分析(cross-case analysis)は、少数の参加者から得られる深掘り事例分析(case analysis)よりも多くの参加者を必要とする。

ケース研究では、現実的かつ臨床応用可能な自己管理行動の記述を目指すため、テーマ別の横断分析が選択された。この場合、経験の異なる6〜10人の目的抽出サンプルで、医療従事者への有益な知見を提供できる可能性がある。

横断分析では全範囲を網羅する必要はなく、研究目的に関連するパターンを提示すればよい。1人の参加者の語りは典型例を示すことはできても多様性は示せないし、対照的な2例でも全体の幅はカバーできない。逆に50人以上では多様性は十分確保できるが、データの整理や分析が困難になる可能性がある。


情報力モデル(Information Power in Qualitative Interview Studies—The Model)

これまでの考察から、著者らはサンプルサイズを評価するためのモデルを構築した。このモデルは、特定の研究における情報力に影響を与える要素について体系的に検討するためのツールである。

モデルによれば、以下の5つの要素が「少人数で十分か、多人数が必要か」を決定する。

  • 研究目的(Aim)
  • サンプル特異性(Specificity)
  • 理論的背景(Established theory)
  • 対話の質(Quality of dialogue)
  • 分析戦略(Analysis strategy)

必要な参加者数が最も少なくて済むのは、研究目的が狭く、参加者の組み合わせが目的に非常に特化しており、既存理論に支えられ、対話の質が高く、分析が少数事例の縦断的・詳細な探究を含む場合である。

逆に、目的が広く、サンプル特異性が低く、理論的基盤がなく、対話の質が低く、分析が横断的で多様性を網羅しようとする場合には、より多くの参加者が必要になる。

要素間は相互に影響し合い、トレードオフが発生する。例えば、経験豊富な研究者が狭い目的を設定し、高品質の対話を行える場合、小規模サンプルでも十分な横断分析が可能になる。一方、経験が浅く理論的知識が限られる研究者は、目的が絞られていて対話が良好でも、何か新しい知見を得るためにはより多くの参加者が必要になることがある。

このモデルは、参加者数を数値的に算出するチェックリストではなく、研究過程の各段階で系統的に募集計画を見直すための推奨事項である。


モデルの適用例(Case Application)

ケースの博士課程学生の場合:

  • 初心者研究者で、性格的な内気さが対話形成に影響 → より多くの参加者が必要
  • 理論的基盤はしっかりしており、テーマに関する豊富な実務経験あり → 参加者数を減らせる要因
  • 横断分析を予定 → より多くの参加者が必要
  • 研究目的は広すぎず狭すぎず → 中間的影響
  • 看護師が研究目的に沿った特性を持つ患者を選ぶため、サンプル特異性は高い → 参加者数を減らせる要因

さらに、指導教員は過去に類似研究を6人の参加者で成功させた経験がある。これらを踏まえ、初期の見積もりとしては10人程度が妥当とされた。


サンプルサイズ見直しのプロセス

情報力の評価は、研究の進行に応じて繰り返し行うべきである。例えば、最初の3件の面接後にデータを確認し、初期分析を行うことで、目的の明確化や理論選定が進む。もし収集したデータの関連性が高く、かつ多様性が十分であれば、必要な参加者数を減らすこともできる。この判断はデータ収集終了前に再度行う必要がある。

では、「モデルの強みと限界」から「飽和との比較」までを訳します。


モデルの強みと限界(The Model—Strengths and Limitations)

本モデルの中核概念は「情報力」である。情報力は、研究目的、サンプル特異性、既存理論の使用、対話の質、分析戦略といった要素によって決まる。それぞれの要素は連続的なスペクトラム上に位置づけられ、研究者は自らの研究がどこに当たるかを見極め、責任ある分析に必要なおおよその参加者数を推定できる。

この評価は研究の進行に応じて繰り返し見直すべきで、最初から固定するべきではない。これにより、十分な情報力を確保できた時点で募集を終了できる。初期計画時にも、情報力の観点は有用である。

ただし、5つの要素は相互に独立しているわけではなく、またこれらが唯一の要素でもない。包括的な現象を探求する場合には、適切な変動性を持つデータが必要であり、ここで示した5要素はあくまで重要かつ実用的な項目に絞ったものである。

また、モデルは個別面接研究を想定しており、サンプルサイズは参加者数として扱っている。他の質的デザイン(フォーカスグループ、観察研究、文書分析など)では、単位の数え方が異なるため、適用方法も変わる。


「飽和」との比較(Should “Saturation” Be Replaced by “Information Power?”)

「飽和(saturation)」は質的研究のサンプルサイズ基準としてよく用いられてきたが、その本来の意味はグラウンデッド・セオリー(GT)の中で、比較分析を繰り返してカテゴリーの性質や関係がこれ以上拡張されなくなる状態を指す。しかし、多くの研究ではGT以外の方法論でも飽和という言葉が用いられ、その評価方法が不明確であったり、概念自体が本来の意味とは異なって使われていることが多い。

探索的研究では、現象の全ての側面を網羅することよりも、新しい洞察を提供し、既存理解に挑戦することが重視される。そのため、「完全に出尽くす」というGT的飽和の前提は、多くの質的研究の哲学とは合致しない。さらに、飽和は研究者による主観的判断に依存しやすく、ある研究者が「もう新しいことは出ない」と判断しても、別の研究者が新規性を見いだす可能性がある。

著者らが提案する「情報力」は、内部的妥当性の一側面として、利用可能な経験的データが新たな知識を生み出す潜在力をどれだけ持っているかに注目する。これはサンプルの大きさよりも、データの質や関連性、出来事の多様性の方が重要であるという立場に基づいている。


研究実践への示唆(Implications for Research Practice)

質的面接研究では、単に参加者数の多寡に注目するのではなく、分析から得られる新しい知識の量と質に焦点を当てたサンプリング戦略が有益である。情報力の考え方は、「サンプルが研究に関連する情報を多く含むほど、必要な参加者数は少なくて済む」という指針を与える。

計画段階ではおおよその人数を見積もる必要があるが、最終的なサンプルサイズの妥当性は、研究の進行中に継続的に評価すべきである。そして、最終的な成果物において、実際に得られたサンプルが研究目的に照らして十分な情報力を持っていたかを明確に示すことが重要である。


論文全体のレジュメ(要約)

論文タイトル

Sample Size in Qualitative Interview Studies: Guided by Information Power

(質的面接研究におけるサンプルサイズ:情報力による指針)

背景

質的研究では、サンプルサイズの評価基準として従来「飽和(saturation)」が用いられてきたが、その概念は特定の方法論(グラウンデッド・セオリー)に依存し、他の方法論では適用や定義が不明確である。従来の原則は「目的達成に十分な大きさと多様性」だが、具体的な計画指針にはならない。

提案する概念:情報力(Information Power)

サンプルが研究目的に関連する豊富な情報を含むほど、必要な参加者数は少なくて済むという考え方。情報力は次の5要素によって決まる:

  1. 研究目的の広さ(狭いほど少人数で済む)
  2. サンプル特異性(高いほど少人数で済む)
  3. 既存理論の利用(活用するほど少人数で済む)
  4. 対話の質(高いほど少人数で済む)
  5. 分析戦略(事例分析は少人数、横断分析は多人数が必要)

モデルの活用

  • 初期計画段階で参加者数の目安を立てる
  • データ収集と分析の過程で繰り返し見直す
  • 条件によっては参加者数を減らす判断も可能

飽和との違い

  • 飽和は「これ以上新しい情報が出ない状態」を基準にするが、情報力はデータの質や多様性を重視
  • 飽和はしばしば主観的で不透明になりやすいが、情報力は明確な要素に基づく評価が可能
  • 情報力は、内部的妥当性と新しい知識創出の潜在力に着目する

実践への示唆

  • 数ではなく質を重視したサンプリング戦略の必要性
  • 初期見積もりと継続的評価の併用
  • 最終成果物で、サンプルが十分な情報力を持っていたかを明示すること

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です