「アンケートは何人くらいに聞けば良いですか?」——調査の入口で必ず出る質問です。
ネットで検索すると 「最低400人」「全社員の30%」 など色々な数字が出てきますが、根拠のないまま使われていることが多い。本記事では サンプルサイズの本来の計算方法 と、「統計的に十分」と「事業判断に十分」が異なる という実務上の判断軸を整理します。
結論先出し — 用途別の目安
| 調査目的 | 推奨サンプルサイズ | 根拠 |
|---|---|---|
| 役員報告・経営判断 | 400件以上 | 母集団大、誤差±5% |
| 部門内の意思決定 | 100〜300件 | 中規模、誤差±5〜8% |
| 仮説の方向性確認 | 30〜100件 | 傾向把握 |
| 個別深掘り(インタビュー併用) | 5〜30件 | 定性中心 |
| 早期プロトタイプテスト | 5〜10件 | UX確認 |
「全部400件必要」ではありません。用途に応じてサイズは変わる のが本質です。
サンプルサイズ計算の基本式
統計的に厳密なサンプルサイズは、以下の3つで決まります:
n = (Z² × p × (1-p)) / e²
- n:必要サンプルサイズ
- Z:信頼水準に対応するZ値(信頼水準95%なら1.96、99%なら2.58)
- p:母比率(不明なら0.5を入れて最大値を取る)
- e:許容誤差(±3%なら0.03、±5%なら0.05)
代表的な組み合わせの目安
| 信頼水準 | 許容誤差 | 必要サンプルサイズ |
|---|---|---|
| 95% | ±3% | 約1,067 |
| 95% | ±5% | 約385 |
| 95% | ±10% | 約97 |
| 90% | ±5% | 約271 |
| 99% | ±5% | 約664 |
実務でよく使われる 「最低400件」 という数字は、この 信頼水準95% × 許容誤差±5% の組み合わせから来ています。
母集団が小さい場合の補正
上の式は 母集団が無限大 という前提です。母集団が有限(例:自社顧客500人)の場合は補正が必要:
n_adjusted = n / (1 + (n - 1) / N)
- N:母集団の人数
例:母集団500人で n=385 を取りたい場合:
n_adjusted = 385 / (1 + (385 - 1) / 500) = 217
つまり、500人に対しては217件取れば、無限母集団に対する385件と同じ精度 になります。
母集団が小さいほど、必要サンプルサイズも小さくて済みます。
ここからが本題 — 「統計的に十分」と「事業判断に十分」は別物
教科書的なサンプルサイズ計算は 「統計的に十分」 を保証する数字です。しかし、実務では:
- 統計的にギリギリ足りなくても、意思決定に十分 な場合
- 統計的に十分でも、施策には全然足りない 場合
があります。
ケース1:統計的に不十分でも意思決定OK
状況:n=30 のアンケートで「機能A への不満」が80%
判定:統計的には誤差±15%(信頼水準95%)で「不確か」
事業判断:80%という強い傾向 → 機能A は明らかに改善すべき
n=30 は統計的には弱いですが、圧倒的多数の不満が出ている時点で判断には十分。さらにn=400取らなくても動ける。
ケース2:統計的に十分でも施策には不十分
状況:n=400 のアンケートで「総合満足度4.0」
判定:統計的には十分、誤差±2%以内
事業判断:「で、何をすべき?」が見えない
n=400 で統計的に堅牢でも、「次に何をすべきか」が見えない数字 には意味がありません。サンプルサイズが多くても、設問設計が雑なら使えない。
状況別の判断フロー
質問1:何のために調査する?
- 経営判断・対外発表 → 統計的厳密性必要 → 計算式に従う
- 部門内の方向性確認 → 100〜300件で十分
- インサイト探索 → 5〜30件で深掘り
質問2:母集団のサイズは?
- 数百人 → 補正後、母集団の50%程度で十分
- 数千〜数万人 → 計算式の値を目安に
- 不明 → 母比率0.5、信頼95%、誤差±5% で約400件
質問3:意思決定の精度をどこまで上げたい?
- 高(誤差±3%以内)→ 1,000件以上
- 中(誤差±5%)→ 約400件
- 低(傾向把握)→ 100件以下
サンプルサイズに惑わされないために
注意1:「全員に聞くのが一番」は誤り
「100%の回答率を狙うべき」と思いがちですが、回答率を上げようと催促するほど、回答品質が落ちる ことがあります。
「適当に答える層」を巻き込むより、真摯に答える層から十分なサイズを取る ほうが価値が高い。
注意2:「サンプルサイズが大きい = 正しい」ではない
n=10,000 の調査でも、設問設計に偏りがあれば誤った結論 になります。サンプルサイズはあくまで「ノイズの少なさ」の話で、「設問の正しさ」とは別問題。
注意3:セグメント別に切るとサンプルが急減
全体:n=400
業種別(5業種)に分けると:1業種あたり平均80件
さらに規模別(3区分)に分けると:1セグメント約27件
「セグメント別の傾向を見たい」なら、全体のサンプルサイズを大きく 取らないと、セグメント切り出し後に統計的に意味のある数字が出せません。
回避策:
- 重要なセグメントだけに絞って深掘る
- セグメント別調査として分けて実施
- 全体傾向は全体サイズで、セグメントは「定性的な参考」として扱う
注意4:自由記述のサイズは別軸
「自由記述を100件集めたい」場合、選択式の n=400 が満たせていてもダメなことがあります。自由記述率は通常20〜40%程度 なので、100件の自由記述には選択式 n=300〜500 必要。
業界別・調査タイプ別の経験則
| 調査タイプ | 経験則のサンプルサイズ |
|---|---|
| 顧客満足度(NPS等) | 200〜500件 |
| 従業員エンゲージメント | 全社員の80%以上を目指す |
| 市場調査(消費者向け) | 500〜2,000件 |
| ABテスト | 統計検定で適切なサイズを計算 |
| ユーザビリティテスト | 5〜10名(定性中心) |
| デプスインタビュー | 5〜15名 |
| プロダクトの新機能反応 | 50〜100件 |
| 採用候補者の動向把握 | 30〜100件 |
これらは 統計的厳密性ではなく、実務で機能する目安 です。
「サンプルサイズ計算より大事なこと」
実は、現場で起きる問題の8割は サンプルサイズではなく、設問設計と回答率の問題 です:
- 設問が誘導的 → サンプルサイズに関係なく結論が偏る
- 回答率が低すぎる → サンプルサイズの計算が当てにならない
- 自由記述が活用されない → サンプルサイズより、活用力の問題
サンプルサイズの計算式を覚えるより、「設問設計」「回答率向上」「結果活用」のサイクル を回すほうが、実務的なインパクトは大きい。
詳細は以下の記事を参照:
レポアンのサンプルサイズ支援
レポアンは「適切なサンプルサイズで運用する」ための機能を備えています。
- 回答数の自動上限設定 — 先着300名等の上限を簡単に設定
- 配信先の絞り込み機能 — セグメント別配信でサイズコントロール
- 回答率モニタリング — 過去配信の回答率を自動表示
- AIによるサンプルサイズ推奨 — 調査目的を伝えると適切なサイズを提案
- 継続調査ダッシュボード — 月次のサイズ管理を自動化
まとめ
サンプルサイズの考え方は:
- 公式:n = (Z² × p × (1-p)) / e²
- 経営判断なら400件以上、部門判断なら100〜300件、インサイト探索なら5〜30件
- 母集団が小さければ補正で必要数も小さくなる
- 「統計的に十分」と「事業判断に十分」は別物
- セグメント切り出し時はサンプルサイズに注意
- 設問設計と回答率の質のほうが、サンプルサイズより重要
「最低何人?」の答えは 目的次第。万能の数字はなく、調査目的・母集団・許容誤差から逆算するのが本来の作法です。