2026年5月6日約10分で読めますアンケート設計ノウハウ by レポアン編集部

リッカートスケール段階数の選び方 — 5段階・7段階・偶数スケールを状況で使い分ける実践ガイド

Q: Q. 「中立」オプションは本当に不要?

目的によります。行動意向を測る設問（「継続利用したいか」「勧めたいか」）は中立排除（偶数スケール）が有効。経験・感想を測る設問（「操作性はどう感じましたか」）は中立あり（奇数スケール）が自然。全設問を偶数にすると回答者がストレスを感じる場合があるため、設問の性質で使い分けましょう。

アンケートで最も使われるリッカートスケールの段階数（5・7・4・6・10）を、中央バイアスの発生メカニズム・before/after の設問例・判断フローとともに解説。設計ミスで起こる「全員3点」問題への対処まで。

「とても満足 / やや満足 / どちらでもない / やや不満 / とても不満」のように、段階的に同意度や満足度を測る形式を リッカートスケール（Likert scale） と呼びます。1932年に心理学者レンシス・リッカートが提唱した古典的な手法ですが、現在もアンケートのもっとも中心的な設問形式です。

「とりあえず5段階」で設計した結果、回答が3（中央）に偏りすぎて施策判断できなかった——こういう失敗は珍しくありません。本記事では段階数の選択に絞り、具体的な判断フロー・設問例・現場のハマりどころ を解説します。質問タイプ全般の比較は質問タイプ比較ガイドを参照してください。

リッカートスケールが選ばれる理由

回答負荷が低い：1問あたり5秒以内で完了する
定量比較しやすい：平均・中央値・分布で扱えるため、月次推移や施策前後の比較が容易
心理的距離を数値化できる：「好き/嫌い」の二択より、「どの程度?」を記録できる

ただし、段階数の選択を誤ると データが使い物にならない ことがあります。

段階数別の特徴と向く場面

5段階スケール ─ 汎用・トレンド観測向き

最も普及している形式。学校の5段階評価に近く、回答者の理解コストが最小です。

設問例（5段階）

このサービスの使いやすさを評価してください。 1=非常に使いにくい　3=どちらでもない　5=非常に使いやすい

メリット: 認知度が高い・回答が速い・長期トレンド観測に使いやすい
デメリット: 中央（3）への集中 = 中央バイアス が発生しやすい

おすすめ用途: 顧客満足度の継続調査（月次・四半期）、社内アンケート、パルスサーベイ

中央バイアスが起きるとどうなるか: 100件回収しても「3」が60件・「4」が30件・「2」が10件のような分布になる。「改善した/悪化した」の判断が平均値0.1の差を読み解く話になり、実務上は使いにくい。

7段階スケール ─ 施策検証・比較調査向き

学術調査や製品比較調査でスタンダードとされる形式。平均値の差が出やすく、A/Bテストの効果検証に適します。

設問例（7段階）

新機能リリース前後の操作性を評価してください。 1=非常に困難　4=どちらでもない　7=非常に容易

メリット: 統計的な差異を検出しやすい・施策の微細な効果を測定できる
デメリット: 選択肢が多く回答時間が伸びる（1問あたり+2〜3秒程度）・「5と6の違い」が回答者に伝わりにくい

おすすめ用途: UI改善前後の比較、競合製品との評価比較、学術的な調査設計

ポイント: 7段階は全段階にラベルを付けると選択肢が長くなりすぎる。両端＋中央の3点アンカーが現実的です。

4段階・6段階（偶数スケール）─ 中央バイアス排除向き

中央の選択肢がない形式。「どちらでもない」を選べないため、回答者は必ず肯定/否定のどちらかに倒す必要があります。

設問例（4段階）

今後もこのサービスを利用したいと思いますか？ 1=まったく思わない　2=あまり思わない　3=やや思う　4=強く思う

before（5段階・問題あり）:

「サービス継続意向：1=まったくない〜5=非常にある」→ 中央（3）に回答が集中し意向の強さが読めない

after（4段階・改善後）:

「サービス継続意向：1=まったくない / 2=あまりない / 3=ある程度ある / 4=強くある」→ 肯定73% / 否定27% など明確な分布が得られる

メリット: 中央バイアスを排除できる・施策の優先順位付けに使いやすい
デメリット: 「本当にどちらでもない」人に不誠実な選択を強いる・心理的に窮屈さを感じる回答者がいる

おすすめ用途: 施策の優先度判断、意思決定に直結する調査、NPS 補完の推奨設問

10段階スケール ─ NPS・採点感覚向き

NPS（ネットプロモータースコア）が代表例。0〜10の11段階が多い。

メリット: 細かい差分を取れる・「10点満点で何点?」という採点感覚と合う
デメリット: 文化バイアスが大きい ——日本人は7前後、米国人は9前後に集まる傾向がある（同じスケールで異文化比較すると誤解が生じる）
NPS 以外の文脈で使うケースは少ない

段階数を選ぶ判断フロー

目的は長期トレンド観測?
    → Yes: 5段階（過去データとの継続性が重要）

目的は施策の前後比較・A/Bテスト?
    → Yes: 7段階（平均の差を検出しやすい）

「どちらでもない」が回答に混入すると困る?
    → Yes: 4段階または6段階（偶数スケール）

NPS・採点感覚での計測?
    → Yes: 10段階（0〜10）

迷ったら?
    → 5段階（最も汎用的で比較データが豊富）

ラベルの設計——見落とされがちな重要ポイント

ラベルの付け方で回答分布が変わります。

アンカーラベル方式（推奨）

両端と中央の3点にのみラベルを付ける。

値	ラベル
1	非常に不満
2	（ラベルなし）
3	どちらでもない
4	（ラベルなし）
5	非常に満足

モバイルでの表示: 選択肢文字が長くなると縦並びになり、スクロールが増える。アンカー方式であれば横並びのままラジオボタンが表示できる。

全段階ラベル方式（学術調査・精度重視時）

「やや不満」「やや満足」など全選択肢にラベルを付ける。回答者の解釈ブレが減るが、選択肢が長くなるためモバイルで読みにくくなる。

推奨: 一般的なマーケティング調査は アンカーラベル（3点） で十分。学術論文レベルの精度が必要なら全段階ラベルを検討。

中央バイアスを避ける3つのテクニック

5段階を維持しながら中央集中を抑えたい場合の対策です。

1. 偶数スケールに変える

4段階または6段階にすれば中央選択肢がなくなり、回答が分散します。

2. 「分からない」を選択肢の外に置く

1=非常に不満 / 2=不満 / 3=満足 / 4=非常に満足 / 【使っていないので分からない】

「どちらでもない」の本来の意味（経験がない・判断できない）と、真の中間意見を分離できます。

3. 設問文を強化する

弱い設問文:「このサービスに満足していますか？」 → 中央に逃げやすい

強い設問文:「今後このサービスを継続利用するか、解約するか、あえて選ぶならどちらですか？」 → 方向性を強制する表現で分散が生まれる

現場でよくある失敗例

失敗1: 「全員3点」問題

状況: 新機能の評価アンケートで5段階スケールを使用。回答平均が3.1〜3.3に収束し、改善/維持の判断ができなかった。

原因: 中央バイアス＋設問が「あなたはどう思いますか?」と曖昧

対策: 7段階に変更し、「リリース前の操作性と比べてどう変わりましたか?（1=大幅に悪化〜7=大幅に改善）」と比較形式に変更 → 平均が4.8（中央より上）と明確に改善を検出できた

失敗2: スケールの途中変更で時系列が崩れた

状況: 四半期ごとに満足度を5段階で追っていたが、「中央バイアスが出ているから」と3回目から4段階に変更。前後の比較が不可能になった。

対策: スケールは調査開始時に決定し、変える場合は 新設問として追加 する（既存設問は継続）。並行期間を1〜2回設けてブリッジ調査を行う。

よくある質問

Q. リッカートスケールとNPSはどう違うの?

NPS（ネットプロモータースコア）は「0〜10の11段階で友人に薦める可能性」を測る特定の設問形式で、9〜10点を「推奨者」、0〜6点を「批判者」に分類してスコアを計算します。リッカートスケールは評価の段階形式そのものを指す言葉で、NPS はその一種とも言えます。顧客ロイヤルティの継続計測には NPS、商品・サービスの詳細評価にはリッカート5〜7段階と使い分けるのが一般的です（詳細：NPS完全ガイド）。

Q. 5段階と7段階、どちらが統計的に正確?

回答者100人以上のサンプルサイズなら、どちらも十分実用的です。7段階の方が「差の検出力」は高く、施策前後の比較（例：リリース前3.8点 → リリース後5.1点）を明確に示したい場合に有利です。一方で回答率への影響（回答者の離脱）も考慮すると、消費者向けの短いアンケートでは5段階の方が完了率が高いです。

Q. モバイルで段階が多いスケールを使うと表示が崩れる?

7段階以上をラジオボタンで横並びにすると、スマートフォン（375px幅）では選択肢が小さくなりタップしにくくなります。対策は2つ：(1) スライダー形式に変える、(2) 縦並びのラジオボタンにラベルをつける。横並び前提で設計するなら5段階が上限です。

Q. 「中立」オプションは本当に不要?

目的によります。行動意向を測る設問（「継続利用したいか」「勧めたいか」）は中立排除（偶数スケール）が有効。経験・感想を測る設問（「操作性はどう感じましたか」）は中立あり（奇数スケール）が自然。全設問を偶数にすると回答者がストレスを感じる場合があるため、設問の性質で使い分けましょう。

Q. 段階数をアンケート内で混在させていい?

混在自体は問題ありません。ただし、同じテーマの複数設問は統一した方が回答しやすく、集計もシンプルになります。例：製品評価6問はすべて7段階、意向確認2問はすべて4段階——のようなブロック単位での統一を推奨します。

まとめ：スケール選択の早見表

目的	推奨スケール	理由
経年トレンド観測	5段階	継続性・回答コストのバランスが最良
施策の前後比較・A/Bテスト	7段階	平均の差を検出しやすい
中央バイアス回避・意思決定調査	4段階・6段階	強制分散で傾向が明確になる
ロイヤルティ計測	NPS（0〜10）	業界標準・ベンチマーク比較に使いやすい

スケールの段階数を迷ったとき、レポアンの AI チャットに「顧客満足度を毎月追いたい」「A/Bテストの効果を精緻に測りたい」と伝えると、目的に合ったスケール設問を自動で提案します。20種類以上の質問タイプ（詳細）に対応しており、設問作成後に段階数を変更しても入力済みデータの互換性は保たれます。

中央バイアス・イエスバイアスの全体対策: アンケートの誤差とバイアス
段階評価の集計と有意差の読み方: アンケートの統計的有意とは
質問タイプ全体の比較: 質問タイプ比較ガイド

レポアンならアンケートをすぐに作れます

AIに目的を伝えるだけでプロ品質の設問を提案。テンプレートからの1クリック作成にも対応。

無料で始める