「とても満足 / やや満足 / どちらでもない / やや不満 / とても不満」のように、段階的に同意度や満足度を測る形式を リッカートスケール(Likert scale) と呼びます。1932年に心理学者レンシス・リッカートが提唱した古典的な手法ですが、現在もアンケートのもっとも中心的な設問形式です。
「とりあえず5段階」で設計した結果、回答が3(中央)に偏りすぎて施策判断できなかった——こういう失敗は珍しくありません。本記事では段階数の選択に絞り、具体的な判断フロー・設問例・現場のハマりどころ を解説します。質問タイプ全般の比較は 質問タイプ比較ガイド を参照してください。
リッカートスケールが選ばれる理由
- 回答負荷が低い:1問あたり5秒以内で完了する
- 定量比較しやすい:平均・中央値・分布で扱えるため、月次推移や施策前後の比較が容易
- 心理的距離を数値化できる:「好き/嫌い」の二択より、「どの程度?」を記録できる
ただし、段階数の選択を誤ると データが使い物にならない ことがあります。
段階数別の特徴と向く場面
5段階スケール ─ 汎用・トレンド観測向き
最も普及している形式。学校の5段階評価に近く、回答者の理解コストが最小です。
設問例(5段階)
このサービスの使いやすさを評価してください。 1=非常に使いにくい 3=どちらでもない 5=非常に使いやすい
- メリット: 認知度が高い・回答が速い・長期トレンド観測に使いやすい
- デメリット: 中央(3)への集中 = 中央バイアス が発生しやすい
おすすめ用途: 顧客満足度の継続調査(月次・四半期)、社内アンケート、パルスサーベイ
中央バイアスが起きるとどうなるか: 100件回収しても「3」が60件・「4」が30件・「2」が10件のような分布になる。「改善した/悪化した」の判断が平均値0.1の差を読み解く話になり、実務上は使いにくい。
7段階スケール ─ 施策検証・比較調査向き
学術調査や製品比較調査でスタンダードとされる形式。平均値の差が出やすく、A/Bテストの効果検証に適します。
設問例(7段階)
新機能リリース前後の操作性を評価してください。 1=非常に困難 4=どちらでもない 7=非常に容易
- メリット: 統計的な差異を検出しやすい・施策の微細な効果を測定できる
- デメリット: 選択肢が多く回答時間が伸びる(1問あたり+2〜3秒程度)・「5と6の違い」が回答者に伝わりにくい
おすすめ用途: UI改善前後の比較、競合製品との評価比較、学術的な調査設計
ポイント: 7段階は全段階にラベルを付けると選択肢が長くなりすぎる。両端+中央の3点アンカーが現実的です。
4段階・6段階(偶数スケール)─ 中央バイアス排除向き
中央の選択肢がない形式。「どちらでもない」を選べないため、回答者は必ず肯定/否定のどちらかに倒す必要があります。
設問例(4段階)
今後もこのサービスを利用したいと思いますか? 1=まったく思わない 2=あまり思わない 3=やや思う 4=強く思う
before(5段階・問題あり):
「サービス継続意向:1=まったくない〜5=非常にある」→ 中央(3)に回答が集中し意向の強さが読めない
after(4段階・改善後):
「サービス継続意向:1=まったくない / 2=あまりない / 3=ある程度ある / 4=強くある」→ 肯定73% / 否定27% など明確な分布が得られる
- メリット: 中央バイアスを排除できる・施策の優先順位付けに使いやすい
- デメリット: 「本当にどちらでもない」人に不誠実な選択を強いる・心理的に窮屈さを感じる回答者がいる
おすすめ用途: 施策の優先度判断、意思決定に直結する調査、NPS 補完の推奨設問
10段階スケール ─ NPS・採点感覚向き
NPS(ネットプロモータースコア)が代表例。0〜10の11段階が多い。
- メリット: 細かい差分を取れる・「10点満点で何点?」という採点感覚と合う
- デメリット: 文化バイアスが大きい ——日本人は7前後、米国人は9前後に集まる傾向がある(同じスケールで異文化比較すると誤解が生じる)
- NPS 以外の文脈で使うケースは少ない
段階数を選ぶ判断フロー
目的は長期トレンド観測?
→ Yes: 5段階(過去データとの継続性が重要)
目的は施策の前後比較・A/Bテスト?
→ Yes: 7段階(平均の差を検出しやすい)
「どちらでもない」が回答に混入すると困る?
→ Yes: 4段階または6段階(偶数スケール)
NPS・採点感覚での計測?
→ Yes: 10段階(0〜10)
迷ったら?
→ 5段階(最も汎用的で比較データが豊富)
ラベルの設計——見落とされがちな重要ポイント
ラベルの付け方で回答分布が変わります。
アンカーラベル方式(推奨)
両端と中央の3点にのみラベルを付ける。
| 値 | ラベル |
|---|---|
| 1 | 非常に不満 |
| 2 | (ラベルなし) |
| 3 | どちらでもない |
| 4 | (ラベルなし) |
| 5 | 非常に満足 |
モバイルでの表示: 選択肢文字が長くなると縦並びになり、スクロールが増える。アンカー方式であれば横並びのままラジオボタンが表示できる。
全段階ラベル方式(学術調査・精度重視時)
「やや不満」「やや満足」など全選択肢にラベルを付ける。回答者の解釈ブレが減るが、選択肢が長くなるためモバイルで読みにくくなる。
推奨: 一般的なマーケティング調査は アンカーラベル(3点) で十分。学術論文レベルの精度が必要なら全段階ラベルを検討。
中央バイアスを避ける3つのテクニック
5段階を維持しながら中央集中を抑えたい場合の対策です。
1. 偶数スケールに変える
4段階または6段階にすれば中央選択肢がなくなり、回答が分散します。
2. 「分からない」を選択肢の外に置く
1=非常に不満 / 2=不満 / 3=満足 / 4=非常に満足 / 【使っていないので分からない】
「どちらでもない」の本来の意味(経験がない・判断できない)と、真の中間意見を分離できます。
3. 設問文を強化する
弱い設問文:「このサービスに満足していますか?」 → 中央に逃げやすい
強い設問文:「今後このサービスを継続利用するか、解約するか、あえて選ぶならどちらですか?」 → 方向性を強制する表現で分散が生まれる
現場でよくある失敗例
失敗1: 「全員3点」問題
状況: 新機能の評価アンケートで5段階スケールを使用。回答平均が3.1〜3.3に収束し、改善/維持の判断ができなかった。
原因: 中央バイアス+設問が「あなたはどう思いますか?」と曖昧
対策: 7段階に変更し、「リリース前の操作性と比べてどう変わりましたか?(1=大幅に悪化〜7=大幅に改善)」と比較形式に変更 → 平均が4.8(中央より上)と明確に改善を検出できた
失敗2: スケールの途中変更で時系列が崩れた
状況: 四半期ごとに満足度を5段階で追っていたが、「中央バイアスが出ているから」と3回目から4段階に変更。前後の比較が不可能になった。
対策: スケールは調査開始時に決定し、変える場合は 新設問として追加 する(既存設問は継続)。並行期間を1〜2回設けてブリッジ調査を行う。
よくある質問
Q. リッカートスケールとNPSはどう違うの?
NPS(ネットプロモータースコア)は「0〜10の11段階で友人に薦める可能性」を測る特定の設問形式で、9〜10点を「推奨者」、0〜6点を「批判者」に分類してスコアを計算します。リッカートスケールは評価の段階形式そのものを指す言葉で、NPS はその一種とも言えます。顧客ロイヤルティの継続計測には NPS、商品・サービスの詳細評価にはリッカート5〜7段階と使い分けるのが一般的です(詳細:NPS完全ガイド)。
Q. 5段階と7段階、どちらが統計的に正確?
回答者100人以上のサンプルサイズなら、どちらも十分実用的です。7段階の方が「差の検出力」は高く、施策前後の比較(例:リリース前3.8点 → リリース後5.1点)を明確に示したい場合に有利です。一方で回答率への影響(回答者の離脱)も考慮すると、消費者向けの短いアンケートでは5段階の方が完了率が高いです。
Q. モバイルで段階が多いスケールを使うと表示が崩れる?
7段階以上をラジオボタンで横並びにすると、スマートフォン(375px幅)では選択肢が小さくなりタップしにくくなります。対策は2つ:(1) スライダー形式に変える、(2) 縦並びのラジオボタンにラベルをつける。横並び前提で設計するなら5段階が上限です。
Q. 「中立」オプションは本当に不要?
目的によります。行動意向を測る設問(「継続利用したいか」「勧めたいか」)は中立排除(偶数スケール)が有効。経験・感想を測る設問(「操作性はどう感じましたか」)は中立あり(奇数スケール)が自然。全設問を偶数にすると回答者がストレスを感じる場合があるため、設問の性質で使い分けましょう。
Q. 段階数をアンケート内で混在させていい?
混在自体は問題ありません。ただし、同じテーマの複数設問は統一した方が回答しやすく、集計もシンプルになります。例:製品評価6問はすべて7段階、意向確認2問はすべて4段階——のようなブロック単位での統一を推奨します。
まとめ:スケール選択の早見表
| 目的 | 推奨スケール | 理由 |
|---|---|---|
| 経年トレンド観測 | 5段階 | 継続性・回答コストのバランスが最良 |
| 施策の前後比較・A/Bテスト | 7段階 | 平均の差を検出しやすい |
| 中央バイアス回避・意思決定調査 | 4段階・6段階 | 強制分散で傾向が明確になる |
| ロイヤルティ計測 | NPS(0〜10) | 業界標準・ベンチマーク比較に使いやすい |
スケールの段階数を迷ったとき、レポアンの AI チャットに「顧客満足度を毎月追いたい」「A/Bテストの効果を精緻に測りたい」と伝えると、目的に合ったスケール設問を自動で提案します。20種類以上の質問タイプ(詳細)に対応しており、設問作成後に段階数を変更しても入力済みデータの互換性は保たれます。
関連記事
- 中央バイアス・イエスバイアスの全体対策: アンケートの誤差とバイアス
- 段階評価の集計と有意差の読み方: アンケートの統計的有意とは
- 質問タイプ全体の比較: 質問タイプ比較ガイド