アンケート評価スケール: 数字 vs. 文字

適切な評価スケールの作成スキルは、アンケート作成のプロとアマを分けるポイントです。調査者は評価スケールを使って回答者の意見や行動を量的に測定します。物差しが間違っていれば、収集した情報にバイアスがかかるリスクが高まり、アンケート結果に深刻な影響を与えるでしょう。

本記事では、「1~10」などの数による評価スケールと「全くあり得ない~非常にあり得る」などの言葉による評価スケールの違い、および、それぞれの長所と短所をご紹介します。この2つは異なる性質を持ち、どちらも非常に便利なので、今日のオンラインアンケートでは一般的に使用されています。

SurveyMonkeyでは他の質問形式もご用意しています。質問の概要ページで詳細をご覧ください。

好きな数字を選んで!

数字スケールは広く受け入れられているアンケートの測定方法です。数字による評価スケールの質問では、選択した数字が回答者の意見の程度を示します。

長所

数字による評価スケールの一番の強みは、そのシンプルさです。アンケートを複数国で実施したり、母集団の学歴が低い場合などには、どのような質問の解釈ミスが起こるかを予測することは困難です。しかし、世界中のほとんどの文化の人が標準的な数のシステムに馴染みがあり、1~10の評価スケールをどこかしらで見たことがあります。

数字スケールのもう1つの強みは、統計的な分析のしやすさです。単純な数字の選択肢を設定することによって、そのスコアと同じ値で各カテゴリーのラベルを作成できます。各カテゴリーのラベルがそのままスコアを反映するため、数字を処理する前に本来すべきコード化の作業が省けます。反対に、文字スケールは回答をスコアの値にコード化する必要があります。そして、統計的な分析が終わったら、その結果の数値が意味するところを文字スケールに沿って説明し直さなけらばなりません。

さらに数字スケールでは、より精密な回答を求めることができます。文字スケールでは、選択肢が8個以上になると手に負えなくなってしまいます。数字のリストであれば、どれだけ増やしても参加者を混乱させることはありません。

短所

残念ながら、数字スケールには重大なデメリットもあります。それは、回答者の主観に非常に依存しているという点です。「1~10」のスケールから「5」を選んだ場合、「良い」という意味にも取れれば、「まあまあ」という意味にも取れます。さらに、スケールの両端にあるカテゴリーの選びやすさは回答者よって異なります。このような特徴によって、同じ意見を持つ回答者が異なるカテゴリーを選択する可能性が高まり、アンケートの回答に起因するエラーを生じさせます。このエラーは、結果のデータが真に意味することを限定することを難しくします。

この問題に対処するため、質問の文中か、数字スケールの最後に説明を追加すると良いでしょう。回答者はスケールが意味することをよく理解でき、調査者は収集しているデータの意味をより正確に定義することができます。

自分の言葉を使う

数字スケールと同様に、文字スケールはスコア化されたカテゴリーのリストから回答者に選んでもらいます。ただし、各カテゴリーはスコアの値をそのまま反映するのではなく、各カテゴリーが意味することを説明する言葉を使用します。

スコアの値はカスタマイズできますが、一般的に次のようになります。

  • 非常に満足 = 5
  • 満足 = 4
  • どちらでもない = 3
  • 不満 = 2
  • 非常に不満 = 1
  • 該当なし = 回答無効

長所

文字スケールの最大の強みは、質問の各カテゴリーについて説明できることです。回答者はトピックに関する自身の感情を内在化させて、自身の意見を最も反映するラベルを選ぶことができます。また、自身の回答がどのように解釈されるかも正確に知ることができます。

文字スケールは各カテゴリーを説明するだけでなく、調査者が回答者の意見をそっくりそのまま使って調査結果をまとめることも可能にします。たとえば、「1~5」のスケールから「5」を選んだ回答者20%いたとしても、調査者はその回答にどのような言葉を当てるべきか限定することはできません。一方、20%の回答者が「非常に満足」と答えた場合、調査対象者の20%が非常に満足したと自信を持って報告できるのです。もちろん、回答者によって各文字スケールの選びやすさが異なるという主観性に関する問題は常にありますが、少なくとも、各スコアの意味という点で回答者と調査者が共通理解を得られます。

文字スケールのもう1つの長所は、スコアリングの柔軟性です。文字ラベルなら、回答者を困らせることなく、カテゴリーのスコアとラベルを調査者が自由に決めることができます。必ずしもスケールを均等に設定する必要はなく、次のようにすることも可能です。

  • 非常に良い = 10
  • とても良い = 8
  • 良い = 6
  • 悪くない = 5
  • 悪い = 3
  • 最悪 = 0

複雑なスコアシステムではありますが、回答者が各選択肢の言葉のみに基づいてカテゴリーを選択するので、回答者を悩ませるのではないかという不安なしにスコアリングできます。

短所

文字スケールを採用するマイナス面は、もちろん、アンケートで使用する言語にあまり通じていない回答者がいた場合です。それに加えて、文字ラベルは調査者のカテゴリーに合わせるよう回答者に強制し、回答者自身の意見を表現する余地はありません。潜在的なバイアスとなるこの欠点を補うには、「該当なし」や「わからない」などのカテゴリーを加えた上で、作成したスケールが回答者にとって答えやすいものかを事前テストで確かめてください。

また、文字スケールでは設定できるカテゴリー数が限られてしまいます。前に述べたように、カテゴリーが8個以上あると多くの回答者が手に負えないと感じてしまいます。数字スケールより文字スケールが精度の点で不利な理由です。

さあ、この記事を読み終わった今、アンケートの評価スケールを正しく選ぶ自信が湧いてきたのではないでしょうか。

SurveyMonkeyが好奇心に火をつける様子をご覧ください