お問い合わせログイン
お問い合わせログイン

アンケートの対象となる回答者数を決める際に考慮すべきポイントをご紹介します。

車椅子に乗りノートパソコンで作業をしている男性と、アンケート設定のスクリーンショット


アンケートは、人々の意見や行動、フィードバックなどをよりよく理解するために実施します。この際、理解しようとしている人々(母集団)の声を反映した信頼できる意見かどうかは、どのように確認すればよいでしょう。そこで大切になるのが、アンケートの標本サイズを決める作業です。

標本サイズとは、アンケートで手元に戻ってくる完了した回答数のことです。ターゲット市場やデモグラフィックの総数に応じて、理想的な標本サイズは変わります。

とは言え、アンケートの標本サイズはアンケート結果に重要性があるか、統計的に有意かどうかを判断する要素の1つに過ぎません。

  • ターゲット市場にアンケートを実施したり、デモグラフィック調査を実施したりするときに、対象の全員から回答を得るというのは現実的ではありません。たとえ達成できたとしても、恐ろしく長い時間とコストがかかるでしょう。
  • 統計的に有意な結果を得やすい標本サイズ、すなわち必要な回答者数を決めると、現実的な人数の回答者に対して自信を持ってアンケートを実施できます。
  • 標本サイズを検討することなくアンケートを送付した場合は、後からでも標本サイズについて理解することで、アンケートデータを分析して、統計的有意性を確認できます。
  • アンケートの標本サイズは、対象母集団やアンケートの種類によって重要度が変わります。たとえば医学研究や市場調査を行う場合は、正確な予測ができるように、得られる回答が母集団を正確に代表していることを確認しなければなりません。一方、従業員にアンケートを実施する場合は、全体的な回答率やエンゲージメント、個別のフィードバックに重点が置かれます。

アンケートの標本サイズを決める方法をご紹介する前に、重要な用語をいくつか確認しましょう。

  • 標本サイズ: アンケートで手元に戻ってくる完了した回答数のことです。
  • 回答率: アンケートを受け取った人のうち、アンケートを完了した人の割合。
  • 完了率: アンケートに回答し始めた人のうち、回答を終えて送信した人の割合。

たとえば、1,000人の集団に対してアンケートを送信し、そのうち400人がアンケートを開いた場合、回答率は40%です。ただし、アンケートを開いた人全員が回答を完了することはほぼありません。アンケートを開いた400人のうち、回答を実際に終えて送信した人が200人だけだった場合、完了率は50%になります。

回答率と完了率は標本サイズに直接は影響しませんが、標本サイズを決める際にこれらの変数を考慮することが大切です。

なぜなら、対象母集団を代表する標本を決める際に、アンケートを受け取った人全員が回答を送ってくれるとは限らないという現実を念頭に置き、それでも統計的有意性が確保できる標本サイズにする必要があるからです。

新製品のアイデアをテストする場面を考えてみましょう。この製品の典型的な顧客は、年齢と給与が一定の層であることがわかっています。また、日本の都市圏やその近郊に居住している傾向もあります。この集団が、理解したい対象者層、すなわち母集団となります。

これで、調査対象(理解したい人々)の総数である母集団のサイズがわかります。この例では、母集団が1,000万人だとします。

次に、許容誤差を決める必要があります。許容誤差は、アンケートの回答が母集団の意見をどの程度代表しているかを表す割合です。

一般的にアンケート調査で使われる許容誤差は、5%です。つまり、結果のデータから±5%の誤差を許容することを意味します。

たとえば、アンケートを完了した回答者のうち60%が「新製品を購入する予定だ」と回答した場合、許容誤差は5%なので、実際に新製品を購入する人は55~65%だと結論づけることができます。 

最後に、信頼水準を決めます。信頼水準は、アンケートを対象母集団の他の標本に送信した場合に同じ結果が得られる可能性を示します。

この例では、アンケートを1,000人に送信します。許容誤差を考慮して、55~65%が新製品を購入すると結論付けました。では、この結果にどの程度確信を持てるでしょうか。

信頼水準を95%に設定しましょう。これは業界標準の水準です。すると、同じアンケートを異なる1,000人の標本に繰り返し送信した場合、95%の確率で同じ結果が得られると判断できます。

母集団、許容誤差、および望ましい信頼水準が決まったら、次はいよいよアンケートの標本サイズを決める番です。標本サイズとは、アンケートで手元に戻ってくる完了した回答数のことですよね。SurveyMonkeyの標本サイズ計算ツールか、以下の標本サイズの計算式を使用して計算することができます。

標本サイズの計算式
  • N = 母集団
  • e = 許容誤差(小数点表記)
  • z = Zスコア*(平均値からどれだけ離れているかを測る標準偏差)

*信頼水準が95%のとき、Zスコアは1.96になります。

この計算式を使うと、母集団が1,000万人で、許容誤差が5%(0.05)、信頼水準が95%(Zスコアは1.96)の場合の標本サイズは、385であることが計算できます。しかし、ここで終わりではありません。標本サイズはただ数を決めればいいものではないのです。

対象の標本サイズを決めた後は、回答者を無作為に選ぶための信頼に足る方法を選ぶ必要があります。無作為抽出の原則に従いつつ、アンケート受信者を効率的に選択するために、Excelを使って無作為標本を作成する方法を学びましょう。

一般的に、標本サイズが大きければ大きいほど結果が統計的に有意になる可能性が高まります。けれど、一概に大きければいいというものでもなく、標本サイズの重要度は以下の変数に応じて変わることがあります。

  • 実施するアンケートの種類: 製品が他国の市場で受け入れられるかどうかを見極めるために、その国で調査を行う状況を考えてみましょう。結果に基づいて大きな経営判断を下す場合は、許容誤差を最小限に抑えられる標本サイズにすることをお勧めします。しかし、イベントに参加した20人から質的フィードバックを収集するような場合には、全体的な統計的有意性よりも、よく考えて詳しく記入された5件の回答の方が役立つかもしれません。
  • 集団の多様性: 性別、年齢、民族、居住地、婚姻状況、学歴など、ターゲット層のデモグラフィックについても検討しましょう。対象母集団が共通の特徴をもつ場合は、回答数は少なくても良いでしょう。しかし、幅広い特徴の人々が混在している場合は、より多くの回答者をバランス良く抽出してアンケートを実施することで、母集団をより正確に反映することができます。
  • 意思決定の内容: アンケート結果に基づいて意思決定を行う場合は、基本的にはデータが多い方が役立ちます。ただ、増やせばいいというものでもなく、目標についても思い出してみてください。小さな変更や改善を図るためのアイデアやフィードバックを集める場合は、回答数が少なくても構いません。より多くの人の目に触れたり、影響もリスクも大きな決定を行う場合は、回答数を増やす方が安全です。

アンケートに必要な回答者数をすばやく見積もりたい場合には、判断に役立つこちらの表を参考にしてください。準備するのは対象母集団の人数と、希望する許容誤差(3~10%)だけです。

母集団±3%±5%±10%
50034522080
1,00052528590
3,000810350100
5,000910370100
10,0001,000385100
100,0001,100400100
1,000,0001,100400100
10,000,0001,100400100

*割合は、3%、5%、10%の許容誤差を示します。

たとえば、医学研究を行う場合の許容誤差は、3%など厳しめに設定します。顧客満足度アンケートの標本サイズを選択する場合の許容誤差は、10%など高めの値に設定すると良いでしょう。

標本サイズを選択するときは、サンプリングの種類についても検討することが大切です。これは、アンケートで代表サンプルを抽出する手法を指します。

慎重に抽出されたサンプル(標本)を使うことで、アンケートのサンプルが対象母集団を正確に反映していない場合に発生する、回答の偏り(バイアス)を軽減することができます。以下のサンプリングの種類の概要を参考にしてください。

確率的サンプリングでは、アンケートの対象に選ばれる可能性が対象母集団の全員に均一に与えられます。

確率的サンプリングには主に4つの種類があります。

  1. 単純無作為: 抽選方式やランダム化を使って、母集団の各メンバーが選択される機会を等しく持つようにします。これは母集団が多い場合には難しいかもしれませんが、抽出時のバイアスを簡単に防げる方法です。
  2. クラスター: 対象母集団をクラスターまたはグループに分けてから、クラスターをサンプルとして無作為に抽出します。抽出したクラスターのすべての回答者にアンケートを実施します。クラスターのデモグラフィックが大きく異なる場合には、バイアスが生じてしまう可能性があります。しかし、クラスターサンプリングは母集団が広く分散していたり、リーチしにくい場合には実用的な方法です。
  3. 系統: 系統抽出法を実施するには、対象母集団からメンバーを一定間隔ごとに選びます。たとえば、5,000人のリストで一番上から50人ごとに1人選ぶのです。リストの順序にバイアスが生じやすい場合には問題になりますが、全体的には効果的な抽出方法です。
  4. 層化: 回答者を性別、所得、居住地などの異なる層に分割した後、各層から無作為に抽出します。これにより、母集団の各デモグラフィック属性を効果的に反映したサンプルを作成できますが、複雑で時間がかかるという面もあります。

非確率的サンプリングは、対象母集団の一部に選択される機会が全く与えられない方法です。

非確率的サンプリングは簡単で費用もそれほどかかりませんが、抽出時にバイアスが生じやすい傾向があり、アンケート結果の信頼度に悪影響を与える可能性があります。

非確率的サンプリングには主に5つの種類があります。

  1. コンビニエンス: 最もアクセスしやすい対象者にアンケートを実施します。回答を簡単に集めることができますが、その結果が対象母集団を正確に代表しているかは保証できません。
  2. 有意または合目的的: 調査目標の達成に役立ちそうだと思う人々にアンケートを実施します。これは、結論を導き出すのに大量の量的データを必要としない質的調査でよく使用されます。
  3. 応募: アンケートに自発的に答えてくれる人を対象にします。特定の人々がアンケートに回答したり、特定の人しか回答できない可能性があり、抽出時のバイアスにつながります。
  4. スノーボール: アンケートを送信した相手に、知り合いにもアンケートへの協力を促すように依頼します。多くの回答者を見つけることができますが、対象母集団全体のうち限られたデモグラフィックにしかリーチできない可能性があります。
  5. 割当法: 母集団を調査にとって重要なカテゴリーに分けます。その後、各カテゴリーから一定の人数を抽出します。この方法ではバイアスが生じやすいリスクもありますが、迅速にフィードバックを得ることができます。

専門的なサンプリング設計からターゲット市場のアンケート調査まで、SurveyMonkey Audienceが、信頼できる市場インサイトを迅速に得るお手伝いをします。