アンケートは、人々の意見や行動、フィードバックなどをよりよく理解するために実施します。この際、理解しようとしている人々(母集団)の声を反映した信頼できる意見かどうかは、どのように確認すればよいでしょう。そこで大切になるのが、アンケートの標本サイズを決める作業です。
標本サイズとは、アンケートで手元に戻ってくる完了した回答数のことです。ターゲット市場やデモグラフィックの総数に応じて、理想的な標本サイズは変わります。
とは言え、アンケートの標本サイズはアンケート結果に重要性があるか、統計的に有意かどうかを判断する要素の1つに過ぎません。
アンケートの標本サイズを決める方法をご紹介する前に、重要な用語をいくつか確認しましょう。
たとえば、1,000人の集団に対してアンケートを送信し、そのうち400人がアンケートを開いた場合、回答率は40%です。ただし、アンケートを開いた人全員が回答を完了することはほぼありません。アンケートを開いた400人のうち、回答を実際に終えて送信した人が200人だけだった場合、完了率は50%になります。
回答率と完了率は標本サイズに直接は影響しませんが、標本サイズを決める際にこれらの変数を考慮することが大切です。
なぜなら、対象母集団を代表する標本を決める際に、アンケートを受け取った人全員が回答を送ってくれるとは限らないという現実を念頭に置き、それでも統計的有意性が確保できる標本サイズにする必要があるからです。
新製品のアイデアをテストする場面を考えてみましょう。この製品の典型的な顧客は、年齢と給与が一定の層であることがわかっています。また、日本の都市圏やその近郊に居住している傾向もあります。この集団が、理解したい対象者層、すなわち母集団となります。
これで、調査対象(理解したい人々)の総数である母集団のサイズがわかります。この例では、母集団が1,000万人だとします。
次に、許容誤差を決める必要があります。許容誤差は、アンケートの回答が母集団の意見をどの程度代表しているかを表す割合です。
一般的にアンケート調査で使われる許容誤差は、5%です。つまり、結果のデータから±5%の誤差を許容することを意味します。
たとえば、アンケートを完了した回答者のうち60%が「新製品を購入する予定だ」と回答した場合、許容誤差は5%なので、実際に新製品を購入する人は55~65%だと結論づけることができます。
最後に、信頼水準を決めます。信頼水準は、アンケートを対象母集団の他の標本に送信した場合に同じ結果が得られる可能性を示します。
この例では、アンケートを1,000人に送信します。許容誤差を考慮して、55~65%が新製品を購入すると結論付けました。では、この結果にどの程度確信を持てるでしょうか。
信頼水準を95%に設定しましょう。これは業界標準の水準です。すると、同じアンケートを異なる1,000人の標本に繰り返し送信した場合、95%の確率で同じ結果が得られると判断できます。
母集団、許容誤差、および望ましい信頼水準が決まったら、次はいよいよアンケートの標本サイズを決める番です。標本サイズとは、アンケートで手元に戻ってくる完了した回答数のことですよね。SurveyMonkeyの標本サイズ計算ツールか、以下の標本サイズの計算式を使用して計算することができます。
*信頼水準が95%のとき、Zスコアは1.96になります。
この計算式を使うと、母集団が1,000万人で、許容誤差が5%(0.05)、信頼水準が95%(Zスコアは1.96)の場合の標本サイズは、385であることが計算できます。しかし、ここで終わりではありません。標本サイズはただ数を決めればいいものではないのです。
対象の標本サイズを決めた後は、回答者を無作為に選ぶための信頼に足る方法を選ぶ必要があります。無作為抽出の原則に従いつつ、アンケート受信者を効率的に選択するために、Excelを使って無作為標本を作成する方法を学びましょう。
一般的に、標本サイズが大きければ大きいほど結果が統計的に有意になる可能性が高まります。けれど、一概に大きければいいというものでもなく、標本サイズの重要度は以下の変数に応じて変わることがあります。
アンケートに必要な回答者数をすばやく見積もりたい場合には、判断に役立つこちらの表を参考にしてください。準備するのは対象母集団の人数と、希望する許容誤差(3~10%)だけです。
母集団 | ±3% | ±5% | ±10% |
500 | 345 | 220 | 80 |
1,000 | 525 | 285 | 90 |
3,000 | 810 | 350 | 100 |
5,000 | 910 | 370 | 100 |
10,000 | 1,000 | 385 | 100 |
100,000 | 1,100 | 400 | 100 |
1,000,000 | 1,100 | 400 | 100 |
10,000,000 | 1,100 | 400 | 100 |
*割合は、3%、5%、10%の許容誤差を示します。
たとえば、医学研究を行う場合の許容誤差は、3%など厳しめに設定します。顧客満足度アンケートの標本サイズを選択する場合の許容誤差は、10%など高めの値に設定すると良いでしょう。
標本サイズを選択するときは、サンプリングの種類についても検討することが大切です。これは、アンケートで代表サンプルを抽出する手法を指します。
慎重に抽出されたサンプル(標本)を使うことで、アンケートのサンプルが対象母集団を正確に反映していない場合に発生する、回答の偏り(バイアス)を軽減することができます。以下のサンプリングの種類の概要を参考にしてください。
確率的サンプリングでは、アンケートの対象に選ばれる可能性が対象母集団の全員に均一に与えられます。
確率的サンプリングには主に4つの種類があります。
非確率的サンプリングは、対象母集団の一部に選択される機会が全く与えられない方法です。
非確率的サンプリングは簡単で費用もそれほどかかりませんが、抽出時にバイアスが生じやすい傾向があり、アンケート結果の信頼度に悪影響を与える可能性があります。
非確率的サンプリングには主に5つの種類があります。
専門的なサンプリング設計からターゲット市場のアンケート調査まで、SurveyMonkey Audienceが、信頼できる市場インサイトを迅速に得るお手伝いをします。