0
アンケートとは、小さなグループ(回答者)に、より大きなグループ(ターゲット市場や母集団など)を代表させようとする行為なので、バランスを取ることが必要になります。許容誤差は、アンケートの結果が母集団の意見にどれだけ近いかを示す統計的尺度です。
許容誤差は、アンケートの精度を示します。許容誤差が小さければ小さいほど、結果の信頼性が高くなります。許容誤差が大きい場合は、結果が母集団全体の意見から乖離していることになります。
許容誤差は、アンケートの結果をまたぐ範囲です。たとえば、「はい」という回答の割合が60%で、信頼水準を95%としたときの許容誤差が5%である場合は、母集団の中で「はい」と答える人の割合が、95%の確率で55~65%の範囲にあることを意味します。
許容誤差は、結果の信頼性を判断するための値であり、調査やアンケートには欠かせません。結果に潜む不確実性を把握する上で役立ち、データを解釈する際の指針となります。許容誤差が小さければ、結果の精度や信頼性が高く、許容誤差が大きければ、ばらつきが大きくて確実性が低いことを意味します。
許容誤差を求めれば、信頼できるデータに基づき、十分な情報を得た上で決定を下すことができます。
信頼区間は、真の結果を含むと考えられる範囲を推定する手段です。たとえば、その国の成人全員の平均身長を推定するときは、信頼区間によって、真の平均がほぼ確実に含まれる身長の範囲を求めることができます。
信頼区間は、調査や意思決定において、推定値や分析に関連する不確実性を把握する上で役立ちます。
信頼区間と許容誤差は、同じ概念を違う形で言い表したものと言うことができます。どちらも、アンケートの推定値に関連する不確実性を示します。信頼区間は、真の値を確実に含むと考えられる値の範囲です。許容誤差は、推定値が真の値とどれだけ異なっている可能性があるかを示す値です。
関連しているものの、異なる概念として、信頼水準が挙げられます。信頼水準は、真の値が信頼区間内にある見込みを表します。
信頼水準には、通常、90%、95%、99%の値を使用します。信頼水準を90%などの低めの値に設定すると、信頼区間が狭まります。信頼区間を狭めると、推定の精度が高まりますが、信頼水準を下げると、真の値を捉える可能性が低くなります。逆に、信頼水準を99%のように高くすると、信頼区間の幅が広がります。信頼区間が広いと、精度は低下しますが、真の値を含む可能性は高まります。
アンケートを計画するときは、正確で信頼できる結果が出るように許容誤差を設定しましょう。許容誤差について理解すれば、アンケートで必要なレベルの推定精度を実現するには、どれだけの標本サイズが必要かを求めることができます。許容誤差を小さくすれば、必要な標本サイズは大きくなり、許容誤差が大きければ、必要な標本サイズは小さくなります。
たとえば、10万人の母集団に対してアンケートを実施するケースで、許容誤差を±5%、信頼水準を95%に設定した場合、標準の計算式で求めた標本サイズは約383人となります。
加えて、許容誤差は、アンケート結果を解釈する際にも重要な意味を持ちます。結果に含まれる不確実性の尺度となるため、結論の信頼性を評価する上で役立ちます。
たとえば、あるアンケートで回答者の60%が「製品Bより製品Aの方が好きだ」と答えたとします。許容誤差を±3%、信頼水準を95%とした場合、製品Aの方を好む人の真の割合は、高い可能性(95%)で57%~63%の範囲にあります。
許容誤差を計算するには、次の式を用います。
n = 標本サイズ • σ = 母標準偏差 • z = Zスコア
望ましい信頼水準 | Zスコア |
80% | 1.28 |
85% | 1.44 |
90% | 1.65 |
95% | 1.96 |
99% | 2.58 |
新製品の名前をAとBのどちらかに決めたいとします。ターゲット市場には40万人の潜在顧客がいます。これが母集団です。
その潜在顧客の中から、600人にアンケートを実施することにしました。これが標本サイズです。
アンケートを実施した結果、回答者の60%が、名前Aの方が好きだと答えました。ここで、許容誤差計算ツールに信頼水準を入力する必要があります。
この数字は、サンプルが全体の傾向をどれだけ正確に反映していると思われるかを表します。調査員は通常90%か95%、または99%に設定します。
上の許容誤差計算ツールに、この例にある数字を入力してみましょう。許容誤差は4%となります。
回答者の60%がAを選んだことを思い出してみましょう。この許容誤差が表すところは、95%の信頼度で、母集団(ターゲット市場)の56~64%がAという製品名を好むだろうということです。
56と64は、サンプル回答者から許容誤差を足したり引いたりして得られた数字です。
許容誤差は、アンケートの推定値をまたぐ値の範囲であり、不確実性のレベルを示します。たとえば、アンケートで60%の人がとあるポリシーを支持すると答えたとします。許容誤差を±4%、信頼水準を95%とした場合、真の支持率はほぼ確実に56%~64%の範囲にあると結論づけることができます。
アンケートにおいては、標本サイズが許容誤差に直接影響します。標本が大きければ許容誤差は小さくなり、標本が小さければ許容誤差は大きくなります。
たとえば、回答者が1000人のアンケートで許容誤差が±3%だった場合、標本サイズを2000にすれば許容誤差は±2%に抑えられます。
関連トピック:標本サイズ計算ツール
信頼水準が高いと許容誤差は広くなり、信頼水準が低いと許容誤差は狭くなります。
たとえば、アンケートの信頼水準が95%のときに許容誤差が±3%であれば、信頼水準を99%に上げると許容誤差は±4%になる可能性があります。
母集団のばらつきが大きければ許容誤差は大きくなり、ばらつきが小さければ許容誤差は小さくなります。
たとえば、所得格差の大きい都市で収入を推定する場合は、許容誤差が±50万円のように大きくなる可能性があります。一方、所得に大きな差がない都市であれば、±20万円と小さくなります。
許容誤差の計算方法とアンケート結果への影響がわかったところで、これらの概念をアンケート設計に落とし込む手順を見ていきましょう。
アンケートを使って調査したい対象の総数のことです。先ほど挙げた例では、40万人の潜在顧客がこれにあたります。
アンケート結果がどのくらいまでターゲット市場の総意と異なってもよいか、許容できるリスクを決めます。つまり、許容誤差と標本の信頼水準を設定します。
信頼水準と許容誤差のバランスを調整したら、何人の回答者が必要かを決定します。その際、アンケートを受け取った人全員が回答するわけではないということに注意してください。標本サイズとは、手元に集まった、完了した回答数を指します。
回答率とは、アンケートを受け取った人のうち、実際に回答した人の割合のことです。過去のアンケートを確認して標準的な回答率を調べましょう。過去のアンケートデータがない場合は、理論的に推測します。回答率は、控えめに見積もって10~15%程度でしょう。
ステップ4で割合が判明したら、ステップ3で決めた数の完了した回答を得るには何人にアンケートを送信すべきかがわかるでしょう。このように、許容誤差(および標本サイズや信頼水準といった、関連するすべての概念)を知ることは、アンケート設計のバランス調整を行う上で非常に大切です。この計算ができると、調査の土台が確かなものになります。
関連トピック: 母集団を推定する方法
SurveyMonkeyを使えば、標本サイズを増やし、許容誤差を小さくすることができます。SurveyMonkey Audienceは、ターゲット市場を正確に反映した回答者からすばやく効率的に高品質なデータを集められる、強力なプラットフォームです。新製品のリリースや顧客満足度の測定、学術調査の実施など、アンケートの目的が何であれ、ターゲット層にリーチして有効な回答を得るためのツールが揃っています。
SurveyMonkeyにはアンケートの作成・最適化・共有に必要な各種ツールが揃っており、求めている回答が集まります。