その他のリソース
市場調査アンケートをスピーディーに始めるために必要なすべてが揃っています。
アンケートを利用した調査に関して、「標本(またはサンプル)」と「母集団」という言葉が混同して使われているのを聞いたことはありませんか。この2つは、実際にはまったく異なる集団を示す言葉です。「母集団」とは、ある調査の対象になりうる個人全員を含む集団を意味します。たとえば、昨年発売した製品のフィードバックを顧客から集めたい場合には、その製品を購入した人、試した人、あるいはその製品と何らかの関わりをもった人全員が母集団になります。一方、「標本」とは、母集団の中の小集団(サブセット)を意味します。標本はさまざまな方法によって特定し、選択することができます。顧客の中でも女性の意見に興味がある場合、顧客デモグラフィックスに焦点を当て、性別に基づいた抽出(サンプリング)方法を採用できます。抽出するときに指標となる特徴には他にも、地理的な属性や行動による属性などがあります。また、母集団が非常に大きく、母集団全体からのデータ収集が手に余るような状況では、無作為の方法によって小さく、管理しやすい標本を選ぶと良いでしょう。
市場調査を実施する前にアンケート用語をおさらいしましょう。
母集団からのデータ収集にも、標本からのデータ収集にも、それぞれ長所があります。どの方法をどのような時に使えばいいか、参考になる経験則もありますのでご紹介いたします。
理想を言えば、ブランド認知調査でも 顧客フィードバックデータの収集でも、どんな調査を実施するときには母集団全体からデータを集めたいものです。理由として、母集団の全構成員が調査データを提供してくれると、結果について行った推論がその母集団を代表していることが最大限保証されるためです。言い換えれば、母集団からのデータ収集は調査結果の妥当性と信頼性を高めます。
しかし現実的には、常に調査母集団からデータを収集できるとは限りません。主な理由として、母集団は往々にして特定することが難しく、統計的に有効な数の回答を収集するのはさらに困難です。ただし、もし母集団の線引きがはっきりしていて、対象者が何らかの形で「囚われて」いるのであれば、母集団からのデータ収集が合理的です。たとえば、従業員のエンゲージメントデータを収集したいなら、母集団に基づいた方法を選択できるかもしれません。人事記録から全従業員の名簿を入手して、各自に直接メールします。
あるいは、母集団が小さくてアンケートに協力的、アンケートの結果に興味を持っているというような場合(新サービスのパイロットユーザー全30名など)にも、この方法が合理的ですが、母集団の境界線が曖昧な場合や、母集団が膨大、地理的に分散しているなどの場合には、標本で線引きをする必要性があるでしょう。
母集団のデータ収集からの方が妥当かつ正確な洞察が導き出せるのに、母集団ではなく標本でアンケートを実施するのはなぜでしょうか?端的に言えば、必要性です。調査者にとって対象の母集団全体に調査を行うことは、規模の大きさや地理的に分散しているため、ほとんどの場合非現実的です。ここで、あなたがオフィス街で人気のフードトラックを営んでいると仮定しましょう。そこで周囲の会社の重役にランチの好みについてアンケートを取りたいと思っています。もし母集団ベースの方法を採用するなら、そこで働く対象者全員の正確かつ完全な名簿を手に入れる必要があります。ちょっと、難しそうですよね。このような場合に、母集団の中の小集団からデータを集める必要があります。そしてその結果は、より大きな母集団に一般化できます。言い換えれば、標本を使うことによって、調査結果が、標本のもととなった大きい母集団を代表していると推測できるのです。ただし、これは大まかな推測が可能であり、いつもではありません。もう少し詳しく見ていきましょう。
標本ベースの方法に決めたら、主に2つの抽出法、確率抽出法と非確率抽出法があります。
確率抽出法は無作為の抽出法
確率抽出法とは、母集団のすべての構成員が等しく標本に含まれる機会を与えられる方法を意味します。たとえば、もし母集団のリスト(「抽出枠」と呼ばれます)がある場合、乱数ジェネレーターを使い、生成された数字とリスト内の順番が同じ個人を選んでいきます。この方法は単純無作為抽出法と呼ばれます。
もう1つの体系的な無作為抽出法としては、抽出枠のたとえば10人目や100人目ごとに個人を選んでいく方法です。層化抽出法は無作為抽出法に似ていますが、まず第一に、母集団を類似した属性でグループ分けします。たとえば顧客が、あなたの店で購入する頻度や購入金額によってグループ分けされているとします。それから、単純または系統的な抽出法の手順で各グループから個人を選びます。この作業によって、母集団内のさまざまなセグメントの代表を確実に最終的な標本に含めることができます。
非確率抽出法はより選択的
一方、非確率抽出法では、母集団のすべての構成員に等しく標本に含まれる機会が与えられるわけではありません。たとえば、土曜の朝にWebサイトを閲覧する訪問者全員にアンケートを取ろうとすれば、週末に買い物をする人しかアンケートに参加するチャンスはありません。あるいは、個人的に関係のある顧客にのみアンケートを送れば、あまりよく知らない顧客の意見は無視されます。この方法では標本にある程度の誤差が生まれ、母集団を代表しない可能性があります。なのになぜ、このような方法を使うのでしょうか?確率ベースの方法は理想的ではありますが、すべての重要でありながら、捉えどころがない母集団リストを手に入れる必要があるからです。
サンプルサイズ計算を使ってどれくらい僅差かを調べてみましょう。
これまで見てきたように、多くの場合、母集団全体ではなく標本からデータを集めなければなりません。これは必要に駆られた選択ですが、だからといって標本からのデータ収集にメリットがない訳ではありません。
データを標本から集める場合も母集団から集める場合も、用語は正しく理解しましょう。母集団ベースと標本ベースの方法の大きな違いの1つが、標本サイズの決定方法です。こちらで詳しく説明しているように、標本サイズとはアンケートを完了して欲しい対象者数の推定値です。「統計量」と「パラメーター(母数)」という用語は、標本と母集団からのデータ収集に関する、関連し合っていますが異なるコンセプトです。ではそれぞれを見ていきましょう。
パラメーターは、母集団全体から収集したデータに基づく、母集団の何らかの特徴の尺度です。たとえば、従業員のモチベーションと仕事の効率を上げるために勤務日を週4日に減らす決断を下したとします(ラッキーな従業員ですね!)。そこで何曜日に休みたいか、すべての従業員にアンケートを送って尋ねます。もし従業員全員がアンケートに回答し、80%が金曜日に休みたいと答えた場合、この80%という数値が母集団のパラメーターとなります。
一方で、統計量とは、母集団の標本から収集されたデータから推測される結果です。従業員数が非常に多い会社なので、無作為の代表サンプル(代表標本)にアンケートを送信することにしました。結果は母集団全体からデータを収集した場合と大体同じで、大多数の従業員(77%)が金曜日を休みにして連休にすることを望んでいました。この場合、結果は変わりませんが、この数字の呼び方が変わり、77%という数値を統計量と呼びます。どうしてこの2つの数値の違いを知っておく必要があるのでしょうか?その答えはサンプリングエラーにあります。
サンプリングエラーは標本関連で知っておく必要がある、もう1つの重要な要素です。簡単に言えば、サンプリングエラーは母集団のパラメーターと標本の統計量の差です。先ほどの例に戻ると、母集団全体に希望の曜日を尋ねたところ、80%が金曜日に休みたいと答えました。しかし、標本でアンケートをとると、77%しか金曜日と答えませんでした。サンプリングエラーはこの母集団から得られた結果と標本から得られた結果の差、すなわちこの場合は3%になります。
この例は、できる限り母集団を代表するような標本を確保することの重要性を示しています。たとえば、パートの従業員のみを抽出して、その多くがもとより金曜日に働いていなかったら一体どうなるでしょうか?より大きな母集団の好みを反映しない、まったく異なる結果が出る可能性があります。
正確性を確保し、エラー(誤差)を最小限に抑えることです。サンプリングエラーは確率ベースの抽出法であっても発生することがあります。これは、たとえ標本が母集団を正確に代表する場合でも、統計的な分散と代表値(平均や標準偏差など)がわずかに異なるためです。目標は可能な限りサンプリングエラーを低く抑えること。サンプリングエラーは標本のサイズを大きくすることで減らせます。
では、アンケートの対象者の人数を、どのように決めればいいのでしょうか?とりあえず作成して、送信し、あとは運任せ?そうとも言えませんが、母集団からデータを収集できるなら、対象者の理想的なサイズは、まさに母集団のサイズと同じなため、この質問は意味をなしません。しかし、標本でアンケートを実施するなら、もう少し考えなければなりません。
まずは、母集団のサイズを推定する必要があります。最新の母集団リストが手元にない場合でも、大まかな数字を念頭に置いておくことをお勧めします。たとえば、地域の路上で自転車に乗る人が直面する危険について知りたいと思っているなら、二次データを使い、その学区で自転車に乗る人口がおよそ2万人いると推定できます。この数字が分かれば、許容誤差を適用できます。これは結果の精度を測る尺度で、パーセンテージで表されます。5%の許容誤差を設定するということは、導き出された統計値の上下5%の範囲に真の結果があると推定することを意味します。したがって、抽出された77%の従業員が金曜日の休みを希望するという統計値に5%の許容誤差を適用すると、実際の数値は72%から82%の間にあることになります。
最後に、標本サイズグラフを使って、母集団サイズを許容誤差と比較し、対象とする標本サイズのおおよその推定値を得ることができます。もちろん、すべての対象者がアンケートに記入してくれるとは限らないことも念頭に入れましょう。標本サイズが100なら、それよりもっと多い回答者にアンケートを実施して、対象者のサイズに達する必要があります。
アンケートの実施に必要な対象者数の決定方法について詳細ををご覧ください。
つまり、簡潔に言えば、母集団からのデータ収集と標本からのデータ収集には違いがあります。どのような市場調査を行うにせよ、既存のさまざまな種類の市場調査アンケートを調べて、一番適したものを見つけましょう。
典型的なサンプルにアンケートを送って市場調査データを収集する
調査の専門家に市場調査プロジェクトをサポートしてもらう
分析やレポート作成の自動化によってクリエイティブや製品のコンセプトをテストする
市場調査関連のリソースをもっと読むには、サイトマップをご覧ください。