Excelでのランダムサンプリングの方法

SurveyMonkeyには無作為標本とランダムサンプリング(無作為抽出法)に関する質問が多く寄せられます(とても良い質問です)。そこで、無作為標本をExcelで手軽に素早く生成する秘訣をご紹介しようと思いますが、まずは、ランダムサンプリングの背景とその必要性について少し見てみましょう。

サンプリングの集中講座

無作為標本って?なぜ必要なの?そう疑問に思ってる方もいるでしょう。たとえば、顧客にアンケートを実施して、彼らのニーズを満たしているのか、満足度を上げるにはどうしたら良いかを知りたいとします。この場合、顧客ベース全体が「母集団」になります。当然のことながら、母集団の顧客全員にアンケートを実施しようとは思っていないでしょう。すべての連絡先情報など持ち合わせていないかもしれませんし、アンケートに全員が答えてくれるとも限りません。どのような理由にしろ、アンケートのために連絡をとることのできる顧客集団のみが「標本抽出枠」となります。そして、実際にアンケートを実施するために連絡をとり、実際にアンケートに応えてくれる回答者が「標本」です。標本抽出枠のすべての人が選択される機会を平等に与えられるよう、標本は無作為に抽出する必要があります(このため無作為標本と呼ばれます)。

最近注文のあった顧客20名や、あいうえお順で最初の20名といった「都合のいい標本」を選ぶわけではありません。このような方法には本質的に偏りがあります。最近注文のあった顧客20名を標本にすると、彼らはおそらく新規顧客で最新の製品やWebサイトのデザインしか知らない可能性があります。無作為標本の抽出により、このような標本抽出枠から都合のいい標本を選んでしまうことによるバイアスを最小限に抑えることができます。

Excelを使って無作為標本を抽出する方法

こんなことを言うとやる気をくじいてしまうかもしれませんが、ランダムサンプリングに統計学や数学の専門知識はいりません。Excelのスプレッドシートさえあれば大丈夫。標本抽出枠、つまり連絡先情報を持っている顧客をスプレッドシートに入力しましょう。Excelに標本抽出枠(潜在的なアンケート回答者)がそろったら、あとは簡単に無作為標本を抽出することができます。たとえば、顧客満足度アンケートを実施するために、顧客3,000名から500名の無作為標本を選びたい場合、次の手順で抽出します。

  1. スプレッドシートに「Random_number」という名前の新しい列を追加する
  2. 見出し行の下の最初のセルに“= RAND()”と入力する
  3. Enterキーを押すと、セルにランダムな数字が表示される
  4. 最初のセルを同じ列の他のセルにコピー&ペーストする
  5. 各行にランダムな数字が表示されたら、「Random_number」の行でレコードを並べ替える
  6. 上から500件のメールアドレスを選択する。これが3,000件のアドレスからランダムに抽出された500件のアドレスになる

無作為標本の回答者数が統計的に有意かどうか、こちらのブログ記事を参照して確認してください。無作為標本は、大規模な母集団に対して実施する以下のようなフィードバックアンケートに役立ちます。

SurveyMonkeyが好奇心に火をつける様子をご覧ください