はじめに
マーケティングリサーチやアンケート調査を行う際、よく課題となるのが「サンプルサイズ(調査対象者数)の決め方」です。
サンプルサイズが小さすぎると信頼性が低くなり、逆に大きすぎるとコストや時間が無駄になる可能性もあります。適切なサンプルサイズは、調査の目的や精度、予算とのバランスで最適化すべき重要な要素です。
この記事では、サンプルサイズとは何か、どのように計算・設定するべきか、実務で役立つ目安やポイントを初心者にもわかりやすく解説します。
サンプルサイズとは?(Sample Size)
サンプルサイズとは、1つの調査群、または標本に含まれる調査対象者や個体の具体的な数を指します。 多くのリサーチにおいて最も重要な数値であり、「n数」として言及されることも一般的です。
例えば、「全国の20代の社会人女性1,000人」を対象とした調査の場合、この1,000人がサンプルサイズにあたります。
サンプルサイズは「n」で表現します。上記の調査では、n=1,000と表記します。
サンプル数(Number of Sample)との違い
サンプル数とは、調査で収集または比較対象とした調査群(標本)の総数、つまりサンプリングを実施した回数やグループの数を指します。
これは、異なる条件や属性を持つグループ間での比較を目的とする場合に特に重要になります。サンプル数は、調査対象の種類や層別化の数を示すものです。
例えば、ある商品の満足度を「関東地方」「関西地方」「九州地方」の3つの異なる地域でそれぞれ調査し、結果を比較したい場合、この3つの地域別グループがサンプル数にあたります。
そもそも、サンプルってなに?
サンプル(Sample)とは、調査対象となる集団全体から、その特性を推定するために選び出された一部の対象者やデータの集合を指します。日本語ではサンプルのことを「標本」と言います。
このときの「調査対象となる集合全体」のことを母集団(Population)と言います。
この調査対象となる集団の全体(母集団)から、その特性を推定するために集団の一部を代表のとして抽出する行為を、サンプリング(標本抽出)と呼びます。
例えば、日本人の20-24歳の飲酒頻度を知りたいとします。このとき、日本中の20-24歳のアンケートデータや購入履歴をすべて取得すれば最も正確な「20-24歳の日本人の飲酒頻度」がわかるでしょう。
とはいえ、日本中の該当者全員のデータを取得することは現実的でないでしょう。莫大な時間と手間を要するでしょうし、コストがかかりすぎます。
そこで、一部の20-24歳をその世代の代表として選び出して調査します。この選ばれた人たちがサンプル(標本)であり、その人数がサンプルサイズです。
簡単に説明すると:20-24歳の日本人1,000人にアンケートをとった結果「週に平均して1-2回お酒を飲む」ということがわかったら、日本全国の20-24歳の平均もだいたいそれくらいだと想像ができますよね。
なぜサンプルサイズが重要なのか?
適切なサンプルサイズを設定することで、以下のようなメリットがあります:
- 必要最小限のコストで実施できる
- 結果の精度(信頼性)が向上する
- 偶然による誤差を抑えられる
- 調査の説得力・再現性が高まる
一般的に、サンプルサイズが大きければ大きいほど、調査対象全体(母集団)の傾向を正確に捉えることができ、結果の信頼性が向上します。(統計的な誤差(標本誤差)が小さくなる、と言います)
しかし、サンプルサイズを大きくすることは、調査にかかるコストや時間、労力を増大させることにもつながります。逆に小さいサンプルサイズは、調査結果のブレや偏り、判断ミスにつながるリスクがあります。
【初心者はスキップ】サンプルサイズの設計方法【理論編】
サンプルサイズを決定する際には、以下の4つの要素が重要です。
マーケティングリサーチ初心者の方は、サンプルサイズの設計方法【実務編】をご覧ください。いま読んでも、混乱するだけだと思います。
1. 母集団のサイズ(N)
調査対象全体の人数。大規模な場合は近似的に無限母集団とみなすこともあります。
2. 許容誤差(e)
調査結果が「どの程度の誤差まで許容できるか」。一般的には±3〜5%程度がよく用いられます。
3. 信頼水準(Z)
調査結果の精度をどの程度の確率で保証するか。よく使われる値は:
- 90%信頼水準 → Z = 1.645
- 95%信頼水準 → Z = 1.96
- 99%信頼水準 → Z = 2.576
4. 分散(p×q)
p=「ある事象が起こる割合」、q=「起こらない割合(=1−p)」 → 最大値となる0.5×0.5=0.25を使うと“最も厳しい条件”として安全なサイズになります。
サンプルサイズの計算式
一般的な計算式は以下の通りです:
n = (Z² × p × q) / e²
例:信頼水準95%(Z=1.96)、p=0.5、e=0.05 の場合:
n = (1.96² × 0.5 × 0.5) / 0.05² ≒ 384.16
→ おおよそ「385サンプル」で±5%の誤差、95%の信頼水準が得られるということになります。
※母集団が小さい場合は「有限母集団補正(FPC)」も考慮します。
サンプルサイズの目安一覧表(信頼水準95%)
| 許容誤差(e) | 必要なサンプルサイズ(p=0.5) |
|---|---|
| ±10% | 約100人 |
| ±5% | 約385人 |
| ±3% | 約1,067人 |
| ±2% | 約2,401人 |
【読者が使えるのはこちら】サンプルサイズの設計方法【実務編】
実務で上記の理論的な考え方はほぼ使いません。
男女別・年代別で分析したいとき
男女別や年代別で比較したい場合、それぞれに十分なサンプルサイズが必要になります。
例えば、20-60代の男女間で比較をしたいときは以下のように設定します。
| 性別/年代 | 20代 | 30代 | 40代 | 50代 | 60代 |
| 男性 | 100 | 100 | 100 | 100 | 100 |
| 女性 | 100 | 100 | 100 | 100 | 100 |
100人ずつ集めると、10セルx100=1,000人回答が必要です。n=1,000です。
1セルあたり最低でも50人は欲しいところです。30人未満のセルは分析対象にしない方が望ましいです。
すると予算がなければn=300~500で設定しますが、基本はn=1,000で取ってほしいです。
n=300の場合、男性に絞るとn=150まで減ります。
そこから「商品Xを買ったことがある人(10%)」を抽出するとn=15です。
「商品Xを買ったことがある男性」の中で複数の属性があったとしてもn=15では傾向を分析しきれません。(標本誤差が大きい、と言います。)
必要な配信数を推定する
サンプルサイズと割付に基づいて、どれくらのアンケートを回収する必要があるのかを設計します。
必要なアンケート配信数を推定する計算式
- アンケートを回答する人数=アンケート配信数xアンケート開始率
- アンケートを完了する人数=アンケートを回答する人数x回答完了率
- 回収率=アンケートを完了する人数÷アンケート配信数
例えば、以下のケースではアンケートはどの程度人数に配信すればよいのでしょうか?
・上記の20~60代の男女で均等割付で計1,000サンプル回収したい
・アンケート開始率:50%
・回答完了率:50%
上記の場合、アンケートを4,000人に配信すれば1,000人の回答を得られるだろう、と推定できます。
計算式
配信数(4,000人) x アンケート開始率(50%) x 回答完了率(50%)= 1,000人
設問が長すぎたりすると、途中で回答を諦めて離脱してしまう可能性が上がり、回答完了率は下がるので注意しましょう。
オンラインのモニターサイトのWebアンケートでは回答完了率(=回収率)が20〜30%程度となるケースもあります。
予算と納期
実現可能なコストやスケジュールに収めるため、調査規模を調整する必要もあります。
調査目的別:サンプルサイズの考え方
認知率・利用率調査
→ ±5%の誤差で全体傾向をつかむ:300〜500人程度が一般的
広告効果測定
ブランドリフト調査やセールスリフト調査と呼ばれるものです。
広告接触者n=300、広告非接触者n=300くらいがよく見かけますね。
広告接触者n=100、広告非接触者n=100のブランドリフト調査も見かけますね。
商品評価・コンセプトテスト
→ 複数パターン比較を行う場合、各グループに100人程度が目安
BtoB調査
→ 母数が限られるため、エキスパートインタビューで実施することが多いです。
まとめ
- サンプルサイズとは、調査対象の人数であり、調査の精度と信頼性を大きく左右する
- 決定には「許容誤差」「信頼水準」「分散」「母集団サイズ」の4要素が重要
- 実務では、目的・予算・回答率なども踏まえて設計すべき
適切なサンプルサイズ設計は、調査結果の信頼性とコストパフォーマンスの両立に欠かせません。 「なんとなく」で決めず、理論と実務のバランスで最適な設計を目指しましょう。



