サンプルサイズの決め方|無料計算ツール付き・調査設計の実務ガイド

📖 この記事の読了時間:約8分

はじめに

マーケティングリサーチやアンケート調査を行う際、よく課題となるのが「サンプルサイズ(調査対象者数)の決め方」です。

サンプルサイズが小さすぎると信頼性が低くなり、逆に大きすぎるとコストや時間が無駄になる可能性もあります。適切なサンプルサイズは、調査の目的や精度、予算とのバランスで最適化すべき重要な要素です。

この記事では、サンプルサイズとは何か、どのように計算・設定するべきか、実務で役立つ目安やポイントを初心者にもわかりやすく解説します。

サンプルサイズとは?(Sample Size)

サンプルサイズとは、1つの調査群、または標本に含まれる調査対象者や個体の具体的な数を指します。 多くのリサーチにおいて最も重要な数値であり、「n数」として言及されることも一般的です。

例えば、「全国の20代の社会人女性1,000人」を対象とした調査の場合、この1,000人がサンプルサイズにあたります。

サンプルサイズは「n」で表現します。上記の調査では、n=1,000と表記します。

🔗 あわせて読みたいサンプリング数の設定方法|調査精度とコストを両立させる実務的アプローチ

サンプル数(Number of Sample)との違い

サンプル数とは、調査で収集または比較対象とした調査群(標本)の総数、つまりサンプリングを実施した回数やグループの数を指します。

これは、異なる条件や属性を持つグループ間での比較を目的とする場合に特に重要になります。サンプル数は、調査対象の種類や層別化の数を示すものです。

例えば、ある商品の満足度を「関東地方」「関西地方」「九州地方」の3つの異なる地域でそれぞれ調査し、結果を比較したい場合、この3つの地域別グループがサンプル数にあたります。

そもそも、サンプルってなに?

サンプル(Sample)とは、調査対象となる集団全体から、その特性を推定するために選び出された一部の対象者やデータの集合を指します。日本語ではサンプルのことを「標本」と言います。

このときの「調査対象となる集合全体」のことを母集団(Population)と言います。

この調査対象となる集団の全体(母集団)から、その特性を推定するために集団の一部を代表のとして抽出する行為を、サンプリング(標本抽出)と呼びます。

例えば、日本人の20-24歳の飲酒頻度を知りたいとします。このとき、日本中の20-24歳のアンケートデータや購入履歴をすべて取得すれば最も正確な「20-24歳の日本人の飲酒頻度」がわかるでしょう。

とはいえ、日本中の該当者全員のデータを取得することは現実的でないでしょう。莫大な時間と手間を要するでしょうし、コストがかかりすぎます。

そこで、一部の20-24歳をその世代の代表として選び出して調査します。この選ばれた人たちがサンプル(標本)であり、その人数がサンプルサイズです。

簡単に説明すると:20-24歳の日本人1,000人にアンケートをとった結果「週に平均して1-2回お酒を飲む」ということがわかったら、日本全国の20-24歳の平均もだいたいそれくらいだと想像ができますよね。

なぜサンプルサイズが重要なのか?

適切なサンプルサイズを設定することで、以下のようなメリットがあります:

  • 必要最小限のコストで実施できる
  • 結果の精度(信頼性)が向上する
  • 偶然による誤差を抑えられる
  • 調査の説得力・再現性が高まる

一般的に、サンプルサイズが大きければ大きいほど、調査対象全体(母集団)の傾向を正確に捉えることができ、結果の信頼性が向上します。(統計的な誤差(標本誤差)が小さくなる、と言います)

しかし、サンプルサイズを大きくすることは、調査にかかるコストや時間、労力を増大させることにもつながります。逆に小さいサンプルサイズは、調査結果のブレや偏り、判断ミスにつながるリスクがあります。

【初心者はスキップ】サンプルサイズの設計方法【理論編】

サンプルサイズを決定する際には、以下の4つの要素が重要です。

マーケティングリサーチ初心者の方は、サンプルサイズの設計方法【実務編】をご覧ください。いま読んでも、混乱するだけだと思います。

1. 母集団のサイズ(N)

調査対象全体の人数。大規模な場合は近似的に無限母集団とみなすこともあります。

2. 許容誤差(e)

調査結果が「どの程度の誤差まで許容できるか」。一般的には±3〜5%程度がよく用いられます。

3. 信頼水準(Z)

調査結果の精度をどの程度の確率で保証するか。よく使われる値は:

  • 90%信頼水準 → Z = 1.645
  • 95%信頼水準 → Z = 1.96
  • 99%信頼水準 → Z = 2.576

4. 分散(p×q)

p=「ある事象が起こる割合」、q=「起こらない割合(=1−p)」 → 最大値となる0.5×0.5=0.25を使うと“最も厳しい条件”として安全なサイズになります。

サンプルサイズの計算式

一般的な計算式は以下の通りです:

n = (Z² × p × q) / e²

例:信頼水準95%(Z=1.96)、p=0.5、e=0.05 の場合:

n = (1.96² × 0.5 × 0.5) / 0.05² ≒ 384.16

→ おおよそ「385サンプル」で±5%の誤差、95%の信頼水準が得られるということになります。

※母集団が小さい場合は「有限母集団補正(FPC)」も考慮します。

上記の計算式を使って、あなたの調査に必要なサンプルサイズを算出できます。

サンプルサイズ計算ツール
信頼水準・許容誤差・母集団サイズから、必要なサンプルサイズを算出します。
信頼水準 (一般的には95%)

許容誤差 (±何%まで許容するか)

母集団サイズ (不明なら空欄でOK)

推定割合 (不明なら50%が最も安全)

※ この計算は統計的な理論値です。実務では回答率・離脱率を考慮し、必要サンプル数の3〜5倍のアンケート配信を見込んでください。

サンプルサイズの目安一覧表(信頼水準95%)

許容誤差(e) 必要なサンプルサイズ(p=0.5)
±10% 約100人
±5% 約385人
±3% 約1,067人
±2% 約2,401人

【読者が使えるのはこちら】サンプルサイズの設計方法【実務編】

実務で上記の理論的な考え方はほぼ使いません。

男女別・年代別で分析したいとき

男女別や年代別で比較したい場合、それぞれに十分なサンプルサイズが必要になります。
例えば、20-60代の男女間で比較をしたいときは以下のように設定します。

性別/年代 20代 30代 40代 50代 60代
男性 100 100 100 100 100
女性 100 100 100 100 100

100人ずつ集めると、10セルx100=1,000人回答が必要です。n=1,000です。

1セルあたり最低でも50人は欲しいところです。30人未満のセルは分析対象にしない方が望ましいです。

すると予算がなければn=300~500で設定しますが、基本はn=1,000で取ってほしいです。

n=300の場合、男性に絞るとn=150まで減ります。

そこから「商品Xを買ったことがある人(10%)」を抽出するとn=15です。

「商品Xを買ったことがある男性」の中で複数の属性があったとしてもn=15では傾向を分析しきれません。(標本誤差が大きい、と言います。)

セグメント分析のためのサンプルサイズ設計原則

上記の例が示すように、セグメント別の分析では「最も細かい分析単位(セル)に何人必要か」から逆算してサンプルサイズを決めます。全体のnだけを見て設計すると、分析段階でセルが足りないという事態に陥ります。

セグメント数に応じた実務上の目安は以下の通りです。

分析パターン セグメント構成例 各セル目安 合計サンプル
全体傾向のみ 分割なし 400〜500
2〜3セグメント比較 男女別、利用頻度別 150〜200人 400〜600
4〜5セグメント比較 年代別(20〜60代) 150〜200人 600〜1,000
クロス分析 性別×年代 最低50人、理想100人 セル数×100

予算に制約がある場合は、分析の優先度が高いセグメントにサンプルを厚く配分し、優先度の低いセグメントは最低限(各セル50人)に抑える「傾斜配分」が有効です。傾斜配分を含む定量調査でのサンプルサイズ・割付・ブースト回収と自然回収の設計の基本は別記事で詳しく解説しています。

必要な配信数を推定する

サンプルサイズと割付に基づいて、どれくらのアンケートを回収する必要があるのかを設計します。

必要なアンケート配信数を推定する計算式

  • アンケートを回答する人数=アンケート配信数xアンケート開始率
  • アンケートを完了する人数=アンケートを回答する人数x回答完了率
  • 回収率=アンケートを完了する人数÷アンケート配信数

例えば、以下のケースではアンケートはどの程度人数に配信すればよいのでしょうか?

・上記の20~60代の男女で均等割付で計1,000サンプル回収したい
・アンケート開始率:50%
・回答完了率:50%

上記の場合、アンケートを4,000人に配信すれば1,000人の回答を得られるだろう、と推定できます。

計算式

配信数(4,000人) x アンケート開始率(50%) x 回答完了率(50%)= 1,000人

設問が長すぎたりすると、途中で回答を諦めて離脱してしまう可能性が上がり、回答完了率は下がるので注意しましょう。

オンラインのモニターサイトのWebアンケートでは回答完了率(=回収率)が20〜30%程度となるケースもあります。

予算と納期

実現可能なコストやスケジュールに収めるため、調査規模を調整する必要もあります。

調査目的別:サンプルサイズの考え方

認知率・利用率調査

→ ±5%の誤差で全体傾向をつかむ:300〜500人程度が一般的

広告効果測定

ブランドリフト調査やセールスリフト調査と呼ばれるものです。

広告接触者n=300、広告非接触者n=300くらいがよく見かけますね。

広告接触者n=100、広告非接触者n=100のブランドリフト調査も見かけますね。

商品評価・コンセプトテスト

→ 複数パターン比較を行う場合、各グループに100人程度が目安

BtoB調査

→ 母数が限られるため、エキスパートインタビューで実施することが多いです。

まとめ

  • サンプルサイズとは、調査対象の人数であり、調査の精度と信頼性を大きく左右する
  • 決定には「許容誤差」「信頼水準」「分散」「母集団サイズ」の4要素が重要
  • 実務では、目的・予算・回答率なども踏まえて設計すべき

適切なサンプルサイズ設計は、調査結果の信頼性とコストパフォーマンスの両立に欠かせません。 「なんとなく」で決めず、理論と実務のバランスで最適な設計を目指しましょう。

リサートにお任せください

お任せいただけること

モデレーター派遣・紹介 / 対象者リクルーティング / 発言録作成 / 同時通訳 / 定性調査サービス / 定量調査サービス

必要な部分だけのご依頼も歓迎です。

よくある質問

Q.サンプルサイズとサンプル数の違いは何ですか?
A.サンプルサイズ(Sample Size)は調査設計段階で決める「必要な標本の大きさ」を指し、サンプル数(Number of Sample)は実際に回収できた標本数を指します。設計上のサンプルサイズに対して、実際のサンプル数が十分かどうかを確認することが重要です。
Q.サンプルサイズの計算に必要な要素は何ですか?
A.主に4つの要素が必要です。母集団のサイズ(N)、許容誤差(e)、信頼水準(Z)、分散(p×q)です。一般的なマーケティングリサーチでは信頼水準95%、許容誤差5%を設定することが多く、この場合に必要なサンプルサイズは約385となります。
Q.セグメント別に分析したい場合のサンプルサイズは?
A.男女別や年代別に分析したい場合、各セグメントごとに十分なサンプル数が必要です。例えば男女×5年代で分析する場合、各セル100サンプルを確保すると全体で1,000サンプルが必要になります。分析の粒度が細かいほど必要なサンプルサイズは増加します。
Q.サンプルサイズの実務的な目安はありますか?
A.全体傾向の把握なら400〜500サンプル、セグメント分析を含む場合は各セグメント100〜200サンプルが実務上の目安です。ただし、回収率を考慮して配信数を設計する必要があります。Web調査の回収率は一般的に10〜30%程度のため、必要サンプル数の3〜10倍の配信が目安です。

この記事を書いた人

石崎健人

石崎 健人 | 株式会社バイデンハウス マネージング・ディレクター
リサート所属モデレーター。外資系コンサルティング・ファーム等を経て現職。生活者への鋭い観察眼と洞察力を強みに、生活者インサイトの提供を得意とする。2022年より株式会社バイデンハウス代表取締役。2025年よりインタビュールーム株式会社(リサート)取締役。

🔗 あわせて読みたい定量調査でのサンプルサイズ・割付・ブースト回収と自然回収の設計の基本

🔗 あわせて読みたい定性調査のサンプルサイズ何人必要か?5つの誤解と失敗しない判断基準