NBDモデルとは何か?プロが教える3つの違いと実務で失敗しない活用法

NBDモデルの正体を知っていますか

マーケティングの現場で需要予測に悩んだことはありませんか。新商品はどれくらい売れるのか、既存ブランドの購入頻度は今後どう変化するのか。こうした問いに答えるため、NBDモデルは消費者の購買行動の法則性を確率論で導き出すシミュレーションモデルとして広く使われてきました。

NBDはNegative Binomial Distributionの略で、負の二項分布を意味します。各顧客の購買は一定のペースで発生するポアソン分布に従い、その購買ペース自体は顧客ごとに異なりガンマ分布に従うという仮定を組み合わせた確率モデルです。森岡毅氏の著書『確率思考の戦略論』で紹介され、USJのマーケティング戦略を支える理論的基盤として注目を集めました。

筆者がリサーチの現場で見てきた限り、多くの企業がこのモデルを誤解したまま導入を試みています。数式の複雑さに圧倒され、実務への応用を諦めてしまう担当者も少なくありません。本記事では、NBDモデルの本質と、混同されやすい関連モデルとの違いを明確にします。

NBDモデルの定義と基本構造

NBDモデルは、特定の商品やブランドが一定期間内にr回購入される確率を求めるシミュレーションモデルです。その数式には2つの変数MとKが登場します。

変数Mは商品カテゴリーまたは特定のブランドが一定期間内に購入された総回数を母数となる消費者の数で割ったもので、プレファレンスの正体といえます。プレファレンスとは相対的な好感度を指し、あるカテゴリーからある商品をどれくらいの確率で選ばれるかを表す概念です。

変数Kは平均値によって決まる確率分布の形状を表し、Mが決まればほぼ自動的に決定されます。したがってマーケティング施策でコントロールできるのはMのみです。筆者の経験では、この点を理解せずにKの改善に注力する誤った戦略を見かけることがあります。

洗剤、インスタントコーヒー、自動車、シャンプーなど異なるカテゴリーであっても消費者の購買行動の原理は同じであることを数字で表せる点が、このモデルの強みです。実際に森岡氏の著書では、パンケーキ、歯磨き粉、本の貸し出しなど複数の異なるカテゴリーでNBDモデルの予測値と実測値がほぼ一致することが示されています。

ガンマ・ポアソン・リーセンシー・モデルとの違い

NBDモデルと混同されやすいのが、ガンマ・ポアソン・リーセンシー・モデルです。両者は同じ確率論的枠組みを共有しますが、焦点が異なります。

ガンマ・ポアソン・リーセンシー・モデルは、最近いつ買ったかや最近いつ訪れたかというデータから、そのブランドの購入頻度や浸透率を導き出すモデルです。リーセンシーとは最近の購入時期を意味し、相対的にどのブランド、どの施設、どの時期に資源を集中すべきか教えてくれます。

NBDモデルが「一定期間内に何回購入されるか」という購買回数の分布を予測するのに対し、ガンマ・ポアソン・リーセンシー・モデルは「最後の購買からの経過時間」という時間軸のデータから今後の行動を予測します。前者が全体の購買パターンを捉えるのに対し、後者は個別顧客の状態に応じた施策判断に向いています。

森岡氏がUSJのハロウィーンイベントで集客を2倍にした事例では、リーセンシーモデルによって前年7万人の集客を14万人以上にできると需要を予測し、10月に注力するというWHATを数理モデルから定めたことが成功につながりました。

統計学的な背景の違い

NBDモデルは各顧客の購買が一定のペースでポアソン分布に従い発生し、その購買ペース自体は顧客ごとに異なりガンマ分布に従うという仮定を組み合わせます。この構造により、ほとんど買わない顧客が多い一方で一部のヘビーユーザーが頻繁に買うという実際の購買パターンをよく表現できます。

一方、ガンマ・ポアソン・リーセンシー・モデルも同じポアソン・ガンマの混合分布を基盤としますが、パラメータ推定にリーセンシー情報を組み込む点が特徴です。数学的には近縁ですが、入力データと出力される指標が異なります。

ディリクレNBDモデルとの違い

ディリクレNBDモデルは1984年にGoodhardtらによって考案され、消費者の繰り返し購買行動やダブルジョパディの法則など様々な現象を説明するために確率的なモデルが適用されてきた歴史の中で生まれました。NBDモデルが単一ブランドの購買を扱うのに対し、ディリクレNBDは複数ブランド間の選択行動を同時にモデル化します。

ディリクレNBDモデルは繰り返し利用するサービスや消費財向けのアプローチで、文献によると生命保険やクレジットカードなどのサービス市場需要の予測がうまくいっているケースがあります。市場全体のブランド間シェアやスイッチング行動を予測する際に威力を発揮します。

筆者が定性調査の後に定量データで検証する際、単一ブランドの購買頻度を予測したいならNBDモデル、複数ブランド間の競合構造やシェア変化を分析したいならディリクレNBDモデルという使い分けをします。後者の方が複雑で、データはアンケートなどで収集する必要があるため総じて時間もお金もかかる手法です。

Pareto/NBDやBG/NBDとの関係

Pareto/NBDモデルは顧客の離脱を明示的に扱う買い終わるまでのBuy-Till-You-Dieモデルで、ポアソンプロセスに従う購買行動と指数分布に従う離脱行動を仮定し、異質性を考慮してλとμがそれぞれ独立なガンマ分布に従う混合分布モデルです。

BG/NBDモデルは離脱を購買直後に起こりやすいと仮定する発展版で、計算が簡単になる点が利点です。これらは顧客維持や離脱予測に焦点を当てており、今も顧客である確率や将来購入が見込める顧客を特定し、離脱リスク顧客に復帰キャンペーンを行うといった実務に向いています。

NBDモデルが市場構造全体の理解を目的とするのに対し、Pareto/NBDやBG/NBDは個別顧客レベルの生涯価値算出や離脱予測という異なる目的を持ちます。

NBDモデルが重要な理由

売上を決定づける構成要素のひとつがプレファレンスであり、売上予測を行うためのNBDモデルの変数はプレファレンスの大きさに左右されます。売上の基本要素は認知率、配荷率、過去購入率、エボークトセットに入る率、年間購入率、年間購入回数、単価の7項目ですが、プレファレンスを決定する要素として、ブランド・エクイティ、製品パフォーマンス、価格が挙げられます。

筆者が企業のマーケティング戦略を支援する際、まずNBDモデルで市場のベースラインを理解し、そのうえで施策による変化をシミュレーションします。このアプローチにより、感覚ではなく数値に基づいた意思決定が可能になります。

NBDモデル・ディリクレNBDは市場構造・消費者行動の本質を表す数式で、USJがV字回復し来場者を倍増させたのは誤解を恐れず突き詰めるとこのモデルとそこから導かれる理論に則りマーケティングをしたからです。

実務での活用範囲

NBDモデルの実務活用として、優良顧客の見極め、離脱防止、広告費の最適化が挙げられます。将来購入が見込める顧客を特定し重点的にアプローチする、今も顧客である確率が低い顧客を抽出し復帰キャンペーンを行う、短期的な見込み利益から許容CPAを逆算し効率的な広告投資判断に活用するといった使い方です。

ただしNBDは外部要因を直接扱えません。販促効果を分析するには階層ベイズなど高度なモデルを検討する必要があります。セールやキャンペーンなど特殊な要因がある場合、単純なNBDモデルでは予測精度が落ちます。

実務でよくある誤解と失敗

筆者がコンサルティングの現場で頻繁に遭遇する誤解が3つあります。

第一に、NBDモデルを導入すればすぐに売上予測ができると考える誤りです。配荷率、過去購入率、エボークトセットに入る率は、流通調査と消費者へのアンケート調査からデータを収集する必要があります。既存のPOSデータだけでは不十分で、きちんとしたアンケート調査の設計が欠かせません。

第二に、すべての商材にNBDモデルが適用できると思い込む失敗です。NBDモデルは最低2回以上の購買がある顧客が対象で、新規顧客には使えません。また高額で購買頻度が極めて低い商材や、購買が季節性に強く依存する商材では予測精度が低下します。

第三に、MとKの意味を取り違える誤解です。Kは分布の形状を表すパラメータであり、施策でコントロールできるのはMのみです。この理解がないと、間違った方向に資源を投入してしまいます。

モデル選択の判断基準

筆者は次のような基準でモデルを選びます。市場全体の購買回数分布を把握したいならNBDモデル、最後の購買時点からの経過時間を活用して個別施策を判断したいならガンマ・ポアソン・リーセンシー・モデル、複数ブランド間の競合構造やシェア変化を分析したいならディリクレNBDモデル、顧客の離脱予測や生涯価値を算出したいならPareto/NBDまたはBG/NBDモデルです。

目的が曖昧なままモデルを選ぶと、データ収集コストだけがかさみ、得られる示唆は乏しくなります。まず何を知りたいのかを明確にすることが先決です。

正しい活用方法とステップ

NBDモデルを実務で活用する際の基本ステップを示します。

まず目的を定義します。新商品の年間購入回数分布を予測したいのか、既存ブランドのプレファレンス変化を把握したいのかで必要なデータが変わります。次に必要なデータを収集します。流通調査と消費者へのアンケート調査からデータを収集し、延べ購入者数、母集団、カテゴリー平均購入回数を把握します。

続いて変数MとKを算出します。変数Mは商品カテゴリーまたは特定のブランドが一定期間内に購入された総回数を母数となる消費者の数で割ったもので、Kは、NBDモデルの式にr=0、算出したM、Pr=購入回数0の割合を代入して求めます。ExcelのソルバーやPythonを使えば計算できます。

モデル式に代入して購買回数別の確率を算出し、予測値と実測値を比較して妥当性を検証します。乖離が大きい場合、データの収集方法やモデルの前提条件を見直す必要があります。最後に得られた予測をもとに施策を設計し、プレファレンスMを高めるための具体的なアクションに落とし込みます。

データ収集の実務ポイント

筆者がアンケート調査を設計する際、特に注意するのが回答者の記憶バイアスです。過去1年間の購入回数を正確に覚えている人は少ないため、購入頻度を直接尋ねるのではなく、最近3か月の購入回数を聞いて年間に換算する工夫をします。

また、カテゴリー全体の購買行動を把握するため、競合ブランドの購入状況も同時に調査します。自社ブランドだけでなく市場全体の文脈の中でプレファレンスを理解することが、正確な予測につながります。この点で定量調査の設計ノウハウが不可欠です。

成功事例に学ぶ実践知

ある日用品メーカーの事例を紹介します。新しい洗剤ブランドを投入する際、NBDモデルを用いて年間購入回数分布を予測しました。既存の競合ブランドのMとKを参考にしつつ、自社ブランドのプレファレンスを保守的に設定してシミュレーションを実施しました。

その結果、初年度の売上目標を現実的なラインに修正でき、過剰な生産在庫を回避できました。さらに、プレファレンスを高めるために何が必要かを定性的に探るため、デプスインタビューを実施し、商品パフォーマンスとブランド・エクイティのどちらを優先すべきかの示唆を得ました。

別の事例では、ECサイト運営企業がガンマ・ポアソン・リーセンシー・モデルを活用し、最後の購入から一定期間経過した顧客に対して復帰クーポンを配信しました。リーセンシーデータをもとに離脱リスクの高いセグメントを特定し、施策のROIを大幅に改善しました。この事例では、単なる購買回数だけでなく時間軸の情報を活用したことが成功のカギでした。

定性調査との組み合わせ

NBDモデルは定量的な予測ツールですが、なぜそのプレファレンスになっているのかという「なぜ」には答えられません。筆者は常に定性調査と組み合わせてアプローチします。

たとえば、プレファレンスMが競合より低い原因を探るために、フォーカスグループインタビューを実施し、消費者がブランドを選ばない理由を深掘りします。その結果、パッケージデザインの問題や認知不足といった具体的な改善点が浮かび上がり、施策の優先順位が明確になります。このように定量と定性を往復することで、数値の背後にある人間の行動原理に迫ることができます。

まとめ

NBDモデルは消費者の購買行動を確率論で捉え、一定期間内の購入回数分布を予測するシミュレーションモデルです。プレファレンスという概念を変数Mとして数式に組み込み、異なるカテゴリーでも同じ法則が成り立つことを示します。

ガンマ・ポアソン・リーセンシー・モデルは最後の購買時点からの経過時間を活用し、相対的にどのブランドや時期に資源を集中すべきか教えてくれます。ディリクレNBDモデルは複数ブランド間の選択行動を同時にモデル化し、市場全体のシェアやスイッチング行動を予測します。Pareto/NBDやBG/NBDは顧客の離脱を明示的に扱い、生涯価値算出や離脱予測に向いています。

実務では目的に応じてモデルを使い分け、必要なデータを適切なアンケート調査で収集することが成功のカギです。数式の複雑さに惑わされず、まず何を知りたいのかを明確にし、得られた予測を具体的な施策に落とし込む姿勢が求められます。定量的な予測と定性調査を組み合わせることで、数値の背後にある消費者の本音に迫ることができます。

この記事を書いた人

石崎 健人 | 株式会社バイデンハウス マネージング・ディレクター
リサート所属モデレーター。外資系コンサルティング・ファーム等を経て現職。バイデンハウスの消費財、ラグジュアリー、テクノロジー領域のリーダーシップ。生活者への鋭い観察眼と洞察力を強みに、生活者インサイトの提供を得意とする。2022年より株式会社バイデンハウス代表取締役。2025年よりインタビュールーム株式会社(リサート)取締役。アドタイにてZ世代の誤解とリアル。「ビーリアルな、密着エスノ記」連載中。