Haozao

アップリフトモデルを構築し、ユーザー操作を通じてクーポンを正確に配布する方法

クーポンの発行は緻密なマーケティングプロセスです。アップリフトモデルを用いてユーザーの獲得利益を計算することで、増分価値を最大化し、盲目的にクーポンを発行することを避けることができます。

オペレーションスタッフが対象ユーザーにクーポンを配布する際、次のような 2 つのジレンマに直面することがよくありますか?

誤解1:大規模なクーポン発行はマーケティングコストの増加と利用率の低下につながります。誤解2:クーポン利用率が高いと売上増加は最小限に抑えられ、ROIも低下します。このため、クーポンがなくても注文する可能性が高いアクティブユーザーにクーポンが発行されてしまうことがよくあります。

実際の例を通して、この問題をどのように解決するかを検討してみましょう。

背景: 解約したユーザーを SMS 経由で再アクティブ化する場合、プール内に解約したユーザーが 100 万人いて、予算が 10 万件の SMS メッセージしかないとき、利益を最大化するためにこれらの 10 万人のユーザーをどのように選択すればよいでしょうか。

解決アプローチ:

1. リコール特典ポイントを決定します。たとえば、300 以上の購入で 50 オフになるクーポンを発行します。

2. 実験グループと対照グループにそれぞれ5000人のユーザーをランダムに選択します。実験グループにはクーポンが発行されますが、対照グループには発行されません。

3. 変換サイクル内の結果を回復し、使用済みまたは未使用としてマークします。

4. アップリフト差分モデルを構築し、実験グループとコントロールグループごとに回帰バイナリ分類応答モデルを構築します。

5. ユーザー入力モデルに基づいてアップリフトスコアを計算し、アップリフトスコアの降順で残りの 90,000 人のユーザーを選択してクーポンを発行します。

6. モデルを使用して対象ユーザーのゲイン値を比較し、精密マーケティングの価値を実証します。

まず、Upliftモデルの原理を紹介します。

アップリフトモデリングは、介入がユーザーの反応に与える影響を測定する個別処置効果(ITE)を推定する手法です。アップリフトモデリングの基本的な考え方は、介入なしと介入なしの条件下で各ユーザーの反応確率を推定する予測モデルを構築し、その差、つまりゲイン値を計算することです。

根底にあるロジックは非常にシンプルです。簡単に言えば、クーポン発行による介入とクーポン発行なしの2つのシナリオにおけるユーザーの再購入率を予測します。その差が介入による利益値です。この操作により、クーポンが発行されなくても戻ってくるユーザーを排除できます。

第二に、運用チームはこのような予測モデルを構築できるでしょうか?

多くの企業で問題となるのは、エンジニアのグループがいわゆるビッグデータモデルの研究に没頭し、ビジネスから乖離していることです。予測モデルの本質は、ユーザー特徴量エンジニアリングがユーザーの意図を効果的に反映できるかどうかです。エンジニアが思いつくユーザー特徴量といえば、アプリの起動回数、閲覧時間、閲覧ページ数といったユーザーの閲覧行動、そしてカートへの追加、お気に入り、購入、購入頻度、購入間隔といったユーザーの購買行動くらいでしょう。しかし、これらの特徴量でユーザーの購買行動を効果的に予測できるでしょうか?もちろん、そんなことはできません。

例えば、このデータモデリングのセット

こうした表面的なユーザー行動データのみに基づいたモデリングでは、推測に過ぎない結果しか生まれません。データロジックの観点からは、ユーザーが商品を収集し、カートに追加するほど、購入確率は高くなります。しかし、実際のユーザーシナリオの観点から見ると、ユーザーが購入するかどうかは、競合プラットフォームでの価格比較やユーザーの気分など、複数の要因に左右されます。まさに、ビジネスとユーザーに最も近いオペレーション担当者が探求すべき特性です。

多くのオペレーション担当者は、データマイニングとモデリングのスキルが不足していると考えています。この記事では、オペレーション担当者がツールを活用してビッグデータマイニングとモデリングを実行し、その価値をさらに高める方法について、分かりやすく解説します。

II. 実際のモデル構築プロセスを見てみましょう。

ステップ1:ユーザー機能エンジニアリングの概要

ユーザーの閲覧行動、消費行動、嗜好行動特性に加えて、消費間隔の傾向、消費カテゴリーの数、消費量などのユーザーの傾向行動を掘り下げることがより重要です。 ユーザーの消費カテゴリーが多様なものから単一のものに変わったり、平均注文額の分布が主に低いものから高いものへ、または高いものから低いものへ変わったり、消費頻度が安定的なものからランダムなものへ、またはランダムなものから安定的なものへ変わったりすると、これらはすべてユーザーの次の消費行動を予測することができます。

例えば、eコマースプラットフォーム上のユーザーが、前回の消費サイクルでは3Cデジタル製品、生鮮食品、日用品を消費していたが、今回のサイクルでは3C製品のみを消費し、平均注文額が数百から数千に増加し、再購入サイクルが30日から60日に変わった場合、このユーザーが生鮮食品を今後も購入し続ける確率はどれくらいでしょうか?

ユーザーの行動傾向を分析し、それを A/B テストの応答データと組み合わせることで、予測モデルを構築できます。

ステップ2: 回帰応答モデルの構築

Upliftでは、戦略グループとコントロールグループそれぞれに個別のレスポンスモデルを構築する必要があります。最終的に、ターゲットユーザーが両方のモデルに入力し、Upliftスコアが計算されます。

分析ツールとデータマイニングツールを使用して上記のデータ ストリームを構築し、ユーザーが介入シナリオと非介入シナリオの両方で応答率を計算できるようにしました。

まずモデルの予測精度を見てみましょう。

モデリングデータの70%はトレーニングに、30%はテストに使用されました。トレーニングセットの予測精度は79.53%、AUCは0.848でした。テストセットの予測精度は69.7%、AUCは0.744でした。モデルの予測性能は許容範囲内です。

ステップ3:クーポンを正確に配布する方法

Upliftのレスポンスモデルは、レスポンスグラフ、ゲイングラフ、利益グラフなど、様々な種類の予測グラフを生成するのに役立ちます。これらのグラフは、クーポンマーケティング活動の指針として活用できます。

1) レスポンスグラフの結果に基づいてクーポン配布対象ユーザーを選択する

レスポンスグラフは、異なるパーセンタイルにおいて実際にレスポンス(例:クーポンの利用)したユーザーの割合を示します。クーポンキャンペーンでは、レスポンスグラフによって、各パーセンタイルにおけるユーザーの何パーセントが実際にクーポンを利用したかを示すことができます。

上記の累積応答率グラフを見ると、曲線が100%付近から徐々に低下し、最終的に50%に近づいていることがわかります。これは、モデルがグラフの左側で非常に高い応答率を予測し、右側(つまり、より多くのユーザーをカバーする)に行くにつれて応答率が徐々に低下していることを示しています。クーポンを配布するユーザー数を決定するには、いくつかの要素を考慮する必要があります。

  1. 全体の反応率:これは、クーポンに反応した全ユーザーの平均割合です。反応グラフでは、この値は50%と表示されます。
  2. 目標レスポンス率:クーポン発行によって達成したい最低レスポンス率。通常、全体のレスポンス率よりも高くなります。
  3. コストとメリット:クーポン発行にかかるコストと期待されるメリット。コストを許容範囲内に抑えながらメリットを最大化するバランスポイントを見つける必要があります。累積レスポンスグラフでは、レスポンス率が目標レスポンス率と一致するポイントを見つけることができます。グラフの左側から曲線に沿って右に移動し、レスポンス率が目標レスポンス率と同等かわずかに高いポイントを見つけます。この点に対応するパーセンタイルは、クーポンを配布する必要があるユーザー数を示します。たとえば、目標レスポンス率が70%の場合、曲線上でレスポンス率が70%となるポイントを見つける必要があります。この点が20%パーセンタイルに対応すると仮定すると、最初の20%のユーザーにクーポンを配布する必要があることを意味します。

2) ゲイングラフに基づいたクーポンの発行

ゲインプロットは、モデル予測による反応とランダムな選択を比較した場合の相対的なゲインを示します。クーポンキャンペーンでは、ゲインプロットは、特定のパーセンタイルのユーザーにおけるクーポンによる追加的な売上増加を示すことができます。

グラフでは、ゲイン値は 1.5914 です。これは通常、モデルの予測がランダム選択よりも 1.5​​914 倍優れていることを示しています。具体的には、ランダム選択の応答率が固定値の場合、モデルを使用して予測される応答率はその固定値の 1.5914 倍になります。このゲイン値は、特にマーケティング キャンペーンにおいて、特定のパーセンタイルでの予測モデルのパフォーマンスを評価し、どの顧客グループがプロモーションに最も反応する可能性が最も高いかを判断するためによく使用されます。実際のアプリケーションでは、ゲイン値が 1 より大きい場合、モデルの予測能力がランダム選択よりも優れていることを意味します。ゲイン グラフでは、パーセンタイル 46 でのゲイン値 1.5914 は、モデルによって最も反応する可能性が高そうな上位 46% のユーザーのうち、応答率がランダムに選択されたユーザーの 1.5914 倍であることを示しています。これは比較的高い改善であり、このパーセンタイルでのモデルの予測が効果的であることを示しています。

3) 利益チャートに基づいたクーポン発行

利益プロットは、異なるパーセンタイルのユーザーグループにおけるクーポンの利用によって生み出される総利益を表します。クーポンキャンペーンの場合、利益プロットは、異なるユーザーグループへのクーポン配布の全体的な財務効果を評価するのに役立ちます。

パラメータ設定は次の図に示されています。

  • 費用:クーポン1枚発行の費用は5元です。
  • 収益: 成功した応答(クーポンを使用した顧客)ごとに 10 元が得られます。
  • 幅: 幅が 1% の場合、利益チャートの各データ ポイントはユーザー グループの 1% を表します。

これにより、ユーザーが1%増えるごとに利益がどのように変化するかを詳細に把握できます。46パーセンタイル、利益630元:グラフでは、対象ユーザーグループが46パーセンタイルに達すると、累積利益は630元に達します。これは、モデルの予測どおりに、反応する可能性が最も高い上位46%のユーザーにクーポンを配布した場合、期待される総利益は630元になることを意味します。

著者:趙文彪、WeChat公式アカウント:ユーザー操作観察(ID:yunyingguancha)