データ分析において、最もよく使われる手法は何でしょうか?それは間違いなくトレンド分析です。データに関することであれば、ほとんどの人が常に使っています。多くの学生は「え?そんな手法があるの?今まで気づかなかった!」と驚くかもしれません。今日は、トレンド分析を体系的に解説します。 質問を聞いてください。 次のグラフは、今月1日から8日までの売上実績の傾向を示しています。このグラフに基づいて、以下の質問に答えてください。 [正誤問題] 従業員番号 8 の業績が従業員番号 7 の業績よりも優れていたというのは本当ですか? [正誤問題] 従業員番号 7 の業績が従業員番号 6 の業績よりも優れていたというのは本当ですか? [正誤問題] 従業員番号 6 の業績が従業員番号 5 の業績よりも優れていたというのは本当ですか? [正誤問題] したがって、今月の業績は良いですが、良いとは言えません。 1 秒かそれ以下で考えれば、多くの学生は答えを口に出せるでしょう。 I. トレンド分析の方法前の質問では、パフォーマンスのトレンドチャートを分析する直感的な体験ができました。多くの学生はきっと「なるほど!なるほど!」と即座に答えたでしょう。実際、トレンド分析の基本原理はそれほどシンプルで、ほとんど誰でも活用できます。 最初のステップは、指標がプラスかマイナスかを判断することです。 例えば、この質問では、売上実績はプラスの指標であり、誰もができるだけ多く売りたいと願っています。したがって、プラスの指標が日々増加している場合はプラスの傾向を示し、日々減少している場合はマイナスの傾向を示します。 2 番目のステップは、データを収集し、指標の傾向を観察することです。 「売上目標が高ければ高いほど良い」ということは既に明らかなので、あとはデータを観察するだけです。日々改善していることが分かるので、売上の傾向は良好だと結論付けることができます。次に、なぜ売上が好調なのかを分析します。とても簡単ですね。オンライン記事やデータ分析コースの90%は、この方法で教えています。 しかし、この答えは間違っています。 これは、販売されている特定の業界と製品が考慮されていないためです。業界や製品によって、一定期間における販売動向は異なります。例えば、食品、飲料、娯楽製品の売上は週末にピークを迎える傾向があり、週単位で周期的な変動を示します。同様に、3Cエレクトロニクス製品では、新製品の発売が最も人気があり、その後徐々に減少します。販売動向に時間軸を加えることで初めて、規則性が明らかになります。 したがって、この問題の最初の3つの質問には「はい、はい、はい」と答えることができますが、4番目の質問は「不確実」です。答えを確定するには、すでに実行した2つのステップに加えて、少なくともさらに2つのステップが必要です。 3番目のステップは、トレンドのベンチマークを確立し、判断基準を設定することです。 ベンチマークを設定する方法は2つあります。業界に精通している場合は、その特性に基づいて全体的なトレンドチャートを直接作成できます。業界に精通していない場合は、期間をさらに延長して、過去数週間のトレンドを見ることができます。もちろん、トレンドを観察するには、前年比、前月比、3年間の比較チャートを作成するのが最適です。これにより、最も正確な見解が得られ、短期的な変動の影響を最小限に抑えることができます(ちなみに、レポートを作成する際に、前年比、前月比、3年間の比較指標を使用し、日次、週次、月次で計算することが多いのは、このためです。これは、短期的な影響を避け、トレンドが正常かどうかを観察するためです)。 4 番目のステップは、現在のデータをベンチマークに適用し、結論を導き出すことです。 すでにベンチマークを確立していて、記事の冒頭の質問のデータを適用すると、すぐに異なる解釈が得られます (下の図を参照)。 では、なぜ「折れ線グラフを描いて、高いところは良い、低いところは悪い」ではなく「トレンド分析」と呼ばれるのでしょうか?それは、折れ線グラフであっても、誤った判断を避けるためには、ルールを段階的に実行する必要があるからです。これが、方法論を持つことと、ただ遊んでいることの違いです。そして、以下で説明するように、遊んでいることはしばしば問題を引き起こします。 II. トレンド分析の利点トレンド分析の最大のメリットは、その便利さです! 理論的根拠も専門知識も必要とせず、多くのデータも必要とせず、結果が出れば肯定的か否定的か直接判断できるという点から、データ分析手法として初めて総括され、20年以上もの間、由緒ある手法として使われてきました。 20年前、企業のデジタルシステムはまだ初期段階だったことを理解することが重要です。当時、プロの経営者は判断を下したいと思っていましたが、現在ほど詳細なデータを分析することはできませんでした。そのため、利益、コスト、売上といったいくつかの主要な指標にしか焦点を当てることができませんでした。 したがって、カーブのトレンドにのみ焦点を当てることができます。60年代と70年代生まれの専門マネージャーや、1985年以前に生まれたデータ関係者は、カーブのトレンドに特に敏感で、過去3年間のトレンドや過去12ヶ月間のトレンドといったデータを見ることを好むことがわかります。 2つ目の利点: 直接的! 再び売上を例に挙げてみましょう。マーケティングキャンペーンや顧客獲得/バイラルマーケティングといった多くの支援活動は、本当に売上に効果があるのでしょうか?複雑なファネル分析は必要ありません。トレンドを一目見るだけで、すぐに結果が分かります。方法がシンプルであればあるほど、結果を評価する上で信頼性が高まります!(下の図を参照)。 3 番目の利点: 独自の基準が付属しています。 曲線のトレンド自体が指標の品質を判断する基準となります。前述の自然周期/ライフサイクル型の基準に加え、上昇と下降の度合いも判断基準として活用できるため、基準を見つける時間を大幅に節約できます(下図参照)。 この方法は今でも有効です。A/Bテスト、ファネルテスト、多次元クロス分析を実施するためのリソースはありますが、毎日、毎時間、毎分、これを実行しようとすると、データアナリストが疲弊するだけでなく、膨大な分析量によって業務の遅延やアプリ開発の遅延が発生し、継続的なイベント追跡とテストが必要になります。ビジネスチームがそれを喜んで行うでしょうか?そのため、日常的な分析の多くは、依然として日次レポートや週次レポートに基づく傾向分析に依存しています。 さらに、毎日、毎時間、毎分データが変化するため、ビジネスは過度に敏感になり、詳細な分析が求められるようになりますが、後になって何も問題がないことが判明するケースが数多くあります。 III. トレンド分析の欠点一つの欠点:緊張すること。 「三人寄れば一虎」効果はトレンド分析において非常によく見られます。具体的な例は下の図に示されています。人々は、突然の大規模な出来事や連続した出来事、あるいは以前とは異なる出来事に過度に敏感になり、より大きな問題を見逃しがちです。 2 番目の欠点は交絡因子の存在です。 因果関係を観察する際の傾向分析では、交絡因子を扱うことができません。複数の因子が重なり合う場合、真に重要な影響因子を区別することは不可能です。 3 番目の欠点は、テクノロジーの誤用と乱用です。 トレンド分析には前提条件があることに注意が必要です。指標が明確なポジティブ/ネガティブの判断が可能な結果重視の指標である場合に限ります。活動率や消費率といった比率など、それ以外のシナリオでは、これらの指標をそのまま適用することはできません。比率の場合、まず分子と分母のどちらの要因が変化を引き起こしているかを検証する必要があります。例えば、ユーザー登録数やページビュー数のように、ポジティブかネガティブかが明確に判断できない指標も不適切であり、少なくともコンバージョン率と併せて検討する必要があります。冒頭で述べた「高いほど良い、低いほど悪い」という表現は、典型的な誤用例です。 4 番目の欠点: 洞察力の欠如。 最も典型的なシナリオは株式取引です。図で見れば一目瞭然です。 なぜなら、トレンドは根本的に、根底にある理由によって推進されるからです。トレンドを分析する際には、結果だけで判断するのではなく、その背後にある理由を理解することが重要です。だからこそ、私たちはA/Bテスト、ファネルチャート、多次元クロス比較といった手法を開発しました。迅速かつ効率的な意思決定のためのシンプルな手法だけでなく、より深い問題解決のためのより複雑な手法も必要です。 4. 他にはどんな伝統的な方法がありますか? データ分析の分野には、伝統的な手法とみなされるものもいくつかあります。例えば、多次元クロス分析、2次元ならマトリックス法、3次元以上ならセグメンテーション比較法などです。確かに、オンライン記事で謎めいたように謳われているこれらの「根底にあるロジック」や「核となるアイデア」は、実際には魔法のようなものではありません。いずれも、特定のシナリオ、データの制約、そしてビジネスニーズに基づいた手法なのです。 |