Haozao

データ分析プロジェクトとは何ですか?どのように行うのですか?

データを担当する学生の多くは、データ分析プロジェクトを自主的に主導したいと考えています。この記事では、データ分析プロジェクトとは何か、そしてどこに課題があるのか​​を詳しく説明しており、データ分析について学びたい学生におすすめの一冊です。

「データランナーにはなりたくない。プロジェクトをやりたい!」これは多くのデータプロフェッショナルが共有する強い思いです。データの目的を理解せずに機械的にデータを処理するサイクルに閉じ込められるのは、本当に不快です。誰もがプロジェクトを自主的に管理する機会を望んでいます。

しかし、多くの学生は疑問を抱いていました。

  • データ分析プロジェクトとは何ですか?
  • なぜ私の会社ではデータ分析プロジェクトを一度も見たことがないのでしょうか?
  • タイタニック、タオバオ電子商取引、米国のクレジットカードのコードをオンラインで検索し、コピーして貼り付けましたが、これはプロジェクトとしてカウントされますか?

最初の質問から始めましょう。データ分析プロジェクトとは何でしょうか?

I. プロジェクトとは何ですか?

プロジェクトの本質は、特定の期間内に人的資源と物的資源を組織化し、特定の成果目標を達成することです。この簡潔な表現は、プロジェクトの3つの重要な要素、すなわち時間、コスト、そして成果物の品質を要約しています。これらの3つの要素は、一般的に「プロジェクトの鉄の三角形」として知られています。

通常の仕事とは対照的であるため、プロジェクトと呼ばれます。

  • プロジェクト: 特定の時間、特定の人々のグループ、特定の成果。
  • 日常的な作業: 毎日、決まったグループの人々によって実行され、終了したら完了です。

鉄道を例に挙げましょう。誰かが一生をかけて古い路線の維持に勤勉に取り組んでも、誰もその存在に気づかないでしょう。しかし、新しい路線の建設は、提灯や太鼓、爆竹が鳴り響く、いつも盛大な行事です。私たちは皆、定型業務よりもプロジェクトを好みます。そして、これは概ね真実です。企業では、多くのプロジェクトを抱え、頻繁にニュースの見出しを飾る部署もあれば、ほとんどプロジェクトがなく、運命を受け入れざるを得ない部署もあります。

II. データ プロジェクトとは何ですか?

厳しい現実ですが、経営陣は「ビッグデータ」「人工知能」「デジタルトランスフォーメーション」を絶えず唱えていますが、ほとんどの企業ではデータはサプライチェーンのツールのようなものに過ぎません。誰もがデータは重要で、未来であり、トレンドだと言いますが、結局のところ、あなたは会社に収益をもたらすことはなく、他人のために汚れ仕事をしているだけなのです。

この厄介な状況により、データの地位はそれほど高くならないだろう。やや高い地位にあるのは、データから直接利益を得られる少数の企業(データ販売コンサルティング会社、サードパーティサービス企業、インターネット・ツー・ビジネス製品など)か、データによる資金調達を待っている企業(VCにAI・ビッグデータ企業であることを証明するためにプログラマーを大量に雇用している企業)だ。地位が低いため、当然ながら、これらの企業に割り当てられるプロジェクトは少なくなる。

III. データ分析プロジェクトとは何ですか?

割り当てられたプロジェクトが少ないことの主な特徴は、データ作業が細分化されると、すべてがルーチン作業になることです。

確かに、彼らはコードを書いているわけではない。「データへの接続」にどれだけの労力がかかっているのか、彼らは全く理解していない。サプライチェーンよりも能力が低い。サプライチェーンでは、少なくとも人々は山積みの資材を見て、彼らの懸命な努力を評価している。データに対する人々の見方は、母親のそれに近い。「一日中コンピューターの前に座って何をしているの?」

したがって、データ関連のプロジェクトを承認してもらいたいなら、方法はただ一つ。すべてを一度にやるのです!面倒で骨の折れる作業をすべて、データとは全く関係ないけれど、信じられないほど印象に残る名前(そう、ビジネスインテリジェンスの話です)でまとめましょう。

これらの中で、最も正当で、広く認知され、そして最も顕著なのは、間違いなく大規模なデータダッシュボードを備えたBIプロジェクトです。多くの従来型企業のデータ部門は、ダッシュボードプロジェクトを作成することで上司の支持を得ています。

もちろん、この状況はここ2年で変化しました。AlphaGoの咆哮は、数え切れないほどの企業経営者に人工知能への希望をもたらしました。解決不可能な問題に直面した時、人々はしばしば、理解しがたい力、あるいは魔法と称されるものに希望を託します。かつては易経や八卦でしたが、今では人工知能アルゴリズムです。その結果、多くのアルゴリズムプロジェクトが立ち上げられました。

実際、ソーシャルメディアで大騒ぎになる前から、アルゴリズムを使用して債務不履行リスクを特定したり、発信コールの成功率を改善したり、ユーザーのクリックスルー率を高めたり、電力消費量や通話量を予測したりするなど、アルゴリズムを使用してビジネスを改善した成功事例はすでに数多くありました。

しかし、これらのアプリケーションには、非常に厳格なデータ品質要件と非常に特殊な適用シナリオが求められます。いくつかのデータポイントを取り出し、モデルに投入して結果を期待するほど単純ではありません。また、管理システム、資金投資、インフラ、そしてビジネス協力を放棄し、コードを実行した途端に画面からお金が噴出することを期待できるわけでもありません。結果として、アルゴリズムという濁った水域に軽率に足を踏み入れた多くのプロジェクトが悲劇的な結末を迎えています。

でも、そんなことは問題ではありません。間もなく、誰もが、自分たちには理解できないけれど、魔法の力と評される新たな力を発見しました。それがデータプラットフォームです!こうして、2020年、高層ビルの建ち崩れを目の当たりにする新たな時代が始まったのです。

IV. データ分析プロジェクトの問題点は何ですか?

プロジェクトの「鉄の三角形」(プロジェクト管理システム)の観点から、データを他のプロジェクトと比較すると、問題の核心は非常に簡単にわかります。

数字自体でさえ、価値を証明するのは難しいものです。例えば因果分析では、データを見なくても、企業は複数の理由を推測できます。企業が仮説を提示し、それをデータで検証するだけにとどめてしまうと、フリスビーを追いかける犬と何ら変わりません。一生懸命働いているのに、人々はあなたをただの使い走りだと考えてしまうのです。

これらが、データ分析プロジェクトが承認されにくく、成功しにくい根本的な理由です。もちろん、さらに問題なのは、多くの新人がこのことに気づいていないことです(特に、学術的に優れた論文をいくつか書いたばかりの大学院生はそうです)。彼らは、まるで新しく買ったトランスフォーマーのおもちゃを自慢する小学生のように、グラフやモデル、コードをひけらかし、「私ってすごい!」と心の中で誇りに満ち溢れています。しかし、実際に物を運ぶとなると、最も基本的なダンプトラックでさえオプティマスプライムよりも効率的であるという事実を見落としています。

行き詰まりを打破するには、プロジェクトの中核となる強みをしっかりと把握する必要があります。

1. 時間

(1)平常時にモニタリング体制を構築し、従業員を一時的なデータ収集から解放する。

(2)日々のデータをもとに経験を積み、チャンスを掴め!

(3)重要な局面で経営危機感を喚起し、自主管理できるプロジェクトに取り組む。

2. コスト

(1)平常時からデータ品質の向上に努める。

(2)適切な時期にデータ基盤の整備を推進する。

(3)各プロジェクトでは、問題を解決するために最小限のデータ量と最も単純なモデルを考慮する必要があります。

3. 品質

(1)インフラ:0から1への作業を増やし、ギャップを埋め、成果を強調する。

(2)方法:推論ロジックを確立し、ビジネス思考に従い、教師ではなくコーチとして行動する。

(3)提案型:100個の仮説を立ててビジネスブレインを満たし、アウトプット結果を主導する。

時間とコストの見積もりは分かりやすいですが、品質の部分は具体的な事例と組み合わせるとさらに分かりやすくなります。

著者:地に足のついた教師チェン

出典:WeChat公式アカウント「地に足のついた陳先生」