Haozao

データ分析の学習に関する8つのよくある誤解にご注意ください

データ分析は人気のスキルとして、多くの学習者を魅了しています。しかし、学習プロセスには落とし穴が多く、時間と労力を無駄にしてしまう可能性があります。この記事では、経験豊富なデータディレクターのチェン氏が綿密に執筆し、データ分析を学ぶ際によくある8つの誤解について詳しく解説します。

データ分析は簡単に習得できるでしょうか?はい、簡単です!しかし、多くの学生が学習中によくある落とし穴に陥り、努力が無駄になり、根本的な解決策を見出せずにいます。今日は、Chen先生がよくある誤解を8つ挙げます。もしこれらの間違いを犯してしまったら、修正しましょう。もしそうでないなら、頑張ってください!

1. 不明確な目標、大規模化と量への欲求

なぜデータ分析を学ぶのか?よくある答え:

1.データ分析の仕事に転職したい。

2. 給料を上げたいです。

3. 私はデータにとても興味があります。

4. 特定の問題を解決する必要があります。

5. 「ビッグデータ」と「人工知能」は非常に流行っていると思います。

それぞれのアイデアは個別には有効です。それぞれのアイデアを一貫して追求すれば、目標を達成できます。問題は、これらのアイデアをすべて一度に組み合わせ、すべてを一度に達成しようとすることにあります。目の前の問題を解決し、自分の興味に合った大企業への就職につながり、給与を大幅に上げ、これらすべての目標を迅速に達成できるスキルを習得したいと想像してみてください…

歴史は繰り返し、言葉を使えば使うほど失敗する確率が高くなることを教えてくれました。目標が多すぎると、学習の失敗に直結します。意欲的な学生が「統計学」から「スイカの本」、「21日間でPythonをゼロから学ぶ」から「データ分析が初心者にできないなんて誰が言った」まで、一度に20冊もの本を購入し、机の上に散らかしたままにして、何ヶ月も経っても何も学べていないことに気づくという光景をよく見かけます。

本質的に、データ分析は典型的な学際分野であり、幅広い分野が絡み合っています(下の図を参照)。目標が明確でなければ、特定の分野に囚われてしまい、そこから抜け出せなくなってしまう可能性があります。

2 番目は、片隅に閉じ込められ、些細な詳細にこだわってしまうことです。

以前の状況とは対照的に、一部の学生は視野の狭いアプローチを取っています。

「俺はエクセル王になる男だ!」

「私はSQLキングになる男だ!」

「私はパイソンの王になる男だ」

...

テクノロジーを習得すること自体は何も悪いことではありません。問題なのは、その献身がテクノロジーへの愛からではなく、「Excel/SQL/Pythonをマスターすれば昇進も昇給もできる…」という思いから生まれた場合です。

うーん、はっきり答えると、「いいえ」です。

まず、「王の男」の地位を獲得するのは非常に困難であり、短期間で達成することは不可能です。

第二に、会社はソフトウェア/ツール/スキルではなく、役職に基づいて給与を支払います。

仕事における特定の問題を解決するには、多くの場合、実践的かつ多様なスキルの組み合わせが求められます。たとえ6ヶ月間集中的に勉強したとしても、一つの分野に没頭しても、昇進や昇給どころか、問題を解決できないことが少なくありません。

第三に、求職とキャリアアップは混同されることが多いです。

学習目標を設定する際には、現在の仕事や業界への適応力を向上させたいのか、それとも就職市場での競争力を高めたいのかという 2 つの基本的な方向性の質問があります。

人材市場における競争力の強化:将来の潜在的な雇用主のニーズを満たす。

現在のポジションへの適応性の向上:会社の現在のニーズを満たす。

将来応募する企業が、現在の会社と業界や事業範囲が類似していない限り、現在のニーズを満たすものと将来のニーズを満たすものは確実に異なります。これは特に業界を転換する人にとって当てはまります。よくあるシナリオを以下にまとめましたので、ご自身に当てはまるものを確認し、それに応じて学習計画を立ててください。

IV. 業界間の転職、不十分な研修

これは、キャリアチェンジを目指す学生によくある質問です。特に、変化が大きく、過去の経験があまり役に立たない場合によく聞かれます。多くの学生が「先生、Excel、SQL、Pythonを学びました。どんな仕事が見つかりますか?」と尋ねます。私はよく「『学んだ』ってどういう意味ですか?」と反論します。

多くの学生は、オンラインリソースの例文や教科書の練習問題を入力し、プログラムを実行して結果が出るのを見て、学習したと勘違いしがちです。しかし、練習不足は筆記試験で忘れてしまったり、面接でぼんやりしたりすることにつながり、必然的に成績の低下につながります。

あらゆる技術的操作には十分な訓練時間が必要です。最善のアプローチは「4つの同一性」(下図参照)です。

5. テクノロジーを避けてビジネスに挑戦しましょう。

これは、転職を考える学生によくある悩みでもあります。ビジネス分析が得意だからという理由ではなく、「自分の技術力では物足りないから、まずはビジネスをやろう…」という理由で、ビジネス系の転職を希望する学生も多いのです。そして、実際に面接に臨んでみると、相手がどんなビジネスをしているのかさえ分からず、結局は不合格になってしまうのも当然です。

注:市場に出回っているいわゆるビジネスアナリストの多くは、業務部門で一人きりで働く「ワイルドアナリスト」か、業務のためにExcelスプレッドシートを整理するだけの人です。彼らの仕事は単純で基本的なものであり、後々転職してもあまり役に立ちません。彼らは依然として、技術スキルを真剣に磨く必要があります。

真のビジネス分析や上級管理職は、ユーザーオペレーション、グロースハック、チャネルプロモーションといった強力なビジネス部門の担当者が担うことが多いです。本質的には、Excelでピボットテーブルを作成するだけでなく、ビジネス能力が問われます。

私は心からこの方向で事業を展開したいと思っています。学ぶ際には、視野を広げ、特定の業界やプロセスを深く理解し、データ収集方法やデータ形式について綿密な調査を行う必要があります。『グロースハッキング』や『リーンアナリティクス』といった理論書は知識を補う上で役立ちますが、業界に対するより深い理解が不可欠です。そうでなければ、実務に着手した際に、完全に途方に暮れてしまうでしょう(下の画像のように)。

VI. 同僚間での転職は深みの欠如につながる。

同じ業界内で転職する多くの人が、この問題に直面します。一見普通のアナリスト職の面接なのに、次々と難問が飛び出してきて、途方に暮れ、将来に不安を抱くのです。

「このような分析にはモデリングが必要ですか?」

「このような分析には理論が必要なのでしょうか?」

「このような分析には方法論が必要なのでしょうか?」

この状況は、実は採用プロセスにおける熾烈な競争によって引き起こされています。誰もがこれらのスキルが不要だと分かっているにもかかわらず、面接官は「そうでなければどうやって他の候補者を排除するのか」と尋ねます。しかし、実際に習得しても、日常生活で使うことはなく、どうなるか分かりません。どうすれば良いのでしょうか?

この学習段階では、深さよりも広さが重要であることを覚えておいてください。まず、統計、機械学習、レコメンデーションアルゴリズムといった科目の目次を暗記しましょう。それぞれの問題の種類における一般的な手法と基本的な考え方を書き留めてください。そして、空き時間があるときにケーススタディで練習し、さらに空き時間があるときに、それらを実際の状況に適用してみてください。

こうすることで、少なくとも面接中に完全に詰まってしまうことはなくなり、状況に対処できるようになります。また、これを自分の経験と組み合わせることで、「これが唯一の方法だ」と言いやすくなります。7つ目は、文脈を無視してテクニックに固執することです。

就職活動中で、実践的な問題を解決したい学生は、しばしばこの問題に直面します。最も典型的な原因は、単に次のようなことを言っていることです。

ユーザープロファイリングの標準的な方法は何ですか?

予測モデルの一般的な方法は何ですか?

因果分析に対する科学的アプローチとは何ですか?

「標準的」、「一般的」、「科学的」を重視する理由を尋ねると、答えはいつも次のようになります。

リーダーは承認しない

同僚はそれを買わない

顧客は受け入れない

これはもはや「標準」や「慣習」や「科学」とは無関係です。人との接し方に関する問題です。この種の問題について参考になる書籍は多くありません。アドバイスを求めるなら、「コミュニケーション研究」や「マネジメント」といった専門書であって、「高度予測モデリング」ではありません…。

同様のシナリオは数多くある。

コミュニケーションと解決を必要とする問題には、一貫したメッセージング、パフォーマンス目標、評価基準などがあります。

経営介入を必要とする問題には、経営基準の欠如や既存の基準の施行の失敗などがあります。

ワークフローがデジタル化されておらず、データ収集が不足しているという問題には、技術的な解決策が必要です。

業務運営において対処が必要な課題としては、企画アイデアの不足、ビジネススキルの不足、経験不足などが挙げられます。

これらの要因はいずれも、実務におけるデータ分析の妨げとなる可能性があります。しかも、これらの要因はデータ分析そのものとは全く関係がありません。したがって、学習を通じてこれらの問題を解決するには、データ分析にのみ焦点を当てるのではなく、複数の視点から「何をすべきか」を考える必要があります。簡単な判断基準を以下に示します(下図参照)。

8. 常に現実を無視してシステムのことばかり考えている。

学生の中には、勉強する際に「体系的に練習しよう」と常に考える人がいます。その考えは間違いではありませんが、単一のデータセット、あるいは大きく幅の広い表の中であらゆる操作を習得しようとすると、問題が生じる可能性が高くなります。

まず、実際の作業では、データ テーブルの構造は複雑であり、すべてに 1 つの広いテーブルを使用することは不可能です。

第二に、実際には、問題は非常に散発的に発生するため、単一の表ですべての問題を網羅することは不可能です。

すべてのスキルを練習するために幅広いデータセットを探そうとすると、100%満足のいくデータセットを見つけるのが難しくなるだけでなく、たとえ練習に適していると思われるデータセットを見つけたとしても、実際のシナリオではつまずいてしまうでしょう。これは、実際の練習では、問題を分解することが最初のステップだからです。

本当に体系的に学びたいのであれば、まずは問題を明確に分解することです。ビジネス上の問題、技術的な問題、データ収集の問題、データ抽出の問題などです。それらを区別する能力を高めましょう。そして、専門書を勉強して、それぞれの分野のスキルを向上させましょう。そうすれば、問題に容易に対処できるようになります。

まとめ

8つの問題はすべて、最初の問題、つまり明確な目標設定から生じています。様々な職種の中でも、データ分析は理論的な裏付けが最も豊富ですが、それぞれの分野は底なしの深淵へと突き進んでいます。そのため、「本をたくさん読めば無敵になれる」という誤解が生じます。

しかし現実には:

データ分析の作業シナリオは非常に複雑で、理論、ビジネス、技術、目標指向、および対人関係の問題が混在しています。

データ アナリストの求人広告は非常に混乱しており、さまざまな用語が飛び交っており、誤解を招くものや誤解を招くものが多くあります。

これらの複雑さは人によって異なり、難易度は個人のスキルレベルによって大きく異なります。そのため、問題に直面した時は、慌てて20冊もの本を買う必要はありません。まず、自分が本当に何を望んでいるのかを明確にしましょう。要点に焦点を絞り、目標から「そして」のような表現をできるだけ排除すれば、後々自然と物事が楽になるでしょう。