DS_辞めたい(YT台本)
データサイエンティストの辛さ
こんにちは、今日はデータサイエンティストになって辛いことを紹介していきます。
このチャンネルではデータサイエンティストのキャリアを発信しています。 発信している理由としては、データサイエンスのキャリアって非常にわかりづらいんですね。 ネット上にある情報だと、非常に断片的なものや、ものによっては間違ってるものも多いので、実際にデータサイエンティストとして働いた経験をもとにして、一次情報としてお話をします。 実体験と本音をもとにしています。
正しい情報を知れば、自分のイメージ通りのキャリアを歩むことができますし、このチャンネルではそれを目指して発信をさせていただきます。今回の動画では、データサイエンティストの辛い面を知りたい、またはデータサイエンティストになる上で広い視野で考えられるようになりたいという人は、ぜひ最後まで見ていってください。 データサイエンティストの辛いところや、どんな人がデータサイエンティストに向いているのかがわかると思います。では、早速内容に入っていきましょう。
専門家でない人の期待値が高すぎる
まずですね、辛いところの1つ目、クライアントや世の中のデータサイエンスへの期待値っていうのはかなり高くなってます。 具体的にどんなことなのかというと、データを使えば何でもわかるとばかりに期待してくるんですよ、世の中の、プログラミングとかあまり知らない人たちって、データを使ってなんとかならないっていう風に言ってくるんですけど、結果的にはその期待通りの結果を返せずに落胆されるってのがよくある流れですね。 どこまでができるのかっていうのがあまりわかってない人が多いんですよ、世の中をね、例えばニュースとか見てても、人工知能を活用して、革新的な取り組みがすごい取り上げられるじゃないですか。あれはね、各企業の先進的な取り組みをしていますというブランディングだと思うんです。ブランディングをして、優秀な技術者が入社してくれればそれは採用に対してプラスに働いたってことになりますし、受注につながるとか、色々な事情はあると思うんですけど、要するに人工知能っていうのは世の中に過剰に評価されてるわけですよ。で、じゃあそれがデータサイエンスにとってどんな意味を持つかっていうと、期待が高まりすぎてて、評価がされない、落胆されるっていうのに繋がるわけですね。これがなかなか辛い部分かなと思ってます。
データを集めるのが大変
2つ目に、データを集めるのが大変ってのがありますね。
社内政治に心身を削られるデータサイエンティストが多数います。こんなことするのがデータサイエンティストの仕事なのかっていうのをよく聞きますね。っていうのも、部署間に壁があるんですよ、会社って。
部署間でやっぱり追ってるKPIが利害関係が全部違うので、他の部署にデータを求めることってかなり大変なんですよ。なので、そもそもデータが揃わないっていう悩みを抱えることになるわけです。ここは社風による部分もあるんですよね。トップダウンでデータサイエンスの文化を定着させているような会社とか、あとはデータ分析を売りにしてるようなベンチャー企業っていうのは、この辺の悩みはないと思うんですけど、データサイエンティストに対してあまり理解がない会社っていうのがいまだに多いので、社内政治には心身削られる可能性は高いなと思います。これを避けるためには、データサイエンティストの数がそもそも多い会社とか、データサイエンティストへの理解がある企業ってのを選ぶことがとても大事になってくるかなと思います。企業選びについては今後動画で発信をしていきます。
はい、で、続いてデータのまえ処理が大変ですね。先ほどデータを集めるのがそもそも大変だって話をしましたけど、集めたデータはだいたい汚いです。そのデータをきれいな状態にするっていうのが仕事として入ってきます。データサイエンスの仕事は9割がデータの整理っていう会社もあるぐらいですね。特に新卒はまえ処理の担当になる可能性が高いので注意をしておいてください。この時点で想像よりも地味な仕事って思っている方も多いと思いますけど、データサイエンティストとして自分が働いて経験とか、知り合いでもデータサイエンティストかなり多いんですけど、彼らは共通して、この辺りは嘆いています。リアルとして知っていただければと思ってます。
コミュニケーションの課題
あとは、わかりやすく説明する必要があるってのが辛い人が多いみたいですね。顧客の方って文系の方が多いんですよ。世の中見て、文系と理系どっちが多いかって言ったら、文系の方がそれは多いわけですよで、専門知識を噛み砕くのに骨が折れることもありますし、時にはね、厳密さを犠牲にするような場面もあります。というのも顧客の期待って、結局それで儲かるのっていうところが一番なわけですよ。むしろそこしかないわけですで、サイエンスはもう全部手段なんですよね。ビジネスなので、お金ありきで、分析に使える時間とかも制約がかかります。例えば完璧な分析をしようと思ったら100時間あれば完璧な分析ができるけど、30時間しか時間がないので、別の手法を選択するといった場面もよくあります。こんな感じでね、専門知識を重視する方にとってはなかなか働きづらいかなっていう職場もね、多いって感じになってますね。と、あと、事業ドメインの知識を習得する必要があります。コンサルの場合はプロジェクトごとに全く違う業界に対してインプットが必要になってきますね。数学とプログラミングだけでは不足してくるので、他の知識、常に吸収する必要があります。実際の事業の場合は、例えばマーケの部署が今何やってんのかとか、コンテンツが今どんな改善をしようとしてるのかっていうところの戦略まで含めて把握する必要があります。会社の中ではビジネスが共通言語であって、数学やプログラミングではありません。もちろん、ビジネス知識を習得した上で、数学やプログラミングができるデータサイエンティストっていうのは社内で一番重宝されます。それが専門性を生かして仕事がするっていうことですね。
休日も勉強の必要がある
休日も勉強をするっていうのがとても辛いと感じる人は多いかなと思います。せっかく社会人になったのに、学生時代みたいに勉強し続ける必要があるのがデータサイエンティストっていう仕事ですね。高度な技術職なので、イノベーションの進歩は早くなってます。なので、それに比例して学習する必要のある量も増えてきます。成果を出すには、継続的な研鑽が必要な職種っていうのはまあわかってる方もね、多いとは思うんですけど、社会人になってからで想像以上だったっていう人も多いので、一応あげておきました。と、あと勉強した割には、使わない知識も多いです。使わない知識が多いんで、自分は本当に勉強する必要はあるのかっていう風にたまに思う人もいるんですけど、けどね、逆に勉強してないと、万が一その知識について聞かれた時に答えられないのでマイナスになりますよね。で、多くの人が落胆するポイントとして、ディープラーニングをめちゃくちゃ勉強したけど、使う仕事ってごく一部だったとか、会社によっては使わないってことも多いんですよね。かっこいい機械学習を使うことっていうのはそうそうないです。企業の扱う分野にもよるんですけど、例えばね、高度なデータ分析を専門にしたコンサル会社っていうのは高度な分析を行うのが仕事なので使うこともあるでしょうけども、一般的な事業会社とかの場合は、ディープラーニングを使って機械学習するっていうのは、ごく一部の仕事になります。
実務ではやっぱり会社なので、過去の成功例がある手法が優先されるわけですね。理論的には新しい手法があったとしても、実装しようと思うとコストとリターンが合わないことってのがよくあるので、結局ちょっとね、データサイエンティスト的にはもやもやしたまま現場でよく使われる手法での分析に落ち着くことが多いというのが現実になってます。
優秀な人材との競争
あとは、優秀な人が増えてることも辛い部分です。近年のデータサイエンティスト人気で、優秀な学生や中途の専門家っていうのが急増しています。データサイエンス専門の大学院も多数設立されていて、そもそも学生時代の時点で自分たちと身につけている知識とか、与えられた環境ってのは違う人も多いわけですよ。その中で競争を始める必要があります。それだけの覚悟を持ってデータサイエンティストになる必要があるってことですね。
社内調整が多い
あと、コミュ力が必要です。1人ではできない仕事が多いんですね。データサイエンスって、そのプロダクトを一人で作るとか、システム開発を一人でやる、アプリを1人でやるっていうのをもしかしたらできる会社もあるかもしれないですけど、データサイエンスってそもそも、先ほどの説明したように、データを人からもらうってところから始まるんですよ。人との社内調整っていうのが多くなるわけです。タイプの人間なんですよ。で、分析結果を説明するのも大事なんですよね。結局、分析しただけでは意味がなくて、「A」という方法と「B」という方法をデータ分析で比較した結果、「B」という方法が良いことが分かりましたので、「B」をやりましょうっていう風に各部署に説得をしなきゃいけないんですよ。人に始まって人に終わるのがデータ分析の仕事なんですね。全ての業務に人が絡みます。よく悩みとして、数学とプログラミングが抜群にできるけど、このコミュ力っていうのがあまり自信がないって人がマネージャーになることができず、待遇が改善しないって言うのはありますね。
データサイエンティストのリアルな辛さが伝わったら幸いです。今後もリアルな情報を発信するのでチャンネル登録お願いします!