【Day001】 データサイエンティストになることを考えてみた
こんにちは、ツヨシです。
今日も早起きです。
Kaggleをやるモチベーション
さて、前回はPython言語の習得を目指していたのですが、具体的な目標のため「Kaggle」を頑張っていこうとなりました。
で、ちょうどいいタイミングで社内でもデータサイエンティストや機械学習分野について力を入れていこうとしており。そのためのワークショップを開催するというお知らせを知りました。
せっかくなのでワークショップには参加しようと思いますが、私はデータサイエンスや機械学習についてはずぶの素人。大学時代に研究していた人や、現在使っている人たちもいるようですが、私はかれらにかないません。といってもまずは参加してみることから始まると思います。
データサイエンティストという選択
てなことを考えていましたが、せっかくなのでデータサイエンティストを目指してみようかなと思います。今はまだ全く知識も経験もありませんが、今後も社内での機会も増えてくるだろうから、その時にデータサイエンティストとしてやっていけるように自分なりに知識をつけていこうと思いました。
年もとしで頭もカッチカチですが、チャンスがやってきたときの準備は必要です。今やっている仕事もちょっと飽きてきたので、こっち方面にシフトする方で考えていこうと思います。
ということで、「Pythonを習得しよう」ー>「Kaggleをやってみよう」ー>「データサイエンティストになる」と目標が変化していきました。
「データサイエンティストになる」の方がわかりやすくていいですね。このためには機械学習、深層学習、微分、統計学などの知識も必要になります。これらはおいおい勉強していきたいと考えています。
これらの習得のバロメータとしてKaggleは良いと思います。「Kaggleの順位が高い=知識がある、知識を使える」となります。Python言語というよりKaggleを頑張っていくっていうのはとりあえずは間違いではないと思いました。
Kaggleをやるために何をすればいいのか
自分は本当に「Kaggle」とはなんぞやと言った状態です。なので、実際手を動かしてみようと思いました。
このために最適な本としてKaggleの入門書をやります。入門書としては「Kaggleスタートブック」がよさそうです。
この本はKaggleのコンペで優勝したことのあるid:upuraさんが書かれた本で、Kaggleの基礎を学ぶことのできる本です。私のようなKaggle初心者にはちょうど良いですね。
データサイエンティストとはなんぞや
データサイエンティストになると言ってみた物の、はてどうすればなれるのでしょうか。 データサイエンティストとはデータサイエンスをやる人のことですが、wikipediaでは次のようになっています。
データサイエンス(英: Data Science、略称: DS)とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。
つまりデータを集めてみたもののこれがどのように使えるかはぱっと見分からないので、それを整理して価値を与える事ですね。そう言った人達をデータサイエンティストと呼んでいます。
何かに価値を与えるというのは仕事の基本でデータを使って行う訳です。
データサイエンティストになるためには統計学、微分などの数学的な素養だけでなく、プログラミング、機械学習やアルゴリズム、大量のデータに対する分散処理などのコンピュータサイエンスに関する知識も必要になります。
統計検定で体系的に学ぶ道
データサイエンティストになることは学ぶことが多くてちょっと先が見えませんが、わくわくしますね。数学に関してはあまりにも知識が劣化しているため学び直そうと思っていたので、ちょうど良いタイミングです。
データサイエンティスト向けの資格として統計検定というものもあります。
これは統計に関する知識を評価する資格になります。資格を持っているから何かになれるわけではありませんが、体系的な知識を得るために資格をとるのは学びとしては結構な近道だったりします。3級が高校レベル、2級が大学レベルなので、まずは3級から取得してみようかなと考えてます。
仕事に関するモチベーション
最近はソフトウェアエンジニアとして設計、実装をすることも少なくなり仕様の確認、決定がおもな業務になっていました。自分としては実際に設計、実装して動かしていく方が性分にあっており、なんだかつまらないと感じていました。
なので、こう言った新しいことを学び、動かしていくことはたのしくもあります。あわよくば仕事にできるならしたいのですが、まずは蓄えること。そのなかで外に出せることはジャンジャンと出していき仕事に結びつけばと思っています。
さて、頭もかちこちになる柔軟に考えられませんが、ちょっとがんばってみますか。
改訂版 日本統計学会公式認定 統計検定3級対応 データの分析
- 発売日: 2020/02/08
- メディア: 単行本