ツヨシのブログ

技術的な事とか日常の事とか徒然なるままに

スポンサーリンク

【Day001】 データサイエンティストになることを考えてみた

スポンサーリンク

こんにちは、ツヨシです。

今日も早起きです。

Kaggleをやるモチベーション

さて、前回はPython言語の習得を目指していたのですが、具体的な目標のため「Kaggle」を頑張っていこうとなりました。

ginga0118.hatenablog.com

で、ちょうどいいタイミングで社内でもデータサイエンティストや機械学習分野について力を入れていこうとしており。そのためのワークショップを開催するというお知らせを知りました。

せっかくなのでワークショップには参加しようと思いますが、私はデータサイエンスや機械学習についてはずぶの素人。大学時代に研究していた人や、現在使っている人たちもいるようですが、私はかれらにかないません。といってもまずは参加してみることから始まると思います。

データサイエンティストという選択

てなことを考えていましたが、せっかくなのでデータサイエンティストを目指してみようかなと思います。今はまだ全く知識も経験もありませんが、今後も社内での機会も増えてくるだろうから、その時にデータサイエンティストとしてやっていけるように自分なりに知識をつけていこうと思いました。

年もとしで頭もカッチカチですが、チャンスがやってきたときの準備は必要です。今やっている仕事もちょっと飽きてきたので、こっち方面にシフトする方で考えていこうと思います。

ということで、「Pythonを習得しよう」ー>「Kaggleをやってみよう」ー>「データサイエンティストになる」と目標が変化していきました。

「データサイエンティストになる」の方がわかりやすくていいですね。このためには機械学習、深層学習、微分統計学などの知識も必要になります。これらはおいおい勉強していきたいと考えています。

これらの習得のバロメータとしてKaggleは良いと思います。「Kaggleの順位が高い=知識がある、知識を使える」となります。Python言語というよりKaggleを頑張っていくっていうのはとりあえずは間違いではないと思いました。

Kaggleをやるために何をすればいいのか

自分は本当に「Kaggle」とはなんぞやと言った状態です。なので、実際手を動かしてみようと思いました。

このために最適な本としてKaggleの入門書をやります。入門書としては「Kaggleスタートブック」がよさそうです。

この本はKaggleのコンペで優勝したことのあるid:upuraさんが書かれた本で、Kaggleの基礎を学ぶことのできる本です。私のようなKaggle初心者にはちょうど良いですね。

upura.hatenablog.com

データサイエンティストとはなんぞや

データサイエンティストになると言ってみた物の、はてどうすればなれるのでしょうか。 データサイエンティストとはデータサイエンスをやる人のことですが、wikipediaでは次のようになっています。

データサイエンス(英: Data Science、略称: DS)とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学統計学アルゴリズムなどを横断的に扱う。

https://ja.wikipedia.org/wiki/%E3%83%87%E3%83%BC%E3%82%BF%E3%82%B5%E3%82%A4%E3%82%A8%E3%83%B3%E3%82%B9?wprov=sfti1

つまりデータを集めてみたもののこれがどのように使えるかはぱっと見分からないので、それを整理して価値を与える事ですね。そう言った人達をデータサイエンティストと呼んでいます。

何かに価値を与えるというのは仕事の基本でデータを使って行う訳です。

データサイエンティストになるためには統計学微分などの数学的な素養だけでなく、プログラミング、機械学習アルゴリズム、大量のデータに対する分散処理などのコンピュータサイエンスに関する知識も必要になります。

統計検定で体系的に学ぶ道

データサイエンティストになることは学ぶことが多くてちょっと先が見えませんが、わくわくしますね。数学に関してはあまりにも知識が劣化しているため学び直そうと思っていたので、ちょうど良いタイミングです。

データサイエンティスト向けの資格として統計検定というものもあります。

www.toukei-kentei.jp

これは統計に関する知識を評価する資格になります。資格を持っているから何かになれるわけではありませんが、体系的な知識を得るために資格をとるのは学びとしては結構な近道だったりします。3級が高校レベル、2級が大学レベルなので、まずは3級から取得してみようかなと考えてます。

仕事に関するモチベーション

最近はソフトウェアエンジニアとして設計、実装をすることも少なくなり仕様の確認、決定がおもな業務になっていました。自分としては実際に設計、実装して動かしていく方が性分にあっており、なんだかつまらないと感じていました。

なので、こう言った新しいことを学び、動かしていくことはたのしくもあります。あわよくば仕事にできるならしたいのですが、まずは蓄えること。そのなかで外に出せることはジャンジャンと出していき仕事に結びつけばと思っています。

さて、頭もかちこちになる柔軟に考えられませんが、ちょっとがんばってみますか。