夏休みの目標 – 勉強記録#02

Pocket

記念すべき勉強記録第2回。

実は同じ内容の投稿を5日前くらいにしようと思ったが、データベースのエラーによって見事消失。もう一度体裁を整えて書き直すことをさきほど決意。

とはいえ、テスト期間中なため、何も勉強らしい勉強はしていない。

先ほど、夏休みやろうと思ってたKaggleに関する記事をアップロードした。
Kaggleを始める – Forest Cover Type

こういう感じで勉強した内容をみんなが見れるような体裁でアップロードしつつ、中の人が全体としてどういう勉強を行ったのかを勉強記録カテゴリーで書いていこうかなと画策中。

ちょっと話が前のめりになってしまったが、今回は夏休み中何をするかを簡単にまとめていく。

  • Webアプリケーションの開発を1つ以上する
  • 他言語の習得(JavaScriptかRuby on Rails)
  • Kaggleの挑戦
  • スクレイピング技術の向上(Scrapy使いこなせるようになる)
  • (発展)機械学習を用いた株価予測の実装

とりあえず以上の5つを目標にしていきたい。

Webアプリケーションの開発を1つ以上する

これに関してはバイト先でWebサービスの開発の半分をやらせてもらえるらしいのでそこで頑張りたい。
PythonとかJavaScriptとかでやるみたいなので(勉強不足でデータベースの区別とかサーバーの違いが全くわからねえ・・・)、習得していきたい。
別枠で勉強する予定のJavaScriptかRuby on Railsの延長でやるかもしれない。
ただ、何作るか全く決めてないから考えなければ。

他言語の習得

今の所、Python以外は何もできない状態な上、Pythonも実務ではほとんど使ったことがない状況。
PythonのツールについてのWeb記事をひたすら執筆し続けていたので特定のツールに対する知識(NumPyとかPandas)は増えたが、実践の場で何も使えてないのがとても悲しい。

ということで(?)他の言語を身につけようと思った。
最初は本を読みながら独学でいいかなと思ったが、お金に若干の余裕があるのでテックアカデミーあたりで何か受講するのもありだなと思っているところ。ただ、かなり時間取られそうなのでやるならそれなりの覚悟が必要と見える。

Python以外ならなんでも良いというのが正直なところだが、学ぶとしたらWebアプリケーション系かなと。

自分でサイト作って、何かサービス展開できる力を蓄えておくと将来フリーランスとしても少し活躍できるかもという打算もある。

Kaggleの挑戦

機械学習関連の勉強を少しだけかじっていたこともあり(PRMLは途中で頓挫)、色々実装して調べながらやった方が理解も深まるかなと思い、数学的な背景(どういう関数を使っているのかというレベル)も把握しながら理解を深めていきたい。

友達とチームを組んで、まずは実際のコードから色々な手法を学んでいって、最終的には何かしらのコンペティションで上位入賞(銅メダルくらい)を狙っていけたらいいなというところ。

このために15インチのMacBookProを買ったといっても過言ではない。

スクレイピング技術の向上

Pythonクローリング&スクレイピングという書籍を一通り(最終章だけまだ終わってない)読んで、自分で実装もしてみたので、今度はこの本を参考にしながら自分なりのクローラー、スクレイパーを作っていきたい。
このあたりの技術は機械学習のデータセット集めに非常に役立つと思うので、ちゃんとわかっておくと非常に便利だと思う。

もちろん、相手のサーバーに負荷をかけないよう配慮するのも忘れずに。

(発展)機械学習を用いた株価予測

今まで挙げたものの集大成としてこれに取り組んでいきたい。
成功したらお金も稼げるので一石二鳥。(実際成功している例はほとんどなさそうなのでかなり難しいとは思う)

TwitterのつぶやきとかFacebookの投稿とかを元に予測できると楽しそう。
もしくは、会社関係のデータが集まるサイト(取引履歴とか?)から情報を引っ張ってきてそれを使って学習させたりとかもよさそう。

とか色々考えているが、クローリングとスクレイピングでデータを集め、Kaggleで学んだ手法を使って色々試せたらな楽しそう。

これで全自動化できたらいいよね。

Pocket