テック

Rを学びたいなら『統計学:Rを用いた入門書』を一冊購入すべし

 

ビッグデータというバズワード(2013年当時)

ビッグデータというバズワードが流行り始めて2年くらい経ちますが、未だにビッグデータをうまく活用したインパクトある事例が出てこないのが気になります。

ビッグデータというからには長年の大量のデータを解析する必要があるので、業界によってはマーケティングデータを収集し始めたばかりで、分析できるほどの結果を観察するまでにまた時間がかかるものですが、未だに単語だけ先走ってる感は否めません。

統計学が最強の学問である

統計学が最強の学問である

この本によりますと、統計学は最強の学問であるらしいのですが、それはなんとなくわかるとしても統計解析という実務は実際に手を動かしてデータを見てみないと身につかないものです。

データを扱うと言うとエクセルを思い浮かべます。エクセル自体も優秀な統計ソフトと言えますが、統計データを扱うプロたちはSPSSやStataのような専門のソフトを使うことが多いです。この理由は簡単に複雑な統計解析ができるからです。

Rという統計専用の無料ソフトウエアを試してみよう

しかしこれらのソフトは値段が高く、一般人が購入することは難しいでしょう。そこでエクセルに比べると少しハードルは高いですが、統計ソフトとしてはRというものがよく使われています。無料です。

エクセルとは異なり、プログラミングちっくな記述をしなければならないのでとても敷居が高いのですが、一度学習すればある程度は使えるようになります。実際は重回帰分析程度であればエクセルでやればいいので、あえてRを使うメリットは底までないことが多いのですが…

それでもRを学ぶというのであれば、個人的におすすめしたい本は『統計学:Rを用いた入門書』です。

統計学:Rを用いた入門書

統計学:Rを用いた入門書

この本は実際にRを動かして分析できますので、かなり実践的で役に立ちます。

Rで分析するためのデータセット

ちなみにこの本で使われているデータセットは以下のサイトからダウンロードできます。

Statistics: An Introduction using R
http://www3.imperial.ac.uk/naturalsciences/research/statisticsusingr

日本人の生活価値観調査や選挙データなどに興味がある人は、東京大学の社会科学研究所アーカイブに様々なデータが公開されていますので、思う存分使ってみるといいかもしれません。

Social Science Japan Data Archive (SSJDA)
http://ssjda.iss.u-tokyo.ac.jp/

まずは、「統計学:Rを用いた入門書」を購入して、上記URLからデータセットをダウンロードし、ゴリゴリと動かしてみよう!