データマイニングがなんちゃら、データ分析がどうたらと最近やたらといろんな場所で聞くようになりました。
かくいう私も前職では提案とかしてましたが、実際に何をすべきかは暗中模索で具体的な提案の形にするのは困難でした。
というか勉強不足なんですね。
というわけで勉強せねばということで、先ずは何をどのように学ぶべきなのかの調査からはじめた時のまとめをします。
① 統計学を学ぶべきか?
学んだほうがいいのは言うまでもないと思いますが、問題はどこまで学ぶかだと思います。
統計学のスペシャリストになりたいわけではありません。
目的はデータ分析をビジネスで利用し他者に提案できるようになることです。
下記のサイトでマーケッターが必要とする統計手法についての記事がありました。
実務で使う分析手法は5つで十分
5つであればハードルも下がりモチベーションの低下も防げると思います。
取り合えずは5つの手法をマスターするを目標に学ぶ方針とします。
② どう学ぶか?
①で統計学を学ぶ方針を立てましたので、次にどう学ぶかです。
図書館に行って統計学の本を借りて学ぶのもいいと思いますが情報が溢れえっている今の時代をかんがみてE-ラーニングを利用するのも手です。
NTTドコモ社とドコモgacco社が共同で推進しているgaccoプロジェクトでデータサイエンティストの講座が開講予定だそうです。
因みに無料です。
「社会人のためのデータサイエンス演習」
時間と場所に縛られないのと受講したい講義だけ受けられるという効率のいい勉強法だと思います。
統計学の基礎を理解するにはちょうどいいと思います。
深堀して学びたい場合は下記の団体に所属してセミナーに参加してみるのもいいと思います。
一般社団法人 データサイエンティスト協会
③ BIツールの選別
実はBIツールは昔から市場に提供されていたりします。
極論を言えばエクセルだってBIツールです。
下記のサイトでお勧めのBIツールを紹介していますのでリンクを張っておきます。
お勧めBIツール
ここではタイトルにあるとおりPowerBiを選択します。
PowerBi
理由としては他システム連携でデータ取得を行えたり、WebPublishできたりと機能が豊富であること。バージョンアップが頻繁に行われていて機能が充足されていくこと。無料版があり手を出しやすいことを考えるとPowerBiがやり易いじゃないかと思ってます。
Azure利用前提なら今のところPowerBi一択になりますしね。
④ リアルデータの利用
データ分析を行うためにはあたりまえですがデータが必要です。
ただ、ひとえにデータといっても自前で用意するのはかなりの手間ですし、テストで作成した場合データの信憑性が低くなります。
そこでご紹介するのが総務省統計局が提供している統計情報です。
e-stat
国勢調査から人口推移など多くのデータが揃っています。
無料でダウンロードできるのでご利用をお勧めします。
IoTデバイスが安く入手できるので、興味がある方は自前でデータ取得できる環境を構築してみるのもいいかもしれません。天候や温度、湿度等のリアルデータを取得して分析を行っている人も実際にいるみたいです。
⑤ 挑戦
ある程度学習しなれてきたら分析投稿サイトで実際に提供されいてる課題に挑戦してみるのも面白いかもしれません。
そこで紹介するのがKaggleです。全世界から企業や研究者がデータを投稿し最適モデル目指して競いあうことが出来るサイトです。
ものによっては賞金が出たり、投稿した企業からヘッドハンティングを受けたりすることもあるらしいです。
Kaggle
動画配信サイトで有名な「NetFlix」はかつて動画のレコメンド手法に1億円の懸賞金をかけて募集したことがあります。
一攫千金を目指すことも出来るのがデータ分析の現在の価値かもしれません。
という感じでやっていければいいなと思います。
コメント