秋葉原はWeeblyさんで開催された「データサイエンス入門」勉強会に参加してきました。
現役データサイエンティストの方が主催してるだけあってリアルな話を聞けたのがよかったです。
得た知識を備忘がてらまとめておきます。
勉強会の詳細
データサイエンスはEBM ⇔ KKD(勘と経験と度胸)
EBM とは Evidence Based Marketing 根拠に基づく事業である。
◆分析のステップアップ
可視化 | データの様子を確認する | グラフ化、基礎統計量 |
比較 | 複数のデータを比較する | A/Bテスト、仮設検定(A/Bで近似値が出た場合のドリルダウンして解析)ミニマム何人で解析できるかも判断可能 |
要因特定 | 必要なデータの項目に絞る | 機械学習 |
予測・モデル作成 | 道のデータの予測を行う | 機械学習、多変量解析 |
システム化 | 定例で実行できるようにする | 動化、定例化 |
今時点ではKKDが優遇されている。
まだまだデータを疑う時代。情報が安定していないため。
データベースの情報が正しいとは限らない。
◆ 3タイプの働き方
- 自分の分析を行う → 分析部署・チーム
- クライアントの分析を行う → コンサル業、フリーランス
- 分析ツール・アプリの開発を行う → BIやAIツール
判断材料を根拠を示し問題解決のサポートがメインの仕事
◆ データサイエンティストの仕事
0 ビジネス理解 | 案件の目的・真のニーズ見極める |
1 データの理解 | 全体の傾向を把握・ヒアリング |
2 データ準備 | モデルに投入するデータを作る |
3 モデリング | 数理モデルを生成する |
4 結果検証 | モデルの性能・信頼性を検証する |
5 サービス実装 | 定例で実行するために実装 |
※0、1で全体の8割の作業する
◆ AIとは
なになにが出来るAIを弱いAIと呼ぶ(特化型)
DeepLearningの様に画像を解析できる等が該当する
何でもできるAIを強いAIと呼ぶ(汎用型)
ドラえもんやアトムみたいに物事判断できるタイプが該当する
但し時代はそこまで追いついていないので現在のAIは特化型がメインとなる
◆ DeepLearningについて
DLの強み → 画像解析、ゲームなど
※結果論が先に出るためなぜそうなったのかについては説明ができない
DLの弱み → 医療判断、経営判断には適応が難しい
感想
メモ書きを転記しましたが勉強会の内容については濃くもなく薄くもなくな感じでした。
聴衆参加型のセミナーでオーディエンスに質問を投げかけて双方向の意見交換をしながら進行していました。
残念な点については時間配分に考慮が足りなかったのか21:00までだったところ30分オーバし21:30過ぎまで実施されたことです。
2時間も休憩なくセミナーを拝聴するのは聞く側にも負担があるので、聞く側にももう少し配慮いただければと思います。
セミナー中に紹介がありましたがデータサイエンティストの勉強をするには「養成読本」シリーズがいいらしいです。
だまされたと思って買ってみます。
コメント