【2日間開催】【AIデータサイエンス・ヘルスケア編】リアル医療データを用いたPython/R予測モデリングの実践

開催日時
1日目 2020-06-09(火) 9:30~12:30
2日目 2020-06-30(火) 9:30~12:30

講師 株式会社JMDC
事業開発部 数理グループ
齋藤 知輝 氏

日本アクチュアリー会正会員 Kaggle Competitions Expert
東京大学工学部計数工学科卒業、日本生命保険相互会社で商品開発業務等を担当した後、2018年より現職 日本最大級のリアル医療データを用いた生活習慣病の疾病リスク予測モデルの開発等に従事

参加費 60,000円 (資料代・消費税を含む)

開催地 カンファレンスルーム(株式会社セミナーインフォ内)

補足事項
普段お使いのPCをご持参いただき、Google Colaboratory(Jupyter Notebook; ブラウザ上)の環境で演習しながら学ぶ体験学習型ワークショップです。特に初心者にとって障害となる環境構築は不要です。

【事前準備について】
※ インターネットを使用します。Wi-Fi環境をご用意いたしますので、接続可能なPCをご持参ください。
※ 事前配布資料「Google Colaboratory接続(Jupyter Notebook)の手順書」を開催1週間前にメール送付します。
※ Google Colaboratory環境で実習していただきます。事前に本セミナー専用のGoogleアカウントをご用意ください。
詳しくは「Google Colaboratory接続(Jupyter Notebook)の手順書」内にてご案内します。
※ 「Google Colaboratory接続(Jupyter Notebook)の手順書」の内容についてはセミナー当日の講義冒頭で簡単に解説しますが、開催前日までにご自身のPC (セミナー当日持参のPC) で本手順書に沿って動作確認をおこなってください。
※ 講義で扱う内容はPythonのコードとRのコードどちらもご用意します。
(講義中のコード解説は基本的にPythonを用いますが、Rについても質問を受け付けます)
※ 本講座で扱うデータは匿名加工情報であるため、参加者全員、第1回のセミナー当日に目的外利用の禁止等に関する誓約書の記入・提出が必須になります。
※本セミナーのキャンセル期限は6/2(金)12時です。(開催1週間前に資料の一部を送付するため)
※回数券を使用して当セミナーにお申込されます場合、2回分の回数券が必要となります。

【概要】
このセミナーでは株式会社JMDCが保有する日本最大級のリアル医療データを題材に機械学習による予測モデリングを実践します。
第1回と第2回の間では各自で予測モデル構築に取り組んでいただきます。実際に試行錯誤しながらコードを書くことで、セミナー終了後にも残るスキルが身に付くはずです。
またセミナーでは課題設定やレポーティング等も含めたデータサイエンス実務の全体像についてもご紹介します。
ビジネス現場でのデータサイエンスの実践力を身につけたい方、ぜひご参加ください。

【第1回】
今回扱うリアル医療データ・モデリング課題の背景についてご説明した後、実際のモデリングの基本的な流れをコードデモ形式で解説します。
そして第1回の内容を踏まえ、第2回までに各自でモデルをブラッシュアップしていただきます。
作成いただいたモデルの予測結果は第2回までに送付いただきます。
※扱う問題は不均衡データに対する2値分類です。

【第2回】
参加者方の取組結果について、簡単な発表も通じて知見を深めあっていただきます。
その後講師のモデリングコードを題材に課題の解説を行います。
また、ビジネスの場面で予測性能に劣らず重視される予測モデルの解釈について、講師の実体験に基づく様々なアプローチ事例をご紹介します。

【セミナー詳細】
【第1回】
1.データの理解と課題設定
(1)保有データの理解
(2)ビジネスでの活用を意識した課題設定

2.不均衡データに対する評価指標の設定
(1)不均衡データに対するモデル性能評価の留意点
(2)ROC曲線とAUC
(3)その他の指標(logloss等)

3.探索的データ分析(EDA)
(1)探索的データ分析(要約統計量の算出、様々な可視化)

4.モデル構築と性能評価
(1)過学習とクロスバリデーション
(2)ロジスティック回帰モデル
(3)ランダムフォレスト
(4)GBDT(XGBoost)

5.質疑応答 ※ 録音、ビデオ・写真撮影はご遠慮ください

【第2回】
1.参加者取組発表
(1)参加者提出データの予測性能まとめ
(2)参加者によるモデル構築の取組発表

2.講師モデリングコードの解説
(1)講師モデリングコードの解説

3.予測モデルの解釈
(1)データサイエンティスト視点でのモデル解釈
(2)ドメイン知識(今回は医学的視点)に基づくモデル解釈
(3)データサイエンス部門以外の方への説明

4.質疑応答  ※ 録音、ビデオ・写真撮影はご遠慮ください

サービス詳細URL:https://www.seminar-info.jp/entry/seminars/view/1/4653

▼問い合わせ先

株式会社セミナーインフォ

〒102-0074 東京都千代田区九段南2-2-3九段プラザビル2階

TEL:03-3239-6544

FAX:03-3239-6545

http://www.seminar-info.jp/

株式会社セミナーインフォのプレスリリース一覧