データマイニング -Data Mining-

担当教員・研究室 配当年次 学期 種別 単位数 授業形態 開講年度 ナンバリングコード
越野 一博 303研究室
3・4年 後期 選択 2 単位
講義(対面)
2021 SSI350
アクティブラーニング
はい
授業概要
生成・保存されるデジタルデータは,その量および種類ともに年を追うごとに増加している。本科目では,大量のデータに対する分類,特徴の抽出や予測を可能とする機械学習およびその背後にある解析学を学ぶ。知識とあわせて,実習によるデータ処理の技術を習得する。
授業は,本学が開発したe-Learning システム(POLITE 3)を利用して行う。
授業における学修の到達目標
1. データマイニングの概念と役割を理解する
2. 回帰分析と分類問題に対する様々な手法を理解する
3. クラスタリング分析と特徴抽出法について理解する
4. 実習(プログラミング)をとおして,Pythonと機械学習用ライブラリの基本的な使い方を習得する。
授業計画
回数 授業、事前・事後学習 時間
1 事前学習 シラバスを確認し授業の全体の内容を読む。第1回学修資料の概要をノートにまとめること。 2
授業 データマイニングの概要,単回帰
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
2 事前学習 第2回学修資料を読み,概要をノートにまとめること。 2
授業 単回帰,重回帰
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
3 事前学習 第3回学修資料を読み,概要をノートにまとめること。 2
授業 重回帰,非線形回帰
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
4 事前学習 第4回学修資料を読み,概要をノートにまとめること。 2
授業 汎化能力とその推定方法
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
5 事前学習 第5回学修資料を読み,概要をノートにまとめること。 2
授業 相関,外れ値とRANSAC法
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
6 事前学習 第6回学修資料を読み,概要をノートにまとめること。 2
授業 サポートベクトル:2クラス分類
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
7 事前学習 第7回学修資料を読み,概要をノートにまとめること。 2
授業 サポートベクトル:一対多,カーネルサポートベクトルマシン
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
8 事前学習 第8回学修資料を読み,概要をノートにまとめること。 2
授業 サポートベクトル:分類における性能指標
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
9 事前学習 第9回学修資料を読み,概要をノートにまとめること。 2
授業 決定木とランダムフォレスト
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
10 事前学習 第10回学修資料を読み,概要をノートにまとめること。 2
授業 ナイーブベイズ分類:ベルヌーイ分布モデル
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
11 事前学習 第11回学修資料を読み,概要をノートにまとめること。 2
授業 ナイーブベイズ分類:多項分布モデル
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
12 事前学習 第12回学修資料を読み,概要をノートにまとめること。 2
授業 K-means法
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
13 事前学習 第13回学修資料を読み,概要をノートにまとめること。 2
授業 確率的クラスタリング:混合ガウスモデル
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
14 事前学習 第14回学修資料を読み,概要をノートにまとめること。 2
授業 主成分分析:主成分と固有値問題
事後学習 授業資料をノートにまとめ、POLITEの小テストを受験する。 2
15 事前学習 第15回学修資料を読み,概要をノートにまとめること。 2
授業 主成分分析:次元削減
事後学習 授業資料をノートにまとめ,試験の準備をする。POLITEの小テストを受験する。 2
成績評価の方法およびその基準
次項の項目及び割合で標準評価基準に基づき総合評価する。
■試験:  50% ■小テスト: 20% □レポート: % ■演習課題: 30% 
□その他[       ]
課題(試験やレポート等)に対するフィードバック方法
試験,小テストの解説,およびレポートに対するコメントによりフィードバックを行う。
教科書
なし
参考書・Webサイト
Pythonで動かして学ぶ!あたらしい機械学習の教科書 第2版
Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 第3版
Pythonデータサイエンスハンドブック Jupyter、NumPy、pandas、Matplotlib、scikit-learnを使ったデータ分析、機械学習
単位習得が望ましい科目
基礎数学,確率・統計I,II,線形代数I,II,微分積分I,II,人工知能
備考
授業で学んだ知識,方法・技術の確認のため、毎回小テストを実施する。演習課題に取り組むことで,方法論と対応づけてのプログラミングの理解・習得を目指す。演習課題では,Jupyter Notebookを使用する。試験は授業16回目に定期試験を行う。
担当教員の実務経験
2003年度から2018年度まで国立の研究所に所属し,医用画像の処理・解析研究を遂行した。その間,医師との共同研究も実施した。研究テーマの一つとして,画像から得られた複数の定量値や検査数値を対象として,診断や病態の進行,予後予測に有用な指標の探索を行ってきた。
これまでの実務経験にもとづいて,データから有益な情報を取り出す方法論の解説だけでなく,医師との共同研究で求められるものや医学と情報工学が連携する様子を学生に伝え,データマイニングが社会に役立っていることを実感できるような教育を行う。