數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)落地實(shí)踐培訓(xùn)大綱
一、大數(shù)據(jù)分析挖掘技術(shù)介紹
1、map/reduce
2、mahout數(shù)據(jù)挖掘
3、sql on hadoop
4、spark生態(tài)體系
5、R語言
6、MPI并行計(jì)算
7、GPU并行計(jì)算(深度學(xué)習(xí))
8、java并行計(jì)算框架
二、常用機(jī)器學(xué)習(xí)算法原理 1、決策樹
2、隨機(jī)森林
3、協(xié)同過濾推薦算法(余弦相似、修正余弦)
4、Jaccard算法
5、樸素貝葉斯算法
6、k-means聚類算法
7、pagerank算法
8、邏輯回歸
9、圖計(jì)算
三、大數(shù)據(jù)挖掘業(yè)務(wù)場(chǎng)景和生產(chǎn)平臺(tái) 1、互聯(lián)網(wǎng)金融業(yè)務(wù)—如何構(gòu)建阿里金融系統(tǒng)
2、銀行客戶需求業(yè)務(wù)
3、大數(shù)據(jù)分析生產(chǎn)平臺(tái)
4、推薦/廣告系統(tǒng)的原理、架構(gòu)、模型、驗(yàn)證等。
5、基于GBDT的組合模型架構(gòu)
四、編程實(shí)踐(動(dòng)手) 1、迭代類機(jī)器學(xué)習(xí)編程入門-求圓周率
2、pagerank的并行化實(shí)現(xiàn)(*)
3、邏輯回歸算法的java實(shí)現(xiàn)
4、決策樹c45,id3的java實(shí)現(xiàn)
5、隨機(jī)森林和全樹并行化實(shí)現(xiàn)
6、訓(xùn)練數(shù)據(jù)和結(jié)果模擬器
7、模型結(jié)果規(guī)則化處理
8、協(xié)同過濾java實(shí)現(xiàn)
9、基于圖計(jì)算的推薦java實(shí)現(xiàn)
五、神經(jīng)網(wǎng)絡(luò)及深度學(xué)習(xí) 1、什么是神經(jīng)網(wǎng)絡(luò)算法
2、多層神經(jīng)網(wǎng)絡(luò)程序如何實(shí)現(xiàn)(java程序)
3、神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)原理(誤差函數(shù)、梯度下降求小值、更新權(quán)重和截距)
4、推導(dǎo)需要的小化數(shù)學(xué)知識(shí)(導(dǎo)數(shù)和偏導(dǎo)數(shù)、導(dǎo)數(shù)運(yùn)算、梯度下降原理)
5、數(shù)學(xué)推導(dǎo)過程
6、什么是深度學(xué)習(xí)
7、深度學(xué)習(xí)的計(jì)算過程
8、深度學(xué)習(xí)如何訓(xùn)練
9、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的關(guān)系是什么
10、圖像識(shí)別原理 |