課程(cheng)描述(shu)INTRODUCTION
大數據分析與可視化技術應用公開課
日程安排SCHEDULE
課程大綱(gang)Syllabus
大數據分析與可視化技術應用公開課
培訓重點
1.數據分析實戰
2.數據挖掘理論及核心技術
3.大數據算法原理及案例實現
4.Python應用(yong)實戰(zhan)
培訓特色
1.理論與實踐相結合、案例分析與行業應用穿插進行;
2.專家精彩內容解析、學員專題討論、分組研究;
3.通過(guo)全面知識理解(jie)、專題技能和實踐結合的授課方式。
日程安排
第一天
數據分析實戰
第一講 零基礎學Python 講解Python背景、國內發展狀況、基礎語法、數據結構及繪圖操作等內容。特別針對向量計算這塊,著重介紹Python在這方面的優勢及用法。
第二講 數據分析方法論 講解統計分析基礎,包括統計學基本概念,假設檢驗,置信區間等基礎,并結合數據案例說明其使用場景和運用方法。介紹數據分析流程和常見分析思路,并結合案例進行講解。
第三講 數據處理技法 從數據接入、數據統計、數據轉換等幾個方面進行講解。數據接入包含接入MySQL、Oracle、Hadoop等常見數據庫操作;數據統計包含Pandas包的具體用法和講解;數據轉換包含對數據集的關聯、合并、重塑等操作。此外,針對海量數據的情況下,介紹在Spark平臺上的數據處理技術,并結合真實環境進行操作講解。
數據挖掘理論及核心技術
第四講 認識數據挖掘 講解數據挖掘基本概念,細致講解業務理解、數據理解、數據準備、建立模型、模型評估、模型部署各環節的工作內容及相關技術;結合業界經典場景,講解數據挖掘的實施流程和方法體系。
第五講(jiang)(jiang)(jiang) 數據(ju)挖掘(jue)(jue)核心技術 細致(zhi)講(jiang)(jiang)(jiang)解(jie)抽樣(yang)(yang)、分(fen)區、樣(yang)(yang)本平衡、特(te)征(zheng)(zheng)選(xuan)(xuan)擇(ze)、訓練模型、評估模型等(deng)數據(ju)挖掘(jue)(jue)核心技術原理(li),并結合(he)(he)案例(li)講(jiang)(jiang)(jiang)解(jie)其具體(ti)實現和用法(fa)。尤其針對樣(yang)(yang)本平衡,重點(dian)(dian)講(jiang)(jiang)(jiang)解(jie)人工合(he)(he)成、代價敏感等(deng)算法(fa);針對特(te)征(zheng)(zheng)選(xuan)(xuan)擇(ze),重點(dian)(dian)講(jiang)(jiang)(jiang)解(jie)特(te)征(zheng)(zheng)選(xuan)(xuan)擇(ze)的核心思路,并結合(he)(he)Python進行案例(li)演示。
第二天
大數據算法原理及案例實現(1)
第六講 特征降維算法及Python實現 降維是大數據分析非常重要的算法 ,它可以在降低極少信息量的情況下,極大地縮小數據規模。主要講解主成分、LDA以及t-SNE原理,并結合案例進行Python實現。特別地,針對海量數據情況下的應用場景,講解實現思路和Python案例。
第七講 決策樹算法及Python實現 決策樹是非常經典的算法 ,一般常見于小數據的挖掘。由于決策樹具有極強的可解釋性,針對海量數據仍然是非常重要的實用價值。主要講解ID3、C4.5、C5.0以及CART決策樹算法的實現原理,并結合案例進行Python實現。
第八講 基于乳(ru)腺(xian)癌數據進行(xing)(xing)降維分(fen)析并建立分(fen)類模型 實戰(zhan)部(bu)分(fen):基于乳(ru)腺(xian)癌數據進行(xing)(xing)降維處理,并嘗(chang)試(shi)建立分(fen)類評估模型。旨(zhi)在(zai)通(tong)過該模型,并潛在(zai)的乳(ru)腺(xian)癌患者進行(xing)(xing)識(shi)別。
大數據算法原理及案例實現(2)
第九講 因果推理算法及Python實現 大數據分析技術可以幫助我們去發現、解決一些業務問題,然而如何去判斷我們的改進是否生效,是否在業務指標上呈現過一定的因果邏輯,則是一個重要問題和分析方向。本節主要介紹因果推理算法,包括貝葉斯推理、狀態空間模型以及CausalImpact工具等內容,并結合案例進行Python實現。
第十講 深度學習算法及Python實現 對于大數據的建模任務,我們可以基于深度學習來實現,不僅能夠針對海量數據進行建模,其效果也非常不錯。本節主要講解深度學習的發展歷程,DBN、DNN等經典深度學習算法,深度學習優化算法以及一些技巧。同時,介紹Keras庫的使用方法,并結合案例進行Python實現。
第(di)十一講 Lending Club信貸(dai)違約(yue)(yue)分(fen)析案例 實戰部分(fen):基于Lending Club信貸(dai)違約(yue)(yue)數據(ju)(ju),嘗(chang)試從多個不同(tong)的(de)維(wei)度(du)進行數據(ju)(ju)分(fen)析,旨(zhi)在(zai)發現一些有價值的(de)信息,同(tong)時基于該數據(ju)(ju),經過一定的(de)處(chu)理,建(jian)立(li)信貸(dai)違約(yue)(yue)識別模(mo)型,旨(zhi)在(zai)對信貸(dai)業(ye)務辦理提(ti)供模(mo)型支持,降(jiang)低(di)違約(yue)(yue)風險。
第三天
Python應用實戰(一)
第十二講 Python自然語言處理原理及案例
目前文檔數據已經成為很多企業重要的資產,通過對文檔數據進行解析、建模、分析、挖掘、可視化,我們能夠發現不一樣的洞察。本節主要講解自然語言處理基本概念和技法,包含分詞、關鍵字提取、文摘提取、文本分類、主題模型、word2vec等內容。介紹在深度學習的加持下,與傳統做法的區別,并使用Python進行案例講解。
第十三講 數據分析圖表及Python案例
數(shu)(shu)據可(ke)視(shi)化(hua)(hua)是(shi)大數(shu)(shu)據分(fen)析的(de)重(zhong)要手(shou)段,通過(guo)合理(li)地使用(yong)(yong)(yong)圖表,不僅(jin)可(ke)以簡潔地表達數(shu)(shu)據的(de)含義,高效地發現問題,還可(ke)以為報告的(de)編寫以及(ji)數(shu)(shu)據分(fen)析web應用(yong)(yong)(yong)增色(se)不少。本節主要講解常用(yong)(yong)(yong)的(de)數(shu)(shu)據分(fen)析圖表及(ji)其使用(yong)(yong)(yong)場景,介(jie)紹數(shu)(shu)據可(ke)視(shi)化(hua)(hua)的(de)方法(fa)論(lun),避免生搬硬套的(de)使用(yong)(yong)(yong)圖表,針對不同(tong)的(de)業(ye)務場景和(he)需(xu)求(qiu),合理(li)選擇可(ke)視(shi)化(hua)(hua)方法(fa)。介(jie)紹的(de)工(gong)具不限于matplotlib、pycha、pyecharts、ggplot、Bokeh、HoloViews、mpld3、plotly、pygal等常用(yong)(yong)(yong)可(ke)視(shi)化(hua)(hua)庫。
Python應用實戰(二)
第十四講 使用Notebook編寫數據分析報告 數據分析報告在大數據分析過程中具有重要價值,它體現了大數據分析的目的、過程和結果,以及對發現問題的解讀、改進方案等等,本節主要講解使用Notebook編寫數據分析報告的具體方法,以及編寫數據分析報告的方法論,并結合案例講解其用法。
第十五講 Dash可(ke)(ke)視(shi)化(hua)開發實(shi)戰 Dash是(shi)一款不(bu)錯的(de)(de)框架,可(ke)(ke)以(yi)基(ji)于Dash快(kuai)速開發一個(ge)輕(qing)量(liang)級的(de)(de)數(shu)(shu)據(ju)分(fen)析(xi)(xi)web應用(yong)。在網頁中嵌入(ru)圖表(biao)、數(shu)(shu)據(ju)以(yi)及(ji)分(fen)析(xi)(xi)的(de)(de)算法,非常適合打造企(qi)業(ye)內部的(de)(de)敏捷(jie)數(shu)(shu)據(ju)分(fen)析(xi)(xi)工具集。本節主(zhu)要(yao)介紹Dash的(de)(de)UI、Server、Reactivity、控件(jian)等內容(rong),同時講解(jie)一個(ge)用(yong)Dash實(shi)現(xian)數(shu)(shu)據(ju)分(fen)析(xi)(xi)功能(兼圖表(biao))的(de)(de)實(shi)際案(an)例(li),搭建(jian)服務器,在企(qi)業(ye)內部實(shi)現(xian)輕(qing)量(liang)級數(shu)(shu)據(ju)分(fen)析(xi)(xi)應用(yong)。
第四天學習考核與業內經驗交流
授課專家
游老師 計算機碩士,大數據分析、挖掘、可視化專家,高級培訓講師,曾服務于華為技術有限公司等多家企業,專注于機器學習、數據挖掘、大數據、知識圖譜等領域的研究、設計與實現,在互聯網、電信、電力、軍工等行業具有豐富的工程實踐經驗,對空間分析、欺詐檢測、廣告反作弊、推薦系統、客戶畫像、客戶營銷建模、知識抽取、智能問答、可視化分析、預測分析、系統架構、大數據端到端解決方案等方面具有深刻理解,多次作為Python語言會議重要嘉賓出席會議并發表主題演講,著有《R語言預測實戰》等多本書籍。
王老師 某集團上市公司數據分析部負責人,主要利用Python語言進行大數據的挖掘和可視化工作。從事數據挖掘建模工作已有10年,曾經從事過咨詢、電商、金融、電購、電力、游戲等行業,了解不同領域的數據特點。有豐富的利用R語言進行數據挖掘實戰經驗,部分研究成果曾獲得國家專利。
俞老師 計算機博士,目前主要研究方向包括電子推薦、智能決策和大數據分析等。主持國家自然科學基金2項、中國博士后科研基金、上海市浦江人才、IBM Shared University Research以及多項企業合作課題等項目。已在《管理科學學報》、《系統工程學報》、Knowledge and Information Systems ,Information Processing & Management,Information Systems Frontiers等國內外刊物和學術會議發表論文90多篇,其中被SCI、EI收錄40多篇。出版著作和教材《智能化的流程管理》、《客戶智能》、《商務智能(第四版)》、《商務智能數據分析的管理視角(第三版)》、《數據挖掘實用案例集》等多部。
劉老(lao)師 10多年(nian)的IT領域(yu)相(xiang)關技術(shu)研究和(he)(he)項目(mu)(mu)(mu)開發工(gong)(gong)作,在(zai)(zai)長期軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)領域(yu)工(gong)(gong)作過程(cheng)中(zhong),對軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)企業運作模(mo)(mo)(mo)式有(you)深(shen)入研究,熟悉軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)質量保障標準ISO9003和(he)(he)軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)過程(cheng)改(gai)進模(mo)(mo)(mo)型CMM/CMMI,在(zai)(zai)具體(ti)(ti)(ti)項目(mu)(mu)(mu)實施過程(cheng)中(zhong)總結經驗,有(you)深(shen)刻認識。通曉多種軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)設計和(he)(he)開發工(gong)(gong)具。對軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)開發整個流程(cheng)非常(chang)熟悉,能根據(ju)(ju)項目(mu)(mu)(mu)特(te)點定制具體(ti)(ti)(ti)軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)過程(cheng),并進行(xing)項目(mu)(mu)(mu)管理(li)和(he)(he)監控,有(you)很(hen)強(qiang)的軟(ruan)(ruan)(ruan)件(jian)(jian)(jian)項目(mu)(mu)(mu)組織(zhi)管理(li)能力。對C/C++ 、HTML 5、python、Hadoop、java、java EE、android、IOS、大數據(ju)(ju)、云計算有(you)比較深(shen)入的理(li)解和(he)(he)應用,具有(you)較強(qiang)的移動互(hu)聯網應用需求分析和(he)(he)系統設計能力,熟悉Android框架、IOS框架等(deng)技術(shu),了(le)解各種設計模(mo)(mo)(mo)式,能在(zai)(zai)具體(ti)(ti)(ti)項目(mu)(mu)(mu)中(zhong)靈活運用。
大數據分析與可視化技術應用公開課
轉載://bamboo-vinegar.cn/gkk_detail/230254.html
已開課時間Have start time
大數據課程公開培訓班
- 大數據時代營銷數據分析技能 陳(chen)劍
- 大數據時代的財務管理—從業 楊(yang)云
- 大數據時代的商業數據分析管 鄒紅偉
- 大數據時代的績效管理-精細 楊云(yun)
- 產品數據管理高級實務培訓 劉海濤(tao)
- 大數據分析與洞察 孫子辰
- 大數據分析(Hadoop) 朱永(yong)春
- 大數據、云計算與信息化演進 何寶宏(hong)
- 大數據時代財務管理-從業務 楊(yang)云
- 贏在未來-大數據時代的財務 呂軍
- 大數據時代的績效管理 楊云
- 大數據時代企業公司化運營 楊云(yun)
大數據課程內訓
- 以需求為導向的大數據精準營 張世民
- 大數據應用現狀與未來發展重 胡國慶
- 政府數字化轉型實務 焦波
- Quick BI 數據分析 張曉如
- 數字時代下的營銷趨勢 韓天成
- 數智化領域新技術與典型應用 胡國慶
- 數字經濟與數據技術應用與變 王文琭
- 《跨境電商全鏈路AI賦能轉 黃光偉
- 《數據資源入表與數據治理》 鐘凱
- 數字技術與數字工具應用 王文琭
- 數字經濟時代銀行開展數字化 李勇
- 《銀行數據驅動經營方法論與 宗錦(jin)(