上海敏捷算法建模訓練營周末培訓班 2023-09-27 18:10:22
引領數智賦能,精通模型應用
在數字經濟時代,利用數字化知識可以使企業擺脫單一供給,本課程將會從企業的角度出發講解不同階段數據應用的建設思路。同時,從找出問題→確定問題→數據清洗→數據建模→數據驗證到挖掘出有價值的數據分析思路,并確認適合企業的解決方案。讓學員掌握可落地、易操作的數據科學思維和技術模板構建出優秀模型。
涵蓋常用工具,完善技術精進
課程中涵蓋了Sklearn、LightGBM、NLP、PyTorch、Transformer等常用工具的應用實現,并根據輸出的結果分析業務需求,為進行合理、有效的策略優化提供數據支撐。在課程學習中以問題為導向,加強知識點的理解和應用,提高學員面對復雜問題的思考能力。聚焦策略分析技術及企業常用的分類、NLP、深度學習、特征工程等數據算法,只教實用干貨,以專精技術能力提升業務效果與效率。
玩轉案例實戰,直通企業
課程涉及大量企業項目案例:精準營銷預測、營銷策略優化、客戶行為分析、風險管理、客戶管理、智能推薦、情感分析、反欺詐等,加持實戰經驗,為學員進入名企提供項目背書。對數據科學崗位認知程度比較淺的學員,可在職業規劃團隊老師的幫助下選擇適合學員的職業發展路線。進一步從職場綜合能力要求出發,通過經驗賦能快速提升崗位匹配度。
在職提升人群
.算法建模少想獲得最優策略算法的人員
.經驗少想提升數據挖掘技能的人員
.業余時間多想提高數據思維能力的人員
在職提升和轉崗人群
.任務重想提高效率的財務、市場等人員
.競爭壓力大想突破職業瓶頸的產品、運營等人員
.行業挑戰多想提升戰略思維的決策、管理等人員
轉行數據分析人群
.自學難度大想零基礎快速入門的人員
,升職加薪難想要跳槽大幅漲薪的人員
.行業不景氣想進新興數據行業的人員
CDA報考人群
.報名參加CDA Level|等級考試的考生
.報名參加CDA Level II等級考試的考生
.報名參加CDA Level II等級考試的考生
細分課程 | 周 | 日 | 內容 | 詳細內容 |
預習課 (錄播) |
|
|
數據庫SQL |
1. 數據庫基本概念 2. DDL數據定義語言 3. DML數據操作語言 4. 單表查詢 5. 多表查詢 6. Python連接SQL |
Python編程基礎 |
1. Python標準數據類型 2. 控制流語句 3. 自定義函數 4. 異常和錯誤 5. 類與面向對象編程 6. Numpy數組操作 7. 用Python做數據分析,必會的庫Pandas 8. 用Pandas做數據清洗與數據探索 9. Python數據可視化庫(Matplotlib,Seaborn) |
|||
數學與統計學基礎 |
1. 線性代數 2. 微積分 3. 描述性統計 4. 參數估計 5. 假設檢驗 6. 相關分析 7. 卡方分析 8. 一元線性回歸理論推導 |
|||
商業策略分析 (Level 2) |
第1周 | 周六 | SQL |
1. 數據庫MySQL語句與實戰 2. Python連接SQL數據庫 3. SQL使用案例 4. 零售電商多表分析案例 |
周日 | 指標體系與統計分析可視化 |
1. 分析基礎-數據分析的概念、過程、能力 2. 指標體系的意義與構建 3. 常用指標體系示例 4. 統計分析可視化 5. 企業經營分析-指標體系 |
||
第2周 | 周六 | Pandas |
1. Python基礎與數據清洗可視化回顧 2. Python實操案例 3. 教育行業分析-學校學科教育可視化案例 4. 數據分析師崗位需求-lagou數據處理及分析案例 |
|
周日 | 方差分析,線性回歸 |
1. 方差分析 2. 線性回歸(模型的建立與估計) 3. 統計模型的檢驗 4. 識別分析-用戶支出影響因素分析案例 |
||
第3周 | 周六 | 邏輯回歸,主成分分析 |
1. 邏輯回歸(模型的建立與估計) 2. 模型評估 3. 信息壓縮-主成分分析與因子分析(數據降維) 4. 成交分析-Talkingviews案例 5. 因子分析-城市發展水平綜合分析 |
|
周日 | 標簽體系與用戶畫像 |
1. 標簽體系的設計原理 2. 用戶標簽的制作方法 3. 客群分析-標簽體系與用戶畫像 4. 應用用戶畫像-信用卡持卡用戶畫像實戰案例 |
||
第4周 | 周六 | 時間序列 |
1. 時間序列分析(ARIMA算法) 2. Box-Jenkins 建模流程 3. 時間序列回歸 4. 銷售額預測-線上平臺銷售額預測實戰案例 |
|
周日 | 聚類分析,決策樹應用 |
1. 層次聚類 2. Kmeans聚類 3. 聚類分析評價方法-決策樹應用 4. 用戶分群-金融行業運營案例 |
||
第5周 | 周六 | 數據采集與處理,特征工程基礎 |
1. 數據采集(概率與非概率抽樣) 2. 數據處理方法(數據錄入,數據清洗,數據編碼) 3. 特征工程基礎(特征預處理,特征的選擇與轉換) |
|
周日 | 數字化方法,最優化方法 |
1. 數字化方法 2. 運籌優化方法(線性規劃與二次優化,基于業務流程的優化) 3. 數字化運營綜合案例-某機構營銷響應概率預測與風險預測案例 |
||
附加內容 | 第6周 | 周六 | ETL數據接入與數倉 |
1. ETL基本概念與常用工具 2. 基于Python的ETL程序開發 3. 定時執行Python程序 4. ETL實戰項目 5. 數據接入策略與調度工具 |
機器學習與人工智能 (Level 3) |
周日 | 大數據平臺Spark,數據挖掘導論 |
1. 分布式存儲與計算 2. Spark與Flink原理 3. Spark基本語法 4. 使用PySpark實現分布式計算 5. 數據挖掘導論 6. 梯度下降 |
|
第7周 | 周六 | 決策樹 |
1. 決策樹與信息熵 2. ID3, C4.5, CART樹 3. 模型調參:網格搜索 4. 決策樹的PySpark實現 5. 決策樹之欺詐識別案例 |
|
周日 | 正則回歸,Pipeline |
1. 正則項的理論基礎 2. 帶正則項的回歸 3. Pipeline流專題 4. 使用Pipeline提交算法模型 |
||
第8周 | 周六 | 關聯規則與協同過濾 |
1. 關聯規則(關聯規則的概念,評估指標,Apriori算法) 2. 協同過濾 3. 大數據環境下的協同過濾實現 4. 產品組合策略-零售產品捆綁銷售策略分析案例 |
|
周日 | 集成算法基礎 |
1. 集成學習的理論基礎 2. Bagging, Boosting, Stacking 3. AdaBoost 4. 隨機森林及其Spark實現 5. GBDT, XGBoost |
||
第9周 | 周六 | 爬蟲,文本分析 |
1. 數據的爬取(http原理, requests應用, HTML結構及xpath應用) 2, 非結構化數據的加工處理 3. 文本數據處理之正則表達式 |
|
周日 | 機器學習進階,人工智能基礎 |
1. LightGBM, CatBoost 2. 數據不平衡問題 3. 貝葉斯搜索調參 4. 貝葉斯調參python實踐 5. 人工智能基礎 6. caie網頁端使用 |
||
第10周 | 周六 | 人工智能之神經網絡 |
1. 深度神經網絡基礎:感知器及多層感知器 2. 神經網絡架構 3. BP反向傳播算法 4. 梯度與學習率專題 5. 卷積神經網絡 6. Pytorch框架與代碼實踐 7. 圖像分析-手寫數字自動識別 |
|
周日 | 聚類分析進階與異常識別 |
1. 聚類分析進階(密度聚類,高斯混合聚類,譜聚類) 2. 異常識別(孤立森林,局部異常因子) 3. 交易反欺詐-異常交易識別案例 |
||
第11周 | 周六 | 人工智能NLP之文本挖掘 |
1. 分詞與詞性標注 2. 文本信息提取 3. 詞嵌入(CBOW與Skip-gram) 4. 構建文本信息庫 5. 文本聚類算法 6. 文本分類算法與Pytorch實現 |
|
周日 | 大型項目案例 | 實戰項目-金融風控大型案例 | ||
第12周 | 周六 | 人工智能NLP之大語言模型LLM |
1. 循環神經網絡RNN 2. 編碼器與遷移學習 3. 殘差網絡ResNet 4. 預訓練框架Transformer 5. 大語言模型LLM技術架構與訓練方法 6. 開源模型平臺與框架 7. Openai api之python代碼實踐 |
|
第13周 | 周六 | 大語言模型LLM前沿方法 |
1. 知識學習 2. GPT之Fine tuning 3. LLM的本地化部署 4. 本地化LLM的Fine tuning 5. Agent 6. 向量數據庫與知識庫 7. 人工智能NLP的前沿方向 |
|
選修課 |
|
|
選修課 |
1、互聯網數字化運營【18課時】 2、何為數據產品經理?【1課時】 3、Python爬蟲【15課時】 4、人工智能(深度學習)實戰之圖像識別【6課時】 5、Tableau多維可視化分析【3課時】 6、SPSS統計分析【12課時】 |