TA的每日心情 | 开心 2024-9-19 21:14 |
---|
签到天数: 757 天 [LV.10]以坛为家III
管理员
- 积分
- 1312677
|
资源详情
课程特色:
明星讲师。诸多免费课程热力遍布全网,五星口碑爆棚;
规划全面。涵盖基础知识、爬虫采集、数据处理、可视化、数据建模,难得一见的Python体系全面数据科学课程,起步之路有高度;
精品质量。课程设计环节紧凑,循循善诱;课堂教学如行云流水,让人受益匪浅;
讲师介绍:
丘祐玮(DA危idChiu)–大数软件(LargitData)创办人,是一位致力于提供舆情分析服务的创业者与数据科学家,熟悉Hadoop,Spark等大数据平台,及擅长使用R,Python与机器学习技术进行数据分析。曾任多家上市公司顾问及担任知名大数据应用程序竞赛的评审,已编著MachineLearningWithRCookbook[Packt]与RCookbook[Packt]二书。
课程大纲:
第一章:Python与数据科学应用
1.数据科学简介与应用
2.Python与数据科学
3.安装Anaconda
4.使用JupyterNotebook
5.Python3语法快速简介
6、Python 資料分析套件 -Pandas 簡介
7.数据科学步骤详解
8.实战范例 - 使用Python计算文章中的字词频率
第二章:数据搜集实例
1.数据型态
2.结构化vs半结构化vs非结构化资料
3.PythonIO与档案处理
4.处理CSV,Excel格式资料
5.处理JSON,XML格式资料
6.撰写网路爬虫搜集网路资料
7.实战范例 - 房天下(Fang.com)屋价资料搜集
第三章:资料清理(I)
1.资料清理概论
2.简介Pandas-使用Pandas处理资料
3.资料筛选
4.侦测遗失值
5.补齐遗失值
6.实战范例 - 房屋资料处理
第四章:资料清理(II)
1.资料转换
2.处理时间格式资料
3.重塑资料
4.学习正规表达式
5.实战范例 - 新闻资料处理
第五章:资料探索与资料视觉化
1.使用Pandas产生叙述忄生统计
2.如何使用Pandas绘制统计图表
3.实战范例 - 网页浏览纪录资料分析
第六章:资料储存实例
1.关联式资料库-SQLite简介
2.将资料储存至资料库中
3.使用SQLQuery分析结构化资料
4.实战范例 - 汇率资讯储存与管理
第七章:使用机器学习建立数据模型(回归模型)
1.机器学习基础
2.Scikit-Learn套件简介
3.监督式学习与非监督式学习
4.回归分析
5.回归模型评估
6.实战范例 - 使用回归模型分析房屋价格
第八章:使用机器学习建立数据模型(分类模型)
1.资料分类-决策树
2.资料分类-LogisticRegression
3.资料分类-SVM
4.资料分类-类神经网路
5.资料分类-随机森林
6.实战范例 - 使用分类模型预测客户流失
第九章:使用机器学习建立数据模型(验证模型)
1.混淆矩阵(ConfusionMatrix)与其意义
2.交叉验证(CrossValidation)
3.使用ROC评估不同分类模型
4.实战范例 - 评估不同客户流失分析模型
第十章:使用机器学习建立数据模型(资料分群)
1.分群方法-阶层式分群
2.分群方法-Kmeans分群
3.分群方法-DBScan分群
4.分群结果评估
5.实战范例 - 利用分群找出文章主题
第十一章:使用机器学习建立数据模型(特征筛选与降低维度)
1.特征筛选(FeatureSelection)
2.特征萃取-PCA
3.特征萃取-SVD
4.实战范例 - 使用SVD 压缩图档
第十二章:使用机器学习建立数据模型(关联与频繁样式分析篇)
1.关联分析(AssociationRule)
2.频繁样式探勘(FrequentPatternMining)
3.实战范例 - 购物篮分析实例
|
|