如果我问你21世纪最火的语言是什么?

你会说什么?Python!

那如果让你说Python可以用来干什么,大家可能就会说出来很多应用场景。系统运维、图形处理、黑客编程、爬虫编写、机器学习、人工智能等等。今天我们聊聊Python进行数据分析。

为什么Python适合做数据分析?

假如我们将数据分析看做是以下的工艺流程,这个流程大致包含数据获取-数据整理-数据可视化-建模分析-模型评估。工欲善其事必先利其器,Python丰富和强大的库则很好地满足了这些需求。

NO1、数据获取

Python可谓是网络数据抓取的利器,通过Request库获取网页,Beautiful_soup库进行网页解析和内容提取,实时保存到文件和数据库系统中。同时作为开源软件,Python可以很好地结合各种数据库和读取本地数据。

No2、数据整理

Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

No3、数据可视化

Python善于处理大批量的数据,尤其适合繁杂的计算和分析工作,可以利用很多模块来创建数据各式各样的图形,如Matplotlib,Seaborn, Pyecharts, Bokeh 等,比如使用Python轻松绘制可视化地图:

No4、建模分析&机器学习

在机器学习和数据挖掘的应用中,Python粉都应该知道的开源机器学习框架:Scikit-learn,使用它可以轻松地解决分类、回归、聚类、降维,模型选择和预处理等工作,并且它有着强大、完整的的帮助文档社区支持。

合抱之木始于毫末,万丈高楼起于垒土。

于是针对零基础学员,CDA数据分析(成都)研究院开设Python周末集训班,对Python有兴趣的你,对数据分析有兴趣的你,快来和我们一起学习吧~

课程简介

数据是信息时代的“新能源”。从金融到零售,从电商到体育,数据科学都成为成功决策的基础,广泛应用在营销优化、风险控制、客户关系等商业领域。 【CDA数据分析周末集训班-python方向】以CDA数据分析师标准等级大纲要求出发,从数据获取(Python爬虫、Mysql数据库)—统计学理论方法—数据分析与软件应用(Python)—数据挖掘和机器学习(Python)—数据可视化(Matplotlib,Seaborn等)整套数据分析流程技术系统讲解,还将结合量化投资、金融、银行、电信等行业真实需求出发全部用实际案例教学来使所学项目课程更能符合企业要求。

学习目标

使用Python爬虫获取网络数据,使用Mysql进行数据的存储和查询

掌握数据分析基础理论和常用分析法,使用统计分析方法进行验证

结合机器学习方法进行预测并清晰传达你的洞察

使用可视化方法Matplotlib,Seaborn,Pyecharts等发现数据中的模式规律

掌握使用Python进行数据分析全流程

学习对象

学生、转行欲从业人士

在职数据分析师

对Python数据分析和挖掘感兴趣的业界人士

学习前有统计基础最佳

开课安排

项目名称

CDA周末集训-Python方向

授课时间

2018年12月15日开课 /@成都&北京

三个月每周周六、日:上午9:00am-12:00am、下午13:30pm-17:00pm。

上课地点

成都市高新区天府二街368号绿地之窗2栋12层(地铁1号线世纪城站)

价格(元)

成都学费:7900元/人(线下的远程班,可以跟老师同学互动交流,也有助教老师辅导)

北京学费:9900元/人(面授)

报名咨询

关于证书

可自愿申请工信部《数据分析师》初、高级证书;

CDA数据分析师的证书只有参加每年两次的全国统考才能获得。

最新福利

课前全套预习视频和资料

讲师、助教全方位答疑服务

课后赠送全套同步课程视频、终身学习

免费参加CDA数据分析师峰会、俱乐部活动

咖啡茶歇,论坛币(1000个)

CDA一家人数据分析圈子等等

(最终以CDA官网最新优惠、福利为准)

课程优惠

提前一个月报名优惠500(仅剩最后一天)

课程简略大纲

01-01 数据分析的武器库

01-02 数据分析工具Python介绍

01-03 Python的基本数据类型

01-04 Python的基本数据结构

01-05 Python的程序控制

01-06 Python的函数与模块

01-07 使用Pandas读取结构化数据

01-08 描述性统计与探索型数据分析

01-09 Pandas高级:分组汇总及交叉表

01-10 使用Python绘制统计图形

01-11 数据整合:行列操作、条件查询、横向合并、纵向合并、排序分组、拆分堆叠列

01-12 数据清洗:错误值、重复值、缺失值、噪声值、分箱方法

02-01 Mysql数据库知识介绍

02-02 Mysql数据库的基本操作

02-03 Mysql数据表的基本操作

02-04 Mysql数据类型和约束条件

02-05 数据的CRUD操作之增加、删除、修改数据表

02-06 SQL数据库单表查询和联合查询

02-07 SQL操作符和函数

02-08 SQL综合案例:彩票数据核对练习

03-01 数据分析行业与知识简介

03-02 概率论基础知识

03-03 描述性统计分析

03-04 统计量与抽样分布

03-05 参数估计:点估计和区间估计

03-06 假设检验方法

03-07 方差分析的基本原理和操作

04-01网络爬虫基础知识

04-02网络请求及响应-requests库

04-03HTML文档解析-BeautifulSoup库

04-04常见反爬虫机制及应对

04-05网络爬虫 VS 网络数据抓取

04-06实战1:批量下载头像

04-07实战2:抓取豆瓣书籍简介

04-08实战3:模拟浏览器selenium抓取电商商品信息及评论

05-01 统计学基本概念回顾

05-02 Python实操 - 假设检验与单样本T检验

05-03 Python实操 - 双样本T检验

05-04 Python实操 - 方差分析

05-05 Python实操 - 相关分析

05-06 Python实操 - 卡方检验

05-07 简单线性回归与多元线性回归

05-08 多元线性回归的变量筛选

05-08 线性回归诊断方法- 残差分析、强影响点分析、多重共线性分析

05-09 正则化方法 - 岭回归和LASSO回归

05-10 Logistic回归的相关关系分析

05-11 Logistic回归模型及实现

05-12 Logistic回归的极大似然估计

05-13 Logistic回归模型评估方法 - ROC曲线

05-14 案例:银行业 - 月均信用卡支出数据集

05-15 案例:汽车业 - 汽车贷款违约数据集

06-01 多元统计基础与变量约减的思路

06-02 主成分分析方法

06-03 因子分析模型与算法

06-04 独立成分分析ICA

06-05 市场分析其他方法:对应分析( Correspondence Analysis )

06-06 市场分析其他方法:多维尺度分析( Multi-Dimensional Scaling,简称MDS )

06-07 案例1:城市经济发展水平数据集

06-08 案例2:电商购物信息数据集

07-01 时间序列分析简介

07-02 时间序列模型介绍-AR和MA

07-03 平稳的时间序列模型-ARMA

07-04 非平稳的时间序列模型-ARIMA

07-05 ARIMA平稳性检验与预测的评价指标

07-06 BOX-JENKINS建模流程

07-07 寻找最优模型

07-08 干预分析模型-ARMAX

07-10 企业案例2:Google Index–关键字之Python 趋势预测

08-01 绘图思想的基本原理

08-02 Python数据可视化包-Matplotlib介绍

08-03 使用Matplotlib进行基本的图形绘制

08-04 使用Python数据处理包Pandas做可视化

08-05 Python数据可视化包-Seaborn介绍与图形绘制

08-06 Python数据可视化包-Pyecharts介绍与图形绘制

08-07 使用Python进行地图绘制-Pyecharts

09-01 课题1:电商客户价值预测

09-02 课题2:网站流量数据分析

09-03 课题3:信用卡客户流失预警

09-04 课题4:银行电话营销响应分析

09-05 以上课题仅供参考

10-01 数据挖掘概要

10-02 数据挖掘的方法和原理

10-03 数据挖掘基础和进阶技术概述

10-04 数据预处理技术:字段选择-数据清洗-字段扩充-数据编码

10-05 人工特征工程:特征构造 - 特征抽取 - 特征选择

10-06 决策树建模思路

10-07 Quinlan系列决策树(ID3、C4.5、C8.0)建模原理

10-08 CART建模原理

10-09 决策树模型修剪

10-10 决策树模型效果评估

10-11 案例:使用决策树进行初始信用评级

11-01 了解神经网络的基本概念

11-02 明确人工神经网络结构

11-03 神经元模型

11-04 掌握BP神经网络学习算法

11-05 多层感知器的scikit-learn代码实现

11-06 贝叶斯公式与分类原理

11-07 朴素贝叶斯的参数估计

11-08 在Python中实现朴素贝叶斯

11-09 KNN算法原理与Python代码实现

11-10 线性可分与线性不可分

11-11 线性可分的支持向量机

11-12 线性支持向量机与软间隔最大化

11-13 非线性支持向量机与核函数

11-14 集成学习方法:Bagging、Boosting、随机森林

12-01 聚类算法的概述

12-02 聚类算法基本概念

12-03 聚类模型的评估

12-04 层次聚类原理与R实现

12-05 基于划分的聚类K-means的原理及应用

12-06 详谈基于密度的聚类方法与Python实现

12-07 案例:通信客户业务使用偏好聚类

12-08 关联规则的一些基本概念

12-09 关联规则Ariori算法的原理与Python实现

12-10 关联规则FP-growth算法

12-11 序列模式的简介与概念

12-12 序列模式AprioriAll算法与Python实现

12-13 基于用户和商品的的协同过滤算法

13-01 课题1:银行客户聚类分析

13-02 课题2:房贷客户进件违约风险预测

13-03 课题3:零售业客户忠诚预测

13-04 课题4:电信业营销响应预测模型

13-05 以上课题仅供参考

滑动查看大纲

注:实际大纲,以上课大纲为主

雄厚师资

权威认证

CDA数据分析师等级认证证书,会员增值,就业直通车。

权威:CDA数据分析师认证证书由经管之家颁发,现已获得大数据大学、CDMS、猎聘网等企业的认可,您获得证书后可一键添加至简历中。

专业:CDA证书分等级和方向,不同的证书代表了不同的专业层级和领域,获得证书是对自身能力的一个有力证明。全国统考、专家命题、公平 严格,更具含金量。

权益:持证人享有系列特殊权益。证书皆绑定考生真实身份,可在CDA官网查询,确保唯一性与防伪性。证书三年审核一次,保证持证人的实力与权益。

学员评价

学员就业去向(部分)

企业内训

CDA 课程咨询丨史老师