北京CDA数据分析师-课程详情

导航

北京Python机器学习算法工程师

请询价

课程班型小班

上课时间任意时段

课时数量480课时

课程简介

课程亮点:

科学的内容设置

七年数据科学教学积淀,内容体系全面,讲解深入浅出从基础内容到前沿知识、从理论基础到工具实践,算法全体系知识一站式解决!

前沿的教学模式

案例驱动式教学,告别枯燥乏味的学习体验,海量实战项目你的学习效率!CDA AI实验室在线编程环境和免费算力使用。算法竞赛项目结业,高能力可以被验证!

专业的讲师助教

高校专家、名企大咖合力精研课程体系,精英讲师、助教全力保障授课服务课程导学、行业解析、视频授课、一对一督学,四大团队全程伴你成长。

完善的就业服务

百家合作企业内部推荐,完善就业辅导体系提供全方位指导行业红利+合作企业+就业服务,三重保障助你新职业扬帆起航!


学习目标:

内容服务全面升级、转行就业一步到位,回归教育本质,真正让学员为学习结果买单

课程内容:

第1阶段

预备知识:数据科学的数据库基础

了解数据库在行业应用中的价值及其在数据分析中的地位,掌握数据库中数据存储、数据查询、数据处理技术,了解与工业场景中Python 操作数据库的逻辑和方法,并攻克BAT数据库重点笔试题。

第1章:数据的存储、读取及简单处理

(一)导学直播:数据库应用价值及其在数据分析中的地位

(二)操作数据库--数据的存储

(三)查询数据库中的数据--查询语句

(四)数据库高级操作--函数

(五)工业场景下数据库数据的提取与处理形式:Python连接数据库

(六)专题直播:BAT数据库面试题精讲

(七)阶段作业

第二阶段

数据分析工具熟练运用养成计划

了解Python在数据科学、人工智能领域的地位,3倍速高效掌握Python编程、Python数据处理与可视化核心技术,并理解可视化技术实现结果输出与内容美化的数据表达逻辑。

第二章:3倍速学习Python核心编程技术

(一)导学直播:Python数据分析工具的市场竞争力分析

(二)Python编程的破冰之旅

(三)掌握Python序列对象:字符串、列表、元组、字典

(四)建立python控制流语句知识模型:条件判断和循环的艺术

(五)实现Python的模块化程序设计:函数

(六)面向对象编程与类

(八)专题直播:使用Git和Github进行版本控制

(九)阶段作业

第三章:数据分析入门:使用Numpy+Matplotlib分析数据

(一)导学直播:巧用Python强大的第三方库功能,大幅度提升编程任务效率

(二)共享单车每季度平均骑行时间对比

(三)动手创建一个批量温度转换器

(四)共享单车各类用户的平均骑行时间趋势对比

(五)气温数据的描述性统计分析:大值、小值、平均值

(六)共享单车的用户类别分析:比例

(七)气温数据的可视化分析

(八)共享单车用类别分析的统计图形绘制

(九)功能强大的Numpy的高级操作

(十)阶段作业

第四章:Pandas从数据分析到可视化

(一)导学直播:数据表达逻辑--结果输出与内容美化

(二)比较咖啡店各类饮品的数量与热量

(三)PM*.5的数值展示及不同来源数值差异对比展示

(四)分析电子游戏在各国的营收情况并用堆叠图展示

(五)房屋价格影响因素探索与房价趋势的可视化展示

(六)神奇宝贝数据的变量关系探索与分析

(七)不同手机操作系统的流量使用情况分析

(八)统计不同专业的员工平均薪资

(九)股票行情分析及价格趋势的可视化展示

(十)幸福指数的等级分析

(十一)专题直播:python实现excel办公自动化

(十二)阶段作业

第三阶段

数据价值的挖掘及预测技术实战

掌握机器学习、深度学习的数学基础、机器学习理论及实现、深度学习理论及实现;掌握机器学习、深度学习在推荐系统、金融、量化等领域的工业应用实践及模型部署上线

第五章:数据价值挖掘及预测的数学基础知识

(一)导学直播:数学基础在机器学习中的重要性与必要性讲解

(二)构建机器学习的线性代数知识模型

(三)掌握机器学习算法原理推导中的微积知识

(四)掌握机器学习算法必知必会的统计学知识

(五)专题直播:Python实现统计分析的方法--statsmodel的介绍及使用

(六)阶段作业

第六章:掌握数据价值挖掘及预测的监督学习算法基础

(一)导学直播:机器学习入门与算法总览

(二)根据像素值对CIFAR10图像数据进行KNN算法分类

(三)动手实现基于决策树的收入分类与可视化

(四)使用线性回归模型实现Ames房价预测

(五)使用逻辑回归构建信用卡反欺诈预测模型

(六)使用朴素贝叶斯构建垃圾邮件分类器

(七)使用支持向量机对金融支付服务的欺诈行为进行预测

(八)通过boosting提升传统算法在海外电商企业用户细分项目中的效果

(九)使用XGBoost提升树对人类发展指数官方数据集进行回归预测

(十)监督学习综合应用实战:基于超参数优化的Gradient Boosting的销售预测

(十一)专题直播:机器学习的人才需求及技术应用现状分析

(十二)阶段作业

第七章:掌握数据价值挖掘及预测的无监督学习算法基础

(一)导学直播:实际工作中我们应该如何根据场景选择适合的机器学习算法模型

(二)使用KMeans进行旅游企业客户分群

(三)使用PCA进行基因序列异常检测实现癌症诊断

(四)基于潜在狄利克雷分配(LDA)的内容主题挖掘

(五)使用Apriori进行322万知乎用户的关注话题关联分析

(十二)阶段作业

第八章:使用深度学习完成你的第1个AI项目--人脸识别

(一)导学直播:深度学习的行业应用价值及技术发展趋势

(二)单层感知器与多层感知器在反欺诈预测上的表现对比

(三)使用神经网络进行手写数字图片识别

(四)快速上手构建一个人脸识别系统

(五)专题直播:深度学习主流框架介绍

(六)阶段作业

第九章 工业项目实战保障机器学习技术的落地实践

(一)导学直播:工业场景下的机器学习模型应用与模型部署

(二)推荐系统案例精讲

(三)金融风控案例精讲

(四)时间序列案例精讲

(五)算法模型的部署--在人工智能实验室 中部署我们的反欺诈预测模型

(六)专题直播:机器学习工程师职业成长路径

(七)阶段作业

第四阶段

分布式机器学习的工具基础与工业项目实战

看了解大数据工具运用的工业应用价值、大数据生态系统的重要组件、大数据架构搭建方法;掌握海量数据的存储与处理技术;了解Spark大数据处理工具及相关组件;了解分布式机器学习的工业应用价值,掌握Spark MLlib分布式机器学习实现的逻辑及其在金融、计算广告、推荐系统、量化投资等领域的应用。

第十章:海量数据存储和处理技术:Linux环境下Sp****.x+Python开发环境的

(一)导学直播:海量数据处理的市场需求分析及工具介绍

(二)导入本地虚拟机至virtualbox及启动系统和远程桌面连接

(二)大数据环境快速搭建:Hadoop伪分布式集群的搭建

(三)大数据环境快速搭建:Linux系统下安装PySpark模块并远程启动Anaconda

(四)使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析

(五)专题直播:Spark DataFrame与Python DataFrame异同

(六)阶段作业

第十一章:千万级别数据的机器学习问题:机器学习的分布式计算实现

(一)分布式机器学习的工业价值及技术发展趋势介绍

(二)PySpark机器学习:Spark Mllib实现算法模型构建

(三)构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎

(四)构建回归模型实现共享单车需求量预测

(五)分布式环境下的Avazu广告数据集性别标签预测

(六)基于Avazu广告数据的广告排名及CTR预估

(七)分布式环境下的Audioscrobbler音乐推荐系统开发

(八)基于分布式机器学习的实现个人贷款违约预测

(九)基于分布式机器学习的银行零售产品的交叉营销

(十)基于分布式XGBoost的量化投资项目实战--股票价格的预测

(十一)专题直播:运用Spark ML Pipeline组建简易文本分类案例需求分析

(十二)阶段作业

作业

第五阶段

结业项目竞赛

学员将组队参加DC平台、阿里天池竞赛,提交项目代码到平台,根据项目得分及排名情况进行优秀学员评选

第十二章:项目竞赛及竞赛案例详解

第六阶段

就业阶段

本阶段将为学员提供专业的简历指导和就业推荐服务,为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务,入职不满意重新推荐

课程内容:

第1阶段

预备知识:数据科学的数据库基础

了解数据库在行业应用中的价值及其在数据分析中的地位,掌握数据库中数据存储、数据查询、数据处理技术,了解与工业场景中Python 操作数据库的逻辑和方法,并攻克BAT数据库重点笔试题。

第1章:数据的存储、读取及简单处理

(一)导学直播:数据库应用价值及其在数据分析中的地位

(二)操作数据库--数据的存储

(三)查询数据库中的数据--查询语句

(四)数据库高级操作--函数

(五)工业场景下数据库数据的提取与处理形式:Python连接数据库

(六)专题直播:BAT数据库面试题精讲

(七)阶段作业

第二阶段

数据分析工具熟练运用养成计划

了解Python在数据科学、人工智能领域的地位,3倍速高效掌握Python编程、Python数据处理与可视化核心技术,并理解可视化技术实现结果输出与内容美化的数据表达逻辑。

第二章:3倍速学习Python核心编程技术

(一)导学直播:Python数据分析工具的市场竞争力分析

(二)Python编程的破冰之旅

(三)掌握Python序列对象:字符串、列表、元组、字典

(四)建立python控制流语句知识模型:条件判断和循环的艺术

(五)实现Python的模块化程序设计:函数

(六)面向对象编程与类

(八)专题直播:使用Git和Github进行版本控制

(九)阶段作业

第三章:数据分析入门:使用Numpy+Matplotlib分析数据

(一)导学直播:巧用Python强大的第三方库功能,大幅度提升编程任务效率

(二)共享单车每季度平均骑行时间对比

(三)动手创建一个批量温度转换器

(四)共享单车各类用户的平均骑行时间趋势对比

(五)气温数据的描述性统计分析:大值、小值、平均值

(六)共享单车的用户类别分析:比例

(七)气温数据的可视化分析

(八)共享单车用类别分析的统计图形绘制

(九)功能强大的Numpy的高级操作

(十)阶段作业

第四章:Pandas从数据分析到可视化

(一)导学直播:数据表达逻辑--结果输出与内容美化

(二)比较咖啡店各类饮品的数量与热量

(三)PM*.5的数值展示及不同来源数值差异对比展示

(四)分析电子游戏在各国的营收情况并用堆叠图展示

(五)房屋价格影响因素探索与房价趋势的可视化展示

(六)神奇宝贝数据的变量关系探索与分析

(七)不同手机操作系统的流量使用情况分析

(八)统计不同专业的员工平均薪资

(九)股票行情分析及价格趋势的可视化展示

(十)幸福指数的等级分析

(十一)专题直播:python实现excel办公自动化

(十二)阶段作业

第三阶段

数据价值的挖掘及预测技术实战

掌握机器学习、深度学习的数学基础、机器学习理论及实现、深度学习理论及实现;掌握机器学习、深度学习在推荐系统、金融、量化等领域的工业应用实践及模型部署上线

第五章:数据价值挖掘及预测的数学基础知识

(一)导学直播:数学基础在机器学习中的重要性与必要性讲解

(二)构建机器学习的线性代数知识模型

(三)掌握机器学习算法原理推导中的微积知识

(四)掌握机器学习算法必知必会的统计学知识

(五)专题直播:Python实现统计分析的方法--statsmodel的介绍及使用

(六)阶段作业

第六章:掌握数据价值挖掘及预测的监督学习算法基础

(一)导学直播:机器学习入门与算法总览

(二)根据像素值对CIFAR10图像数据进行KNN算法分类

(三)动手实现基于决策树的收入分类与可视化

(四)使用线性回归模型实现Ames房价预测

(五)使用逻辑回归构建信用卡反欺诈预测模型

(六)使用朴素贝叶斯构建垃圾邮件分类器

(七)使用支持向量机对金融支付服务的欺诈行为进行预测

(八)通过boosting提升传统算法在海外电商企业用户细分项目中的效果

(九)使用XGBoost提升树对人类发展指数官方数据集进行回归预测

(十)监督学习综合应用实战:基于超参数优化的Gradient Boosting的销售预测

(十一)专题直播:机器学习的人才需求及技术应用现状分析

(十二)阶段作业

第七章:掌握数据价值挖掘及预测的无监督学习算法基础

(一)导学直播:实际工作中我们应该如何根据场景选择适合的机器学习算法模型

(二)使用KMeans进行旅游企业客户分群

(三)使用PCA进行基因序列异常检测实现癌症诊断

(四)基于潜在狄利克雷分配(LDA)的内容主题挖掘

(五)使用Apriori进行322万知乎用户的关注话题关联分析

(十二)阶段作业

第八章:使用深度学习完成你的第1个AI项目--人脸识别

(一)导学直播:深度学习的行业应用价值及技术发展趋势

(二)单层感知器与多层感知器在反欺诈预测上的表现对比

(三)使用神经网络进行手写数字图片识别

(四)快速上手构建一个人脸识别系统

(五)专题直播:深度学习主流框架介绍

(六)阶段作业

第九章 工业项目实战保障机器学习技术的落地实践

(一)导学直播:工业场景下的机器学习模型应用与模型部署

(二)推荐系统案例精讲

(三)金融风控案例精讲

(四)时间序列案例精讲

(五)算法模型的部署--在人工智能实验室 中部署我们的反欺诈预测模型

(六)专题直播:机器学习工程师职业成长路径

(七)阶段作业

第四阶段

分布式机器学习的工具基础与工业项目实战

看了解大数据工具运用的工业应用价值、大数据生态系统的重要组件、大数据架构搭建方法;掌握海量数据的存储与处理技术;了解Spark大数据处理工具及相关组件;了解分布式机器学习的工业应用价值,掌握Spark MLlib分布式机器学习实现的逻辑及其在金融、计算广告、推荐系统、量化投资等领域的应用。

第十章:海量数据存储和处理技术:Linux环境下Sp****.x+Python开发环境的

(一)导学直播:海量数据处理的市场需求分析及工具介绍

(二)导入本地虚拟机至virtualbox及启动系统和远程桌面连接

(二)大数据环境快速搭建:Hadoop伪分布式集群的搭建

(三)大数据环境快速搭建:Linux系统下安装PySpark模块并远程启动Anaconda

(四)使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析

(五)专题直播:Spark DataFrame与Python DataFrame异同

(六)阶段作业

第十一章:千万级别数据的机器学习问题:机器学习的分布式计算实现

(一)分布式机器学习的工业价值及技术发展趋势介绍

(二)PySpark机器学习:Spark Mllib实现算法模型构建

(三)构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎

(四)构建回归模型实现共享单车需求量预测

(五)分布式环境下的Avazu广告数据集性别标签预测

(六)基于Avazu广告数据的广告排名及CTR预估

(七)分布式环境下的Audioscrobbler音乐推荐系统开发

(八)基于分布式机器学习的实现个人贷款违约预测

(九)基于分布式机器学习的银行零售产品的交叉营销

(十)基于分布式XGBoost的量化投资项目实战--股票价格的预测

(十一)专题直播:运用Spark ML Pipeline组建简易文本分类案例需求分析

(十二)阶段作业

作业

第五阶段

结业项目竞赛

学员将组队参加DC平台、阿里天池竞赛,提交项目代码到平台,根据项目得分及排名情况进行优秀学员评选

第十二章:项目竞赛及竞赛案例详解

第六阶段

就业阶段

本阶段将为学员提供专业的简历指导和就业推荐服务,为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务,入职不满意重新推荐

使用人群
有一定基础
课程内容
Python机器学习算法工程师
课程亮点
专业指导

免费领取试听名额

名额有限 领完为止

  • 160****9421 已成功领取
  • 182****2746 已成功领取
  • 168****7361 已成功领取
  • 130****2057 已成功领取
  • 154****9205 已成功领取
  • 188****3335 已成功领取
  • 131****6990 已成功领取
  • 168****6584 已成功领取
  • 132****5207 已成功领取
  • 164****4001 已成功领取

上课校区

更多
  • 上地十街

    北京市海淀区上地十街

    导航
  • 高粱桥斜街59号

    北京市海淀区高粱桥斜街59号

    导航
  • 厂洼街校区

    厂洼路丹龙大厦

    导航

相关推荐

首页 北京培训 数据分析师 课程详情

通知:本页信息由注册会员(机构)自行发布或提供,所有内容仅供参考,最终以机构的官方信息为准,任何关于对机构的推荐都不能替代您的考察核实,本站不承担相关内容和推荐所引起的法律责任。如果您的知识产权或其他合法权益被侵犯,请立即向我们发出"权利通知书",我们将根据相关法律法规采取相应的措施予以处理,切实维护您的合法权利。联系我们:18615226315@163.com