北京Python机器学习算法工程师

请询价

课程班型小班

上课时间任意时段

课时数量480课时

课程简介

课程亮点：

科学的内容设置

七年数据科学教学积淀，内容体系全面，讲解深入浅出从基础内容到前沿知识、从理论基础到工具实践，算法全体系知识一站式解决！

前沿的教学模式

案例驱动式教学，告别枯燥乏味的学习体验，海量实战项目你的学习效率！CDA AI实验室在线编程环境和免费算力使用。算法竞赛项目结业，高能力可以被验证！

专业的讲师助教

高校专家、名企大咖合力精研课程体系，精英讲师、助教全力保障授课服务课程导学、行业解析、视频授课、一对一督学，四大团队全程伴你成长。

完善的就业服务

百家合作企业内部推荐，完善就业辅导体系提供全方位指导行业红利+合作企业+就业服务，三重保障助你新职业扬帆起航！

学习目标：

内容服务全面升级、转行就业一步到位，回归教育本质，真正让学员为学习结果买单

课程内容：

第1阶段

预备知识：数据科学的数据库基础

了解数据库在行业应用中的价值及其在数据分析中的地位，掌握数据库中数据存储、数据查询、数据处理技术，了解与工业场景中Python 操作数据库的逻辑和方法，并攻克BAT数据库重点笔试题。

第1章：数据的存储、读取及简单处理

（一）导学直播：数据库应用价值及其在数据分析中的地位

（二）操作数据库--数据的存储

（三）查询数据库中的数据--查询语句

（四）数据库高级操作--函数

（五）工业场景下数据库数据的提取与处理形式：Python连接数据库

（六）专题直播：BAT数据库面试题精讲

（七）阶段作业

第二阶段

数据分析工具熟练运用养成计划

了解Python在数据科学、人工智能领域的地位，3倍速高效掌握Python编程、Python数据处理与可视化核心技术，并理解可视化技术实现结果输出与内容美化的数据表达逻辑。

第二章：3倍速学习Python核心编程技术

（一）导学直播：Python数据分析工具的市场竞争力分析

（二）Python编程的破冰之旅

（三）掌握Python序列对象：字符串、列表、元组、字典

（四）建立python控制流语句知识模型：条件判断和循环的艺术

（五）实现Python的模块化程序设计：函数

（六）面向对象编程与类

（八）专题直播：使用Git和Github进行版本控制

（九）阶段作业

第三章：数据分析入门：使用Numpy+Matplotlib分析数据

（一）导学直播：巧用Python强大的第三方库功能，大幅度提升编程任务效率

（二）共享单车每季度平均骑行时间对比

（三）动手创建一个批量温度转换器

（四）共享单车各类用户的平均骑行时间趋势对比

（五）气温数据的描述性统计分析：大值、小值、平均值

（六）共享单车的用户类别分析：比例

（七）气温数据的可视化分析

（八）共享单车用类别分析的统计图形绘制

（九）功能强大的Numpy的高级操作

（十）阶段作业

第四章：Pandas从数据分析到可视化

（一）导学直播：数据表达逻辑--结果输出与内容美化

（二）比较咖啡店各类饮品的数量与热量

（三）PM*.5的数值展示及不同来源数值差异对比展示

（四）分析电子游戏在各国的营收情况并用堆叠图展示

（五）房屋价格影响因素探索与房价趋势的可视化展示

（六）神奇宝贝数据的变量关系探索与分析

（七）不同手机操作系统的流量使用情况分析

（八）统计不同专业的员工平均薪资

（九）股票行情分析及价格趋势的可视化展示

（十）幸福指数的等级分析

（十一）专题直播：python实现excel办公自动化

（十二）阶段作业

第三阶段

数据价值的挖掘及预测技术实战

掌握机器学习、深度学习的数学基础、机器学习理论及实现、深度学习理论及实现；掌握机器学习、深度学习在推荐系统、金融、量化等领域的工业应用实践及模型部署上线

第五章：数据价值挖掘及预测的数学基础知识

（一）导学直播：数学基础在机器学习中的重要性与必要性讲解

（二）构建机器学习的线性代数知识模型

（三）掌握机器学习算法原理推导中的微积知识

（四）掌握机器学习算法必知必会的统计学知识

（五）专题直播：Python实现统计分析的方法--statsmodel的介绍及使用

（六）阶段作业

第六章：掌握数据价值挖掘及预测的监督学习算法基础

（一）导学直播：机器学习入门与算法总览

（二）根据像素值对CIFAR10图像数据进行KNN算法分类

（三）动手实现基于决策树的收入分类与可视化

（四）使用线性回归模型实现Ames房价预测

（五）使用逻辑回归构建信用卡反欺诈预测模型

（六）使用朴素贝叶斯构建垃圾邮件分类器

（七）使用支持向量机对金融支付服务的欺诈行为进行预测

（八）通过boosting提升传统算法在海外电商企业用户细分项目中的效果

（九）使用XGBoost提升树对人类发展指数官方数据集进行回归预测

（十）监督学习综合应用实战：基于超参数优化的Gradient Boosting的销售预测

（十一）专题直播：机器学习的人才需求及技术应用现状分析

（十二）阶段作业

第七章：掌握数据价值挖掘及预测的无监督学习算法基础

（一）导学直播：实际工作中我们应该如何根据场景选择适合的机器学习算法模型

（二）使用KMeans进行旅游企业客户分群

（三）使用PCA进行基因序列异常检测实现癌症诊断

（四）基于潜在狄利克雷分配（LDA）的内容主题挖掘

（五）使用Apriori进行322万知乎用户的关注话题关联分析

（十二）阶段作业

第八章：使用深度学习完成你的第1个AI项目--人脸识别

（一）导学直播：深度学习的行业应用价值及技术发展趋势

（二）单层感知器与多层感知器在反欺诈预测上的表现对比

（三）使用神经网络进行手写数字图片识别

（四）快速上手构建一个人脸识别系统

（五）专题直播：深度学习主流框架介绍

（六）阶段作业

第九章工业项目实战保障机器学习技术的落地实践

（一）导学直播：工业场景下的机器学习模型应用与模型部署

（二）推荐系统案例精讲

（三）金融风控案例精讲

（四）时间序列案例精讲

（五）算法模型的部署--在人工智能实验室中部署我们的反欺诈预测模型

（六）专题直播：机器学习工程师职业成长路径

（七）阶段作业

第四阶段

分布式机器学习的工具基础与工业项目实战

看了解大数据工具运用的工业应用价值、大数据生态系统的重要组件、大数据架构搭建方法；掌握海量数据的存储与处理技术；了解Spark大数据处理工具及相关组件；了解分布式机器学习的工业应用价值，掌握Spark MLlib分布式机器学习实现的逻辑及其在金融、计算广告、推荐系统、量化投资等领域的应用。

第十章：海量数据存储和处理技术：Linux环境下Sp****.x+Python开发环境的

（一）导学直播：海量数据处理的市场需求分析及工具介绍

（二）导入本地虚拟机至virtualbox及启动系统和远程桌面连接

（二）大数据环境快速搭建：Hadoop伪分布式集群的搭建

（三）大数据环境快速搭建：Linux系统下安装PySpark模块并远程启动Anaconda

（四）使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析

（五）专题直播：Spark DataFrame与Python DataFrame异同

（六）阶段作业

第十一章：千万级别数据的机器学习问题：机器学习的分布式计算实现

（一）分布式机器学习的工业价值及技术发展趋势介绍

（二）PySpark机器学习：Spark Mllib实现算法模型构建

（三）构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎

（四）构建回归模型实现共享单车需求量预测

（五）分布式环境下的Avazu广告数据集性别标签预测

（六）基于Avazu广告数据的广告排名及CTR预估

（七）分布式环境下的Audioscrobbler音乐推荐系统开发

（八）基于分布式机器学习的实现个人贷款违约预测

（九）基于分布式机器学习的银行零售产品的交叉营销

（十）基于分布式XGBoost的量化投资项目实战--股票价格的预测

（十一）专题直播：运用Spark ML Pipeline组建简易文本分类案例需求分析

（十二）阶段作业

作业

第五阶段

结业项目竞赛

学员将组队参加DC平台、阿里天池竞赛，提交项目代码到平台，根据项目得分及排名情况进行优秀学员评选

第十二章：项目竞赛及竞赛案例详解

第六阶段

就业阶段

本阶段将为学员提供专业的简历指导和就业推荐服务，为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务，入职不满意重新推荐

课程内容：

第1阶段

预备知识：数据科学的数据库基础

第1章：数据的存储、读取及简单处理

（一）导学直播：数据库应用价值及其在数据分析中的地位

（二）操作数据库--数据的存储

（三）查询数据库中的数据--查询语句

（四）数据库高级操作--函数

（五）工业场景下数据库数据的提取与处理形式：Python连接数据库

（六）专题直播：BAT数据库面试题精讲

（七）阶段作业

第二阶段

数据分析工具熟练运用养成计划

第二章：3倍速学习Python核心编程技术

（一）导学直播：Python数据分析工具的市场竞争力分析

（二）Python编程的破冰之旅

（三）掌握Python序列对象：字符串、列表、元组、字典

（四）建立python控制流语句知识模型：条件判断和循环的艺术

（五）实现Python的模块化程序设计：函数

（六）面向对象编程与类

（八）专题直播：使用Git和Github进行版本控制

（九）阶段作业

第三章：数据分析入门：使用Numpy+Matplotlib分析数据

（一）导学直播：巧用Python强大的第三方库功能，大幅度提升编程任务效率

（二）共享单车每季度平均骑行时间对比

（三）动手创建一个批量温度转换器

（四）共享单车各类用户的平均骑行时间趋势对比

（五）气温数据的描述性统计分析：大值、小值、平均值

（六）共享单车的用户类别分析：比例

（七）气温数据的可视化分析

（八）共享单车用类别分析的统计图形绘制

（九）功能强大的Numpy的高级操作

（十）阶段作业

第四章：Pandas从数据分析到可视化

（一）导学直播：数据表达逻辑--结果输出与内容美化

（二）比较咖啡店各类饮品的数量与热量

（三）PM*.5的数值展示及不同来源数值差异对比展示

（四）分析电子游戏在各国的营收情况并用堆叠图展示

（五）房屋价格影响因素探索与房价趋势的可视化展示

（六）神奇宝贝数据的变量关系探索与分析

（七）不同手机操作系统的流量使用情况分析

（八）统计不同专业的员工平均薪资

（九）股票行情分析及价格趋势的可视化展示

（十）幸福指数的等级分析

（十一）专题直播：python实现excel办公自动化

（十二）阶段作业

第三阶段

数据价值的挖掘及预测技术实战

第五章：数据价值挖掘及预测的数学基础知识

（一）导学直播：数学基础在机器学习中的重要性与必要性讲解

（二）构建机器学习的线性代数知识模型

（三）掌握机器学习算法原理推导中的微积知识

（四）掌握机器学习算法必知必会的统计学知识

（五）专题直播：Python实现统计分析的方法--statsmodel的介绍及使用

（六）阶段作业

第六章：掌握数据价值挖掘及预测的监督学习算法基础

（一）导学直播：机器学习入门与算法总览

（二）根据像素值对CIFAR10图像数据进行KNN算法分类

（三）动手实现基于决策树的收入分类与可视化

（四）使用线性回归模型实现Ames房价预测

（五）使用逻辑回归构建信用卡反欺诈预测模型

（六）使用朴素贝叶斯构建垃圾邮件分类器

（七）使用支持向量机对金融支付服务的欺诈行为进行预测

（八）通过boosting提升传统算法在海外电商企业用户细分项目中的效果

（九）使用XGBoost提升树对人类发展指数官方数据集进行回归预测

（十）监督学习综合应用实战：基于超参数优化的Gradient Boosting的销售预测

（十一）专题直播：机器学习的人才需求及技术应用现状分析

（十二）阶段作业

第七章：掌握数据价值挖掘及预测的无监督学习算法基础

（一）导学直播：实际工作中我们应该如何根据场景选择适合的机器学习算法模型

（二）使用KMeans进行旅游企业客户分群

（三）使用PCA进行基因序列异常检测实现癌症诊断

（四）基于潜在狄利克雷分配（LDA）的内容主题挖掘

（五）使用Apriori进行322万知乎用户的关注话题关联分析

（十二）阶段作业

第八章：使用深度学习完成你的第1个AI项目--人脸识别

（一）导学直播：深度学习的行业应用价值及技术发展趋势

（二）单层感知器与多层感知器在反欺诈预测上的表现对比

（三）使用神经网络进行手写数字图片识别

（四）快速上手构建一个人脸识别系统

（五）专题直播：深度学习主流框架介绍

（六）阶段作业

第九章工业项目实战保障机器学习技术的落地实践

（一）导学直播：工业场景下的机器学习模型应用与模型部署

（二）推荐系统案例精讲

（三）金融风控案例精讲

（四）时间序列案例精讲

（五）算法模型的部署--在人工智能实验室中部署我们的反欺诈预测模型

（六）专题直播：机器学习工程师职业成长路径

（七）阶段作业

第四阶段

分布式机器学习的工具基础与工业项目实战

第十章：海量数据存储和处理技术：Linux环境下Sp****.x+Python开发环境的

（一）导学直播：海量数据处理的市场需求分析及工具介绍

（二）导入本地虚拟机至virtualbox及启动系统和远程桌面连接

（二）大数据环境快速搭建：Hadoop伪分布式集群的搭建

（三）大数据环境快速搭建：Linux系统下安装PySpark模块并远程启动Anaconda

（四）使用结构化海量数据处理框架Spark SQL、Spark DataFrame进行航空数据分析

（五）专题直播：Spark DataFrame与Python DataFrame异同

（六）阶段作业

第十一章：千万级别数据的机器学习问题：机器学习的分布式计算实现

（一）分布式机器学习的工业价值及技术发展趋势介绍

（二）PySpark机器学习：Spark Mllib实现算法模型构建

（三）构建分类模型预测StumbleUpon给用户个性化推荐的网页是否长期受欢迎

（四）构建回归模型实现共享单车需求量预测

（五）分布式环境下的Avazu广告数据集性别标签预测

（六）基于Avazu广告数据的广告排名及CTR预估

（七）分布式环境下的Audioscrobbler音乐推荐系统开发

（八）基于分布式机器学习的实现个人贷款违约预测

（九）基于分布式机器学习的银行零售产品的交叉营销

（十）基于分布式XGBoost的量化投资项目实战--股票价格的预测

（十一）专题直播：运用Spark ML Pipeline组建简易文本分类案例需求分析

（十二）阶段作业

作业

第五阶段

结业项目竞赛

学员将组队参加DC平台、阿里天池竞赛，提交项目代码到平台，根据项目得分及排名情况进行优秀学员评选

第十二章：项目竞赛及竞赛案例详解

第六阶段

就业阶段

本阶段将为学员提供专业的简历指导和就业推荐服务，为学员的就业保驾护航。学员入职后持续提供为期1年的入职护航服务，入职不满意重新推荐

使用人群: 有一定基础

课程内容: Python机器学习算法工程师

课程亮点: 专业指导

免费领取试听名额

名额有限领完为止

160****9421 已成功领取
182****2746 已成功领取
168****7361 已成功领取
130****2057 已成功领取
154****9205 已成功领取
188****3335 已成功领取
131****6990 已成功领取
168****6584 已成功领取
132****5207 已成功领取
164****4001 已成功领取

上课校区

更多

上地十街

北京市海淀区上地十街

导航
高粱桥斜街59号

北京市海淀区高粱桥斜街59号

导航
厂洼街校区

厂洼路丹龙大厦

导航

北京Python机器学习算法工程师

免费领取试听名额

上地十街

高粱桥斜街59号

厂洼街校区