《Python大数据机器实战.docx》由会员分享,可在线阅读,更多相关《Python大数据机器实战.docx(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、大数据机器学习实战”高级工程师实战培训班的通知地点:北京时间: 月 月 一、课程学习目标每一个算法模块按照“原理讲解f分析数据一自己动手实现一特征与调参”的顺序o “数据清洗和特征提取,提升学习深度、降低学习坡度。增加网络爬虫的原理和编写,从获取数据开始,重视将实践问题转换成实际模型的能 力,分享工作中的实际案例或者案例:广告销量分析、环境数据异常检测和分析、数字 图象手写体识别、乘客存活率预测、用户电影推荐、真实新闻组数据主题分析、中文分词、股票数据特征分析等。强化矩阵运算、概率论、数理统计的知识运用,掌握机器学习根本。阐述机器学习原理,提供配套源码和数据。以直观解释,增强感性理解。对照不同
2、的特征选择带来的预测效果差异。重视项目实践,重视落地。思量不同算法之间的区别和联系,提高在实际工作中选择 算法的能力。涉及和讲解的部份库有: 、二、课程目标本课程特点是从数学层面推导最经典的机器学习算法,以及每种算法的示例和代码实现()、如何做算法的参数调试、以实际应用案例分析各种算法的选择等。三、培训对象大数据分析应用开辟工程师、大数据分析项目的规划咨询管理人员、大数据分析项目的 项目高管人员、大数据分析与挖掘处理算法应用工程师、大数据分析集群运维工程师、大数据分析项目的售前和售后技术支持服务人员四、详细培训内容介绍课程模块课程主题主要内容及案例和演示模块-机器学习的数学基础数学分析机器学习
3、的普通方法和横向比较数学是实用的:以 为例机器学习的角度看数学复习数学分析直观解释常数导数梯度随机梯度下降展式的落地应用系数凸函数不等式组合数与信息燧的关系模块二机器学习的 数学基础 概率论与贝叶斯先验概率论基础古典概型贝叶斯公式先验分布 后验分布 共轨分布常见概率分布泊松分布和指数分布的物理意义协方差 矩阵和相关系数独立和不相关大数定律和中心极限定理的实践意义深刻理解最大似然估计和最大后验估计过拟合的数学原理与解决方案模块三机器学习的 数学基础 矩阵和线性线性代数在数学科学中的地位马尔科夫模型矩阵乘法的直观表达模块四模块五模块六代数基础及其数学库基础机器学习库基础数据清状态转移矩阵矩阵和向量
4、组特征向量的思量和实践计算分解对称阵、正交阵、正定阵数据白化及其应用向量对向量求导标量对向量求导标量对矩阵求导工作机制解释器:基础:列表元组字典类文件展式的代码实现的介绍和典型使用多元高斯分布泊松分布、幕律分布典型图象处理胡蝶效应分形与可视化的介绍和典型使用损失函数的绘制多种数学曲线多项式拟合快速傅里叶变换奇妙值分解算子与卷积网络卷积与指数挪移平均线股票数据分析实际生产问题中算法和特征的关系股票数据的特征提取和应用模块七洗和特征选回归一致性检验缺失数据的处理环境数据异常检测和分析含糊数据查询和数据校正方法、算法、应用 朴素贝叶斯用于莺尾花数据朴素贝叶斯用于 篇 新闻文本的分类线性回归回归广义线
5、性回归正则化与梯度下降算法:与特征选择与过拟合函数的直观解释回归的概念源头回归模块八 归最大嫡模型散度损失函数回归的实现与调参机器学习库介绍线性回归代码实现和调参 回归代码实现和调参模块九 回归实践回归回归广告投入与销售额回归分析 莺尾花数据集的分类交叉验证数据可视化模块十决策树和随 机森林埔、联合端、条件燧、散度、互信息最大似然估计与最大嫡模型、详解决策树的正则化预剪枝和后男枝随机森林不平衡数据集的处理利用随机森林做特征选择使用随机森林计算样本相似度数据异常值检测模块十一随机森林实 践随机森林与特征选择决策树应用于回归多标记的决策树回归决策树和随机森林的可视化葡萄酒数据集的决策树随机森林分类
6、波士顿房价预测模块十二提升提升为什么有效梯度提升决策树算法详解 算法 加法模型与指数损失模块十三提升实践用于蘑菇数据分类 与随机森林的比较 库介绍展式与学习算法 简介泰坦尼克乘客存活率估计模块十四线性可分支持向量机软间隔的改进损失函数的理解核函数的原理和选择算法支持向量回归模块十五实践代码库介绍原始数据和特征提取葡萄酒数据分类数字图象的手写体识别用于时间序列曲线预测、回归、随机森林三者的横向比较模块十六聚类(一)各种相似度度量及其相互关系相似度和准确率、召回率相关系数与余弦相似度与及变种算法算法及其应用模块十七聚类(二)密度聚类谱聚类聚类评价算法及其应用模块十八聚类实践算法原理和实现 向量量化
7、及图象近似 并查集的实践应用 密度聚类的代码实现 谱聚类用于图片分割模块十九算法最大似然估计不等式模块二十算法实践主题模型模块二十二实践朴素理解算法精确推导算法的深入理解混合高斯分布主题模型多元高斯分布的实现分类结果的数据可视化与聚类的比较过程三维及等高线等图件的绘制主题模型与算法贝叶斯学派的模型认识分布与二项分布共胡先验分布分布平滑采样详解网络爬虫的原理和代码实现住手词和高频词动手自己实现开源包的使用和过程分析 算法模块二十三隐马尔科夫模型与的比较算法与实践概率计算问题前向后向算法的参数学习算法详解算法详解隐马尔科夫模型的应用优劣比较模块二十四实践动手自己实现 用于中文分词 多个语言分词开源
8、包的使用和过程分析 文件数据格式、住手词和标点符号对分词的影响 前向后向算法计算概率溢出的解决方案 发现新词和分词效果分析 高斯混合模型用于股票数据特征提取模块二十五课堂提问与互动讨论五、师资介绍张老师:阿里大数据高级专家,国内资深的、 技术专家、虚拟化专家,对、 和 等生态系统中的技术进行了多年的深入的研究,更主要的是这些技术在大量的实际项目中得到广泛的应用, 因此在开辟和运维方面积累了丰富的项目实施经验。近年主要典型的项目有:某电信集团网络优化、中国挪移某省挪移公司请账单系统和某省挪移详单实时查询系统、中国银联 大数据数据票据详单平台、某大型银行大数据记录系统、某大型通信运营商全国用户上网记 录、某省交通部门违章系统、某区域医疗大数据应用项目、互联网公共数据大云和构建游戏云平台项目等。六、颁发证书参加相关培训并通过考试的学员,可以获得:工业和信息化部颁发的大数据工程师证书。该证书可作为专业技术人员职业能力考核的证明,以及专业技术人员岗位聘用、任职、定级和晋升职务的重要依据。注:请 学员带一寸彩照 张(背面注明姓名)、身份证复印件一张。七、培训费用及须知元人(含教材、培训费、考证费以及学习用具等费用)食宿统一安排,费用自理。八、报名回执大数据实战培训班”报名回执表单位名称详细地址联系人电话传真邮箱姓 名性别部门职务电话手机邮箱、户名:I我会单位签字或者盖章注:此表复印有效