基于Spark的机器学习资料48、系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中).pdf

上传人:ylj18****70940 文档编号:73138455 上传时间:2023-02-15 格式:PDF 页数:1 大小:43.80KB
返回 下载 相关 举报
基于Spark的机器学习资料48、系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中).pdf_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《基于Spark的机器学习资料48、系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中).pdf》由会员分享,可在线阅读,更多相关《基于Spark的机器学习资料48、系统整体架构再次介绍+技术串联介绍(将学习的技术全部整合到项目中).pdf(1页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、系统整体架构再次介绍+技术串联介绍 项目结构:ETL-Mongodb-IK-HDFS-Spark ML/Spark Streaming-Kafka 课程学到的技术:scala、IK、Hdfs、Spark ML、Spark Streaming、Spark SQL、Kafka、Zookeeper、Mongodb、Spring-data-mongodb 等 项目需要的工程结构:1、父类工程,主要是管理各个 jar 的版(ml-sdk)-java 实现 2、avro 序列化 jar,用于客户端和机器学习实现序列化和反序列化(*-store-api)-java 实现 3、kafka 发送数据 jar,给

2、 app 调用并实现切词并发送数据到 kafka(*-avro-kafka)-java 实现 4、工具类 jar,实现操作 hdfs、切词以及操作 mongodb(*-extract-facade)-java 实现 5、操作类 jar,调用工具类具体进行切词以及数据清洗并且存储到 Hdfs(*-extract)-java 实现 6、机器学习集合 jar,主要用来存放 record(ml-common)-scala 实现 7、机器学习算法 jar,主要进行 tf-idf 以及 kmeans 计算,主要实现企业上下游、供求上下游模型计算(ml-kmeans)-scala 实现 8、流式计算 jar,主要是接受客户端发送到 kafka 的数据加载模型进行计算(ml-kmeans-streaming)-scala 实现 9、测试模拟 jar,主要模拟实现用户加载 avro 序列化 jar 写数据到 kafka(*-test)-java 实现

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > 工作报告

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁