《搜索技术架构.pptx》由会员分享,可在线阅读,更多相关《搜索技术架构.pptx(10页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、搜索宏观架构概览搜索业务线流程图为什么选择ElasticsearchElasticsearch是个开源分布式搜索引擎它的特点有:近实时索引高级分析聚合查询分布式零配置自动发现索引自动分片索引副本机制restful风格接口多租户schema free自动搜索负载等ES亿级电商数据支撑Elasticsearch 为电商搜索保驾护航轻松上100+节点自动化,多机房冷热互备轻松管理上1000+个索引片段500+个分片轻松处理10亿+条 100g数据在ES面前就是小菜索引数据速度峰值1k请求一秒,3w更新一秒ES天生就是大数据的宠儿ES内部服务模块架构实时大数据搜索业务流程ES的速度可以快过火箭目标:实
2、现千万级数据毫秒级返回实现:Spark集群+es+hbase+MR,es作为数据索引,通过MR框架并行运算切分数据集,利用Spark多表join功能提供并行数据分析能力,轻松实现在亿级数据锁定你想要的.ES与机器学习和数据挖掘ES天生和Hadoop家族联系紧密,拥有定制好的机器学习和数据挖掘算法包MAHOUT.1.我们能够很好的解决用户行为数据分析,能给用户精确的推荐他潜在喜欢的商品2.我们能够定制化排序算法让更加优秀的数据排在前面3.我们能够精确的分析出用户输入的关键词定位到合适的分类里面去,让搜索结果更加符合用户需求4.我们能够提供强大的关键词纠错能力,用户不在担心自己输入错误的关键词5.我们能够分析和统计出热门关键词和热门数据指数,为用户定制竞价排名搜索引擎与机器学习的结合