2022年TFS海量小文件存储系统线上运维经验 .pdf

上传人:Che****ry 文档编号:35293770 上传时间:2022-08-21 格式:PDF 页数:3 大小:201.81KB
返回 下载 相关 举报
2022年TFS海量小文件存储系统线上运维经验 .pdf_第1页
第1页 / 共3页
2022年TFS海量小文件存储系统线上运维经验 .pdf_第2页
第2页 / 共3页
点击查看更多>>
资源描述

《2022年TFS海量小文件存储系统线上运维经验 .pdf》由会员分享,可在线阅读,更多相关《2022年TFS海量小文件存储系统线上运维经验 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、微博为粉丝群紧急扩容TFS集群经验分享新浪微博平台架构师卫向军微博 12.21日发布客户端 5.0版本, 其中的粉丝群刚一上线, 流量马上暴涨,尤其是粉丝群内的语音、视频分享急剧增加,几天时间内,3 年前搭建的 TFS集群容量达到 80%,为了应对圣诞、元旦、春节的明星推广活动,平台对整个系统紧急扩容。首先简单介绍一下, TFS (Taobao File System )是淘宝专门针对海量非结构化数据存储设计的分布式系统,其构建在普通的Linux机器集群上,可为外部提供高可靠和高并发的存储访问。平台的文件服务平台,构建在TFS集群上,为微博提供海量小文件存储,包括长微博、对象库底层的实体库、私

2、信附件、粉丝群附件等,这些文件通常文件大小不超过 1M,全部存储在文件服务平台。文件服务平台分为三层: 1)最上面是 proxy代理层, 根据 fid 做 hash sharding ,完成下行请求到 Download Node 的路由;2)中间是 Download Node,通过 fid 从wCache缓存读取文件返回或者穿透到TFS集群,并回源到 wCache ,由于有权限规则, 所以没有用 CDN; 3) 最下面是 TFS集群, 由数量众多的数据节点 (Data Node)名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名

3、师精心整理 - - - - - - - 第 1 页,共 3 页 - - - - - - - - - 组成,支撑具体文件的下行访问请求。ProxyProxyProxyDownload NodewCacheDownload NodeDownload NodewCacheDownload NodeDownload NodewCacheDownload NodeDownload NodewCacheDownload NodeDownload NodewCacheDownload NodeData NodeData NodeData NodeData NodeTFS 集群应用以及缓存扩容前扩容后扩容前扩

4、容后Step 1 :灰度上线 Download NodeStep 2 :灰度上线 Proxy 节点,使用 1/N的QPS 请求量来预热Download Node的wCache 缓存Step 3 :灰度上线 TFS 集群的 Data Node在平台扩容整个系统的过程中,一共分为三个主要阶段:1.灰度上线一部分的Download Node,这个时候这些节点还没有生效。2.灰度更新一台 proxy 的可调度 Download Nodes,这台灰度的 proxy 可以hash sharding到#1 扩容后的所有 Download Nodes上, 这一步的目的是逐步预热 #1 上线的 Download

5、Nodes节点上的 wCache ,防止穿透到 TFS集群,引起雪崩。重复步骤 2,完成所有 Download Nodes 的 wCache缓存预热后,全量更新所有的 proxy 节点。3.凌晨 2点, 所有 Data Nodes准备好后,每台机器上可以配置 12个 instance,每次所有机器灰度上线一个instance,观察集群状态,逐步启动更多的instance,在凌晨到早上这段业务低峰期,TFS集群可以做不同节点之间的数据均衡迁移。几个小时候后,我们完成了整个系统的扩容,最后还是有几点体会分享:1.按道理应该先扩容Data Nodes,这样可以提升存储的吞吐量,降低穿透DB造成的压力

6、,我们最后升级的原因是公司存储机型稀缺,到货最晚。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 3 页 - - - - - - - - - 2.实际扩容过程中,动态观察wCache预热的速度与 TFS集群的健康状态,不断调整灰度 Proxy的规模,加快扩容进度。3.需要制定应急备案, 我们在扩容过程中, 如果穿透 wCache对 TFS造成压力,可以立马回滚灰度的Proxy前端机。感谢大家的阅读,如果觉得有帮助,欢迎关注我的微博” 卫向军 _微博” 。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 3 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁