2022年网站访问量-网站硬性规划 .pdf

上传人:Q****o 文档编号:30529578 上传时间:2022-08-06 格式:PDF 页数:5 大小:50.83KB
返回 下载 相关 举报
2022年网站访问量-网站硬性规划 .pdf_第1页
第1页 / 共5页
2022年网站访问量-网站硬性规划 .pdf_第2页
第2页 / 共5页
点击查看更多>>
资源描述

《2022年网站访问量-网站硬性规划 .pdf》由会员分享,可在线阅读,更多相关《2022年网站访问量-网站硬性规划 .pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、百万级访问量网站的技术准备工作当今从纯网站技术上来说,因为开源模式的发展,现在建一个小网站已经很简单也很便宜, 所以很多人都把创业方向定位在互联网应用。这些人里大多数不是很懂技术, 或者不是那么精通, 而网站开发维护方面的知识又很分散,学习成本太高, 所以这篇文章将这些知识点结合起来,系统的来说, 一个从日几千访问的小小网站, 到日访问一两百万的小网站,中间可能会产生什么问题, 以及怎么才能在一开始做足工作尽量避免这些问题。你的网站因为努力经营, 访问量逐渐升高, 在升高的过程中, 问题也可能开始显现了。 因为带宽的增加、 硬件的扩展、 人员的扩张所带来的成本提高是显而易见的, 而还有相当大的

2、一部分成本是因为代码重构、架构重构, 甚至底层开发语言更换引起的, 最坏的情况就是数据丢失, 所有努力付之一炬。 这类成本支出大多数在一开始就可以避免, 先打好基础,往后可以省很多精力, 少操很多心。对于不同的初期投资成本, 技术路线的选择是不同的。 这里假设网站刚刚只是一个构想,计划第一年服务器硬件带宽投入5 万左右。对于这个资金额度,有很多种方案可选择, 例如租用虚拟主机、 租用单独服务器,或者流行的私有云,或者托管服务器。 前两种选择, 网站发展到一定规模时需迁移,那时再重做规划显然影响更大。 服务器托管因为配置自主、 能完全掌握控制权, 所以有一定规模的网站基本都是这种模式。 采用自己

3、托管服务器的网站, 一开始要注意以下几点一、开发语言一般来说, 技术人员(程序员) 都是根据自己技术背景选择自己最熟悉的语言, 不过不可能永远是一个人写程序, 所以在语言的选择上还要是要费些心思。首先明确一点, 无论用什么语言, 最终代码质量是看管理, 因此我们从前期开发成本分析。现在国内流行的适用于网站的语言, 大概有 java、 php、 .net、python 、ruby 这五大阵营。 python 和 ruby 因为在国内流行的比较晚, 现在人员还是相对难招一些。 .net 平台的人相对多,但是到后期需要解决性能问题时,对人员技能的要求比较高。剩余的java、php 用人可以说是最多的

4、。 java 和 php 无法从语言层面做比较, 但对于初期, 应用几乎都是靠前端支撑的网站来说,php 入门简单、编写快速,优势相对大一点。至于后端例如行为分析、银行接口、异步消息处理等,等真正需要时,就要根据不同业务需求来选择不同语言了。二、代码版本管理名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 5 页 - - - - - - - - - 稍微有点规模的网站就需要使用代码版本管理了。代码版本管理两点最大的好处,一是方便协同工作, 二是有历史记录可查询比较。代码版本

5、管理软件有很多,vss/cvs/svn/hg 等, 目前国内都比较流行, 其中 svn 的普及度还是很高的。假设选了 svn, 那么有几点考虑。一是采用什么树结构。 初期可能只有一条主干,往后就需要建立分支, 例如一条开发分支, 一条上线分支, 再往后,可能要每个小组一个分支。 建议一开始人少时选择两条分支,开发和线上, 每个功能本地测试无误后提交到开发分支, 最后统一测试, 可以上线时合并到上线分支。如果每人都建自己的分支, 合并时会浪费很大精力, 对于几乎每天都要修改几次的WEB应用来说,所费时间太多。向服务器部署代码,可以手工部署也可以自动部署。手工部署相对简单,一般可直接在服务器上sv

6、n update ,或者找个新目录svn checkout ,再把 web root 给 ln -s 过去。应用越复杂,部署越复杂,没有什么统一标准,只是别再用ftp 上传那种形式,一是上传时文件引用不一致错误率增加,二是很容易出现开发人员的版本跟线上版本不一致,导致本来想改个错字结果变成回滚。如果有多台服务器还是建议自动部署, 更换代码的机器从当前服务池中临时撤出,更新完毕后再重新加入。三、服务器硬件在各个机房里, 靠一台服务器孤独支撑的网站数不清,但如果资金稍微充足,建议至少三台的标准配置,分别用作web 处理、数据库、备份。 web 服务器至少要 8G 内存,双 sata raid1 ,

7、如果经济稍微宽松,或静态文件或图片多,则 15k sas raid10 。数据库至少 16G 内存,15k sas raid 10 。备份服务器最好跟数据库服务器同等配置。 硬件可以上整套品牌, 也可以兼容机, 也可以半品牌半组装,取决于经济能力。 当然,这是典型的搭配, 有些类型应用的性能瓶颈首先出现在 web 上,那种情况就要单独分析了。web 服务器可以既跑程序又当内存缓存,数据库服务器则只跑主数据库(假如是 MySQL 的话),备份服务器所承担就相对多一些,web 配置、缓存配置、数据库配置都要跟前两台一致,这样WEB 和数据库任意一台出问题,很容易就可以将备份服务器切换过去临时顶替,

8、直到解决完问题。 要注意, 硬件是随时可能坏掉的,特别是硬盘,所以宁可WEB 服务器跟数据库服务器放在一起,也一定不能省掉备份, 备份一定要异机, 并且有异步, 电力故障、 误操作都可能导致一台机器上的所有数据丢失。很多的开源备份方案可选择,最简单的就是rsync,写 crontab 里,定时同步。备份和切换,建议多做测试,选最安全最适合业务的,并且尽可能异地备份。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 5 页 - - - - - - - - - 四、机房三种机房

9、尽量不要选:联通访问特别慢的电信机房、电信访问特别慢的联通机房、电信联通访问特别慢的移动或铁通机房。机房要尽可能多的实地参观,多测试,找个网络质量好, 管理严格的机房。 机房可以说是非常重要, 直接关系到网站访问速度, 网站访问速度直接关系到用户体验,访问速度很慢的网站, 很难获得用户青睐。五、架构在大方向上,被熟知的架构是web 负载均衡 +数据库主从 +缓存 +分布式存储+队列。在一开始,按照可扩展的原则设计和编程就可以。只是要多考虑缓存失效时的雪崩效应、 主从同步的数据一致性和时间差、队列的稳定性和失败后的重试策略、 文件存储的效率和备份方式等等意外情况。缓存失效、 数据库复制中断、队列

10、写入错误、电源损坏,在实际运维中经常发生,如果不注意这些,出现问题时恢复期可能会超出预期很长时间。六、服务器软件操作系统 Linux 很流行。在没有专业运维人员的情况下,应倾向于择使用的人多、社区活跃、配置方便、升级方便的发行版, 例如 RH 系列、 debian 、ubuntu server 等,硬件和操作系统要一起选择,看是否有适合的驱动,如果确定用某种商业软件或解决方案,也要提前知晓其对哪种操作系统支持最佳。web服务器方面, apache、nginx、lighttpd 三大系列中, apache 占有量还是最大,但是想把性能调教好还是需要很专业的,nginx 和 lighttpd 在不

11、需要太多调整的情况下可以达到一个比较不错的性能。无论选择什么软件, 除非改过这些软件或你的程序真的不兼容新版本,否则尽量版本越新越好, 版本新, 意味着新特性增多、BUG 减少、性能增加。一个典型的php 网站,基本上大多数人都没改过任何服务器软件源代码,绝大多数情况是能平稳的升级到新版本的。类似于jdk5到 jdk6,python2 到 python3 这类变动比较大的升级还是比较少见的。看看ChangeLog ,看看升级说明,结合自己情况评估测试一下,越早升级越好,升级的越晚,所花费的成本越高。 对于软件包,尽量使用发行版内置的包管理工具,没有特殊要求时不建议自己编译,那样对将来运维不利。

12、七、数据库几乎所有操作最后都要落到数据库身上,它又最难扩展(存储也挺难)。数据库常见的扩展方法有复制、 分片, 设计时要考虑到每种应用的数据如何复制、分片, 当然这种考虑一般会推迟到技术设计时期。在初期进行数据库结构设计时,要根据不同的业务类型和增长量预期来考虑是否要分库、分区,并且尽量不要使名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 5 页 - - - - - - - - - 用联合查询、不使用自增ID 以方便分片。复制延时问题、主从数据库数据一致性问题,可以自己写

13、或者用已有的运维工具进行检测。用存储过程是比较难扩展的,这种情形多发生于传统C/S,特别是 OA 系统转换过来的开发人员。 低成本网站不是一两台小型机跑一个数据库处理所有业务的模式,是机海作战。 方便水平扩展比那点预分析时间和网络传输流量要重要的多的多。另外,现在流行一种概念叫NoSQL ,可以理解为非传统关系型数据库。实际应用中, 网站有着越来越多的密集写操作、上亿的简单关系数据读取、 热备等,这都不是传统关系数据库所擅长的,于是就产生了很多非关系型数据库,比如 Redis/TC&TT/MongoDB/Memcachedb等,在测试中,这些几乎都达到了每秒至少一万次的写操作, 内存型的甚至

14、5 万以上。在设计时, 可根据业务特点和性能要求来选择是否使用这类数据库。例如 MongoDB ,几句配置就可以组建一个复制 +自动分片 +failover 的环境,文档化的存储也简化了传统设计库结构再开发的模式。 但是当你决定采用一项技术时,一定要真正了解其优劣, 例如可能你所选择的技术并不能支持你所需要的事务和数据一致性要求。八、文件存储存储的分布几乎跟数据库扩展一样困难, 不过只有百万的 PV 的情况下,磁盘 IO 方面一般不会成大问题,一两台采用SATA 做条带 RAID 的机器可以应付, 反而是自己做异步备份比较复杂, 因为小文件多。如果只有一台机器做存储,可以做简单的优化, 例如放

15、最小缩略图的分区和放中等缩略图的分区,根据平均大小调整一下块大小。存储要规划好目录结构,否则文件增多后维护起来复杂,也不利于扩展。同时还要考虑将来扩容,例如采用LVM,或者把文件根据不同规则散列到不同机器。 磁盘 IO繁重的情况下更容易出现故障, 所以要做好备份,若发现有盘坏掉, 要马上行动更换, 很多人的硬盘都是坏了一块之后,接二连三的坏下去。为了将来图片走 cdn 做准备,一开始最好就将图片的域名分开,且不用主域名。因为很多网站都将cookie 设置到了 .domain.ltd ,如果图片也在这个域名下,很可能因为cookie 而造成缓存失效,并且占多余流量,还可能因为浏览器并发线程限制造

16、成访问缓慢。九、程序名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 5 页 - - - - - - - - - 一定硬件条件下,应用能承载多少访问量,很大一部分也取决于程序如何写。程序写的不好, 可能一万的访问都承载不了,写的好, 可能一两台机器就能承担几百万 PV。越是复杂、数据实时性要求越高的应用,优化起来越难,但对普通网站有一个统一的思路,就是尽量向前端优化、 减少数据库操作、 减少磁盘 IO。向前端优化指的是,在不影响功能和体验的情况下,能在浏览器执行的不要在服务

17、端执行, 能在缓存服务器上直接返回的不要到应用服务器,程序能直接取得的结果不要到外部取得,本机内能取得的数据不要到远程取,内存能取到的不要到磁盘取, 缓存中有的不要去数据库查询。减少数据库操作指减少更新次数、缓存结果减少查询次数、 将数据库执行的操作尽可能的让你的程序完成(例如 join 查询),减少磁盘IO 指尽量不使用文件系统作为缓存、减少读写文件次数等。程序优化永远要优化慢的部分,换语法是无法“ 优化” 的。然而编程时不应该把重点放在优化上,应该关注扩展性。当今的WEB 应用,需求变化非常之快, 适应多种需求的架构是不存在的,我们的扩展性就要把要点放在跟底层交互的架构上, 例如持久化数据的存取规则、 缓存的存取规则等,还有一些共用服务, 例如用户信息等。 先把不变的部分做完善, 剩下的部分就很容易将精力放在业务逻辑上面了。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 5 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 技术资料 > 技术总结

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁