《2022年内幕调查:出卖Alexa(上)Alexa相关教程.docx》由会员分享,可在线阅读,更多相关《2022年内幕调查:出卖Alexa(上)Alexa相关教程.docx(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、2022年内幕调查:出卖Alexa(上)Alexa相关教程在Google上搜寻“Alexa”,简体中文的结果有7万多条。现在,“Alexa排名”已经是国内网站的站长们嘴边最常挂的单词。那么,这个Alexa是干嘛的?它 凭什么令国内网站侧目?Alexa有哪些鲜为人知的隐私?本报记者通过深化调查和采访,努力为读者还原一个真实的Alexa,其中许多信息是首次在媒体上披露。 出卖Alexa 写下这个题目,记者还怕有欠妥之处,细致回想连日来的调查采访,给记者设置迷障的网站,向记者供应帮助的挚友,还有记者自己,都对Alexa投入了极大热忱,从某种意义上说,我们也是在共同“出卖Alexa”。 本报记者 王翌
2、 前些天,北京某周刊刚发布了“中国商业网站100强”排行榜,当然,这个排行榜本身就少不了“商业”的味道,但其中对某些网站做介绍时,该媒体竟然又引用了另一个排名数据来说明这些网站的价值,这个被“中国商业网站100强”排行榜引用的排名就是“世界闻名的第三方测评机构美国Alexa”的全球网站排名。当然,该媒体对这个Alexa排名的引用,无非是为了说明其“中国商业网站100强”排名的权威性。而以另一个“权威”来树立自己的“权威”,恰恰说明白该媒体对另一个“权威”Alexa排名的认可。 Alexa是谁? 1996年4月,Alexa在美国创立,那时它只是一个小网站,主要做分类导航。在那时候,许多网站都是雅
3、虎的Fans,Alexa只是众多跟风者中的一员罢了。但Alexa自己也有一些技术,就是对访问某个Web站点的流量进行统计和分析。后来,Alexa还向网民供应自己开发的搜寻引擎服务。 1997年7月,Alexa发布了一款软件,就是现在闻名的Alexa Toolbar(Alexa工具条),这是一个嵌入到微软IE阅读器中的工具,它在用户访问每个Web页面时都向Alexa发回一串代码,将该次阅读的相关信息告知Alexa.而用户会在该工具条上看到其阅读的网站在全球全部网站中的排名信息,当然,这只是Alexa给出的网站排名。 1999年,Alexa被美国电子商务旗舰企业“亚马逊”收购,成为后者的全资子公司
4、。 2022年春,Alexa放弃了自己的搜寻引擎,转而与Google合作。Google遍及全球的Web爬行程序构造了一个巨大的页面信息数据库,这极大地丰富了Alexa自身的URL网址数据库。同时,Alexa也偷偷地放出了自己的爬行程序,在互联网上搜寻未知的网址。经过多年积累,Alexa的URL网址库已存储了400亿网址信息,超过了Google等搜寻引擎,成为互联网上最全的网址信息数据库。Alexa数据库的每日平均增量高达1TB,每两个月就能对数据库进行一次全面更新。 现在,Alexa工具条在全球的“装机量”早已上千万,而Alexa主要的工作就是基于遍及全球电脑用户桌面的工具条返回的信息,对全球
5、网民的阅读习惯进行监测,并开发和销售各种相关产品。其中,有最长达10万个网址的全球网站排行榜,有针对某些特定行业网站的排行分析,有针对个别网站定制的网站流量监测报告。Alexa还供应了许多免费的基本信息,比如“全球网站500强”,还有“简体中文网站100强”,网民们可以在Alexa上单独查看关于某个网站的排名历史改变图,甚至还能同时对最多5个网站的流量及排名等数据进行直观的横向对比。 尽管Alexa在其网站上供应了特别多有价值的信息,但其真正赖以成名的还是那个被四处引用并被媒体多次炒作过且引发了巨大争议的全球网站排名。根据Alexa网站上的“官方声明”,Alexa公开的那份全球网站总排名是通过
6、收集全部Alexa工具条返回的信息,经过计算得出的综合排名。从这份“官方声明”中,我们不难看出,影响Alexa排名的因素是两个,一是Alexa采集的信息,二是Alexa对这些信息进行深加工的计算方法。 在Alexa网站上,人们可以针对某个特定网址去查询其所属的网站的访问人数,Alexa供应了一个叫做Reach per million users(每百万用户访问人次,简称Reach)的数据来表示访问人数,这个数据指的是每一百万个Alexa工具条用户中每天访问某一网站的平均人数。比如,2022年11月3日,的Reach值为178,500,就是说,这一天里,每一百万个Alexa工具条用户中就有近18
7、万人访问过.仅有访问人数,还不足以反映一个网站被网民阅读的状况,Alexa还供应了另一个数据来反映到访的网民对特定网站的运用率,这就是PageViews per user(每用户阅读页面数,简称PV)。某网站的PV值是每天全部访问该网站的Alexa工具条用户在该网站上阅读的总页面数的平均值,而同一人对相同页面的重复阅读在每天只计作一次。还以2022年11月3日的访问数据为例,这一天,的PV值是4.0,也就是说,来访的网民们平均在网站上阅读了4个页面。 有了Reach和PV这两个数据,Alexa就可以给全球网站按综合流量进行排名了,它把网站的这个排名称作Traffic Rank(流量排名,简称R
8、ank),据Alexa在其网站上的说明,确定这个Rank的就是Reach和PV的几何平均数,也就是两者乘积的平方根。明显,一个网站的Reach和PV值越高,其Rank也越高。仍以为例,其4.0的PV值在一般的网站来说并不算高,但是,由于Google搜寻引擎的用户特别多,其Reach值远高于一般的网站,就使得的Rank达到3,也就是说,当天的全球排名是第三位。而全球排名最高的网站是,其Reach和PV值在全球网站中都是相对很高的。 利用与怀疑 每时每刻,全球每个安装了Alexa工具条的计算机终端都会向Alexa汇报该终端在互联网上的访问状况。依据这些信息,Alexa每天都会对全球网站的排名做重新
9、计算,也就是说,Alexa排名是每日更新的。因为几乎全球全部的网站都在Alexa的监测范围内,而这个每日更新的排行榜又显得过于直观,加之又是公开的随时可查的数据,就使得Alexa排名在许多场合都显得很敏感。 自2022年以来,国内互联网行业起先全面升温,曾经被资本们无情甩掉的网站CEO们又找回了从前的感觉,但风险投资家们的确比上一次。COM泡沫时期精明白很多,网站要吸引投资,必需首先打消资本的顾虑,就算是已经上了市的网站,也须要给股东们一些明确的数据来表明自身的价值。就在这时,Alexa排名被介绍到了国内,虽然这个网站以前从未引起大家的留意,但是它供应的这个排行榜却很快显示出巨大的商业价值。
10、一些网站在向投资人递交商业安排书的同时,起先有意无意地提一下自己的Alexa排名,根据某种大家默认的逻辑,排在全球300名的网站总是比排在全球1000名以外的网站更有价值。最终,在“圈内人”的口口相传中,Alexa排名在中国互联网上名声大噪,而此时,远在大洋彼岸的Alexa却对它的中国Fans们一窍不通。 当Alexa排名起先得到业界的普遍认可时,最终有人起先利用Alexa排名来创建“价值”了。大批个人网站的站长们起先探讨Alexa的排名规则,网上起先流传各种针对Alexa的作弊工具,许多网站上起先刊登介绍Alexa作弊方法的文章,各种论坛里起先出现对Alexa排名的探讨。一时间,中国互联网业
11、界刮起了“Alexa旋风”。 在2022年底,针对这股Alexa热,一些业内人士又起先质疑Alexa排名的可信度,并揭发出许多网站作弊的“内幕”。事实上,有相当多网民都对Alexa的排名表示过怀疑,因为在2022年的大部分时间里,Alexa排名上的全球第三和第四的网站是两个韩国网站,Alexa对此的说明是,韩国的互联网用户中安装Alexa工具条的比例较高,因此Alexa在韩国网民中得到的采样数据比较高,这就导致韩国的两家门户网站进入了全球前五名。 不过,Alexa的说明好像越描越黑,因为Alexa工具条始终只有英文版,既没有中文版,更没有韩文版,假如要说工具条的普及率高,欧美国家应当首当其冲。
12、有网友据此认为,韩国网站是靠作弊提升了网站排名,更有人认为,既然Alexa根本没有向亚洲国家推出本地化版本的工具条,亚洲国家就应当坚决抵制Alexa排名。 无论如何,从追捧到棒杀,业界对Alexa的关注一点儿都没减。进入2022年以来,照样有许多网站的站长们在费尽心机地想把自己网站的Alexa排名“做上去”,而以前揭露过Alexa的炮手们也同样接着怀揣各种目的炮轰着Alexa.今年十一长假过后,国内网站在Alexa上的排名突然经验了一次大规模集体滑坡,各种谣言起先在网民中流传,一种比较流行的说法是,Alexa最终起先调整算法来反击越来越多的中国作弊网站,人们把这看做是Alexa的“正值防卫”,
13、终归,一个以排行榜为最大卖点的网站赖以生存的就是它的排名的公正性。 各种传言都无法解决看客们对Alexa可信度的怀疑,因为国内主流媒体从未针对Alexa的技术进行过深化的分析和报道,而在下面的介绍中,读者可以看到,或许韩国网站排名过高另有缘由,而所谓的Alexa作弊手段也不只是此前一些媒体报道的多次刷新那么简洁,而且,Alexa也有自己特别高超的防作弊手段。不过,本文中所提及的作弊手段与网上随处可见的“作弊宝典”有本质的不同,所以,Alexa在多大程度上能抵挡这种不常见的作弊方式也就很难说了。 Alexa工具条的DNA 要想彻底搞清晰Alexa排名是否可信,必需从技术上对Alexa的全球网站流量监测进行全面的解剖,当然,Alexa从来没有公布自己的技术细微环节,记者确定“以彼之道,还施彼身”,既然Alexa声称其数据来源就是那个工具条,记者确定首先从破解工具条入手。 (出处: