首页 » 戏曲谱曲

Warframe中文维基:403

2022-01-12 16:33 128 中国乐谱网

如果你是在2021年2月14日之后访问到这个页面,请确认:

WARFRAME中文wiki(灰机wiki)遭到了大量来路不明爬虫骚扰,

由于爬虫已经严重影响了其他托管站点的用户和访问者平等访问、使用灰机平台的权利,我们只能对Warframe站点进行暂时性隔离并限制访问

隔离期间我们会积极分析日志,加强对非法爬虫、QQbot的反制措施,并收集必要的证据,保留对滥用wiki开放机制,抄袭剽窃wiki内容者采取进一步措施的可能性。

隔离治疗期间玩家和用户可以使用狗头人APP进行访问

WIKI编辑者请加群414922009获得登陆权限

warframe站点之外的子站点不受隔离影响

对给各位带来的不便深表歉意!

隔离取消时间另行通知。

Warframe中文维基:403


关于为什么要隔离

我知道有的人不理解为什么要隔离,可能会认为“不就是爬虫吗”,“爬虫是正常的分享行为”

我这里集中做一次说明


1.这里的异常爬虫不是搜索引擎的爬虫,而是以恶意剽窃、盗取wiki劳动成果为目的的网页爬虫

重要的事情再说一遍,异常爬虫不是搜索引擎爬虫(Spider),正常的爬虫会声明自己的ua,如果有问题很好屏蔽,而异常爬虫,会把自己ua伪装成正常的浏览器,甚至是搜索引擎爬虫,来迷惑服务器,从而达到浑水摸鱼的目的

首先,这种爬虫是非必须的,因为wiki已经是公开、免费、没有任何附加条件共大家浏览的了,爬取只有一个目的,就是转移内容到别有用心者的app、软件、qqbot上,至于为什么,仁者见仁智者见智。

其次,这种爬虫是非必要的,因为灰机和其他MediaWiki一样提供了开放的api,只不过好多人弱智到不愿意请求高效率的api,蠢到去费劲爬html,害人害己。对此不予置评。

最后,还有一种爬虫是伪装成爬虫的恶意攻击脚本,我会在下面介绍。

为什么要物理隔离,别的方法不好吗?  

我前面说过,由于异常爬虫的特征和行为很隐蔽,相当于是疑难杂症,从表征上我并不知是哪个站点的问题导致的,所以采用隔离测试是最行之有效的办法,假设我隔离了站点A,病状消失了,说明问题出在站点A上,然后才好对症下药,分析站点A的访问日志,否则灰机全平台几百个站点,日访问超过百万的有好几个,分析起来没有抓手,效率会很低。也得多亏了wf这边的异常爬虫丧心病狂到离谱,到一眼就能看出来是wf的问题(下面我会说),所以第一个隔离就中了,省了我很多事。

这个就好比“窒息疗法”,异常爬虫大部分是以抄袭偷窃内容为目的,比如qqbot、攻略app,他是需要在表面维系一个“内容都是我做的”这样子一个假象,kjfpgov.com,一旦我把wiki隔离了,他们的内容来源就断了,马上就会现出原形。所以隔离非常有利于我们甄别出,哪些人才是小偷。

有个故事叫前狼假寐,这一次我故意隔离一下,就像我之前被DDOS的时候故意不马上抢救一样,示弱了之后,针对你的人就会认为你死了,马上开始上蹿下跳,wf隔离不到两天,各种起义军就出现了,号召去某wiki另开炉灶的帖子我看到了好几个,你说是不是很好笑?就这智商,还要警察干啥,自己就招了???

2.关于爬虫是否正常

下图是2月1日的网站二级域名流量统计(不算CDN)

Warframe中文维基:403

可以看到wf一个站点的出站流量是76.57G,其他所有站点加到一起没到20个G。

可以确定的是,wf的访问人数肯定没有ff14多。

某些人管这个叫正常?正常的定义是??

wf的流量消耗和访问次数是ff14的9倍?比全灰机其他站点加起来都多??你管这个叫正常吗?


我们再来看结果


2月1日,仅wf一个站点就出现了17000+次50x(服务器不堪重负),全平台出现了十几万次,严重干扰了编辑者的体验(差不多有小一万人遇到了50x,注意,只有编辑者才会遇到50x,匿名访问的是缓存,一般不会出现50x)。

所以我是应了广大编辑者的要求彻查服务器和异常爬虫的,这不是什么扯虎皮做大旗,也不是挟天子以令诸侯。

我为了那10000人不遇到50x隔离了wf站点,请问我有什么不对的地方吗?

有疑问的欢迎加入各种编辑群了解真相,而不是人云亦云被带节奏。