文章内容

2020/8/19 11:34:53,作 者: 黄兵

2020年8月19日大量网络爬虫攻击总结

2020年8月19日,早上9:13左右,通过查看nginx日志,有大量connect连接网站,截图如下:

虽然connect连接发送很少的字节,但是如果同一时间非常多,也会将服务器的宽带占满,导致正常访客打开网站速度非常慢。

开始大量屏蔽Connect连接的IP。

同时大量请求网站正常内容,由于做了反爬虫措施,无法获取正常内容,都被重定向,由于重定向返回的字节数有点多,下面是选取的nginx日志一段内容:

43.242.242.196 - - [19/Aug/2020:09:18:40 +0800] "GET /article/Instructions_for_testing_anti-reptiles_recently_global_v2?return_url=%2F%3Fpage%3D1 HTTP/1.1" 200 13859

可以看到返回了13859字节,转换成KB是:13.53418KB,但是依然请求非常多,导致宽带资源被占满。

开始根据关键字屏蔽相应IP,经过两个小时左右的屏蔽,已经将流量恢复正常,截图如下:


事后对屏蔽的IP进行查找,发现在一些代理网站上有部分IP,可以肯定,应该是恶意消耗宽带的攻击,不知主要抓取内容的。

应该攻击者提前测试过,正常更本无法抓取,所以是宽带消耗攻击。

备份了一下防火墙的IP列表,在此下载:https://image.pdflibr.com/blog/iptables.conf

通过这次攻击,如果是要防御,需要不断收集互联网上公开的代理IP,并将其加入到网站黑名单里面,这样如果是黑名单里的IP直接返回403错误。


黄兵个人博客原创。

转载请注明出处: 黄兵个人博客 - 2020年8月19日大量网络爬虫攻击总结

分享到:

发表评论

评论列表