网站屏蔽dotbot等消耗资源的恶意爬虫 建站

zsxwz 20/07.12 10:04 837

几个资源消耗比较高的爬虫包括:

dotbot

SemrushBot

MJ12bot 一些版权方会使用这家的爬虫来批量检查网站中是否包含侵犯版权的文件

SMTBot


对于这些爬虫建议直接在 robots.txt 中屏蔽掉它们,目前复查日志发现至少它们确实是遵守 robots.txt 规则的

User-agent: dotbot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: SMTBot
Disallow: /


via:http://suo.im/5PR4VX


上一篇:Chrome 扩展(插件)官方文档中文翻译版
下一篇:一个浏览器书签管理插件:Bookmarks clean up
最新回复 (0)
    • 姿势论坛—姿势小王子
      2
返回
发新帖
友情链接
免责声明:本站部分资源来源于网络,如有侵权请发邮件(mail@zsxwz.com)告知我们,我们将会在24小时内处理。