Crawl-delay是一个非官方的指令,用来告诉搜索引擎爬虫在抓取网站时应该等多久,例如,Crawl-delay:30意味着每次爬虫抓取一个页面,都要等30秒才能抓取下一个页面(每次抓取之间至少要等30秒),这样可以减轻服务器的压力,避免爬虫频繁请求网站资源。当搜索引擎抓取一个页面时,它会请求该页

Crawl-delay是一个非官方的指令,用来告诉搜索引擎爬虫在抓取网站时应该等多久,例如,Crawl-delay:30意味着每次爬虫抓取一个页面,都要等30秒才能抓取下一个页面(每次抓取之间至少要等30秒),这样可以减轻服务器的压力,避免爬虫频繁请求网站资源。
robots文件的Crawl-delay有什么作用

当搜索引擎抓取一个页面时,它会请求该页面的 HTML 内容,以及该页面引用的 CSS、JavaScript 和图片等资源。Crawl-delay 指令只影响搜索引擎抓取页面的时间间隔,而不影响它抓取单个页面所需的时间。也就是说,当搜索引擎抓取一个页面时,它会在很短的时间内连续请求该页面的 HTML 内容和相关资源,而不会在请求每个资源之间都等待 Crawl-delay 指定的时间。

1
2
3
4
5
User-agent: *
Crawl-delay: 30

User-agent: Bing
Crawl-delay: 10

上面的 robots.txt 代码表示对于所有的爬虫,都要等待30秒;但是对于必应的爬虫,只要等待10秒。

哪些搜索引擎支持 Crawl-delay

目前,只有 Bing、DuckDuckGo、Yandex 等少数搜索引擎承认这个指令。但 Yandex 建议使用 Yandex.Webmaster 控制台设置抓取频率。

谷歌则完全忽略它,而是根据网站的性能和流量来自动调整爬取速率。百度spider则明确表示不支持Crawl-delay,建议通过百度站长平台的抓取压力反馈工具定义爬虫的首选抓取频率。

温馨提示:本文最后更新于 2024-05-22 14:57 ,某些文章具有时效性,若有错误或已失效,请在下方留言或联系QQ115904045
声明:
1.本站大部分内容均收集于网络!若内容若侵犯到您的权益,请发送邮件至:115904045@qq.com,我们将第一时间处理!
2.资源所需价格并非资源售卖价格,是收集、整理、编辑详情以及本站运营的适当补贴,并且本站不提供任何免费技术支持
3.所有资源仅限于参考和学习,版权归原作者所有,更多请阅读网站声明

给TA打赏
共{{data.count}}人
人已打赏
网站优化

什么是面包屑导航

2023-7-12 22:45:54

网站优化

手机上带wap、3g、m的网站区别是什么?

2023-7-16 23:34:24

  • 0 条回复 A文章作者 M管理员
      暂无讨论,说说你的看法吧
    购物车
    优惠劵
    今日签到
    有新私信 私信列表
    搜索

    夕阳无别事,等风也等你

    联系我们