禁止Baiduspider访问您的网站
禁止Baiduspider访问您的网站
User-agent: Baiduspider
Disallow: /
禁止spider访问特定目录
在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即robot不会访问这三个目录。
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
使用"*"限制访问url
禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
User-agent: *
Disallow: /cgi-bin/*.htm
使用"$"限制访问url
仅允许访问以".htm"为后缀的URL。
User-agent: *
Allow: .htm$
Disallow: /
robots.txt文件里还可以直接包括在sitemap文件的链接。
就像这样: Sitemap: http://www.***.com/sitemap.xml