HOME
联系方式
付款方式
网站地图
 
沈阳网站制作,沈阳网站建设
沈阳网站建设咨询QQ: 4006558158
沈阳网站建设,立足沈阳,面向企业,您身边的企业信息化服务专家!
盛图快捷导航:模板建站 | 在线订单 | 在线留言
 
首页 关于我们 品牌建站 自助建站 模板建站 域名注册 虚拟主机 可信认证 网站商务通 经典案例 网站推广 联系我们
 
我想咨询网站制作价络 我有网站想给网站改版和维护 我要建网站,请为我提供解决方案 24小时服务QQ: 4006558158
SEO优化

一站式服务,让您的网站更具竞争力和影响力!

关于Robots工具,什么是Robots.txt?
发布日期:2012/10/3
 
阅读次数:740
一、什么是robots.txt文件

搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。

二、robots.txt文件的格式

"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:

"<field>:<optional space><value><optionalspace>"

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow和Allow行,详细情况如下:

User-agent:

该项的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到"robots.txt"的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则对任何robot均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名为"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:

该项的值用于描述不希望被访问的一组URL,这个值可以是一条完整的路径,也可以是路径的非空前缀,以Disallow项的值开头的URL不会被 robot访问。例如"Disallow:/help"禁止robot访问/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"则允许robot访问/help.html、/helpabc.html,不能访问/help/index.html。"Disallow:"说明允许robot访问该网站的所有url,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"不存在或者为空文件,则对于所有的搜索引擎robot,该网站都是开放的。

Allow:

该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL 是允许robot访问的。例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

使用"*"and"$":

Baiduspider支持使用通配符"*"和"$"来模糊匹配url。

"$" 匹配行结束符。

"*" 匹配0或多个任意字符。

注:我们会严格遵守robots的相关协议,请注意区分您不想被抓取或收录的目录的大小写,我们会对robots中所写的文件和您不想被抓取和收录的目录做精确匹配,否则robots协议无法生效。

三、robots.txt文件放在哪里

    robots.txt文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如 http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果 Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。

( 沈阳网站建设)
友情合作

链接说明:本站接受PR>=4的首页链接,互换链接时,请先做好本站链接,链接联系QQ:4006558158

品牌 · 服务 · 影响力 ——企业信息化服务专家 沈阳域名注册 | 沈阳网站制作 | 沈阳网站建设 | 沈阳网站优化 | 沈阳服务器租用 | 沈阳网站开发 | 沈阳网络公司

盛图服务网络: 沈阳 |  鞍山 | 海城 |  辽阳 |  锦州 | 大连 |  营口 | 丹东 |  朝阳 |  盘锦 |  抚顺 |  铁岭 | 葫芦岛 | 本溪 | 阜新

Tel:4006558158 Email:hhidc@syhhidc.com Fax:024-83992248 Address:沈阳市沈河区青年大街219号华新国际大厦11楼11BC单元

(C)2005-2010 www.syhhidc.com. 沈阳恒昊互联网络有限公司 版权所有 严禁抄袭复制 使用须知 | 著作权声明 辽B-2-3-20060003-19