臻享优惠价:最高返 500 抵扣券 → 查看活动!>>>

WordPress博客怎么样写robots.txt

昨天星速云SEO搞定了网站sitemap,其实开始之前我以为很复杂,当然做完之后也不是我想象中的复杂,大家只要多去查查资料,网上有好多高手愿意分享他们自己的方法。今天我发现自己根目录下没有robots.txt文件,有些服务器提供商会提供robots.txt文件,自己在去写,但是这次我是在美国那里的虚拟主机,我就准备自己...

昨天星速云SEO搞定了网站sitemap,其实开始之前我以为很复杂,当然做完之后也不是我想象中的复杂,大家只要多去查查资料,网上有好多高手愿意分享他们自己的方法。

今天我发现自己根目录下没有robots.txt文件,有些服务器提供商会提供robots.txt文件,自己在去写,但是这次我是在美国那里的虚拟主机,我就准备自己建立robots.txt文件,基本书写方法和规则,就去百度,找了一点好资料分享给大家。

使用Wordpress搭建的博客,利用robots.txt文件限制搜索引擎抓取部分目录及文件,归纳大致有以下几种方法。

最简单的开放写法

不作任何限制,Wordpress站内链接结构比较合理,作为一般博客,完全开放就可以了,代码:

User-agent: * Disallow:

允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。

最简单的严格写法

User-agent: * Disallow: /wp-* #Allow: /wp-content/uploads/ Disallow: /*.php$ Disallow: /*.inc$ Disallow: /*.js$ Disallow: /*.css$ Disallow: /?s=

允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。

Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。Allow 不是所有搜索引擎都支持。

最合理的写法

这是乐思蜀的wordpress博客robots.txt的内容。

User-agent: * Disallow: /wp-admin Disallow: /wp-content/plugins Disallow: /wp-content/themes Disallow: /wp-includes Disallow: /?s= Sitemap: http://www.lesishu.com/sitemap.xml

允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果。

包含sitemap.xml地址(这一项viki中有专门的说明,但Google管理员工具会提示‘检测到无效的 Sitemap 引用’,有效性尚有争议)。

robots.txt其他写法

为避免在搜索引擎中出现重复页面,Wordpress玩家自创了很多robots写法,列举一些常用的,作为参考(适用于伪静态方式的永久链接):

Disallow: /page/

#限制抓取Wordpress分页

Disallow: /category/*/page/*

#限制抓取分类的分页

Disallow: /tag/

#限制抓取标签页面

Disallow: */trackback/

#限制抓取Trackback内容

Disallow: /category/*

#限制抓取所有分类列表

最后,推荐使用 Google管理员工具,登录后访问“工具 -> 分析 robots.txt”,检查文件有效性。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给TA打赏
共{{data.count}}人
人已打赏
豆包可以帮你高效完成AI问答、AI对话、提供软件相关教程以及解决生活中遇到的各种疑难杂症,还能帮助你进行AI写作、AI绘画等等,提高你的工作学习效率。
!
你也想出现在这里?立即 联系我们吧!
信息
个人中心
购物车
优惠劵
今日签到
搜索