贝利信息

如何通过 .htaccess 精确屏蔽爬虫对指定目录的访问

日期:2026-01-23 00:00 / 作者:霞舞

本文详解如何在 wordpress 环境下,使用 apache 的 mod_rewrite 规则精准阻止 googlebot、bingbot、baiduspider 等主流爬虫访问特定子目录(如 `/tbd_templates/` 和 `/custom_post/`),同时保障网站其余路径正常可访问。

要在不干扰 WordPress 核心重写逻辑的前提下,仅对特定目录实施爬虫屏蔽,关键在于:将规则置于 WordPress 主规则之前,并使用精确匹配的 URL 路径正则表达式,而非全局 .* —— 后者会导致整个站点被误拦。

以下是推荐的 .htaccess 配置方案(插入在 # BEGIN WordPress 之前):

# Block crawlers from specific directories
RewriteCond %{HTTP_USER_AGENT} (g

ooglebot|bingbot|baiduspider) [NC] RewriteRule ^(tbd_templates|custom_post)(?:$|/) - [F]

说明与要点

⚠️ 注意事项

总结:精准路径匹配 + 条件化 User-Agent 判断 + 合理插入位置 = 安全、轻量、可维护的爬虫目录级访问控制。