Spider Analyser是一款用于跟踪WordPress网站各种搜索引擎蜘蛛爬行日志,并进行详细的蜘蛛爬行数据统计、蜘蛛行为分析、蜘蛛爬取分析及伪蜘蛛拦截等。
插件优势
插件概述
蜘蛛概况
支持查看网站日常各大搜索引擎蜘蛛来访的数据;
- 今日蜘蛛-方便站长快速了解当日、昨日及30天平均的来访蜘蛛数、爬取URL数及平均爬取URL数。
- 趋势图-支持按今天、昨天、最近7天及最近30天查看蜘蛛数、爬取URLs总量、响应状态码及热门蜘蛛爬取链接数走势折线图,并可查看上一周期数据,以作对比分析。
- Top10蜘蛛-支持按今天、昨天、最近7天及最近30天查看Top10蜘蛛的爬取URL数及占比相关数据。
- Top10蜘蛛爬取URL-支持按今天、昨天、最近7天及最近30天查看Top10蜘蛛爬取URL的爬取次数及占比,方便站长对热门蜘蛛爬取页面URL进行分析。
- Top10热门文章-按今天、昨天、最近7天及最近30天查看Top10热门文章,以便于站长分析热门文章蜘蛛爬取情况以进一步优化文章页SEO。
蜘蛛日志
支持按今天、最近7天及最近30天查看蜘蛛日志,包括蜘蛛访问时间、状态码、访问链接、蜘蛛IP及蜘蛛名称等参数。
并且支持按蜘蛛名称、状态码及时间进行筛选日志;以及可通过访问URL、蜘蛛IP搜索蜘蛛日志。
蜘蛛列表
蜘蛛列表包含蜘蛛清单、蜘蛛IP段、疑似伪蜘蛛及蜘蛛拦截四部分的功能,其中:
- 蜘蛛清单-清单包括蜘蛛名称、蜘蛛类型、蜘蛛地址、最近来访时间、爬取URLs及占比情况等数据,支持按蜘蛛名称、蜘蛛类型及时间段筛选查询;并且支持忽略或者拦截指定蜘蛛。
- 蜘蛛IP段-在该列表可以查看不同蜘蛛对应IP段及其占比情况,支持按蜘蛛名、时间进行筛选查询;且支持按蜘蛛名称及蜘蛛IP段进行拦截。
- 疑似伪蜘蛛-协作站长快速发现疑似伪蜘蛛名称及IP地址,便于快速对伪蜘蛛执行拦截操作。
- 蜘蛛拦截-蜘蛛拦截列表用于站长管理蜘蛛拦截清单,支持站长按名称、IP/IP段或者名称+IP/IP段对蜘蛛进行拦截操作。
注:蜘蛛拦截可通过蜘蛛日志列表、蜘蛛清单列表、蜘蛛IP段列表及疑似伪蜘蛛列表对蜘蛛进行拦截。
访问路径
支持按今天、最近7天及最近30天查看蜘蛛访问路径(爬取页面URL)具体信息列表,包括URL、URL类型、爬取次数及占比情况等数据。
并且支持按蜘蛛名称、类型、状态、时间、访问URL及蜘蛛IP进行筛选查询。
文章爬取
此功能模块是为了方便站长按蜘蛛名称、不同状态的文章类型及时间,快速了解网站文章蜘蛛访问量、出链数及入链数。站长再根据这几个指标,对文章进行内链布局处理,提升蜘蛛爬取频率,从而提升网站收录量。
插件设置
- 记录管理-支持自定义蜘蛛类型及设置蜘蛛记录状态。
- 链接自定义-允许通过设置链接规则来区分蜘蛛爬取URL链接类型,支持添加自定义或者修改新增现有链接类型的规则。
- 日志设置-支持设置插件日志保留时间周期(最近30天、最近3个月、最近6个月、最近1年或永久),日志备份及删除和自定义蜘蛛。
Spider Analyser插件非常适合站长作为网站SEO优化的辅助工具,通过数据统计深入了解更大搜索引擎蜘蛛爬取页面URL的行为习惯。WordPress站长可以利用该插件,并结合WordPress网站SEO优化插件、百度推送插件和关键词推荐插件,对WordPress网站内容的搜索引擎收录及排名优化可以做到事半功倍的效果!
插件安装
方式1:在线安装(推荐)
1. 进入WordPress仪表盘,点击’插件-安装插件’,关键词搜索’Spider Analyser’,找搜索结果中找到’Spider Analyser’插件,点击’现在安装’;
2. 安装完毕后,启用 `Spider Analyser` 插件.
3. 通过仪表盘左侧菜单’蜘蛛分析’即可查看蜘蛛概况及蜘蛛日志.
方式2:上传安装
FTP上传安装
1. 解压插件压缩包spider-analyser.zip,将解压获得文件夹上传至wordpress安装目录下的 `/wp-content/plugins/`目录.
2. 访问WordPress仪表盘,进入’插件’-‘已安装插件’,在插件列表中找到’Spider Analyser’,点击’启用’.
3. 通过仪表盘左侧菜单’蜘蛛分析’即可查看蜘蛛概况及蜘蛛日志.
仪表盘上传安装
1. 进入WordPress仪表盘,点击’插件-安装插件’;
2. 点击界面左上方的’上传按钮’,选择本地提前下载好的插件压缩包spider-analyser.zip,点击’现在安装’;
3. 安装完毕后,启用 `Spider Analyser` 插件;
4. 通过仪表盘左侧菜单’蜘蛛分析’即可查看蜘蛛概况及蜘蛛日志.
插件截图



FAQ
= 如何应对蜘蛛日志过多导致数据库反应缓慢? =
(1)将插件日志保留周期改为最近30天;(2)及时删除历史日志;(3)对不必要的蜘蛛日志,设置为忽略或者添加至拦截列表。
= 为什么插件统计的蜘蛛日志与服务器日志数据有差异? =
插件仅统计前端页面的蜘蛛访问日志,服务器日志则统计所有数据访问日志。因此,理论上服务器日志蜘蛛访问数据应该大于插件的蜘蛛访问数据。但插件统计的数据已经足以作为搜索引擎蜘蛛分析。
= Spider Analyser插件的蜘蛛数据存放在哪里? =
数据库。由于该数据仅用于网站管理分析时使用,存放在数据库更加实时和准确,主要是占数据库空间,对服务器性能影响可以忽略不计。
= Spider Analyser插件是否会识别伪蜘蛛? =
暂不对伪蜘蛛进行识别,如站长发现可以伪蜘蛛,甚至任意你不希望对网站内容爬取的其他蜘蛛,可以通过Robots.txt进行屏蔽。查看教程《如何编写和优化WordPress网站的Robots.txt?》,但不是所有蜘蛛不一定遵循该协议。
= 访问路径统计中URL类型为什么有些现实为unknown? =
部分历史数据及一些未能够识别类别的蜘蛛访问URL地址,均列为unknown。在后面的插件版本,将会加入URL类型分组自定义功能。
文章标题:「WordPress蜘蛛分析插件」统计分析搜索引擎蜘蛛-Spider Analyser,本文链接:https://www.siwihs.com/8273.html。未经允许,禁止转载。