当前位置：沐风博客 / SEO技术 / 正文

网站日志如何分析，分析网站日志的步骤方法

发布时间：2022年02月28日 08:08:24 | 责任编辑 : 沐风 | 分类 : SEO技术 | 浏览: 10695次 | 评论 2 人

做网站seo，数据分析是日常工作之一，数据分析包括很多方面，在这篇文章里笔者主要跟大家聊聊关于网站原始日志的分析。

网站原始日志不仅包括了用户的点击行为，同时也记录了搜索引擎抓取及停留等动作，下面就以实例来进行网站日志分析，这里针对百度。

网站日志需要在服务器下载（通常以logs命名），不懂如何下载的朋友可以咨询技术人员（公司没有专门技术的话可以咨询服务器提供商），另外需要注意的是，有些服务器为了节约空间，没有设置保留网站日志。

网站日志.jpg

Notepad++有强大的编辑能力，安装也十分方便，大家可以自行搜索下载，下面是日志打开的截图，一些数据筛选提取将从这里开始。

Notepad++打开文件图.jpg

百度蜘蛛是Baiduspider/2.0，所以我们按Ctrl+F调出查找功能，如图：

搜索查找.jpg

在查找目标量输入Baiduspider/2.0，最后点击“查找所有打开文件”，会在下方得出所有包含Baiduspider/2.0的行，如下图：

搜索结果.jpg

1.先将所有查找出来的内容复制到另一个Notepad++窗口中，然后用两次扩展替换，如图：

扩展替换.jpg

扩展替换2.jpg

这里简单的说明，\n是换行的意思，我们通过两次替换将页面的url剥离出来成为一行，然后将所有内容复制粘贴到表格（xls）中，如图：

表格.jpg

接着利用xls的自动筛选功能，筛选出页面url（看具体情况，一次筛选不成可进行多次筛选），如图：

自动筛选.jpg

更多操作，比如说要看看tag页面被抓取了多少，我们可以筛选包含tag的页面，如图：

包含tag的url.jpg

到这里大家应该知道网站日志分析的基本流程和方法了，更多的细节分析大家可以根据具体的需求进行。

另外，知道了哪些页面被抓取了，他们的收录又是怎样的呢？我们可以用Python来批量检测，如图：

python批量查询.jpg

收录结果.jpg

关于网站原始日志的分析（seo方向）就到这里，希望能对大家有所帮助。

本站内容大部分由沐风博客原创，少部分内容来源于网络，如有侵权请与我们联系，我们会及时删除！