欢迎光临来到我们官方网站!
打开客服菜单
南京网站优化
南京网站优化首页 > SEO经验 > 怎样读日志文件
怎样读日志文件
时间 : 2018-11-14 11:23 浏览量 : 54

流量数据监测

大部分情况下,流量分析要借助于流量分析软件,但直接读网站日志还是站长及SEO的基本功之一。

1.怎样读日志文件

网站服务器会把每一个访问信息、每一个服务器动作、每一个文件调用自动记录下来,存在服务器原始日志文件中。所以日志中的信息是相对准确、全面的。有些南京网站SEO人员需要知道的信息在流量分析软件中很少支持,必须直接查看日志,如服务器返回的状态码,蜘蛛爬行记录等。

原始日志就是一个纯文本文件,只要用文字编辑软件如 WordPad Notepad打开就可以。一般主机商会在控制面板提供日志文件下载。

下面是从南京网站优化老李负责的南京瑞联节能公司网站(https: //www.njruilian.com)2018t年11月份日志文件中随机选取的一行,我们来看一下它包括哪些信息:

27.40.136.117 - - [13/Nov/2018:04:06:55 +0800] "GET / HTTP/1.0" 200 8324 "https://www.baidu.com/link?url=OWPE8QWbmgE1szueZOz_MS-bH2RmFSvM3iF5mQW6-89tceOGcP41kTfEDVqMui0I&wd=&eqid=a2d0eb9700002e79000000065be9dd34" "Mozilla/5.0 (Windows NT 6.1; rv:34.0) Gecko/20100101 Firefox/34.0"

用户IP地址:

27.40.136.117

这是访问用户所在的IP地址,显示出访问的人来自什么地理位置。在IP地址信息服务查一下这个IP所属位置,可以看到这位访客来自广东省

IP地址显示来自广东

日期/时间:13/Nov/2018:04:06:55

这是文件被访问的准确时间。和IP地址结合起来,查看多条日志记录就可以跟踪某一个特定的用户从一个网页到另一个网页的访问顺序和在网站上的活动。

时区:+0800

相对格林威治时间的时区差。中国、新加坡处于东8区。

服务器动作:

 "GET/HTTP/1.1"

服务器要做的动作要么是GET,要么是POST。除了一些CGI脚本外,通常都应该是GET,也就是从服务器上获取某个文件,可以是HTML、图片、CSS等

例子里的这段记录意思就是,按HTTP/1.1协议获取URL/处的文件。这里的URL是相对地址,已经省去了域名部分,所以/指的就是博客首页。

上面的例子是访问一个图片时的记录。在日志中,每一个页面、图片、JS脚本等文件的访问也都会有一行记录。

服务器状态码:

200

服务器返回的状态码。200指成功获取了文件一切正常。如果返回404,就是文件不存在/没有找到。其他常见状态码包括:

301—永久转向。

302—暂时转向。

304—文件未改变,客户端缓冲版本还可以继续使用。

400—非法请求。

401—访问被拒绝,需要用户名、密码

403—禁止访问。

500—服务器内部错误,通常是程序有问题。

503—服务器没有应答,如负载过大等。

文件大小:

434

指的是所获取文件的大小,例子中是8324字节。

来路:

 "https://www.baidu.com/link?url=OWPE8QWbmgE1szueZOz_MS-bH2RmFSvM3iF5mQW6-89tceOGcP41kTfEDVqMui0I&wd=&eqid=a2d0eb9700002e79000000065be9dd34"

显示访问者是从哪里来到当前网页,也就是来到这个网页之前访问的那个网页URL。来路可能是同一个网站的其他页(用户通过点击网站内部链接浏览),有可能是其他网站(用户通过其他网站上的链接点击过来,也有可能是搜索引擎的结果页面,如上面所示的例子。

以前百度是显示搜索关键词的,不过后来由于很多人用这个作弊,现在链接已经加密了,让我们失去了一个很珍贵的信息。

用户代理(USer Agent):

Mozilla/5.0 (Windows NT 6.1; rv:34.0) Gecko/20100101 Firefox/34.0"

最后一段显示的是浏览器和用户计算机的一些信息。

例子中这段信息表示用户使用的是:

·与 Netscape Mozilla浏览器。实际上大部分浏览器 USer Agent都使用 Mozilla/为开头,所以并不能区分浏览器。

·浏览器是 Firefox

Windows NT 操作系统。

如果用户使用的是其他类型计算机或浏览器,在这一段还可能看到这类代码: Mozilla/4.0( compatible; MSIE 6.0: Windows NT 5.0; Maxthon; Alexa Toolbar傲游浏览器。

 Mozilla/5.0(Windows; U; Windows NT 5.1; zh-CN; rv: 1.9.2.8)Gecko/20100722 Firefox/3.6.8gTB7.1—火狐浏览器。

 ."Mozilla/4.0(compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2;.NET CLR 2.0.50727;.NET CLR 3.5.30729;.NET CLR 3.0.30729:Media Center PC6.0.net.oc.net.oe360se)"-360浏览器

 Mozilla compatible MSIE6.0; Windows NT5.1;sV1;)微软I6浏览器。

搜索引擎蜘蛛就相当于一个浏览器,提到的搜索引擎蜘蛛用于表明身份的用户代理就是这段信息。如百度蜘蛛如下表明自己:

 Baiduspider+(thttp: //www.baidu.c/search/spider. htm)

日志是网站访问的最真实记录。分析用户访问时还可以借助下面介绍的GA等流量分析工具,但检查某些问题,如访问错误、蜘蛛爬行情况等,非依靠原始日志不可大中型网站日志文件可能很大,完整人工查看是不可能的,SEO部门可以开发专用日志分析工具,主要统计各种访问错误和蜘蛛爬行、抓取数据。


标签:
cache
Processed in 0.003714 Second.