第一,log是什么格式
如下所示的ex120807.log就是一个日志文件。扩展名为.log格式即为日志文件。
第二,网站日志文件在哪
通常一个网站日志文件在空间管理后台的logofiles文件夹下面。每天系统会自动生成一个LOG日志文件。
网站日志文件是安全的,只有站长自己登陆空间管理后台才能看见LOG日志文件。每天生成一个日志文件,一个日志文件里面往往记录了网站下所有的记录,包括用户与蜘蛛的访问信息,如:访问页面、IP信息、返回状态等等等。所以,网站日志文件对于我们站长进行网站分析与优化有一定价值。
第三,log日志分析和查看
明白了log是什么格式,也知道了网站日志文件在哪,站长们接下来可以将网站日志文件下载到电脑里面打开进行分析。
通常打开一个网站日志文件,可以看到下面这样的一段代码。一个网站日志文件,根据网站访问和爬行记录,由N段这样的代码组成,每一段代码表示一条记录。
接下来,笔者以这样一段代码来介绍如何进行log日志分析。
2012-08-07 04:08:46 GET /images/index5_22.gif - - 113.4.225.46 HTTP/1.1 Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE) http://www.ittribalwo.com/show.asp?id=968 200 360
1. 2012-08-07 04:08:46:是用户访问时间。
2. GET:服务器的处理动作,包括GET和POST。网站日志中绝大部分都是GET,只有在进行CGI处理的时候才会出现POST。GET,就是用户从服务器上获取了页面或者别的文件。
3. GET后面“/…”:是用户访问的页面,只有一个斜杠表示网站首页。
4. 113.4.225.46:用户IP地址。通过用户IP,可以查询到用户来自哪个国家、省份、城市。
5. HTTP/1.1:用户访问该页面是通过HTTP1.1协议进行传输的,也就是超文本传输1.1版本协议。
6. Mozilla/5.0+(compatible;+MSIE+9.0;+Windows+NT+6.1;+Trident/5.0;+360SE:表示用户所使用的电脑是Mozilla浏览器,Windows NT操作系统等等。
7. http://www.ittribalwo.com/show.asp?id=968 200 360:这是代码中最重要的信息。前面自然是用户访问自己网站的某一个页面, 后面的200,表示用户访问页面的时候返回的状态码。200后面的360代表的是被访问页面的体积。
常见的状态码有:200,301,302,404,500等。
200:表示服务器成功地接受了客户端请求。这是最佳的,表示网站页面正常。
301:表示用户所访问的某个页面已经做了301重定向(永久性)处理。
302:则是暂时性重定向。如果网站日志分析发现有过多的302,需要确认是否将301做错为302。如果是,赶紧修改,搜索引擎不喜欢302重定向。
404:则代表所访问的页面已经不存在,或者是访问的url根本就是错误的。
500:服务器的错误。