《Apache_日志配置及查看方法15393.pdf》由会员分享,可在线阅读,更多相关《Apache_日志配置及查看方法15393.pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 1 Apache 日志配置及查看方法 有时候我们需要定制Apache 默认日志的格式和内容,比如增加或减少日志所记录的信息、改变默认日志文件的格式等。本文介绍可以用日志记录的所有信息,以及如何设置Apache使其记录这些信息。一、定义日志格式 很久以前,日志文件只有一种格式,这就是“公共格式”,许多人已经习惯于使用这种格式。随后出现了定制日志格式,而且看起来定制日志格式更很受欢迎,即使公共日志格式本身也重新用定制日志格式定义。本文介绍的就是如何随心所欲地定制日志文件的格式、如何让日志文件记录自己想要的信息。定制日志文件的格式涉及到两个指令,即LogFormat 指令和CustomLog 指令
2、,默认httpd.conf 文件提供了关于这两个指令的几个示例。LogFormat 指令定义格式并为格式指定一个名字,以后我们就可以直接引用这个名字。CustomLog 指令设置日志文件,并指明日志文件所用的格式(通常通过格式的名字)。LogFormat 指令的功能是定义日志格式并为它指定一个名字。例如,在默认的httpd.conf 文件中,我们可以找到下面这行代码:LogFormat%h%l%u%t%r%s%b common 该指令创建了一种名为“common”的日志格式,日志的格式在双引号包围的内容中指定。格式字符串中的每一个变量代表着一项特定的信息,这些信息按照格式串规定的次序写入到日志
3、文件。Apache 文档已经给出了所有可用于格式串的变量及其含义,下面是其译文:%.a:远程IP 地址%.A:本地IP 地址%.B:已发送的字节数,不包含HTTP 头%.b:CLF 格式的已发送字节数量,不包含HTTP 头。例如当没有发送数据时,写入-而不是0。%.FOOBARe:环境变量FOOBAR 的内容%.f:文件名字%.h:远程主机%.H 请求的协议%.Foobari:Foobar 的内容,发送给服务器的请求的标头行。%.l:远程登录名字(来自identd,如提供的话)%.m 请求的方法%.Foobarn:来自另外一个模块的注解“Foobar”的内容 2%.Foobaro:Foobar
4、 的内容,应答的标头行%.p:服务器响应请求时使用的端口%.P:响应请求的子进程ID。%.q 查询字符串(如果存在查询字符串,则包含“?”后面的部分;否则,它是一个空字符串。)%.r:请求的第一行%.s:状态。对于进行内部重定向的请求,这是指*原来*请求 的状态。如果用%.s,则是指后来的请求。%.t:以公共日志时间格式表示的时间(或称为标准英文格式)%.formatt:以指定格式format 表示的时间%.T:为响应请求而耗费的时间,以秒计%.u:远程用户(来自auth;如果返回状态(%s)是401 则可能是伪造的)%.U:用户所请求的URL 路径%.v:响应请求的服务器的ServerNam
5、e%.V:依照UseCanonicalName 设置得到的服务器名字 在所有上面列出的变量中,“.”表示一个可选的条件。如果没有指定条件,则变量的值将以“-”取代。分析前面来自默认httpd.conf 文件的 LogFormat 指令示例,可以看出它创建了一种名为“common”的日志格式,其中包括:远程主机,远程登录名字,远程用户,请求时间,请求的第一行代码,请求状态,以及发送的字节数。有时候我们只想在日志中记录某些特定的、已定义的信息,这时就要用到“.”。如果在“%”和变量之间放入了一个或者多个HTTP 状态代码,则只有当请 求返回的状态代码属于指定的状态代码之一时,变量所代表的内容才会被
6、记录。例如,如果我们想要记录的是网站的所有无效链接,那么可以使用:LogFormat%404Refereri BrokenLinks 反之,如果我们想要记录那些状态代码不等于指定值的请求,只需加入一个“!”符号即可:Apache 日志:访问日志(一)想要知道什么人在什么时候浏览了网站的哪些内容吗?查看Apache 的访问日志就可以知道。访问日志是Apache 的标准日志,本文详细解释了访问日志的内容以及相关选项的配置。一、访问日志的格式 Apache 内建了记录服务器活动的功能,这就是它的日志功能。这个Apache 日志系列文章介绍的就是Apache 的访问日志、错误日志,以及如何分析日志数据
7、,如何定制Apache日志,如何从日志数据生成统计报表等内容。如果Apache 的安装方式是默认安装,服务器一运行就会有两个日志文件生成。这两个文件是access_log(在Windows 上是 access.log)和error_log(在Windows 上是error.log)。采用默认安装方式时,这些文件可以在/usr/local/apache/logs 下找到;3 对于Windows 系统,这些日志文件将保存在Apache 安装目录的logs 子目录。不同的包管理器会把日志文件放到 各种不同的位置,所以你可能需要找找其他的地方,或者通过配置文件查看这些日志文件配置到了什么地方。正如其名
8、字所示,访问日志access_log 记录了所有对Web 服务器的访问活动。下面是访问日志中一个典型的记录:216.35.116.91-19/Aug/2000:14:47:37-0400 GET/HTTP/1.0 200 654 这行内容由7 项构成,上面的例子中有两项空白,但整行内容仍旧分成了7 项。第一项信息是远程主机的地址,即它表明访问网站的究竟是谁。在上面的例子中,访问网站的主机是216.35.116.91。随便说一句,这个地址属于一台 名为的机器(要找出这个信息,可以使用nslookup 工具查找DNS), 是一家制作Web 搜索软件的公司。可以看出,仅仅从日志记录的第一项出发,我们
9、就可以得到有关访问者的不少信息。默认情况下,第一项信息只是远程主机的IP 地址,但我们可以要求Apache 查出所有的主机名字,并在日志文件中用主机名字来替代IP 地址。然而,这种做 法通常不值得推荐,因为它将极大地影响服务器记录日志的速度,从而也就减低了整个网站的效率。另外,有许多工具能够将日志文件中的IP 地址转换成主机名 字,因此要求Apache 记录主机名字替代IP 地址是得不偿失的。然而,如果确实有必要让Apache 找出远程主机的名字,那么我们可以使用如下指令:HostNameLookups on 如果HostNameLookups 设置成double 而不是on,日志记录程序将对
10、它找到的主机名字进行反向查找,验证该主机名字确实指向了原来出现的IP 地址。默认情况下HostNameLookups 设置为off。上例日志记录中的第二项是空白,用一个“-”占位符替代。实际上绝大多数时候这一项都是如此。这个位置用于记录浏览者的标识,这不只是浏览者的登录名字,而是浏览者的 email 地址或者其他唯一标识符。这个信息由identd 返回,或者直接由浏览器返回。很早的时候,那时Netscape 0.9 还占据着统治地位,这个位置往往记录着浏览者的email 地址。然而,由于有人用它来收集邮件地址和发送垃圾邮件,所以它未能保留多久,很久之前市 场上几乎所有的浏览器就取消了这项功能。
11、因此,到了今天,我们在日志记录的第二项看到email 地址的机会已经微乎其微了。日志记录的第三项也是空白。这个位置用于记录浏览者进行身份验证时提供的名字。当然,如果网站的某些内容要求用户进行身份验证,那么这项信息是不会空白的。但是,对于大多数网站来说,日志文件的大多数记录中这一项仍旧是空白的。日志记录的第四项是请求的时间。这个信息用方括号包围,而且采用所谓的“公共日 4 志格式”或“标准英文格式”。因此,上例日志记录表示请求的时间是2000 年 8 月 19 日星期三14:47:37。时间信息最后的“-0400”表示服务器所处时区位于UTC 之前的4 小时。日志记录的第五项信息或许是整个日志记
12、录中最有用的信息,它告诉我们服务器收到的是一个什么样的请求。该项信息的典型格式是“METHOD RESOURCE PROTOCOL”,即“方法 资源 协议”。在上例中,METHOD 是 GET,其他经常可能出现的METHOD 还有POST 和 HEAD。此外还有不少可能出现的合法METHOD,但主要就是这三种。RESOURCE 是指浏览者向服务器请求的文档,或URL。在这个例子中,浏览者请求的是“/”,即网站的主页或根。大多数情况下,“/”指向DocumentRoot 目录的index.html文档,但根据服务器配置的不同它也可能指向其他文件。PROTOCOL 通常是HTTP,后面再加上版本号
13、。版本号或者是1.0,或者是1.1,但出现1.0 的时候比较多。我们知道,HTTP 协议是Web 得以 工作的基础,HTTP/1.0 是 HTTP 协议的早期版本,而 1.1 是最近的版本。当前大多数Web 客户程序仍使用1.0 版本的HTTP 协议。日志记录的第六项信息是状态代码。它告诉我们请求是否成功,或者遇到了什么样的错误。大多数时候,这项值是200,它表示服务器已经成功地响应浏览器的请 求,一切正常。此处不准备给出状态代码的完整清单以及解释它们的含义,请参考相关资料了解这方面的信息。但一般地说,以2 开头的状态代码表示成功,以3 开 头的状态代码表示由于各种不同的原因用户请求被重定向到
14、了其他位置,以4 开头的状态代码表示客户端存在某种错误,以5 开头的状态代码表示服务器遇到了某个 错误。日志记录的第七项表示发送给客户端的总字节数。它告诉我们传输是否被打断(即,该数值是否和文件的大小相同)。把日志记录中的这些值加起来就可以得知服务器在一天、一周或者一月内发送了多少数据。二、配置访问日志 访问日志文件的位置实际上是一个配置选项。如果我们检查httpd.conf 配置文件,可以看到该文件中有如下这行内容:CustomLog/usr/local/apache/logs/access_log common 注意,对于版本较早的Apache 服务器,这行内容可能略有不同。它使用的可能不
15、是CustomLog 指令,而是TransferLog 指令。如果你的服务器属于这类情况,建议你尽可能地早日升级服务器。CustomLog 指令指定了保存日志文件的具体位置以及日志的格式。至于如何定制日志文件的格式以及内容,我们将在这个Apache 日志系列文章的 后面几篇讨论。上面这行指令指定的是common 日志格式,自从有了Web 服务器开始,common 格式就是它的标准格式。由此我们也可以理解,虽然几乎 不再有任何客户程序向服务器提供用户的标识信息,但访问日志却还保留着第二项内容。5 CustomLog 指令中的路径是日志文件的路径。注意,由于日志文件是由HTTP 用户打开的(用User 指令指定),因此必须注意这个路径要有安全保证,防止该文件被随意改写。Apache 日志系列文章的后面几篇将继续介绍:Apache 错误日志,定制日志的格式和内容,如何将日志内容写入指定的程序而不是文件,如何从日志文件获得一些非常有用的统计信息,等等。