使用 AWK 总结日志
1. HTTPD 日志文件格式
在处理任何文件时,首先要熟悉文件的结构。对于 Apache HTTPD 网络服务器的访问日志文件,在基于 Debian 的系统中,默认日志文件位置是/var/log/apache2/access.log,其他系统可能使用httpd目录代替apache2。
可以使用tail命令查看日志文件末尾:
$ tail /var/log/apache2/access.log日志文件以空格分隔,各字段含义如下表所示:
| 字段 | 用途 |
| ---- | ---- |
| 1 | 客户端 IP 地址 |
| 2 | 由 RFC 1413 和ident客户端定义的客户端身份。除非启用IdentityCheck,否则不读取该字段,未读取时该值为连字符 |
| 3 | 启用用户认证时的用户 ID。未启用认证时,该值为连字符 |
| 4 | 请求的日期和时间,格式为day-month-year(hour:minute:second timezone)|
| 5 | 实际请求和方法 |
| 6 | 返回状态码,如 200 或 404 |
| 7 | 文件大小(字节) |
需要注意的是,日期、时间和时区是一个字段,用