超强干货!通过filebeat、logstash、rsyslog 几种方式采集 nginx 日志

开发 前端
本文介绍了如何通过filebeat、logstash、rsyslog采集nginx的访问日志和错误日志的几种方式,具体需要根据实际情况灵活的运用。

由于nginx功能强大,性能突出,越来越多的web应用采用nginx作为http和反向代理的web服务器。而nginx的访问日志不管是做用户行为分析还是安全分析都是非常重要的数据源之一。如何有效便捷的采集nginx的日志进行有效的分析成为大家关注的问题。

本文通过几个实例来介绍如何通过filebeat、logstash、rsyslog采集nginx的访问日志和错误日志。

大家都知道ELK技术栈是采集、分析日志的利器。所以这里介绍的是从nginx采集日志到ES。当然至于日志采集以后存到看大家的需要。通过logstash可以方便的配置日志输出存储的方式。

一般来说nginx默认安装后,日志文件在 /usr/local/nginx/logs 目录下。分别有 access.log和error.log 访问日志和错误日志。

这次示例Elasitcsearch是三个节点组成的集群172.28.65.22、172.28.65.23、172.28.65.24,172.28.65.30 是kibana的地址,172.28.65.32是数据采集服务器,上面装有logstash、nginx、 filebeat。一般来说采集服务器上有logstash,而nginx、 filebeat应该是装在采集目标上。

一、直接通过filebeat采集日志到ES

在filebeat的安装目录找到filebeat.yml 配置获取日志文件的路径及输出到ES的配置。

具体: 

  1. - type: log  
  2. # Change to true to enable this input configuration.  
  3.   enabled: true  
  4. # Paths that should be crawled and fetched. Glob based paths.  
  5.   paths:  
  6. #- /var/log/*.log  
  7.     - /usr/local/nginx/logs/*.log  
  8. #- c:\programdata\elasticsearch\logs\* 

如果需要在kibana中友好显示的化,可进行kibana配置

输出到es中,在hosts中配置好你的ES服务地址。如果单机只有一个节点,就可以只配一个ip和端口。

启动filebeat 进行日志数据采集 

  1. ./filebeat -e -c filebeat.yml -d "publish" 

通过elasticsearch-head插件查看es索引中的日志信息

可以看到nginx中的access.log和error.log的日志都已经上来了。

在kibana中通过filebeat-*过滤看filebeat的索引,可以看到通过filebeat采过来的数据。

这种直接通过filebeat直接对接ES采日志的方式简单直接,但是无法对采集的日志进行预处理和其他一些操作,也不够灵活。

可以在filebeat 和 ES之间加一层Logstash,可以将filebeat于ES解耦,通过Logstash可以做一些预处理,也可以通过Logstash采集到除ES以外的其他数据存储上。

二、通过filebeat采集日志到logstash再送到ES

首先得安装 logstash ,安装完后在logstash的安装目录下新建vi filebeat-pipeline.conf,filebeat-pipeline.conf的具体配置如下: 

  1. input {  
  2.     beats {  
  3.         port => "5044"  
  4.     }  
  5.  
  6. output {  
  7.     elasticsearch { hosts => ["172.28.65.24:9200"] }  
  8.     stdout { codec => rubydebug}  

input配置表示通过5044端口接收beats的数据。

output配置表示输出到elasticsearch,并且同时输出到标准输出也就是控制台。然后通过命令 

  1. bin/logstash -f filebeat-pipeline.conf --config.reload.automatic 

应用filebeat-pipeline.conf启动logstash。

启动以后可以看到logstash的启动日志5044端口的服务已经起了,可以接受通过filebeat通过5044端口传过来的数据了。

接下来配置filebeat:

在filebeat的安装目录找到filebeat.yml 配置获取日志文件的路径及输出到logstash的配置。不直接输出到ES了。

具体配置如下:

将output.elasticsearch的配置屏蔽,配置output.logstash,配置正确的logstash的服务主机和端口。

启动filebeat 进行日志数据采集 

  1. ./filebeat -e -c filebeat.yml -d "publish" 

我们访问nginx服务提供的web服务http://172.28.65.32/,在logstash的控制台 可以看到相应的访问access.log 日志

同时在ES 中也可以看到有相应的日志数据

三、直接通过rsyslog采集日志到logstash在送到ES

在很多情况下你需要采集的web服务器并不是自己能够控制的,不是说你想装filebeat就可以让你装的,这时候就可以要求目标数据源通过 syslog 的方式将日志发出来。我们可以再通过 logstash送到ES或其他的日志存储处理平台。

 

通过syslog往日志服务器上发nginx的日志有两种方式,一种就是利用nginx的配置往外发日志,一种就是通过配置linux的rsyslog的配置往外发日志。

1、通过nginx配置发送syslog到logstash

具体配置如下:

在nginx的配置文件nginx.conf中,在server下配置access_log和error_log的输出方式 

  1. access_log syslog:server=172.28.65.32:514,facility=local7,tag=nginx_access_log,severity=info 
  2. error_log syslog:server=172.28.65.32:514,facility=local7,tag=nginx_error_log,severity=info

配置完成后执行 ./nginx -s reload 使配置生效。这样就通过linux的rsyslog服务将nginx的日志往外发了。

接着来配置logstash的syslog的服务接收配置 。在logstash的安装目录下新建vi syslog-pipeline.conf,syslog-pipeline.conf的具体配置如下: 

  1. input {  
  2.     syslog{ 
  3.          type => "system-syslog"  
  4.         port => 514  
  5.     }  
  6.  
  7. output {  
  8.     elasticsearch {  
  9.         hosts => ["172.28.65.24:9200"]  
  10.         index => "system-syslog-%{+YYYY.MM}"  
  11.     }  
  12.     stdout { codec => rubydebug}  

input配置表示通过514端口接收syslog的数据。

output配置表示输出到elasticsearch,并且同时输出到标准输出也就是控制台。通过执行 bin/logstash -f syslog-pipeline.conf --config.reload.automatic 启动logstash

可以看到logstash启动以后开启了514端口的tcp和upd协议的侦听。

我们访问nginx服务提供的web服务http://172.28.65.32/,在logstash的控制台 可以看到相应的nginx访问access和error的日志

同样通过Elasticsearch-head在ES 中也可以看到有相应的日志数据

2、通过配置rsyslog发送syslog日志到logstash

有些老版本的nginx不支持配置syslog输出日志,或者说我想输出其他不是nginx的日志该怎么办呢?可以通过直接配置rsyslog的方式来往外发送日志。

在/etc/rsyslog.conf 中配置: 

  1. $IncludeConfig /etc/rsyslog.d/*.conf 

意思是可以引用外部的配置文件,引用外部的配置文件一方面可以不影响主配置文件,另一方面也比较好管理。

在/etc/rsyslog.d目录下新建nginx-log.conf,配置如下: 

  1. $ModLoad imfile  
  2. $InputFilePollInterval 1  
  3. $WorkDirectory /var/spool/rsyslog  
  4. $PrivDropToGroup adm  
  5. ##Nginx访问日志文件路径,根据实际情况修改:  
  6. $InputFileName /usr/local/nginx/logs/access.log  
  7. $InputFileTag nginx-access:  
  8. $InputFileStateFile stat-nginx-access  
  9. $InputFileSeverity info  
  10. $InputFilePersistStateInterval 25000  
  11. $InputRunFileMonitor  
  12. ##Nginx错误日志文件路径,根据实际情况修改:  
  13. $InputFileName /usr/local/nginx/logs/error.log  
  14. $InputFileTag nginx-error:  
  15. $InputFileStateFile stat-nginx-error  
  16. $InputFileSeverity error  
  17. $InputFilePersistStateInterval 25000  
  18. $InputRunFileMonitor  
  19. *.* @172.28.65:514 

配置好了以后,重启rsyslog服务。 

  1. systemctl restart rsyslog 

我们访问nginx服务提供的web服务http://172.28.65.32/,在logstash的控制台 可以看到同样的效果。

本文介绍了如何通过filebeat、logstash、rsyslog采集nginx的访问日志和错误日志的几种方式,具体需要根据实际情况灵活的运用。 

 

责任编辑:庞桂玉 来源: 民工哥技术之路
相关推荐

2021-04-27 09:45:33

Nginx日志运维

2019-04-25 08:28:58

工具LogstashFilebeat

2023-11-06 01:17:25

主机容器选项

2022-04-28 23:28:07

FilebeatRedis日志

2020-07-07 09:57:24

人脸识别人工智能数据

2023-07-07 07:29:53

Kubernetes容器

2021-03-08 09:15:46

日志Filebeat运维

2023-09-27 00:12:23

2021-09-07 09:34:04

CentOSfilebeatkafka

2022-05-20 07:44:10

AWS云服务器GrayLog

2023-12-17 14:36:05

2023-10-31 18:42:21

2013-09-05 09:37:49

2020-09-28 15:49:25

Python编程语言工具

2022-08-30 08:41:51

日志文件FileBeat配置

2023-10-26 08:19:34

2022-08-12 11:46:50

Kubernetes云原生开源

2023-01-14 15:38:07

日志管理工具

2011-06-30 09:30:57

rsyslogLinux日志红帽企业级

2023-12-14 08:19:56

Prometheus服务数据
点赞
收藏

51CTO技术栈公众号