使用Loki收集网络设备日志
前言
Loki是Grafana Labs团队的开源项目,是一个水平可扩展,高可用性,多租户的日志聚合系统,它的设计非常简洁易于操作。
受Prometheus启发的,可以水平扩展、高可用以及支持多租户的日志聚合系统,使用了和Prometheus相同的服务发现机制,将标签添加到日志流中而不是构建全文索引,从promtail接收到的日志和应用的Metrics指标就有相同的标签集,不仅提供了更好的日志和指标之间的上下文切换,还避免了对日志进行全文索引。
日常的网络运维中,如果能把网络设备的日志收集起来,集中查看,在处理故障或日常巡检时,会比较方便一些
如果没有专业的日志收集硬件或软件设备,那么可以搭建Loki进行收集,并使用Grafana查看收集好的日志
本文的主要内容如下:
- 如何安装部署loki
- 如何配置网络设备的syslog
- 如何使用rsyslog收集到网络设备的日志
- 如何配置Grafana并查看日志
环境准备
1台主机,可以是云主机、虚机,可以根据日志的多少来决定配置的大小,本实验中的配置是4C8G的
OS为Debian11,但其他发行版如CentOS,大部分情况下也是适用的
该主机将会安装loki,rsyslog、promtail
*本文档不再介绍如何安装Grafana
安装部署Loki
- 下载最新的版本
https://github.com/grafana/loki/releases/[1]
在Linux中安装时可下载loki-linux-amd64.zip - 解压可执行文件到目标目录
unzip -d /usr/local/bin/ loki-linux-amd64.zip
- 创建用户
useradd -r -s /sbin/nologin loki
- 创建配置文件
mkdir -pv /etc/loki /data/loki
chown -R loki:loki /etc/loki
- 编辑Loki的配置文件
auth_enabled: false
server:
http_listen_port: 3100
grpc_listen_port: 9096
common:
path_prefix: /data/loki
storage:
filesystem:
chunks_directory: /data/loki/chunks
rules_directory: /data/loki/rules
replication_factor: 1
ring:
instance_addr: 10.20.20.20
kvstore:
store: inmemory
schema_config:
configs:
- from: 2020-10-24
store: boltdb-shipper
object_store: filesystem
schema: v11
index:
prefix: index_
period: 24h
ruler:
alertmanager_url: http://localhost:9093
- 请修改以上几项内容
- instance_addr,修改为安装主机的IP地址
- alertmanager_url:修改为alertmanager的url,本次并未使用alertmanager,所以写的localhost
- 编辑Systemd[2]的服务配置文件
vim /lib/systemd/system/loki.service
[Unit]
Description=Loki service
After=network.target
[Service]
Type=simple
User=loki
ExecStart=/usr/local/bin/loki-linux-amd64 -config.file /etc/loki/loki-my-config.yaml
[Install]
WantedBy=multi-user.target
- 启动并设置为开机自启动
systemctl start loki; systemctl enable loki
systemctl status loki
安装并配置promtail
- 从https://github.com/grafana/loki/releases[3]下载安装包
- 下载示例的配置文件
wget https://raw.githubusercontent.com/grafana/loki/master/cmd/promtail/promtail-local-config.yaml
也可以直接使用如下的示例配置,注意个别地址需要修改,已进行注释
server:
http_listen_port: 9080
grpc_listen_port: 0
positions:
filename: /etc/promtail/positions.yaml
clients:
# 将地址修改为实际的 loki Server 的地址
- url: http://10.20.20.20:3100/loki/api/v1/push
scrape_configs:
- job_name: loki
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: whcq
vendor: loki
hostname: m-loki
__path__: /var/log/network/m-loki-127.0.0.1.log
- job_name: syslog
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: whcq # 设备的机房或者所在的位置
vendor: huawei # 品牌
hostname: Test-S6720-254 # 主机名
__path__: /var/log/network/Test-S6720-254-10.20.99.254.log # 日志的路径
- job_name: syslog
static_configs:
- targets:
- localhost
labels:
job: syslog
env: prod
location: shbd
vendor: cisco
hostname: Test-C3560G
__path__: /var/log/network/192.168.99.254-192.168.99.254.log
- 调整promtail执行文件和配置文件的路径
mv promtail-linux-amd64 /usr/local/bin/
mkdir -pv /etc/promtail; mv promtail-local-config.yaml config-promtail.yml
- 创建用户并修改文件的权限
useradd -r promtail
chown promtail:promtail /tmp/positions.yaml
- 编辑 Promtail.service
vim /lib/systemd/system/promtail.service
[Unit]
Description=Promtail service
After=network.target
[Service]
Type=simple
User=promtail
ExecStart=/usr/local/bin/promtail -config.file /etc/promtail/config-promtail.yml
[Install]
WantedBy=multi-user.target
- 启动服务
systemctl start promtail
systemctl enable promtail
使用rsyslog收集到网络设备的日志
· 搭建并配置rsyslog
- 配置文件如下
vim /etc/rsyslog.conf
# provides UDP syslog reception
module(load="imudp")
input(type="imudp" port="514")
# provides TCP syslog reception
module(load="imtcp")
input(type="imtcp" port="514")
$template IpTemplate,"/var/log/network/%HOSTNAME%-%FROMHOST-IP%.log"
*.* ?IpTemplate
& ~
%HOSTNAME%-%FROMHOST-IP%.log
是日志文件的名字,表示主机名+发送源主机的IP
- 重启服务
systemctl restart rsyslog
配置交换机发送日志到Loki
· Cisco交换机
# 设置发送日志的源端口
logging source-interface Vlan99
# 设置目标主机
logging 10.20.20.20
· 华为交换机
# 根据实际情况修改源接口,或者不配置
info-center loghost source Vlanif999
# 设置 syslog 的目标主机
info-center loghost 10.20.20.20
# 默认情况下是Info级别,所以此命令可以不执行
info-center source default channel loghost log level informational
· 配置Grafana
- 导入ID为13639的Dashboard
- 配置Variables,建议的配置如下
3. 查看日志
参考资料:
[1]https://github.com/grafana/loki/releases/: https://github.com/grafana/loki/releases/[2]Systemd: https://www.wolai.com/5YUVEN1zqVdZG2inbWBKh9[3]https://github.com/grafana/loki/releases: https://github.com/grafana/loki/releases
文章转载自公众号:新钛云服