Tsar服务器系统和应用信息的采集报告工具

Tsar介绍
Tsar是淘宝的一个用来收集服务器系统和应用信息的采集报告工具,如收集服务器的系统信息(cpu,mem等),以及应用数据(nginx、swift等),收集到的数据存储在服务器磁盘上,可以随时查询历史信息,也可以将数据发送到nagios报警。
Tsar能够比较方便的增加模块,只需要按照tsar的要求编写数据的采集函数和展现函数,就可以把自定义的模块加入到tsar中。
Tsar安装
Tsar目前托管在github上,下载编译安装步骤:

$git clone git://github.com/kongjian/tsar.git
$cd tsar
$make
$make install

安装后:
1、定时任务配置:/etc/cron.d/tsar,负责每分钟调用tsar执行采集任务;
2、日志文件轮转配置:/etc/logrotate.d/tsar,每个月会把tsar的本地存储进行轮转;
3、Tsar配置文件路径:/etc/tsar/tsar.conf,tsar的采集模块和输出的具体配置;
4、模块路径:/usr/local/tsar/modules,各个模块的动态库so文件;

Tsar配置

Tsar的配置主要都在/etc/tsar/tsar.conf中,常用的有:
增加一个模块,添加 mod_ on 到配置文件中
打开或者关闭一个模块,修改mod_ on/off
output_stdio_mod 能够配置执行tsar时的输出模块
output_file_path 采集到的数据默认保存到的文件(如果修改的话需要对应修改轮转的配置/etc/logrotate.d/tsar)
output_interface 指定tsar的数据输出目的,默认file保存本地,nagios/db输出到监控中心/数据库中,这两个功能还需要结合其它配置,具体见后面
Tsar使用
查看历史数据,tsar
-l/–list 查看可用的模块列表
-l/–live 查看实时数据,tsar -l –cpu
-i/–interval 指定间隔,历史,tsar -i 1 –cpu
–modname 指定模块,tsar –cpu
-s/–spec 指定字段,tsar –cpu -s sys,util
-d/–date 指定日期,YYYYMMDD或者n代表n天前
-C/–check 查看最后一次的采集数据
-d/–detail 能够指定查看主要字段还是模块的所有字段
-h/–help 帮助功能

高级功能
输出到nagios

配置: 首先配置output_interface file,nagios,增加nagios输出
然后配置nagios服务器和端口,以及发送的间隔时间

####The IP address or the host running the NSCA daemon
server_addr nagios.server.com
####The port on which the daemon is running – default is 5667
server_port 8086
####The cycle of send alert to nagios
cycle_time 300

由于是nagios的被动监控模式,需要指定nsca的位置和配置文件位置
####nsca client program
send_nsca_cmd /usr/bin/send_nsca
send_nsca_conf /home/a/conf/amon/send_nsca.conf

接下来指定哪些模块和字段需要进行监控,一共四个阀值对应nagios中的不同报警级别
####tsar mod alert config file
####threshold [hostname.]servicename.key;w-min;w-max;c-min;cmax;
threshold cpu.util;50;60;70;80;

输出到Mysql

配置: 首先配置output_interface file,db,增加db输出
然后配置哪些模块数据需要输出
output_db_mod mod_cpu,mod_mem,mod_traffic,mod_load,mod_tcp,mod_udpmod_io

然后配置sql语句发送的目的地址和端口
output_db_addr console2:56677

目的地址在该端口监听tcp数据,并且把数据入库即可,可以参照 tsar2db。

监控nginx实例:
打开nginx的status页面:
location /nginx_status {
stub_status on;
}

修改mod_nginx.c文件,此文件在tsar安装目录下的modules目录中:
static void
init_nginx_host_info(struct hostinfo *p)
{
char *port;
p->host = getenv(“NGX_TSAR_HOST”);
p->host = p->host ? p->host : “127.0.0.1”; #默认是127.0.0.1
port = getenv(“NGX_TSAR_PORT”);
p->port = port ? atoi(port) : 80; #监控的端口,如果大家有多个虚拟机主机,需要注意
p->uri = getenv(“NGX_TSAR_URI”);
p->uri = p->uri ? p->uri : “/nginx_status”;

p->server_name = getenv(“NGX_TSAR_SERVER_NAME”);
p->server_name = p->server_name ? p->server_name : “test.abc.com”; #server_name 根据nginx.conf 修改

注:当不修改mod_nginx.c文件内的变量时,tsar会找当前nginx内的default主机,不会找配置有nginx_status的虚拟主机,这个问题找了好几天。。。

参考:http://blog.51cto.com/luyafei/1198387
https://github.com/alibaba/tsar
https://blog.csdn.net/manzhe/article/details/23748513

发表评论