check_ganglia_metric

Tela Software:
check_ganglia_metric
Detalhes de Software:
Versão: 2012.02.28
Data de upload: 15 Apr 15
Licença: Livre
Popularidade: 1

Rating: 3.0/5 (Total Votes: 1)

check_ganglia_metric é um plugin Nagios que lhe permite disparar alertas sobre qualquer Ganglia métrica.
check_ganglia_metric foi fortemente inspirado por check_ganglia_metric.php de Vladimir Vuksan, mas ele vem com uma série de melhorias.

Instalação

# Pip instalar check_ganglia_metric
... Ou:
# Easy_install check_ganglia_metric
Configuração Ganglia
A menos que seu servidor Nagios e Ganglia Meta Daemon estão rodando na mesma máquina, você provavelmente precisará de editar o seu gmetad.conf para permitir conexões remotas de seu servidor Nagios.
Para permitir conexões de nagios-server.example.com:
trusted_hosts nagios-server.example.com
Para permitir conexões de todos os hosts (provavelmente um risco de segurança):
all_trusted em
Testing na linha de comando
Primeiro, vamos ver se check_ganglia_metric pode se comunicar com os gânglios Meta Daemon:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle
Estado Ok, Inativo CPU = 99,3% | cpu_idle = 99,3% ;;;;
A mensagem "Status Ok" indica que check_ganglia_metric está funcionando. Se você está tendo problemas para fazer este trabalho, tente novamente com o registro detalhado habilitado (--verbose), a fim de obter uma melhor visão sobre o que está acontecendo de errado.
Agora vamos tentar definir um limiar de alerta:
check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = host.example.com --metric_name = cpu_idle --critical = 99
Estado crítico, Inativo CPU = 99,6% | cpu_idle = 99,6% ;; 99 ;;
Dissemos check_ganglia_metric para retornar um status "Critical" se a CPU ocioso foi maior do que 99. A mensagem "Status Critical" indica que ele trabalhou. Note-se que check_ganglia_metric analisa intervalos e limites de acordo com as diretrizes de desenvolvimento do plugin oficiais Nagios.
Para ver uma lista completa de opções de linha de comando com breves explicações, correm check_ganglia_metric com a opção --help.
Configuração do Nagios
Em primeiro lugar, criar uma definição de comando:
comando define {
& Nbsp; check_ganglia_metric command_name
& Nbsp; command_line /usr/bin/check_ganglia_metric.py --gmetad_host = gmetad-server.example.com --metric_host = $ HostAddress $ --metric_name = $ ARG1 $ --warning = $ ARG2 $ --critical = $ ARG3 $
}
Agora você pode usar o comando acima em suas definições de serviço:
definir serviço {
& Nbsp; service_description CPU ociosa - Ganglia
& Nbsp; uso some_template
! & Nbsp; check_command check_ganglia_metric cpu_idle 0: 20 0: 0!
& Nbsp; host_name host.example.com
}
Isso vai funcionar bem até que algo vai mal com check_ganglia_metric (por exemplo, o arquivo de cache não pode ser lido / escrito para, o gânglio Meta Daemon não pode ser alcançado, etc.). Nesse ponto, todos os serviços que se baseia em check_ganglia_metric irá falhar, possivelmente, inundando-o com alertas. Podemos evitar isso através do uso de dependências de serviço.
A primeira coisa que precisamos é de uma definição de comando para verificar a idade de um arquivo:
comando define {
& Nbsp; check_file_age command_name
& Nbsp; command_line / usr / lib / nagios / plugins / check_file_age -f $ ARG1 $ w $ ARG2 $ -c $ ARG3 $
}
Em seguida, vamos definir um serviço que verifica a idade de arquivo cache do check_ganglia_metric. Note-se que, para ser verdadeiramente eficaz, este serviço deve ser verificado, pelo menos, como (de preferência mais) freqüência do que todas as outras verificações que dependem de check_ganglia_metric:
definir serviço {
& Nbsp; Cache service_description para check_ganglia_metric
& Nbsp; uso some_template
& Nbsp;!! Check_command check_file_age /var/lib/nagios/.check_ganglia_metric.cache 60 120
& Nbsp; localhost host_name
& Nbsp; check_interval 1
& nbsp; max_check_attempts 1
}
E, finalmente, montamos a dependência de serviço real. Note que eu habilitado use_regexp_matching em Nagios, o que me permite usar expressões regulares em minhas diretrizes. Furando "- Gânglios" no final de cada serviço que se baseia em check_ganglia_metric, posso salvar-me um grande esforço:
definir servicedependency {
& Nbsp; localhost host_name
& Nbsp; Cache service_description para check_ganglia_metric
& Nbsp; dependent_host_name *.
& Nbsp;. Dependent_service_description * - Ganglia $
& Nbsp; execution_failure_criteria c, p
}
Agora, se algo der errado com check_ganglia_metric, apenas um alerta será enviado para fora sobre o arquivo de cache, e todos os cheques de serviços dependentes serão pausa até que você corrigir o problema que causou check_ganglia_metric a falhar. Assim que o problema for corrigido, você vai precisar atualizar o timestamp do arquivo de cache, a fim de colocar o "Cache para check_ganglia_metric" serviço de volta para um estado OK (o que irá permitir o controlo de serviços dependentes para continuar):
& Nbsp; toque /var/lib/nagios/.check_ganglia_metric.cache
Dicas e Truques
É possível obter uma lista completa dos exércitos e métricas disponíveis, permitindo logging "mais detalhada" (-vv). Desde são necessárias as opções metric_host e METRIC_NAME, você tem um pouco de um "ovo e da galinha" problema aqui, mas isso é OK. Basta fornecer alguns dados fictícios. O plugin erro no final com um "host / métrica não encontrado" erro, mas não antes que ele despeja seu cache:
& Nbsp; check_ganglia_metric.py --gmetad_host = gmetad-server.example.com
& Nbsp; - metric_host = --metric_name manequim = -vv manequim

O que é novo nesta versão:

  • Adicionar - opção -metrics_max_age
  • Mesclar CHANGELOG.rst em README.rst

Requisitos :

  • Python
  • Nagios

Limitações :

  • Não funciona com Python 2.4

Programas semelhantes

Zorka
Zorka

17 Feb 15

MasterShaper
MasterShaper

3 Jun 15

NetXMS
NetXMS

17 Feb 15

Opsview
Opsview

20 Feb 15

Comentário para check_ganglia_metric

Comentários não encontrado
Adicionar comentário
Ligue imagens!