Pesquisa de site

Lista de verificação de manutenção de servidor: lista de 15 pontos usada por profissionais de TI


Servidores dedicados são um componente essencial de qualquer empresa. A continuidade dos negócios depende de servidores funcionando o tempo todo, e cada erro leva a um tempo de inatividade dispendioso. É por isso que a manutenção do servidor é tão importante.

Manter um servidor funcionando envolve mais do que apenas carregar os patches e atualizações mais recentes. Use nossa lista de verificação de manutenção do servidor para garantir o bom funcionamento do seu servidor e evitar tempo de inatividade.

Aqui está nossa lista de 15 dicas de manutenção de servidor para ajudá-lo a gerenciar melhor seu hardware e evitar os problemas mais comuns.

1. Verifique e verifique seus backups

Se você já teve que se recuperar de uma falha catastrófica na unidade, sabe como os dados são importantes para o bom funcionamento de um negócio.

Com uma boa estratégia de backup, é melhor tê-los e não precisar deles, do que precisar deles e não tê-los. Agende alguns minutos toda semana (ou todos os dias) para verificar os backups do servidor. Como alternativa, espelhe o ambiente do servidor em uma máquina virtual na nuvem e teste-o regularmente.

2. Verifique a matriz RAID

Muitos servidores dedicados executam um array RAID (Redundant Array of Independent Disks). No RAID, vários discos rígidos atuam como um dispositivo de armazenamento no caso de falha de um único disco.

Alguns tipos de RAID são projetados para desempenho, outros para redundância. Na maioria dos casos, as matrizes RAID modernas possuem ferramentas avançadas de monitoramento. Uma rápida olhada no utilitário de monitoramento RAID pode alertá-lo sobre possíveis falhas na unidade. Isso permite planejar substituições e reconstruções de unidades de forma a minimizar o tempo de inatividade.

3. Verifique a utilização do armazenamento

Verifique periodicamente o uso do disco rígido dos seus servidores. Os servidores geram muitos arquivos de log, e-mails antigos e pacotes de software desatualizados.

Se for importante manter arquivos de log antigos, considere arquivá-los em armazenamento externo. E-mails antigos também podem ser arquivados ou excluídos. Alguns atualizadores de aplicativos não removem arquivos antigos. Felizmente, alguns gerenciadores de pacotes possuem protocolos de limpeza integrados que você pode usar. Você também pode encontrar utilitários de terceiros para gerenciar arquivos de software antigos.

Os discos rígidos não são usados apenas para armazenamento. Eles também usam um arquivo de troca, que funciona como memória física. Se a utilização do disco ultrapassar 90%, isso poderá interferir no arquivo de troca, o que poderá degradar gravemente o desempenho.

4. Revise o uso de recursos do servidor

Além de revisar o espaço em disco, também é aconselhável observar outros usos do servidor.

O uso da memória e do processador pode mostrar o quanto um servidor está sendo usado. Se o uso da CPU e da memória estiver frequentemente próximo de 100%, é um sinal de que seu servidor pode estar sobrecarregado. Considere reduzir a carga do seu hardware atualizando ou adicionando servidores adicionais. Outras opções incluem reatribuir determinadas cargas de trabalho a um ambiente de nuvem, implementando assim uma solução de nuvem híbrida.

5. Atualize seu painel de controle

O software do painel de controle (como cPanel) deve ser atualizado manualmente. Ao atualizar o cPanel, apenas o painel de controle é atualizado. Você ainda precisa atualizar os aplicativos que ele gerencia, como Apache e PHP.

6. Atualizar aplicativos de software

Dependendo da configuração do seu servidor, você poderá ter muitos aplicativos de software diferentes. Alguns sistemas possuem gerenciadores de pacotes que podem atualizar software automaticamente. Para aqueles que não o fazem, crie um cronograma para revisar as atualizações de software disponíveis.

Isto é especialmente verdadeiro para aplicativos baseados na Web, que são responsáveis pela grande maioria das violações. Tenha em mente que alguns sistemas operacionais podem exigir especificamente versões de aplicativos mais antigas. Nos casos em que for necessário usar software mais antigo em um ambiente de produção, tome cuidado para evitar expor esse software a uma rede aberta.

Saiba mais sobre como automatizar o processo de gerenciamento de servidores consultando nosso artigo Guia de automação de servidores.

7. Examine as ferramentas de gerenciamento remoto

Verifique as ferramentas de gerenciamento remoto, incluindo console remoto, reinicialização remota e modo de recuperação. Eles são especialmente importantes se você executa um ambiente de servidor virtual baseado em nuvem ou gerencia seus servidores remotamente. Proteja o acesso remoto para seus funcionários se o trabalho remoto for praticado pela sua organização.

Verifique esses utilitários regularmente para ter certeza de que estão funcionando. A reinicialização pode resolver muitos problemas por si só. Um console remoto permite que você faça login em um servidor sem estar fisicamente presente. O modo de resgate é uma solução da Red Hat, mas a maioria dos sistemas operacionais de servidor possui um modo de gerenciamento ou de segurança que você pode inicializar remotamente para fazer reparos.

8. Verifique a utilização da rede

Assim como o uso de memória e CPU, as cargas do servidor têm capacidade de rede. Se o seu servidor estiver próximo da capacidade máxima do hardware de rede, considere instalar atualizações. Além da capacidade da rede, você pode considerar o uso de ferramentas de monitoramento de rede. Essas ferramentas podem monitorar o tráfego da rede em busca de uso incomum ou problemático.

O monitoramento dos padrões de tráfego pode ajudá-lo a otimizar o tráfego da web. Por exemplo, você pode migrar recursos acessados com frequência para um servidor mais rápido. Você também pode rastrear comportamentos incomuns para identificar tentativas de invasão e violações de dados e gerenciá-los de forma proativa.

9. Verifique as atualizações do sistema operacional

As atualizações do sistema operacional podem ser um campo complicado de navegar. Por um lado, patches e atualizações podem resolver problemas de segurança, expandir a funcionalidade e melhorar o desempenho. Os hackers geralmente planejam ataques de segurança cibernética em torno de explorações de “dia zero”. Ou seja, eles analisam os patches do sistema operacional lançados e atacam esses pontos fracos antes que uma empresa possa corrigir a vulnerabilidade.

Por outro lado, software personalizado pode enfrentar conflitos e instabilidade com atualizações de software. Dedique tempo regularmente para revisar as atualizações do sistema operacional. Se você tiver um ambiente de produção confidencial, considere criar um ambiente de teste para testar as atualizações antes de implementá-las na produção.

10. Hardware de servidor fisicamente limpo

Agende um tempo para limpar fisicamente e inspecionar os servidores para evitar falhas de hardware. Isso ajuda a manter a poeira e detritos longe das placas de circuito e dos ventiladores.

O acúmulo de poeira interfere no gerenciamento do calor, e o calor é inimigo do desempenho do servidor. Durante a limpeza, inspecione visualmente os servidores e o ambiente do servidor. Certifique-se de que os gabinetes tenham bastante fluxo de ar. Verifique se há alguma fiação incomum nas conexões. Uma unidade flash inesperada pode ser uma violação de segurança. Um cabo de rede não autorizado pode criar uma preocupação com a privacidade dos dados.

11. Verifique se há erros de hardware

Os sistemas operacionais de servidores modernos mantêm registros de erros de hardware.

>

Um erro de hardware pode ser um erro SMART em um disco rígido com falha, um erro de driver para um dispositivo com falha ou erros aleatórios que podem indicar um problema de memória. Verificar seus logs de erros pode ajudá-lo a identificar e resolver um problema de hardware antes que ele se transforme em uma falha no sistema.

12. Revise a segurança da senha

Avalie sua política de senha regularmente. Se você não estiver usando um sistema de gerenciamento de senhas empresariais, comece agora.

Você deve ter um sistema que automatize uma boa higiene de senhas. Caso contrário, este pode ser um bom momento para instruir os usuários a alterar as senhas manualmente.

13. Avalie contas de usuário

A maioria das empresas tem algum nível de rotatividade e é fácil ignorar as contas dos usuários.

Revise a lista de contas de usuário periodicamente e remova todas as contas de usuário que não sejam mais necessárias. Você também pode verificar as permissões da conta para ter certeza de que são apropriadas para cada usuário. Ao revisar esses dados, você também deve examinar os dados e contas dos clientes. Pode ser necessário remover manualmente os dados de antigos clientes para evitar complicações legais ou de segurança

14. Considere a segurança geral do servidor

Avalie as políticas de segurança do seu servidor para garantir que estejam atualizadas e funcionando. Considere usar uma ferramenta de segurança de rede de terceiros para testar sua rede externamente. Isso pode ajudar a identificar áreas que você negligenciou e a evitar violações antes que elas ocorram.

15. Verifique os logs do servidor regularmente

Os servidores mantêm logs que rastreiam acessos e erros no servidor. Esses logs podem ser extensos, mas algumas ferramentas e procedimentos facilitam seu gerenciamento.

Revise seus logs regularmente para se familiarizar com a operação de seus servidores. Um erro registrado pode identificar um problema de hardware que você pode corrigir antes que ele falhe. Anomalias nos logs de acesso podem significar uso não autorizado por usuários ou acesso não autorizado de um intruso.

A manutenção regular do servidor reduz o tempo de inatividade e falhas

Com esta lista de verificação, você deverá entender melhor como realizar a manutenção de rotina do servidor.

A manutenção regular garante que pequenos problemas do servidor não se transformem em falhas desastrosas do sistema. Muitas falhas de servidores como resultado de situações evitáveis devido a um planejamento inadequado.

Artigos relacionados