Práticas recomendadas para recuperação de desastre no Project Server 2007
Atualizado: março de 2009
Tópico modificado em: 2009-03-02
Um plano de recuperação de desastre deve assegurar que todos os seus sistemas e dados possam ser restaurados à sua operação normal em caso de desastre natural (como incêndio) ou técnico (como falha de dois discos em uma matriz RAID-5. Ao criar um plano de recuperação de desastre, identifique todas as ações que devem ocorrer em resposta a uma catástrofe.
Teste inteiramente o plano de backup e recuperação antes de implantar o Microsoft Office Project Server 2007 em um ambiente de produção. Durante o teste, procure áreas vulneráveis simulando quantos cenários de falha forem possíveis. Recomendamos verificar se o plano de recuperação de desastre está simulando a ocorrência de uma catástrofe.
Ao planejar a estratégia de recuperação de desastre, considere o seguinte:
Para que mídia você enviará o backup (fita ou disco)?
Você fará os backups manualmente ou programará sua realização automática?
Se os backups forem automáticos, como você verificará que eles ocorreram com êxito?
Como você assegurará que os backups são utilizáveis?
Por quanto tempo os backups ficarão salvos antes que a mídia seja reutilizada?
Ocorrendo uma falha, quanto tempo será necessário para restaurar o backup mais recente? O período de inatividade é aceitável?
Onde você armazenará os backups? As pessoas adequadas terão acesso a eles?
Se o administrador do sistema responsável não estiver disponível, alguma outra pessoa conhece as senhas e os procedimentos para realizar backups e, se necessário, restaurar o sistema?
Recomendamos fazer o seguinte, como parte do plano de recuperação de desastre:
Use Visualizar Eventos do Microsoft Windows diariamente para verificar erros e avisos no log do sistema e no log de aplicativos dos seus servidores de produção.
Mantenha sempre um disco de reparação de emergência do Windows ou uma Recuperação Automatizada do Sistema (ASR) definida para cada servidor da implantação. Consulte a Ajuda do Windows para obter mais informações.
Verifique se todos os servidores estão protegidos por software antivírus adequado. Mantenha o software atualizado com os arquivos de assinatura de vírus mais recentes. Use o recurso de atualização automática do antivírus para manter a assinatura atualizada.
Tipos de eventos
Os administradores do sistema devem proteger suas redes contra perda de dados e inatividade do sistema. Isso envolve a realização de procedimentos de rotina contínuos e etapas extraordinárias para prevenir ou resolver períodos de inatividade inesperados.
Algumas das possíveis causas da inatividade do sistema incluem:
Falha do subsistema do disco rígido
Falha de energia
Falha no software do sistema
Uso acidental ou mal intencionado de comandos de exclusão ou modificação
Vírus destrutivos
Desastres naturais
Furto ou sabotagem
A probabilidade de ocorrência desses eventos varia de acordo com a organização, mas todos podem prejudicar a implantação do Office Project Server 2007. Recomendamos que você avalie sua vulnerabilidade a vários tipos de eventos e tome as providências necessárias para minimizar a exposição da empresa.
Considerações sobre o espaço no disco rígido
Você precisa ter espaço suficiente no disco rígido para restaurar o banco de dados e os arquivos de log dos computadores que executam o SQL Server. Backups muito grandes não caberão no local original. Por exemplo, um backup Normal realizado uma vez por semana, mais seis dias de backups do tipo Diferencial, podem exigir mais espaço em disco durante uma restauração do que o disponível no servidor.
Além disso, nunca deixe sua unidade do banco de dados com mais da metade de sua capacidade ocupada. Embora a unidade de banco de dados com menos da metade ocupada constitua espaço em disco não usado, ela ainda pode reduzir o tempo de inatividade estendido do servidor pelas seguintes razões:
Você pode restaurar bancos de dados mais rápido do que com a unidade cheia (principalmente se o sistema de arquivos estiver fragmentado).
Você pode fazer o backup de uma cópia dos bancos de dados no mesmo disco físico antes de restaurá-los, o que lhe permite tentar reparar os bancos de dados se ocorrer algum problema durante o processo de restauração (por exemplo, se o backup existente contiver erros).
Usando padrões de hardware
Adote um padrão para hardware e aplique-o com a maior frequência possível. Use esses mesmos tipos de componentes, como placas de rede, controladores de disco e placas de vídeo, em todos os componentes. Use este perfil de computador padrão para todos os aplicativos, mesmo que seja mais que o necessário para alguns aplicativos. As únicas modificações que devem ser feitas no hardware referem-se à quantidade de memória, ao número de CPUs e às configurações de disco rígido.
Os padrões de hardware oferecem as seguintes vantagens para sua organização:
Ter uma única plataforma reduz a quantidade de testes necessários.
Ao aplicar atualizações de driver ou de softwares aplicativos, você só precisa realizar um teste antes de implantar as atualizações em todos os computadores.
Como somente um tipo de sistema precisa ter suporte, o pessoal de suporte precisa de menos treinamento.
Não é preciso manter muitas peças sobressalentes no local, o que reduz o custo para a organização.
Mantenha peças sobressalentes e de reserva no local e inclua equipamentos sobressalentes em qualquer orçamento de hardware. O número de peças sobressalentes mantidas no local varia de acordo com a configuração e as condições de falha que os usuários e o pessoal operacional podem tolerar.
Algumas peças, como a memória e a CPU, são fáceis de encontrar mesmo anos depois da aquisição da peça original. Outras, como discos rígidos, são mais difíceis de encontrar após poucos anos. Nesse caso, e se for necessário usar peças exatamente iguais, planeje a compra de sobressalentes ao adquirir o equipamento. Considere usar prestadoras de serviço ou contratos de prestação de serviço com um fornecedor para delegar a responsabilidade, ou mantenha uma ou duas reservas de cada componente essencial em um local centralizado.
Mantendo registros de hardware
Para limitar a quantidade de tempo gasto na solução de problemas de configuração de hardware durante uma recuperação de desastre, mantenha registros de configuração de hardware atualizados, incluindo:
Uma lista de todas as informações de contato de fornecedores, com números de telefone, endereços de email e páginas da Web para suporte online.
Uma lista do hardware de cada servidor, com versões de atualização de firmware e versões do driver do hardware (essas informações de hardware podem ser encontradas no Gerenciador de Dispositivos do Windows).
Uma lista de informações de BIOS, de configuração do disco rígido e de configurações de jumper do hardware do servidor.
Importante: |
---|
Mantenha uma cópia externa destas informações caso haja danos nas suas instalações e você precise recuperar seus sistemas em um novo local. |
Mantendo registros de software
Para limitar a quantidade de tempo gasto na solução de problemas relacionados a software durante uma recuperação de desastre, mantenha registros de software atualizados, incluindo:
Informações de contato dos seus fornecedores de software, com números de telefone, endereços de email e páginas da Web para suporte online.
Uma lista cronológica de todas as atualizações de software (como service packs) e patches de software instalados nos servidores. Mantendo essa lista, você pode instalar as atualizações de software na mesma ordem da instalação original.
Um registro da configuração de cada servidor, incluindo:
Nome do servidor.
Nome do grupo administrativo ao qual pertence o servidor.
Informações de configuração do disco rígido, incluindo uma lista de cada partição de disco rígido com os nomes e tamanhos de volumes das partições e um resumo do que foi instalado em cada uma.
Lista de endereços IP, máscaras de sub-rede e gateways padrão usados pelo servidor.
Um registro das informações de configuração do cluster, se sua topologia inclui clusters.
Personalizações feitas no servidor, como personalizações do Project Web Access.
Informações de configuração de qualquer Provedor de Serviços Compartilhados, aplicativos Web, sites ou outras configurações.
Importante: Mantenha uma cópia externa destas informações caso haja danos nas suas instalações e você precise recuperar seus sistemas em um novo local.
Planejando contingências de hardware
Para minimizar os custos da inatividade, incluindo perdas em vendas e produtividade, mantenha o hardware substituto imediatamente disponível para os servidores de produção. Os tipos de hardware que precisam ter substitutos imediatos disponíveis incluem servidores de backup alternativos, adaptadores de rede, placas de vídeo e controladora de disco rígido, roteadores, cabos, discos rígidos, placas-mãe e fontes de alimentação.
Oferecendo treinamento e documentação
Verifique se os administradores, os operadores e a equipe de suporte de sua organização têm acesso a várias oportunidades de treinamento e à documentação relativa a problemas de recuperação de desastre.
Se um ou mais servidores apresentar problemas, o tempo de inatividade subsequente poderá sair caro. No entanto, se você investir em bons cursos de treinamento e em manuais técnicos atualizados para os administradores, operadores e equipe de suporte do servidor, sua organização estará preparada, e o tempo de inatividade será reduzido.
Você também pode realizar simulações de recuperação de desastre ocasionais em domínios separados, de não produção. Essas simulações familiarizam administradores, operadores e equipe de suporte com procedimentos de recuperação, bem como indicam deficiências nas estratégias de backup e recuperação. Atualize sua documentação com os procedimentos ou práticas desenvolvidos durante essas simulações.
Baixar este manual
Este tópico está incluído no seguinte manual baixável para facilitar a leitura e a impressão:
Consulte a lista completa de manuais disponíveis na página de download de conteúdo do Project Server 2007 (em inglês).