Análise de disponibilidade e recuperação de serviços em infraestrutura de computação em nuvem
Carregando...
Data
Título da Revista
ISSN da Revista
Título de Volume
Editor
004
Resumo
Este trabalho analisa estratégias que garantem a disponibilidade de serviços e a continuidade de negócios em ambientes de computação em nuvem. A pesquisa combina revisão bibliográfica e um estudo prático realizado em um provedor PaaS para avaliar como redundância, tolerância a falhas, elasticidade e automação contribuem para alta disponibilidade. Também são considerados mecanismos de monitoramento contínuo e práticas de Site Reliability Engineering (SRE). A prova de conceito inclui testes de estresse e falhas controladas, permitindo mensurar estabilidade, códigos de resposta e tempos de recuperação (MTTR). Os resultados mostram que ambientes em nuvem, quando configurados corretamente, oferecem recursos nativos que sustentam SLAs elevados e possibilitam recuperação rápida de serviços críticos.
This study analyzes strategies that ensure service availability and business continuity in cloud computing environments. The research combines a structured literature review with a practical study conducted on a PaaS/IaaS provider to evaluate how redundancy, fault tolerance, elasticity, and automation contribute to high availability. Continuous monitoring mechanisms and Site Reliability Engineering (SRE) practices are also considered. The proof of concept includes stress tests and controlled failures, allowing the measurement of stability, response codes, and recovery times (MTTR). The results show that cloud environments, when properly configured, provide native resources that support high SLA levels and enable rapid recovery of critical services.
This study analyzes strategies that ensure service availability and business continuity in cloud computing environments. The research combines a structured literature review with a practical study conducted on a PaaS/IaaS provider to evaluate how redundancy, fault tolerance, elasticity, and automation contribute to high availability. Continuous monitoring mechanisms and Site Reliability Engineering (SRE) practices are also considered. The proof of concept includes stress tests and controlled failures, allowing the measurement of stability, response codes, and recovery times (MTTR). The results show that cloud environments, when properly configured, provide native resources that support high SLA levels and enable rapid recovery of critical services.
Descrição
Palavras-chave
Citação
SOUZA, Davi Vinco; ANTUNES, Rafael Ciavolelo. Análise de disponibilidade e recuperação de serviços em infraestrutura de computação em nuvem, 2025. Trabalho de Conclusão de Curso (Curso Superior de Tecnologia em Segurança da Informação) - Faculdade de Tecnologia de Americana “Ministro Ralph Biasi”, Americana, 2025.