A Amazon Web Services (AWS), divisão de computação em nuvem da Amazon, anunciou o lançamento do DevOps Agent, uma ferramenta inovadora de Inteligência Artificial (IA) destinada a identificar a causa-raiz de problemas técnicos que resultam em interrupções e apagões de serviços.
Na prática, esta tecnologia tem como principal objetivo reduzir drasticamente o tempo de inatividade e a duração da investigação de incidentes, acelerando significativamente a recuperação dos serviços.
Como a IA da AWS Encontra a Causa dos Apagões
O DevOps Agent é impulsionado por modelos de IA desenvolvidos tanto pela Amazon quanto por outros fornecedores. Para prever a origem dos problemas técnicos, a plataforma utiliza dados e informações de tecnologias de terceiros especializadas em monitoramento de softwares e operações, como Datadog e Dynatrace.
O principal benefício para as empresas é a agilidade na correção. Em vez de depender de funcionários de plantão para notar o problema e, só então, iniciar a longa investigação para descobrir a causa, o DevOps Agent:
- Fornece imediatamente a origem do erro.
- Aciona os agentes responsáveis pela correção com rapidez.
De acordo com Swami Sivasubramanian, vice-presidente de IA agente da AWS, o funcionário responsável já inicia o trabalho com um relatório de incidente contendo informações suficientes para chegar à solução, economizando horas de diagnóstico.
Testes Demonstram a Eficácia
O anúncio do DevOps Agent ocorre durante a semana do evento Reinvent da AWS, em Las Vegas. A AWS já disponibilizou uma versão prévia para clientes interessados se inscreverem e testarem a ferramenta antes de ela se tornar um serviço pago.
O Commonwealth Bank of Australia foi uma das primeiras instituições a testar a novidade. A Amazon revelou que o software conseguiu encontrar a causa de um problema em menos de 15 minutos, algo que levaria horas para ser detectado por um engenheiro experiente.
Concorrência: Vale notar que a iniciativa não é inédita no setor. O Azure, serviço em nuvem da Microsoft e principal concorrente da Amazon, já possui uma ferramenta de detecção de erros semelhante desde maio.
Contexto: O Apagão Global da AWS
O lançamento do DevOps Agent acontece pouco mais de um mês após um grande apagão na própria AWS no final de outubro.
Na ocasião:
- Uma falha técnica nos serviços da empresa derrubou servidores e deixou uma parte significativa da internet global instável ou fora do ar durante um dia inteiro.
- No pico do incidente, mais de 6,5 milhões de usuários em diversos países relataram falhas de acesso.
- Plataformas globais como Alexa, Zoom, Duolingo, Snapchat, Fortnite, Mercado Livre e Prime Video sofreram instabilidades.
O incidente de outubro reforçou o alerta de especialistas sobre a concentração de serviços de internet nas mãos de poucos provedores, evidenciando a necessidade de ferramentas como o DevOps Agent para garantir a resiliência da web.
Veja uma demonstração:







