SRE Foundation
INSCRIÇÕES PELO SYMPLA
SRE significa Site Reliability Engineering ou “Engenharia de Confiabilidade de Site”, uma disciplina que combina os aspectos de engenharia de software e operações de sistemas para criar sistemas altamente confiáveis, escaláveis e sustentáveis.
Atualmente, as organizações lidam com volumes imensos de mudanças, em ambientes cada vez mais complexos o que aumenta os riscos de incidentes e interrupções. Nesse sentido, as equipes de TI devem aprimorar a confiabilidade do serviço e resiliência do sistema. Com automação e observabilidade se tornando fatores-chave para implementações mais eficientes e rápidas, o perfil SRE se tornou valioso no mercado.
O profissional SRE:
Os profissionais SRE são responsáveis por monitorar, analisar e resolver problemas de desempenho do sistema, bem como criar e manter ferramentas de automação para gerenciar e implantar infraestrutura de TI. Eles trabalham com outros engenheiros de software e administradores de sistemas para garantir que as necessidades do negócio sejam atendidas e que o sistema esteja funcionando com máximo desempenho.
Além disso, os profissionais SRE são responsáveis por garantir que os sistemas estejam seguros e protegidos contra ameaças externas, como hackers e malware. Eles também são responsáveis por garantir a conformidade com as regulamentações de segurança e privacidade de dados.
Em resumo, o profissional SRE é um especialista em garantir que os sistemas de TI sejam confiáveis, eficientes e seguros, permitindo que as empresas possam operar sem interrupções e atingir seus objetivos de negócios.
Objetivo do treinamento:
Atualmente, a confiabilidade dos sistemas é uma das principais preocupações das empresas que buscam a satisfação dos seus clientes. E se você atua ou está buscando uma carreira em TI, é imprescindível que conheça o SRE.
Nesse curso, você irá aprender sobre sistemas mais confiáveis utilizando SLA, SLO, Error Budget e SLI. Além disso, compreenderá temas como respostas a incidentes e plantões, gerenciamento de cargas e blameless post-mortem.
A partir desse conhecimento, você se tornará um profissional mais valorizado pelas organizações.
Público alvo:
Desenvolvedores de sistemas e analistas de suporte e operações
Profissionais em busca de aprimorar confiabilidade
Interessados na liderança de TI moderna e abordagens de mudança organizacional
Executivos de TI, PO, Scrum Masters, Engenheiros de Software, analistas de Cloud e infraestrutura
Estudantes de Ciência da Computação e afins
Conteúdo programático:
1. Princípios e Práticas SRE
– O que é Engenharia de Confiabilidade de Sites (SRE)?
– Diferenças entre DevOps e SRE
– Princípios e práticas SRE
2. Objetivos de Nível de Serviço e Orçamentos de Erro
– Objetivos de Nível de Serviço
– Error Budgeting
– Políticas de Error Budgeting
3. Redução da Labuta (Toil)
– O que é Toil?
– Por que Toil é ruim?
– Fazendo algo sobre Toil
4. Monitoramento e Indicadores de Nível de Serviço
– SLI – Indicadores de Nível de Serviço
– Monitoramento
– Observabilidade
5. Ferramentas e Automação SRE
– Definição de automação
– Hierarquia de tipos de automação
– Segurança na automação
– Ferramentas de automação
6. Anti-fragilidade e aprendendo com a falha
– Por que aprender com o fracasso?
– Benefícios da anti-fragilidade
– Mudando o equilíbrio organizacional
7. Impacto organizacional da SRE
– Por que as organizações adotam SRE?
– Padrões para adoção de SRE
– SRE – descrição do trabalho
– Resposta sustentável a incidentes
– Investigação sem culpa
– SRE e escala
8. SRE, outros frameworks e tendências
– SRE e outros Frameworks
– Evolução SRE
9. Orientação para o exame
Estão inclusos:
Apostila oficial
Certificado de participação
Simulado
Carga Horária: 16 horas
Informações sobre o exame de certificação:
– Formato: online com 60 min de duração
– Número de questões: 40
– Índice de aprovação: 65% (26 de 40)
– Utilização de material de apoio durante o exame: sim
– Equipamentos eletrônicos permitidos: não