Ingeniero Senior de Confiabilidad de Sitio (Site Reliability Engineer)
Empresa busca un Ingeniero Senior de Confiabilidad de Sitio (SRE) con experiencia en arquitectura, gobernanza y eficiencia de costos de infraestructura cloud. El rol es remoto para candidatos en LATAM.
Si sos un SRE con experiencia en cloud y te copa diseñar arquitecturas escalables y eficientes, este puesto remoto es para vos. Podés liderar la infraestructura de una empresa y definir las mejores prácticas, trabajando desde cualquier lugar de LATAM.
Descripción del puesto
Buscamos un/a Ingeniero/a de Confiabilidad de Sitio Senior (Senior Site Reliability Engineer) que sea responsable de la arquitectura, gobernanza y eficiencia de costos de nuestra infraestructura en la nube y de plataforma. En este rol, diseñarás y evolucionarás nuestros entornos de producción, definirás estándares y mejores prácticas, y colaborarás con los equipos de ingeniería y TI para construir sistemas escalables y confiables que sean fáciles de operar y rentables. Serás un líder técnico práctico: diseñando arquitecturas de referencia, construyendo pipelines de CI/CD y automatización, liderando prácticas de respuesta a incidentes y estableciendo directrices de seguridad, confiabilidad y gestión de costos en nuestras plataformas. Este es un puesto de contratista remoto. Buscamos candidatos ubicados en LATAM. Responsabilidades clave: Arquitectura y propiedad de la infraestructura: - Diseñar, implementar y evolucionar arquitecturas de infraestructura en la nube para alta disponibilidad, confiabilidad, seguridad y escalabilidad. - Definir y mantener arquitecturas y patrones de referencia para servicios, aplicaciones y entornos en toda la organización. - Desarrollar procesos de flujo de trabajo y estándares para construir, implementar y mantener aplicaciones dentro de una arquitectura distribuida. - Liderar iniciativas de modernización de infraestructura (ej. contenerización, adopción de Kubernetes, infraestructura como código, consolidación de plataformas). Gobernanza, estándares y gestión de costos: - Establecer y hacer cumplir estándares de gobernanza para infraestructura, CI/CD, observabilidad y prácticas operativas. - Definir y mantener políticas para la gestión de entornos, control de acceso, gestión de configuración y gestión de cambios. - Implementar prácticas de gestión de costos (ej. etiquetado, alertas de presupuesto, dimensionamiento correcto, reservas/uso comprometido, políticas de escalado automático) para optimizar el gasto en la nube. - Colaborar con el liderazgo de producto e ingeniería para equilibrar el rendimiento, la confiabilidad y la eficiencia de costos en todos los entornos. - Utilizar métricas DORA y benchmarks de la industria para impulsar la mejora continua en el rendimiento de entrega y operaciones. CI/CD, automatización y operaciones: - Diseñar, implementar y mantener pipelines de CI/CD para múltiples aplicaciones y entornos utilizando herramientas como Git, Azure DevOps, GitLab o Jenkins. - Desarrollar y gestionar pipelines de automatización para implementación, configuración y gestión de infraestructura. - Construir y mantener sistemas de monitoreo, alertas y registro para garantizar la visibilidad, alta disponibilidad y rendimiento de aplicaciones y servicios. - Gestionar recursos y servicios de infraestructura en la nube para garantizar confiabilidad, seguridad y escalabilidad. Gestión de incidentes y confiabilidad: - Liderar esfuerzos de respuesta a incidentes, incluyendo triaje, análisis de causa raíz y revisiones post-incidente. - Contribuir y mantener procesos de respuesta a incidentes, runbooks y prácticas de guardia. - Colaborar con los equipos de ingeniería para diseñar sistemas resilientes y reducir el tiempo medio de recuperación (MTTR). Liderazgo, mentoría y colaboración interfuncional: - Colaborar con los equipos de ingeniería de software, QA, producto y TI para determinar la mejor manera de abordar desafíos complejos de infraestructura, seguridad y entrega. - Mentorizar a ingenieros en prácticas, herramientas y estándares de DevOps y plataforma en toda la organización. - Liderar iniciativas departamentales relacionadas con DevOps, ingeniería de plataformas y disciplinas de infraestructura; presentar planes y progreso a las partes interesadas. - Impulsar nuevas iniciativas departamentales basadas en las necesidades organizacionales y tu experiencia en tecnologías modernas y tendencias de la industria. - Mantenerse actualizado sobre tecnologías emergentes, herramientas y mejores prácticas; evaluar su aplicación potencial dentro de nuestro stack tecnológico. Experiencia requerida: - Licenciatura o Maestría en Ciencias de la Computación, Ingeniería o un campo técnico relacionado, o experiencia práctica equivalente. - Más de 6 años de experiencia con servicios de orquestación de contenedores (preferiblemente Kubernetes). - Más de 6 años de experiencia administrando e implementando herramientas de CI/CD (ej. Git, Azure DevOps, Jira, GitLab, Jenkins). - Más de 6 años de experiencia gestionando aplicaciones escalables en uno o más proveedores de nube importantes. - Más de 8 años de experiencia significativa con entornos de sistemas operativos Windows y Linux. - Más de 7 años de experiencia con scripting y automatización utilizando herramientas como PowerShell, Bash o Python. - Más de 4 años de experiencia con plataformas de infraestructura como código y orquestación (ej. Terraform, ARM/Bicep, CloudFormation, Ansible, etc.). - Experiencia demostrada en el diseño de arquitecturas para stacks tecnológicos escalables, confiables y seguros en sistemas distribuidos. - Experiencia demostrada en la implementación de procesos de flujo de trabajo para operar y mantener aplicaciones en arquitecturas distribuidas. Calificaciones y habilidades: - Sólida experiencia trabajando en entornos de desarrollo de software con inclinación ágil y en diversos stacks de aplicaciones. - Profundo conocimiento de las mejores prácticas y operaciones de TI en arquitecturas distribuidas y nativas de la nube. - Experiencia en la definición e implementación de gobernanza y directrices en torno a infraestructura, CI/CD y seguridad. - Sólido conocimiento de la gestión de costos en la nube y técnicas de optimización (ej. análisis de uso, dimensionamiento correcto, políticas de escalado). - Excelentes habilidades de resolución de problemas, solución de problemas y gestión de incidentes. - Excelentes habilidades de comunicación oral y escrita; capaz de presentar conceptos técnicos complejos a audiencias técnicas y no técnicas. - Orientado a procesos con sólidas habilidades de documentación y atención al detalle. - Capacidad para traducir requisitos de producto o plataforma vagamente definidos en soluciones técnicas robustas y escalables. Compensación mensual total: $4,000 — $5,000 USD
Responsabilidades
- Diseñar, implementar y evolucionar arquitecturas de infraestructura cloud
- Definir y mantener arquitecturas de referencia y patrones
- Desarrollar procesos de flujo de trabajo para construir, desplegar y mantener aplicaciones
- Liderar iniciativas de modernización de infraestructura
- Establecer y hacer cumplir estándares de gobernanza
- Implementar prácticas de gestión de costos cloud
- Diseñar, implementar y mantener pipelines de CI/CD
- Desarrollar y gestionar pipelines de automatización
- Construir y mantener sistemas de monitoreo, alerta y logging
- Gestionar recursos de infraestructura cloud
- Liderar esfuerzos de respuesta a incidentes
- Colaborar con equipos de ingeniería, QA, producto y TI
- Presentar planes y progreso a stakeholders