Ingeniero/a de Confiabilidad de Sitio - Automatización y Observabilidad
Chevron busca un Ingeniero/a de Confiabilidad de Sitio (SRE) para su centro GBS en Buenos Aires, enfocado en automatización y observabilidad para entornos OT/PCN. El rol implica mejorar la confiabilidad y eficiencia de sistemas mediante SRE, automatización y observabilidad.
Si te copa la automatización y la observabilidad en entornos industriales, este puesto en Chevron es para vos. Podés aportar a la mejora continua de sistemas críticos y trabajar en un centro de servicios global.
Descripción del puesto
Chevron Global Business Services (GBS), ubicado en Buenos Aires (Puerto Madero), Argentina, busca un Site Reliability Engineer (SRE) – Automation & Observability. Serás parte de la Organización de TI, un centro de servicios y técnico multifuncional con más de 1800 empleados que brindan servicios y soluciones de negocio a la corporación a nivel mundial. El SRE diseñará, implementará y operará capacidades de ingeniería de confiabilidad en entornos OT/PCN (Process Control Network). El rol se enfoca en mejorar la confiabilidad, escalabilidad y eficiencia operativa del sistema, aprovechando la automatización, la observabilidad y las prácticas SRE. Colaborarás con product owners, equipos de plataforma y líderes técnicos para definir y aplicar estándares de confiabilidad de servicios (SLIs/SLOs), construir capacidades de observabilidad escalables e integrar flujos de trabajo de automatización con los procesos de ServiceNow ITSM. Este rol es fundamental para avanzar en la plataforma de Automatización y Observabilidad, reduciendo el trabajo operativo repetitivo, permitiendo operaciones proactivas y escalando la automatización reutilizable en todos los entornos. Requerirá una estrecha colaboración con equipos globales y socios proveedores para impulsar la adopción de operaciones impulsadas por la ingeniería y la mejora continua de la confiabilidad en sistemas OT críticos. Responsabilidades: - Definir e implementar prácticas SRE, incluyendo SLIs, SLOs y presupuestos de error, para mejorar la confiabilidad del servicio. - Construir y estandarizar capacidades de observabilidad en métricas, logs y traces, incluyendo dashboards y estrategias de alerta. - Liderar la respuesta a incidentes, análisis de causa raíz y postmortems para impulsar la mejora continua. - Desarrollar y mantener pipelines de CI/CD (Azure DevOps) para automatizar el despliegue, la validación y los flujos de trabajo operativos. - Integrar señales de monitoreo y observabilidad con flujos de trabajo de ServiceNow ITSM (incidentes, cambios, tareas indicadoras). - Diseñar y habilitar componentes de automatización reutilizables (ej. pipelines, roles, frameworks de validación) para escalar casos de uso. - Operar dentro de entornos OT/PCN, cumpliendo con los estándares de seguridad, segmentación y cumplimiento. - Aprovechar la telemetría de plataformas de infraestructura y cumplimiento (ej. SolarWinds) para mejorar la visibilidad operativa. - Colaborar con product owners, arquitectos y socios proveedores en ceremonias Agile y sesiones de trabajo técnico. - Producir y mantener documentación técnica, incluyendo runbooks, diagramas de arquitectura y guías operativas. Requisitos: - Más de 3 años de experiencia operando sistemas de producción con un fuerte enfoque en observabilidad e ingeniería de confiabilidad. - Experiencia práctica con prácticas SRE (SLIs, SLOs, presupuestos de error, gestión de incidentes). - Experiencia comprobada en la construcción y mantenimiento de pipelines de CI/CD (ej. Azure DevOps). - Experiencia integrando monitoreo y operaciones con flujos de trabajo de ServiceNow ITSM. - Sólidas habilidades de scripting en Python y/o PowerShell. - Sólida comprensión de conceptos de observabilidad (métricas, logs, traces, alertas, correlación). - Experiencia trabajando en entornos complejos o regulados, preferiblemente OT/PCN. - Fuertes habilidades de comunicación con capacidad para colaborar con equipos globales. Se valorará: - Experiencia en entornos industriales u OT (petróleo y gas, utilities, manufactura). - Familiaridad con SolarWinds o plataformas similares de observabilidad y cumplimiento. - Experiencia con ServiceNow Service Mapping, CMDB o integraciones de automatización. - Exposición a frameworks de automatización (ej. Ansible) y patrones de diseño reutilizables. - Conocimiento de frameworks de seguridad y cumplimiento (ej. CIS, NIST, ISA/IEC 62443). - Experiencia trabajando en modelos de entrega Agile con desarrollo basado en backlog. Opciones de reubicación: Se puede considerar la reubicación. Consideraciones internacionales: No se considerarán asignaciones de expatriados. Chevron participa en E-Verify en ciertas ubicaciones según lo exija la ley.
Responsabilidades
- Diseñar, implementar y operar capacidades de ingeniería de confiabilidad en entornos OT/PCN
- Mejorar la confiabilidad, escalabilidad y eficiencia operativa
- Definir y aplicar estándares de confiabilidad de servicio (SLIs/SLOs)
- Construir capacidades de observabilidad escalables
- Integrar flujos de trabajo de automatización con procesos ServiceNow ITSM
- Reducir el trabajo operativo repetitivo (toil)
- Habilitar operaciones proactivas
- Escalar automatización reutilizable
- Liderar respuesta a incidentes, análisis de causa raíz y postmortems
- Desarrollar y mantener pipelines CI/CD
- Integrar señales de monitoreo y observabilidad con ServiceNow ITSM
- Diseñar y habilitar componentes de automatización reutilizables
- Operar dentro de entornos OT/PCN, cumpliendo estándares de seguridad, segmentación y cumplimiento
- Aprovechar telemetría de plataformas de infraestructura y cumplimiento
- Colaborar con product owners, arquitectos y partners en ceremonias Agile y sesiones técnicas
- Producir y mantener documentación técnica