directo

Ingeniero/a de Confiabilidad de Sitio - Automatización y Observabilidad

Buenos AiresPresencial · Tiempo completo

Senior3+ años

A convenir

Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Chevron busca un Ingeniero/a de Confiabilidad de Sitio (SRE) para su centro GBS en Buenos Aires, enfocado en automatización y observabilidad para entornos OT/PCN. El rol implica mejorar la confiabilidad y eficiencia de sistemas mediante SRE, automatización y observabilidad.

Por qué aplicar

Si te copa la automatización y la observabilidad en entornos industriales, este puesto en Chevron es para vos. Podés aportar a la mejora continua de sistemas críticos y trabajar en un centro de servicios global.

Descripción del puesto

Chevron Global Business Services (GBS), ubicado en Buenos Aires (Puerto Madero), Argentina, busca un Site Reliability Engineer (SRE) – Automation & Observability. Serás parte de la Organización de TI, un centro de servicios y técnico multifuncional con más de 1800 empleados que brindan servicios y soluciones de negocio a la corporación a nivel mundial. El SRE diseñará, implementará y operará capacidades de ingeniería de confiabilidad en entornos OT/PCN (Process Control Network). El rol se enfoca en mejorar la confiabilidad, escalabilidad y eficiencia operativa del sistema, aprovechando la automatización, la observabilidad y las prácticas SRE. Colaborarás con product owners, equipos de plataforma y líderes técnicos para definir y aplicar estándares de confiabilidad de servicios (SLIs/SLOs), construir capacidades de observabilidad escalables e integrar flujos de trabajo de automatización con los procesos de ServiceNow ITSM. Este rol es fundamental para avanzar en la plataforma de Automatización y Observabilidad, reduciendo el trabajo operativo repetitivo, permitiendo operaciones proactivas y escalando la automatización reutilizable en todos los entornos. Requerirá una estrecha colaboración con equipos globales y socios proveedores para impulsar la adopción de operaciones impulsadas por la ingeniería y la mejora continua de la confiabilidad en sistemas OT críticos. Responsabilidades: - Definir e implementar prácticas SRE, incluyendo SLIs, SLOs y presupuestos de error, para mejorar la confiabilidad del servicio. - Construir y estandarizar capacidades de observabilidad en métricas, logs y traces, incluyendo dashboards y estrategias de alerta. - Liderar la respuesta a incidentes, análisis de causa raíz y postmortems para impulsar la mejora continua. - Desarrollar y mantener pipelines de CI/CD (Azure DevOps) para automatizar el despliegue, la validación y los flujos de trabajo operativos. - Integrar señales de monitoreo y observabilidad con flujos de trabajo de ServiceNow ITSM (incidentes, cambios, tareas indicadoras). - Diseñar y habilitar componentes de automatización reutilizables (ej. pipelines, roles, frameworks de validación) para escalar casos de uso. - Operar dentro de entornos OT/PCN, cumpliendo con los estándares de seguridad, segmentación y cumplimiento. - Aprovechar la telemetría de plataformas de infraestructura y cumplimiento (ej. SolarWinds) para mejorar la visibilidad operativa. - Colaborar con product owners, arquitectos y socios proveedores en ceremonias Agile y sesiones de trabajo técnico. - Producir y mantener documentación técnica, incluyendo runbooks, diagramas de arquitectura y guías operativas. Requisitos: - Más de 3 años de experiencia operando sistemas de producción con un fuerte enfoque en observabilidad e ingeniería de confiabilidad. - Experiencia práctica con prácticas SRE (SLIs, SLOs, presupuestos de error, gestión de incidentes). - Experiencia comprobada en la construcción y mantenimiento de pipelines de CI/CD (ej. Azure DevOps). - Experiencia integrando monitoreo y operaciones con flujos de trabajo de ServiceNow ITSM. - Sólidas habilidades de scripting en Python y/o PowerShell. - Sólida comprensión de conceptos de observabilidad (métricas, logs, traces, alertas, correlación). - Experiencia trabajando en entornos complejos o regulados, preferiblemente OT/PCN. - Fuertes habilidades de comunicación con capacidad para colaborar con equipos globales. Se valorará: - Experiencia en entornos industriales u OT (petróleo y gas, utilities, manufactura). - Familiaridad con SolarWinds o plataformas similares de observabilidad y cumplimiento. - Experiencia con ServiceNow Service Mapping, CMDB o integraciones de automatización. - Exposición a frameworks de automatización (ej. Ansible) y patrones de diseño reutilizables. - Conocimiento de frameworks de seguridad y cumplimiento (ej. CIS, NIST, ISA/IEC 62443). - Experiencia trabajando en modelos de entrega Agile con desarrollo basado en backlog. Opciones de reubicación: Se puede considerar la reubicación. Consideraciones internacionales: No se considerarán asignaciones de expatriados. Chevron participa en E-Verify en ciertas ubicaciones según lo exija la ley.

Responsabilidades

Diseñar, implementar y operar capacidades de ingeniería de confiabilidad en entornos OT/PCN
Mejorar la confiabilidad, escalabilidad y eficiencia operativa
Definir y aplicar estándares de confiabilidad de servicio (SLIs/SLOs)
Construir capacidades de observabilidad escalables
Integrar flujos de trabajo de automatización con procesos ServiceNow ITSM
Reducir el trabajo operativo repetitivo (toil)
Habilitar operaciones proactivas
Escalar automatización reutilizable
Liderar respuesta a incidentes, análisis de causa raíz y postmortems
Desarrollar y mantener pipelines CI/CD
Integrar señales de monitoreo y observabilidad con ServiceNow ITSM
Diseñar y habilitar componentes de automatización reutilizables
Operar dentro de entornos OT/PCN, cumpliendo estándares de seguridad, segmentación y cumplimiento
Aprovechar telemetría de plataformas de infraestructura y cumplimiento
Colaborar con product owners, arquitectos y partners en ceremonias Agile y sesiones técnicas
Producir y mantener documentación técnica

Skills requeridas

Prácticas SRE (SLIs, SLOs, presupuestos de error, gestión de incidentes)Integración de monitoreo y operaciones con flujos de trabajo de ServiceNow ITSMHabilidades de scripting en Python y/o PowerShellConceptos de observabilidad (métricas, logs, traces, alertas, correlación)Trabajo en entornos complejos o reguladosColaboración en equipos globalesComunicación

Trabajos similares

Ingeniero/a de Confiabilidad de Sitio - Automatización y Observabilidad

Descripción del puesto

Responsabilidades

Skills requeridas

Trabajos similares

Site Reliability Engineer II - LATAM

SRE / Site Reliability Engineer

Site Reliability Engineer III: NeoVest

Infrastructure / Site Reliability Engineer

Site Reliability Engineer - Senior Associate

Senior Site Reliability Engineer

Más ofertas de Chevron

Analytical Tools Coordinator

Data Engineer

Software Engineer

Optimization Software Engineer

Explorar empleos relacionados