Ingeniero de Confiabilidad de Sitios - Senior
J.P. Morgan busca un Ingeniero de Confiabilidad de Sitios Senior con experiencia en Python para unirse a su equipo en Buenos Aires. El rol implica la optimización y mantenimiento de sistemas críticos, la resolución de problemas complejos y la colaboración en el diseño e implementación de pipelines CI/CD.
Si sos un SRE con experiencia en Python y te copan los desafíos, este puesto en J.P. Morgan es para vos. Podrás optimizar sistemas críticos y colaborar en la modernización tecnológica. Ideal para quienes buscan crecer en un sector clave.
Descripción del puesto
¡Nada es más emocionante que estar en el centro de un campo tecnológico en rápida expansión y aplicar tus habilidades para impulsar la innovación y modernizar los sistemas más complejos y críticos del mundo! Como Site Reliability Engineer III en JPMorgan Chase, dentro de Cyber & Technology Controls, resolverás problemas de negocio complejos y amplios con soluciones simples y directas. A través de código e infraestructura en la nube, configurarás, mantendrás, monitorearás y optimizarás aplicaciones y su infraestructura asociada para descomponer de forma independiente y mejorar iterativamente las soluciones existentes. Serás un contribuyente significativo para tu equipo, compartiendo tus conocimientos sobre operaciones de extremo a extremo, disponibilidad, confiabilidad y escalabilidad de tu aplicación o plataforma. Responsabilidades del puesto: - Guiar y asistir a otros en la creación de diseños apropiados y obtener el consenso de los colegas cuando sea necesario. - Colaborar con otros ingenieros de software y equipos para diseñar e implementar enfoques de despliegue utilizando pipelines automatizados de integración y entrega continuas (CI/CD). - Colaborar con otros ingenieros de software y equipos para diseñar, desarrollar, probar e implementar soluciones de disponibilidad, confiabilidad y escalabilidad en sus aplicaciones. - Implementar infraestructura, configuración y red como código (IaC) para las aplicaciones y plataformas bajo tu responsabilidad. - Colaborar con expertos técnicos, partes interesadas clave y miembros del equipo para resolver problemas complejos. - Comprender los indicadores de nivel de servicio (SLI) y utilizar los objetivos de nivel de servicio (SLO) para resolver proactivamente problemas antes de que afecten a los clientes. - Apoyar la adopción de las mejores prácticas de ingeniería de confiabilidad de sitios (SRE) dentro de tu equipo. - Liderar la respuesta a incidentes importantes, análisis de causa raíz y postmortems sin culpa. Requisitos, capacidades y habilidades requeridas: - Más de 5 años de experiencia trabajando en soporte de productos/infraestructura. - Dominio de la cultura y principios de SRE y familiaridad con cómo implementarlos en una aplicación o plataforma. - Dominio de al menos un lenguaje de programación como Python o Java/Spring Boot. - Conocimiento experto de aplicaciones de software y procesos técnicos dentro de una disciplina técnica dada (ej. Cloud, inteligencia artificial, Android, etc.). - Experiencia en observabilidad, como monitoreo de caja blanca y negra, alertas de objetivos de nivel de servicio (SLO) y recopilación de telemetría utilizando herramientas como Grafana, Dynatrace, Prometheus, Datadog, Splunk y otras. - Experiencia con herramientas de integración y entrega continuas (CI/CD) como Jenkins, GitLab o Terraform. - Familiaridad con contenedores y orquestación de contenedores como ECS, Kubernetes y Docker. - Experiencia en definición de SLO/SLI, ingeniería del caos (Gremlin, Chaos Monkey), planificación de recuperación ante desastres. - Familiaridad con la resolución de problemas comunes de tecnologías y redes. - Capacidad para contribuir a equipos grandes y colaborativos presentando información de manera lógica y oportuna, con lenguaje convincente y supervisión limitada. - Capacidad para identificar nuevas tecnologías y soluciones relevantes para garantizar que las restricciones de diseño sean cumplidas por el equipo de software. - Capacidad para iniciar e implementar ideas para resolver problemas de negocio. - Sólidas habilidades de comunicación, verbales y escritas, capacidad para dirigir reuniones y sesiones de intercambio de conocimientos con los equipos. Requisitos, capacidades y habilidades preferidas: - Experiencia práctica con AWS / Azure / GCP u otros entornos de nube. - Experiencia práctica con Terraform u otras tecnologías de infraestructura como código (IaC). - Experiencia práctica con GitHub y revisiones de código. - Experiencia práctica con DevOps utilizando Python, scripting para automatización. - Conocimiento y experiencia práctica con herramientas como (Jira, Confluence, ServiceNow, Netcool). - Experiencia liderando y mentorizando equipos en prácticas de SRE y DevOps. J.P. Morgan es un líder mundial en servicios financieros, que brinda asesoramiento estratégico y productos a las corporaciones, gobiernos, individuos adinerados e inversores institucionales más prominentes del mundo. Nuestro enfoque de "negocio de primera clase de manera de primera clase" para servir a los clientes impulsa todo lo que hacemos. Nos esforzamos por construir asociaciones confiables y a largo plazo para ayudar a nuestros clientes a alcanzar sus objetivos comerciales. Reconocemos que nuestra gente es nuestra fortaleza y los diversos talentos que aportan a nuestra fuerza laboral global están directamente relacionados con nuestro éxito. Somos un empleador que ofrece igualdad de oportunidades y valoramos mucho la diversidad y la inclusión en nuestra empresa. No discriminamos por ningún atributo protegido, incluyendo raza, religión, color, origen nacional, género, orientación sexual, identidad de género, expresión de género, edad, estado civil o de veterano, embarazo o discapacidad, o cualquier otra base protegida por la ley aplicable. También hacemos adaptaciones razonables para las prácticas y creencias religiosas de los solicitantes y empleados, así como para las necesidades de salud mental o discapacidad física. Visite nuestras preguntas frecuentes para obtener más información sobre cómo solicitar una adaptación.
Responsabilidades
- Configurar, mantener, monitorear y optimizar aplicaciones e infraestructura.
- Resolver problemas de negocio complejos con soluciones simples.
- Contribuir al conocimiento del equipo sobre operaciones, disponibilidad, confiabilidad y escalabilidad.
- Guiar y asistir a otros en el diseño de soluciones.
- Colaborar en el diseño e implementación de pipelines CI/CD.
- Diseñar, desarrollar, probar e implementar soluciones de disponibilidad, confiabilidad y escalabilidad.
- Implementar infraestructura, configuración y red como código.
- Resolver problemas complejos en colaboración con expertos técnicos y stakeholders.
- Utilizar SLOs para resolver proactivamente problemas.
- Apoyar la adopción de mejores prácticas SRE.
- Liderar la respuesta a incidentes mayores, análisis de causa raíz y postmortems.