Ingeniero/a de Confiabilidad de Sitio Senior
J.P. Morgan busca un Ingeniero/a de Confiabilidad de Sitio (SRE) Senior para su equipo de Gestión de Producción en Buenos Aires. El rol se enfoca en mejorar la confiabilidad y eficiencia de plataformas, automatizar procesos, gestionar incidentes y mentorizar al equipo.
Si te apasiona la mejora continua y la automatización, este puesto en J.P. Morgan es para vos. Podrás optimizar plataformas críticas, resolver desafíos complejos y mentorizar al equipo, dejando tu huella en la eficiencia operativa.
Descripción del puesto
Buscamos un Ingeniero de Confiabilidad de Sitio (SRE) III dedicado para unirse a nuestro equipo de Gestión de Producción de alto rendimiento. Este rol es ideal para personas con curiosidad innata, motivación para aprender y energía para realizar mejoras significativas. Jugarás un papel clave en la mejora de la confiabilidad y eficiencia de las plataformas que soportan a nuestros profesionales de Ventas e Investigación. Si bien algunas responsabilidades pueden implicar actividades rutinarias, tendrás la oportunidad única de identificar y abordar estos desafíos, transformándolos en procesos optimizados que mejoren la experiencia tanto de clientes como de colegas. La satisfacción de este rol proviene de marcar una diferencia tangible: eliminar obstáculos y permitir operaciones más fluidas. Responsabilidades Clave: - Soporte de Producción: - Brindar soporte diario para los procesos y flujos de trabajo de las aplicaciones, asegurando estabilidad, disponibilidad y resolución oportuna de problemas. - Ser el contacto principal para todos los asuntos de soporte de producción. - Mejora de Procesos: - Identificar y priorizar tareas repetitivas o de alto impacto, e implementar soluciones para automatizarlas o eliminarlas, impulsando una mayor eficiencia y consistencia. - Monitoreo y Perspectivas: - Diseñar e implementar sistemas integrales de monitoreo y alertas, asegurando una visibilidad clara del estado y rendimiento de la plataforma. - Respuesta a Incidentes: - Desarrollar y mantener soluciones automatizadas para la detección y resolución de incidentes, reduciendo el tiempo de inactividad y mejorando los tiempos de respuesta. - Desarrollo de Equipo: - Asesorar y apoyar a los colegas en la adopción de mejores prácticas, fomentando una cultura de mejora continua y responsabilidad compartida por la confiabilidad. - Preparación Operacional: - Colaborar con los equipos para mejorar la capacidad de soporte a través de procesos robustos y una gestión de configuración eficaz. - Integración de Herramientas: - Asegurar que las aplicaciones se integren con herramientas estándar de monitoreo y alertas, proporcionando cobertura confiable y perspectivas accionables. - Gestión de Incidentes: - Liderar prácticas efectivas de gestión de incidentes, incluyendo detección rápida, comunicación clara, análisis exhaustivo e implementación de medidas preventivas. - Resiliencia y Recuperación: - Contribuir a la resiliencia continua de nuestras plataformas a través de análisis rigurosos, pruebas y validación de procedimientos de recuperación. Calificaciones y Habilidades: - Mínimo 3 años de experiencia en soporte y mantenimiento de servicios tecnológicos en entornos de producción. - Familiaridad con aplicaciones e infraestructura a gran escala, tanto on-premises como en la nube. - Sólidas habilidades analíticas y de resolución de problemas, con experiencia en la resolución de problemas técnicos complejos. - Dominio de al menos un lenguaje de programación (como Java o Python) para automatización y mejora de procesos. - Experiencia con herramientas de monitoreo y alertas, y una sólida comprensión de métricas e indicadores de salud del sistema. - Conocimiento de los procesos de incidentes, problemas, cambios y solicitudes de servicio. - Comprensión de los principios de ingeniería de confiabilidad, incluida la automatización y la gestión de incidentes. - Experiencia con redes y herramientas de entrega modernas (como Jenkins, GitLab o Terraform) es una ventaja. J.P. Morgan es un líder mundial en servicios financieros, que brinda asesoramiento estratégico y productos a las corporaciones, gobiernos, individuos adinerados e inversores institucionales más importantes del mundo. Nuestro enfoque de "negocio de primera clase de manera de primera clase" para servir a los clientes impulsa todo lo que hacemos. Nos esforzamos por construir asociaciones confiables y a largo plazo para ayudar a nuestros clientes a alcanzar sus objetivos comerciales. Reconocemos que nuestra gente es nuestra fortaleza y los diversos talentos que aportan a nuestra fuerza laboral global están directamente relacionados con nuestro éxito. Somos un empleador que ofrece igualdad de oportunidades y valoramos mucho la diversidad y la inclusión en nuestra empresa. No discriminamos por ningún atributo protegido, incluida la raza, religión, color, origen nacional, género, orientación sexual, identidad de género, expresión de género, edad, estado civil o de veterano, embarazo o discapacidad, o cualquier otra base protegida por la ley aplicable. También hacemos adaptaciones razonables para las prácticas y creencias religiosas de los solicitantes y empleados, así como para las necesidades de salud mental o discapacidad física. Visite nuestras preguntas frecuentes para obtener más información sobre cómo solicitar una adaptación.
Responsabilidades
- Soporte diario para procesos y flujos de trabajo de aplicaciones
- Identificar y priorizar tareas repetitivas o de alto impacto para automatizar o eliminar
- Diseñar e implementar sistemas de monitoreo y alerta
- Desarrollar y mantener soluciones automatizadas para detección y resolución de incidentes
- Mentorizar y apoyar a colegas en la adopción de mejores prácticas
- Colaborar con equipos para mejorar la soportabilidad
- Asegurar la integración de aplicaciones con herramientas de monitoreo y alerta
- Liderar prácticas efectivas de gestión de incidentes
- Contribuir a la resiliencia de las plataformas