directohace 1 mes

Ingeniero de Servicio Designado - Experto en Ceph

WEKA Remoto · Tiempo completo
Senior10+ años
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

WEKA busca un Ingeniero de Servicio Designado - Experto en Ceph para un rol de tiempo completo en modalidad remota. El candidato debe tener experiencia en arquitectura y operaciones de Ceph, así como habilidades en liderazgo técnico y comunicación con clientes.

Por qué aplicar

Ideal para expertos en Ceph que buscan un desafío en un entorno remoto y dinámico

Descripción del puesto

Sobre el trabajo WEKA está diseñando un nuevo enfoque para la pila de datos empresarial construida para la era del razonamiento. NeuralMesh de WEKA establece el estándar para la infraestructura de datos de IA agéntrica con una solución de software nativa en la nube y de IA que se puede implementar en cualquier lugar. Transforma los silos de datos heredados en canalizaciones de datos que aumentan drásticamente la utilización de GPU y hacen que el entrenamiento de modelos de IA y la inferencia, el aprendizaje automático y otras cargas de trabajo intensivas en cómputo se ejecuten más rápido, funcionen de manera más eficiente y consuman menos energía. WEKA es una empresa en crecimiento, previa a la OPI, en una trayectoria de hipercrecimiento. Hemos recaudado $375M en capital de docenas de inversores de capital de riesgo y estratégicos de clase mundial. Ayudamos a las empresas y organizaciones de investigación más grandes e innovadoras del mundo, incluyendo a 12 de las Fortune 50, a lograr descubrimientos, conocimientos y resultados comerciales más rápido y de manera más sostenible. Estamos apasionados por resolver los desafíos de datos más complejos de nuestros clientes para acelerar la innovación inteligente y el valor comercial. Si compartes nuestra pasión, te invitamos a unirte a nosotros en este emocionante viaje. Qué harás Este es un rol de Premium Services orientado al cliente que combina una profunda arquitectura y administración de Ceph con el enfoque de alto contacto y orientado a resultados de un Ingeniero de Servicios Designado Senior (DSE). Serás el experto principal en Ceph para clientes estratégicos asignados y iniciativas internas, responsable del diseño, implementación, operaciones de ciclo de vida y rendimiento de entornos de almacenamiento de objetos basados en Ceph. Paralelamente, desempeñarás un papel clave en garantizar el éxito del cliente de WEKA, contribuyendo a nuestras reseñas de cinco estrellas de Gartner. Trabajarás con tecnologías de vanguardia y clientes de primer nivel, brindando experiencia técnica y fortaleciendo las relaciones con los clientes. Colaborando estrechamente con los equipos de cuenta, obtendrás una visión profunda de los requisitos comerciales, las necesidades técnicas y los entornos de sistemas de los clientes. Tu rol implica resolver problemas técnicos, puenteando brechas entre clientes y ingeniería, y garantizando el más alto nivel de servicio. Arquitectura y operaciones de Ceph - Arquitectar, implementar y operar clústeres de Ceph de producción a gran escala que admitan S3 con énfasis en disponibilidad, rendimiento y simplicidad operativa. - Gestionar actividades de ciclo de vida del clúster: actualizaciones, parcheo, gestión de configuración, comprobaciones de salud de rutina y remediación proactiva de riesgos. - Solucionar problemas complejos en toda la pila de Ceph, liderar la respuesta a incidentes y el análisis de causa raíz. - Establecer y mantener libros de operaciones, mejores prácticas operativas y documentación orientada al cliente; impulsar la mejora continua en confiabilidad, observabilidad y automatización. - Colaborar con equipos de clientes en requisitos de seguridad y cumplimiento. - Asesorar sobre la elección de hardware y topología para cumplir con los requisitos de carga de trabajo. Ingeniería de servicios designada - Servir como enlace técnico principal entre clientes y WEKA Engineering/Producto para abordar brechas de características, preocupaciones de confiabilidad y mejoras de documentación. - Poseer, rastrear y documentar problemas de clientes a través del sistema de tickets; impulsar problemas hacia la resolución con comunicación clara, oportuna y actualizaciones listas para ejecutivos cuando sea necesario. - Monitorear proactivamente entornos de clientes (Ceph y WEKA) utilizando herramientas de observabilidad y monitoreo remoto para identificar y remediar riesgos antes de que afecten la producción. - Respaldar a los equipos de cuenta (Éxito del Cliente, Ingeniería de Ventas, Socios/Revendedores) con experiencia técnica profunda y credibilidad frente a las partes interesadas senior del cliente. - Contribuir al intercambio de conocimientos a través de documentación interna y orientada al cliente (preguntas frecuentes, artículos de KB, libros de operaciones) y playbooks de solución de problemas repetibles. - Gestionar múltiples compromisos y casos simultáneamente, equilibrando urgencia, impacto y resultados de clientes a largo plazo. - Participar en rotaciones de soporte y seguimiento del sol como se requiera; trabajar horas alternativas ocasionales (noches, fines de semana, vacaciones) y viajar según sea necesario. Aprendizaje y crecimiento en WEKA - Aprender sobre la arquitectura de WEKA, herramientas y modelo de soporte, y progresivamente tomar posesión de compromisos de servicios designados más allá de Ceph. - Desarrollar experiencia más profunda en conceptos y ecosistemas de almacenamiento de objetos compatibles con S3 (clientes, equilibrio de carga, pruebas de rendimiento, multitenencia), con tutoría de expertos en WEKA. - Colaborar con equipos internos para mejorar la capacidad de soporte del producto y la excelencia operativa para casos de uso de almacenamiento de objetos. Requisitos Estamos buscando un ingeniero senior orientado al cliente que pueda liderar la arquitectura y las operaciones de Ceph hoy y que esté emocionado de crecer en un rol más amplio de almacenamiento de objetos y WEKA. - 10+ años en roles técnicos orientados al cliente resolviendo problemas complejos de infraestructura empresarial. - 5+ años de experiencia práctica con Ceph en producción: diseño de clúster, implementación, actualizaciones y operaciones de día 2. - Fuerte comprensión de los internos de Ceph y la mecánica operativa: MON quorum, MGR activo/standby, comportamiento de OSD, CRUSH y mapas CRUSH, grupos de pools y colocación (PGs), recuperación/rellenado y reequilibrio. - Experiencia operando entornos de Ceph a gran escala (multi-PB) y navegando por los desafíos operativos de tamaño de flota, escala de PG y eventos de recuperación en ejecución prolongada. - Experiencia práctica con Ceph RGW y conceptos S3 (buckets, usuarios/arrendatarios, equilibrio de carga, patrones de escala, solución de problemas de rendimiento). - Experiencia en administración de Linux/Unix en entornos distribuidos de múltiples plataformas. - Fuertes habilidades de solución de problemas en capas de hardware, SO, red y almacenamiento distribuido (incluyendo diagnosticar cuellos de botella de rendimiento y escenarios de falla). - Profunda comprensión de redes (Infiniband, Ethernet, DPDK, UCX), computación en la nube y almacenamiento distribuido. - Experiencia con pilas de observabilidad y monitoreo (Prometheus/Grafana y herramientas de registro/métricas comunes). - Dominio de Python y/o Bash; comodidad construyendo automatización para monitoreo, diagnóstico y tareas operativas repetibles. - Excelentes habilidades de comunicación escritas y verbales, con la capacidad de explicar temas técnicos complejos tanto a partes interesadas técnicas como no técnicas. Es agradable si tienes - Experiencia con Kubernetes/Contenedores y/o plataformas en la nube (AWS, Azure, OCI, GCP) en entornos con mucho almacenamiento. - Familiaridad con Jira, Confluence, Slack y colaboración entre equipos de soporte, ingeniería y producto. - Experiencia en soporte de infraestructura HPC o AI/ML (clústeres de GPU, redes de alto rendimiento, evaluación comparativa de rendimiento). - Experiencia con infraestructura como código o gestión de configuración (Ansible, Terraform, etc.). - Fuertes habilidades de escritura técnica y hábito de crear libros de operaciones y playbooks reutilizables. Qué parece el éxito - Los clientes te ven como un líder técnico de confianza para Ceph y almacenamiento de objetos, y se involucran contigo proactivamente para obtener orientación arquitectónica y revisiones operativas. - Puedes evaluar de forma independiente la salud del clúster de Ceph, identificar riesgos y liderar planes de remediación que mejoren la disponibilidad y el rendimiento. - Ofreces comunicaciones de cliente consistentes y de alta calidad y conduces problemas hacia la resolución mientras colaboras de manera efectiva con equipos internos (CS, Producto e Ingeniería). - Creas artefactos duraderos (libros de operaciones, paneles, automatización, postmortems) que elevan la madurez operativa de los entornos de clientes y la capacidad de soporte de WEKA. - Aprendes rápidamente sobre los productos y procesos de WEKA y expandes tu propiedad más allá de Ceph hacia compromisos más amplios de servicios designados. La forma WEKA - Somos responsables: asumimos la plena propiedad, siempre, incluso cuando las cosas no salen como se planeó. Lideramos con integridad, nos presentamos con responsabilidad y propiedad, y nos mantenemos a nosotros mismos y a los demás con los estándares más altos. - Somos valientes: cuestionamos el status quo, empujamos límites y asumimos riesgos inteligentes cuando es necesario. Aceptamos desafíos y abrazamos debates como oportunidades de crecimiento, convirtiendo el coraje en combustible para la innovación. - Somos colaborativos: la verdadera colaboración no se trata solo de trabajar juntos. Se trata de levantar a los demás para tener éxito colectivamente. Somos orientados al equipo y nos comunicamos con empatía y respeto. Desafiamos a los demás y resolvemos conflictos de manera positiva. Somos transparentes sobre nuestros objetivos y resultados. Y juntos, somos imparables. - Estamos centrados en el cliente: nuestros clientes están en el centro de todo lo que hacemos. Escuchamos activamente y priorizamos el éxito de nuestros clientes, y cada decisión que tomamos está impulsada por cómo podemos servir mejor, respaldar y empoderar a nuestros clientes para que tengan éxito. Cuando nuestros clientes ganan, ganamos.

Responsabilidades

  • Arquitectura y operaciones de Ceph
  • Liderazgo técnico
  • Comunicación con clientes
  • Resolución de problemas

Skills requeridas

Liderazgo técnicoArquitectura de CephOperaciones de CephTroubleshootingComunicación con clientesComunicación efectivaLiderazgoColaboraciónResolución de problemas