Data Lead (Life Sciences)
Se busca Data Lead en Life Sciences para diseñar y construir plataformas de datos modernas en la nube para clientes de Life Sciences, enfocado en casos de uso de Omics y análisis intensivo de datos.
Atractivo para profesionales que buscan crecer en Life Sciences con proyectos innovadores y colaboración en equipo.
Descripción del puesto
En el último año en Loka, nuestros equipos de ingeniería han ayudado a clientes a avanzar en el tutor de lectura de IA número uno del mundo, eliminar $ 1.000 millones en desperdicio de alimentos y desarrollar medicamentos novedosos para combatir el cáncer. Para culminar, a fines de 2024 Loka fue reconocida por AWS como Socia de Innovación del Año, superando a 150.000 socias para el título. Y lo logramos todo mientras disfrutábamos de cada otro viernes libre 😎 Como Data Lead en Ciencias de la Vida, diseñarás y construirás plataformas de datos en la nube modernas para clientes de Ciencias de la Vida, enfocándote en casos de uso de Omics y análisis intensivo. Liderarás proyectos técnicos de principio a fin, colaborarás estrechamente con equipos de Bioinformática, ML y Producto y garantizarás que la infraestructura de datos sea escalable, confiable, segura y fácil de usar. Únete a nuestro equipo para alimentar tu deseo de crecer, construir con las últimas herramientas y colaborar en proyectos de los que puedas estar orgulloso. **El rol** - Diseñar e implementar plataformas de datos y aplicaciones nativas en la nube escalables para negocios de Ciencias de la Vida, enfocándose en conjuntos de datos Omics y multimodales relacionados. - Liderar proyectos técnicos a través de arquitectura, diseño, implementación y despliegue, estableciendo estándares y mejores prácticas para el equipo. - Colaborar con equipos de Aprendizaje Automático, Ciencia de Datos, Bioinformática, Ingeniería de Software, Diseño y Negocios para comprender los requisitos y solucionar problemas de datos o ETL. - Definir e implementar comprobaciones de calidad de datos, pruebas y monitoreo para mantener altos estándares de código, esquema e integridad de datos. - Monitorear y analizar datos que fluyen a través de pipelines y plataformas, construyendo paneles de control, alertas y herramientas de observabilidad adecuadas. - Gestionar un equipo de ingenieros de datos y ayudarlos con orientación de proyectos y desarrollo profesional. **Requisitos** - 5+ años de experiencia, incluyendo responsabilidad por sistemas de producción, en Ingeniería de Datos o un rol estrechamente relacionado - 3+ años de experiencia liderando equipos, incluyendo mentoría técnica y propiedad de entrega - Capacidad comprobada para comunicar el estado técnico, los riesgos y las compensaciones a los clientes y las partes interesadas internas, brindando orientación clara sobre las decisiones de plataforma de datos y arquitectura - Dominio avanzado de Python y SQL para construir pipelines de datos, transformaciones y herramientas de análisis - Fuerte experiencia en diseño, implementación y mantenimiento de ETL/ELT en cargas de trabajo por lotes y/o en streaming - Experiencia práctica con al menos un proveedor importante de nube (AWS, GCP o Azure) que entregue productos o plataformas centradas en datos - Experiencia con almacenes de datos en memoria y en disco, bases de datos relacionales y no relacionales y tecnologías de búsqueda (por ejemplo, MySQL/PostgreSQL, MongoDB, DynamoDB, OpenSearch/Elasticsearch), con puntos adicionales para bases de datos de grafos (por ejemplo, Neo4j) - Experiencia con conceptos de almacenamiento de datos, modelado dimensional/columnar y patrones de warehouse/lakehouse modernos - Conocimiento práctico de lagos de datos, almacenes de datos y tecnologías o servicios de procesamiento masivo en paralelo (MPP) - Habilidades sólidas para resolver problemas y la capacidad de trabajar a través de la ambigüedad, las especificaciones incompletas y los requisitos en evolución - Experiencia colaborando con equipos de Bioinformática o desarrollando flujos de trabajo y plataformas que admitan pipelines de Bioinformática **Preferente pero no requerido** - Conocimiento práctico de conceptos de seguridad y confiabilidad básicos: IAM, autenticación federada, SSO/SAML, cifrado, mejores prácticas de seguridad/red, respaldo y recuperación ante desastres - Familiaridad con conjuntos de datos de Omics y Ciencias de la Vida (por ejemplo, RNA‑seq, ATAC‑seq, WGS) y formatos de datos de bioinformática relevantes (por ejemplo, FASTQ, BAM, VCF, h5ad) - Fuerte experiencia con sistemas distribuidos para procesamiento y análisis de datos a gran escala - Experiencia con Spark para manipulación interactiva y a gran escala de datos - Experiencia con formatos de tabla/lakehouse abiertos (por ejemplo, Apache Hudi, Delta Lake, Apache Iceberg, Databricks) y su papel en las plataformas de datos modernas - Experiencia con Infraestructura como Código (por ejemplo, Terraform, CloudFormation) y pipelines de CI/CD para cambios de datos e infraestructura - Experiencia con herramientas de visualización de datos y BI (por ejemplo, QuickSight, Looker, Tableau) para crear paneles de control y monitoreo **Perfil de personalidad** - Curioso: Quieres aprender y crecer en diferentes industrias utilizando una pila de tecnología moderna. - Autónomo: Te desenvuelves en un entorno completamente remoto. - Colaborativo: Disfrutas trabajando como parte de un equipo. - Adaptable: Operas con una mentalidad de inicio y te mueves a un ritmo de inicio. - Confiable: Puedes confiar para entregar trabajo de alta calidad. **Beneficios** - Cada otro viernes libre (26 días libres adicionales al año) - Remoto y flexible - Programas de exploración y reubicación (tres meses de trabajo en el extranjero o reubicación internacional completa) - Días de enfermedad pagos y días festivos locales - Suscripciones de salud mental premium - Acceso a LokaLabs ™, nuestro programa de investigación y desarrollo interno - Suscripción de acondicionamiento físico - Programas de bienestar mental - Camino profesional definido **Por favor, envíe su CV en inglés.**
Responsabilidades
- Diseñar e implementar plataformas de datos en la nube
- Liderar proyectos técnicos
- Colaborar con equipos de Machine Learning, Data Science, Bioinformatics
- Definir e implementar controles de calidad de datos
Skills requeridas
Beneficios
- Días libres cada dos viernes
- Remoto y flexible
- Programas de exploración y reubicación
- Días de enfermedad pagos
- Suscripciones de salud mental
- Acceso a LokaLabs
- Suscripción de fitness
- Programas de bienestar mental
- Carrera definida