directohace 4 meses

Ingeniero/a de Datos Mid/Senior - Plataformas de Datos e Integración ERP

M
Modus Create
Remoto · Por proyecto
Semi Senior4+ años
A convenir
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa global busca Ingeniero/a de Datos Mid/Senior con experiencia en Python, SQL y AWS para un rol remoto, enfocado en la construcción de pipelines de datos desde sistemas ERP y la creación de productos de datos listos para IA.

Por qué aplicar

Si sos un/a Ingeniero/a de Datos con experiencia en Python, SQL y AWS, este puesto remoto te permite construir pipelines de datos desde cero y crear productos listos para IA. Ideal si buscás trabajar en una empresa global y reconocida por su cultura remota.

Descripción del puesto

Acerca de nosotros Fundada en 2011, Modus es un equipo global, totalmente remoto, de tecnólogos de primer nivel que prosperan en un entorno colaborativo e innovador. Somos un socio de ingeniería de productos digitales para empresas con visión de futuro. Nuestros equipos globales trabajan codo a codo con los clientes para diseñar, construir y escalar soluciones personalizadas que logran resultados reales y cambios duraderos, asociándonos con líderes de la industria como AWS, GitHub y Atlassian. ¡Estábamos totalmente remotos antes de que fuera popular! Reconocidos como una de las empresas de más rápido crecimiento privado según Inc. 5000 durante nueve años y una empresa líder en trabajo remoto por FlexJobs, hemos ayudado a algunas de las marcas más grandes del mundo a ofrecer potentes experiencias digitales. La oportunidad Buscamos un Ingeniero de Datos Mid/Senior para unirse a nuestra práctica de Ingeniería de Datos y ayudar a los clientes a construir modernas bases de datos en Databricks y AWS. Diseñarás y construirás pipelines de datos que extraen de sistemas ERP empresariales, transforman a través de arquitecturas medallion y entregan productos de datos gobernados y listos para IA. Trabajarás directamente con expertos en la materia del cliente para comprender los dominios de negocio, validar modelos de datos y asegurar que la plataforma sea apta para producción desde el primer día. Los compromisos actuales involucran entornos de fabricación regulados donde la gobernanza de datos, la gestión de la calidad y la trazabilidad son esenciales. Este es un puesto totalmente remoto con colaboración entre equipos distribuidos y superposición diaria con la Zona Horaria del Este de EE. UU. Requisitos - 4 a 7+ años de experiencia como Ingeniero de Datos o en un rol estrechamente relacionado - Sólidas habilidades de programación en Python, incluyendo PySpark - Sólidas habilidades de SQL, incluyendo consultas analíticas complejas contra grandes bases de datos empresariales - Experiencia práctica con Databricks: Delta Lake, Unity Catalog, Databricks Workflows y SQL Warehouse - Conocimiento práctico de los servicios principales de AWS: S3, IAM, VPC y fundamentos de redes - Experiencia en la construcción de pipelines ETL/ELT que extraen de sistemas ERP empresariales o transaccionales (Oracle, SAP, Microsoft Dynamics o similar) - Fuerte comprensión de modelado de datos, arquitecturas medallion y diseño dimensional - Experiencia con marcos de calidad de datos: reglas de validación, detección de anomalías y manejo de excepciones - Experiencia en el uso de herramientas de IA y LLM para acelerar flujos de trabajo de ingeniería, incluyendo la derivación de contratos de datos, especificaciones de mapeo y documentación de esquemas a partir de metadatos de bases de datos y contexto de negocio limitado - Comodidad colaborando directamente con stakeholders de negocio y expertos en la materia, no solo con equipos de ingeniería - Capacidad para participar en discusiones técnicas, revisiones de código y decisiones arquitectónicas con confianza - Internet confiable de alta velocidad y capacidad para trabajar eficazmente en un entorno remoto-first - Superposición diaria con la Zona Horaria del Este de EE. UU. Puntos extra - Familiaridad con las estructuras de tablas y patrones de datos de Oracle E-Business Suite (módulos INV, PO, BOM, WIP) - Exposición a conceptos del dominio de fabricación: listas de materiales, órdenes de trabajo, rutas de producción, gestión de inventario - Experiencia con dbt para transformación de datos y desarrollo de productos de datos - Experiencia práctica con herramientas de gobernanza de datos y catálogo (Unity Catalog, AWS Glue/Datazone, Apache Atlas o similar) - Integración de datos multisisitema o experiencia en consolidación de ERP, reconciliando diferentes esquemas de origen en un modelo canónico unificado - Metodología de desarrollo basada en especificaciones o contratos, especificaciones YAML, validación de esquemas, contratos de datos - Experiencia en dispositivos médicos, farmacéutica u otros entornos de fabricación regulados - Databricks Asset Bundles y automatización CI/CD para implementaciones de plataformas de datos - Familiaridad con Apache Iceberg o Delta Lake UniForm para interoperabilidad de formatos de tabla abiertos - Experiencia en el soporte de flujos de trabajo de IA/ML en producción: ingeniería de características, integración de servicio de modelos o diseño de productos de datos listos para IA Te encantará - Construir bases de datos que potencian la IA, la analítica y la toma de decisiones operativas para empresas de fabricación - Trabajar directamente con expertos del dominio para comprender cómo operan los negocios reales, no solo mover datos a través de tuberías. - Resolver desafíos de integración multisisitema donde no hay dos ERP que almacenen datos de la misma manera - Diseñar plataformas con gobernanza, observabilidad y calidad de datos integradas desde el principio. - Contribuir a un acelerador de plataforma reutilizable que se implementará en múltiples compromisos con clientes - Elevar el estándar de cómo se realiza la ingeniería de datos: basada en especificaciones, probada, controlada por versiones y lista para producción Acerca del equipo Nuestra práctica de Ingeniería de Datos trabaja con clientes de industrias reguladas para diseñar y entregar plataformas de datos modernas. Los compromisos actuales incluyen la consolidación de datos multi-ERP en Databricks, bases de datos listas para IA para fabricación e implementaciones de gobernanza de datos empresariales. El equipo opera con un alto grado de autonomía, una fuerte disciplina de ingeniería y una preferencia por la simplicidad sobre la complejidad. Al unirte a nuestro equipo, serás parte de un grupo que valora la precisión, la comunicación honesta y la entrega de trabajo que resiste el escrutinio. Postúlate ahora y demuéstranos que tienes lo necesario para construir plataformas de datos que importan.

Responsabilidades

  • Diseñar y construir pipelines de datos que extraigan de sistemas ERP empresariales
  • Transformar datos a través de arquitecturas medallion
  • Entregar productos de datos gobernados y listos para IA
  • Colaborar con expertos en la materia del cliente para comprender dominios de negocio
  • Validar modelos de datos
  • Asegurar que la plataforma sea apta para producción desde el primer día
  • Utilizar herramientas de IA y LLM para acelerar flujos de trabajo de ingeniería

Skills requeridas

Colaboración con stakeholders de negocioParticipación en discusiones técnicasRevisiones de códigoToma de decisiones arquitectónicasGestión de calidad de datosModelado de datosColaboraciónInnovaciónComunicación

Beneficios

  • Construcción de bases de datos que potencian la IA, analítica y toma de decisiones
  • Trabajo directo con expertos de dominio
  • Resolución de desafíos de integración multi-sistema
  • Diseño de plataformas con gobernanza, observabilidad y calidad de datos
  • Contribución a un acelerador de plataforma reutilizable
  • Mejora de las prácticas de ingeniería de datos

Explorar empleos relacionados