directohace 19 horas

Ingeniero Senior de Datos y Plataforma

Logo de Truelogic
Truelogic
Remoto · Tiempo completo
Senior5+ años
A convenir
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de tecnología veterinaria busca Ingeniero Senior de Datos y Plataforma para ser dueño end-to-end de su plataforma de datos, asegurando la ingesta, transformación, almacenamiento y entrega de analíticas críticas. Se requiere experiencia en Snowflake, dbt, Airflow, Terraform y Kubernetes.

Por qué aplicar

Si sos un ingeniero de datos con experiencia en Snowflake, dbt y Terraform, y buscás un rol remoto con autonomía para gestionar una plataforma de datos de punta a punta, esta oportunidad en una empresa de tecnología veterinaria es para vos. Podrás ser dueño de tu trabajo y potenciar tu crecimiento profesional.

Descripción del puesto

SOBRE TRUELOGIC En Truelogic, somos un proveedor líder de servicios de "staff augmentation" "nearshore" con sede en Nueva York. Durante más de dos décadas, hemos estado entregando soluciones tecnológicas de primer nivel a empresas de todos los tamaños, desde "startups" innovadoras hasta líderes de la industria, ayudándolas a alcanzar sus objetivos de transformación digital. Nuestro equipo de más de 600 profesionales tecnológicos altamente calificados, con base en Latinoamérica, impulsa la disrupción digital asociándose con empresas de EE. UU. en sus proyectos más impactantes. Ya sea colaborando con gigantes de Fortune 500 o escalando "startups", entregamos resultados que marcan la diferencia. Al postularte a este puesto, estás dando el primer paso para unirte a un equipo dinámico que valora tu experiencia y aspiraciones. Nuestro objetivo es alinear tus habilidades con oportunidades que fomenten un crecimiento profesional y un éxito excepcionales, al tiempo que contribuyes a proyectos transformadores que dan forma al futuro. NUESTRO CLIENTE Un innovador líder en el espacio de la tecnología veterinaria, que proporciona un ecosistema integral de software de gestión de prácticas, herramientas de IA y soporte de decisiones clínicas utilizado por profesionales de todo el mundo. RESUMEN DEL PUESTO Como "Senior Data Engineer", tendrás la propiedad "end-to-end" de una plataforma de datos en rápida expansión, impulsando la ingesta, transformación, almacenamiento y entrega de análisis críticos para clínicas veterinarias. Trabajando dentro de un equipo de ingeniería totalmente remoto y de alta "ownership", asegurarás la salud y confiabilidad de "pipelines" complejos, aprovecharás prácticas modernas de "infrastructure-as-code" y establecerás estándares robustos de calidad de datos. El candidato ideal es un "builder" probado en batalla que ha construido previamente plataformas de datos desde cero, combinando a la perfección una profunda experiencia en "data warehousing" con la gestión práctica de infraestructura. RESPONSABILIDADES - Tomar propiedad "end-to-end" de la confiabilidad de la plataforma de datos, abarcando "pipelines", "warehousing", transformaciones y observabilidad. - Diseñar, construir y mantener "pipelines" de datos robustos utilizando Apache Airflow, orquestando flujos de trabajo complejos en cargas de trabajo "batch" y "near-real-time". - Gestionar y optimizar el "data warehouse" principal de Snowflake, manejando el diseño de esquemas, claves de "clustering", vistas materializadas, controles de acceso y una estricta gobernanza de costos. - Construir y mantener la capa de transformación de "dbt", incluyendo diseño de modelos, estrategias incrementales, gestión de dependencias y documentación. - Desplegar y operar servicios de la plataforma de datos en Kubernetes (EKS), gestionando de forma independiente cargas de trabajo, depurando problemas de "pods" y ajustando las solicitudes de recursos. - Provisionar y gestionar la infraestructura de la plataforma de datos, incluyendo recursos de Snowflake y Airflow, utilizando Terraform. - Escribir SQL y Python de alta calidad para herramientas de ETL, lógica de "pipelines" y entrega de productos de datos. - Gestionar PostgreSQL como base de datos operacional "source-of-truth", centrándose en la optimización de consultas, indexación, replicación y migraciones. - Liderar la transición hacia "change data capture" (CDC) para la ingesta de datos, utilizando herramientas como Debezium para transmitir cambios de bases de datos. - Implementar observabilidad integral, seguimiento de SLAs y alertas en toda la plataforma de datos utilizando Datadog. - Mantener "pipelines" de CI/CD para despliegues de DAGs, ejecuciones de "dbt", migraciones de esquemas y compilaciones de imágenes de contenedores. - Colaborar con los equipos de "analytics", producto y desarrollo "full-stack" para modelar productos de datos limpios y bien documentados. - Navegar por entornos AWS (incluyendo RDS y S3) para gestionar servicios adyacentes a datos, leer registros y ajustar parámetros de escalado. CALIFICACIONES Y REQUISITOS DEL PUESTO - Más de 5 años de experiencia en ingeniería de datos o un rol combinado de datos e infraestructura, con un historial comprobado de construcción de plataformas de datos de grado de producción desde cero. - Profunda experiencia en Snowflake, incluyendo diseño de esquemas, optimización de rendimiento, control de acceso y optimización avanzada de costos. - Fuerte experiencia práctica con "dbt" (patrones de modelado, estrategias incrementales, pruebas) y Airflow (escritura de DAGs, gestión de dependencias, depuración). - Dominio avanzado de SQL y sólidas habilidades de programación en Python para ETL y automatización. - Conocimiento práctico de Kubernetes, con capacidad para desplegar cargas de trabajo, leer registros de "pods" y gestionar "Helm charts" de forma independiente. - Amplia experiencia en el uso de Terraform para el aprovisionamiento de infraestructura, específicamente para la gestión de componentes de la plataforma de datos. - Experiencia práctica con Datadog para observabilidad, monitoreo y visibilidad de SLAs. - Familiaridad con servicios AWS adyacentes a datos como RDS y S3. - Fluidez en la utilización de asistentes de desarrollo basados en IA para escribir, revisar y depurar código de manera eficiente. - Experiencia previa con Amazon Redshift es un plus. - Se prefiere familiaridad con infraestructura de "streaming" (Kafka, Flink) o formatos de tabla abiertos (Iceberg, Delta Lake). - La experiencia con Elixir o Erlang es ventajosa. - El conocimiento de herramientas de calidad de datos, catalogación o linaje (por ejemplo, Great Expectations, Soda, Monte Carlo, DataHub, OpenMetadata) es un fuerte plus. - La experiencia práctica con Debezium o herramientas CDC comparables, particularmente en despliegues de producción, es un gran "bonus". - La experiencia en la gestión de instancias EKS Spot a escala es un plus. - Se prefiere experiencia en los dominios de salud, medicina veterinaria o dominios regulados similares que requieren estricta precisión de datos y auditabilidad. QUÉ OFRECEMOS - Trabajo 100% Remoto: Disfruta de la libertad de trabajar desde la ubicación que te ayuda a prosperar. Todo lo que necesitas es una laptop y una conexión a internet confiable. - Pago Altamente Competitivo en USD: Gana una compensación excelente y líder en el mercado en USD, que va más allá de las ofertas típicas del mercado. - Tiempo Libre Remunerado: Valoramos tu bienestar. Nuestras políticas de tiempo libre remunerado aseguran que tengas la oportunidad de desconectar y recargar cuando sea necesario. - Trabaja con Autonomía: Disfruta de la libertad de gestionar tu tiempo siempre que el trabajo se complete. Enfócate en los resultados, no en el reloj. - Trabaja con las Mejores Empresas Estadounidenses: Amplía tu experiencia trabajando en proyectos innovadores y de alto impacto con Empresas Líderes en la Industria de EE. UU. POR QUÉ TE GUSTARÁ TRABAJAR AQUÍ - Una Cultura que te Valora: Priorizamos el bienestar y el equilibrio entre la vida laboral y personal, ofreciendo actividades de "engagement" y fomentando equipos dinámicos para asegurar que prosperes tanto personal como profesionalmente. - Red Global Diversa: Conéctate con más de 600 profesionales en más de 25 países, expande tu red y colabora con un equipo multicultural de Latinoamérica. - Forma Equipo con Profesionales Calificados: Únete a talento senior. Todos nuestros miembros del equipo son expertos experimentados, lo que garantiza que trabajes con los mejores en tu campo. ¡Postúlate ahora!

Responsabilidades

  • Tomar propiedad end-to-end de la confiabilidad de la plataforma de datos, abarcando pipelines, data warehousing, transformaciones y observabilidad.
  • Diseñar, construir y mantener pipelines de datos robustos utilizando Apache Airflow, orquestando flujos de trabajo complejos entre cargas de trabajo batch y casi en tiempo real.
  • Gestionar y optimizar el data warehouse principal de Snowflake, manejando el diseño de esquemas, claves de clustering, vistas materializadas, controles de acceso y una estricta gobernanza de costos.
  • Construir y mantener la capa de transformación dbt, incluyendo diseño de modelos, estrategias incrementales, gestión de dependencias y documentación.
  • Desplegar y operar servicios de la plataforma de datos en Kubernetes (EKS), gestionando cargas de trabajo de forma independiente, depurando problemas de pods y ajustando las solicitudes de recursos.
  • Aprovisionar y gestionar la infraestructura de la plataforma de datos, incluyendo recursos de Snowflake y Airflow, utilizando Terraform.
  • Escribir SQL y Python de alta calidad para herramientas ETL, lógica de pipelines y entrega de productos de datos.
  • Gestionar PostgreSQL como base de datos operacional de fuente de verdad, centrándose en la optimización de consultas, indexación, replicación y migraciones.
  • Liderar la transición hacia el cambio de captura de datos (CDC) para la ingesta de datos, utilizando herramientas como Debezium para transmitir cambios en la base de datos.
  • Implementar observabilidad integral, seguimiento de SLA y alertas en toda la plataforma de datos utilizando Datadog.
  • Mantener pipelines CI/CD para despliegues de DAGs, ejecuciones de dbt, migraciones de esquemas y compilaciones de imágenes de contenedores.
  • Colaborar con los equipos de analítica, producto y desarrollo full-stack para modelar productos de datos limpios y bien documentados.
  • Navegar por entornos AWS (incluyendo RDS y S3) para gestionar servicios adyacentes a datos, leer logs y ajustar parámetros de escalado.

Skills requeridas

Construcción de plataformas de datosGestión de infraestructuraDiseño de esquemasOptimización de rendimientoControl de accesoGobernanza de costosDiseño de modelosEstrategias incrementalesGestión de dependenciasDocumentaciónDespliegue de cargas de trabajoDepuración de podsAjuste de solicitudes de recursosAprovisionamiento de infraestructuraMonitoreoAlertasCI/CDCalidad de datosAuditoríaPropiedad end-to-endAlta propiedadColaboraciónAutonomíaAdaptabilidad

Beneficios

  • 100% Trabajo Remoto
  • Pago altamente competitivo en USD
  • Días de vacaciones pagas
  • Autonomía en la gestión del tiempo
  • Trabajo con empresas líderes de EE. UU.

Explorar empleos relacionados