Directo de la empresahace 1 mes

Ingeniero de Datos - Remoto, Latinoamérica

Buenos AiresRemoto · Tiempo completo

Senior2+ años

Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de consultoría busca un Ingeniero de Datos con experiencia en Python (PySpark) y Azure Synapse Analytics para desarrollar procesos ETL, modelado de datos y optimización de rendimiento. El rol es 100% remoto para Latinoamérica.

Por qué aplicar

Ideal para desarrolladores apasionados que buscan un entorno dinámico y colaborativo.

Descripción del puesto

Bluelight es una consultora de software líder dedicada a diseñar y desarrollar tecnología innovadora que mejora la vida de los usuarios. Con un firme compromiso de brindar un servicio excepcional a nuestros clientes, Bluelight se destaca en su enfoque en la calidad y la satisfacción del cliente. Nuestra misión no es solo crear aplicaciones de vanguardia, sino también fomentar un entorno de trabajo colaborativo y enriquecedor donde cada miembro del equipo pueda crecer y prosperar. Con presencia en Estados Unidos y América Central/del Sur, Bluelight se encuentra en una emocionante fase de expansión, buscando continuamente talento excepcional para unirse a su comunidad dinámica y diversa. Como ETL Data Engineer, desempeñarás un papel fundamental en el equipo de ingeniería de datos de nuestro cliente, diseñando, desarrollando y manteniendo procesos de integración de datos principalmente utilizando Python (PySpark) y Azure Synapse Analytics para garantizar la precisión y disponibilidad de los datos analíticos. Trabajando en estrecha colaboración con científicos de datos, analistas y otras partes interesadas para entregar datos de alta calidad para insights y toma de decisiones, este puesto es ideal para un profesional apasionado por el desarrollo de software que prospera en un entorno dinámico y de ritmo rápido donde las opiniones y los esfuerzos de todos son valorados. Al unirte a la consultora de software en crecimiento de nuestro cliente, tendrás la oportunidad de contribuir a proyectos desafiantes y líderes en el mercado dentro de una comunidad colaborativa que valora profundamente el trabajo duro, el aprendizaje continuo, el crecimiento personal y el desarrollo profesional. Responsabilidades: - ETL Data Engineering: Desarrollar y mantener procesos de ETL Data Engineering utilizando Python (PySpark) dentro de Azure Synapse Analytics Notebooks y/o Azure Synapse Analytics Pipelines, para garantizar extracciones, transformaciones y cargas de datos eficientes. - Data Warehousing: Aplicar tu experiencia en data warehousing, comprendiendo esquemas en estrella, hechos y dimensiones, para diseñar y construir estructuras de almacenamiento de datos efectivas en un Massively Parallel Processing (MPP) SQL Pool. - Data Source Expertise: Extraer datos de diversas fuentes, incluyendo REST APIs, tablas de bases de datos SQL y archivos CSV. - Azure Synapse Analytics Expertise: Utilizar tu profundo conocimiento de Azure Synapse Analytics para diseñar y optimizar notebooks/pipelines de datos para escalabilidad y rendimiento. - Data Fabric Concepts: Contribuir a la implementación y comprensión de otros conceptos de Data Fabric, como data lakes, lakehouses, delta lakes y data cataloging, para mejorar las capacidades de gestión de datos. - Data Modeling: Colaborar con arquitectos de datos para crear modelos y esquemas de datos que se alineen con los requisitos del negocio. - Data Quality: Implementar procesos de validación y calidad de datos para mantener la precisión y consistencia de los datos. - Performance Tuning: Identificar y resolver cuellos de botella de rendimiento y optimizar notebooks/pipelines de ETL de datos para cumplir con los SLAs. - Monitoring and Troubleshooting: Monitorear trabajos de ETL, diagnosticar problemas e implementar soluciones para garantizar la confiabilidad de los pipelines de datos. - Documentation: Mantener documentación completa de los procesos de ETL Data Engineering, flujos de datos y transformaciones de datos. - Collaboration: Trabajar en estrecha colaboración con equipos multifuncionales para comprender los requisitos de datos y brindar soporte para iniciativas relacionadas con datos. - Security and Compliance: Garantizar la seguridad de los datos y el cumplimiento de los estándares de gobernanza y privacidad de datos. Calificaciones: - Título de Grado en Ciencias de la Computación, Tecnología de la Información o un campo relacionado; o experiencia laboral equivalente, con certificaciones relacionadas con data engineering o data science (ej. Azure Data Engineer) como un plus. - Experiencia comprobada en ETL Data Engineering con experiencia significativa en el uso de Python (PySpark) para realizar extracción, transformación y carga de datos desde REST APIs, tablas de bases de datos SQL y archivos CSV. - Dominio en el uso de recursos de Azure Synapse Analytics, incluyendo Notebooks, Pipelines, Linked Services y Azure Key Vault. - Capacidad demostrada para escribir consultas SQL complejas, optimizar el rendimiento de las consultas y trabajar tanto con SparkSQL como con MS SQL para extraer, transformar y cargar datos de manera efectiva. - Conocimiento de las mejores prácticas y herramientas de integración de datos. - Experiencia con sistemas de control de versiones, como Git (Azure DevOps). - Sólidas habilidades de resolución de problemas y analíticas, con una gran atención al detalle. - Excelentes habilidades de comunicación, tanto verbales como escritas, con la capacidad de trabajar en colaboración en un entorno de equipo con prioridades cambiantes. - Familiaridad con tecnologías de big data, machine learning y análisis de datos preferida. - Experiencia con herramientas de visualización de datos (ej. Power BI, Tableau) y Metodologías Ágiles como un plus.

Responsabilidades

Develop and maintain ETL data engineering processes using Python (PySpark) within Azure Synapse Analytics Notebooks, and/or Azure Synapse Analytics Pipelines, to ensure efficient data extractions, transformation, and loading.
Apply expertise in data warehousing, understanding star schemas, facts, and dimensions, to design and build effective data storage structures in a Massively Parallel Processing (MPP) SWL Pool.
Extract data from various sources, including REST APIs, SWL database tables, and CSV files.
Utilize deep knowledge of Azure Synapse Analytics to design and optimize data notebooks/pipelines for scalability and performance.
Contribute to the implementation and understanding of other Data Fabric concepts, such as data lakes, lakehouses, delta lakes, and data cataloging, to enhance data management capabilities.
Collaborate with data architects to create data models and schemas that align with business requirements.
Implement data quality checks and validation processes to maintain data accuracy and consistency.
Identify and resolve performance bottlenecks and optimize ETL data notebooks/pipelines to meet SLAs.
Monitoring ETL jobs, diagnose issues, and implement solutions to ensure data pipeline reliability.
Maintain comprehensive documentation of ETL data engineering processes, data flows, and data transformations.
Work closely with cross-functional teams to understand data requirements and provide support for data-related initiatives.
Ensure data security and compliance with data governance and privacy standards.

Habilidades

ETLData WarehousingData ModelingData QualityPerformance TuningMonitoring and TroubleshootingDocumentationCollaborationSecurity and ComplianceProblem-solvingAnalytical skillsAttention to detailCommunication skillsCollaborationProblem-solvingAnalytical skillsAttention to detailCommunication skills

Trabajos similares

Data Engineer

Allata · Buenos Aires · Remoto

Data Engineer

Onhires · Presencial

Data Engineer

Huzzle · Remoto

Data Engineer

Pavago · Remoto

Data Engineer

Chevron Wd5/Jobs · Buenos Aires · Presencial

SR Data Engineer – Microsoft Fabric & Azure BI - Remoto

IT4W · Remoto

Más ofertas de Bluelightconsulting

Azure Data Engineer - Remote, Latin America

Bluelightconsulting · Mendoza · Remoto

Data Engineer - Remote, Latin America

Bluelightconsulting · Mendoza · Remoto

Azure Data Engineer - Remote, Latin America

Bluelightconsulting · Remoto

Data Engineer - Remote, Latin America

Bluelightconsulting · Remoto

Más empleos de Tecnología y Sistemas en Buenos Aires

Ingeniero de procesos de acondicionamiento

Sinergiumbiotech · Buenos Aires · Presencial

Técnico Instalador Junior

Baireshr · Buenos Aires · Presencial

Ingeniero ejecucion perforacion

YPF · Buenos Aires · Presencial

Cybersecurity Trainee

Grupo Techint · Buenos Aires · Presencial

Ver los 1.461 empleos de Tecnología y Sistemas en Buenos Aires →

Explorar empleos relacionados

Empleos de Tecnología y Sistemas en Buenos Aires Empleos de Tecnología y Sistemas Tecnología y Sistemas remotos Sueldos de Tecnología y Sistemas Empleos en Buenos Aires

¿Te interesa empleos en Buenos Aires? Creá una alerta y te avisamos.

Postularte en la empresa

Descripción del puesto

Responsabilidades

Develop and maintain ETL data engineering processes using Python (PySpark) within Azure Synapse Analytics Notebooks, and/or Azure Synapse Analytics Pipelines, to ensure efficient data extractions, transformation, and loading.

Apply expertise in data warehousing, understanding star schemas, facts, and dimensions, to design and build effective data storage structures in a Massively Parallel Processing (MPP) SWL Pool.

Extract data from various sources, including REST APIs, SWL database tables, and CSV files.

Utilize deep knowledge of Azure Synapse Analytics to design and optimize data notebooks/pipelines for scalability and performance.

Contribute to the implementation and understanding of other Data Fabric concepts, such as data lakes, lakehouses, delta lakes, and data cataloging, to enhance data management capabilities.

Collaborate with data architects to create data models and schemas that align with business requirements.

Implement data quality checks and validation processes to maintain data accuracy and consistency.

Identify and resolve performance bottlenecks and optimize ETL data notebooks/pipelines to meet SLAs.

Monitoring ETL jobs, diagnose issues, and implement solutions to ensure data pipeline reliability.

Maintain comprehensive documentation of ETL data engineering processes, data flows, and data transformations.

Work closely with cross-functional teams to understand data requirements and provide support for data-related initiatives.

Ensure data security and compliance with data governance and privacy standards.

Trabajos similares