workablehace 19 horas

Ingeniero/a Databricks

Santiago del Estero ProvinceRemoto · Tiempo completo

Senior3+ años

A convenir

Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de consultoría busca Ingeniero/a Databricks con experiencia en Spark, Delta Lake y MLflow para unirse a su equipo remoto. El rol implica el desarrollo y optimización de pipelines de datos, integración con soluciones cloud y soporte a soluciones de IA/ML.

Por qué aplicar

Si te copa laburar con Databricks, Spark y Delta Lake en un equipo remoto y colaborativo, este puesto en RevStar es para vos. Podés meter mano en pipelines de datos y soluciones de IA/ML, creciendo en una consultora partner de Databricks.

Descripción del puesto

En RevStar, construimos lo que importa como Ingeniero/a de Databricks. RevStar es un Partner de Databricks que lanza una práctica agnóstica a la nube enfocada en servicios de Datos, Machine Learning (ML) e Inteligencia Artificial (AI). Nuestra misión es ayudar a las empresas a modernizar sus plataformas de datos, optimizar flujos de trabajo analíticos e implementar soluciones escalables impulsadas por IA utilizando Databricks. Nos apasiona lo que construimos y cómo lo construimos. Desde la arquitectura y el diseño hasta la codificación y la entrega, abordamos cada proyecto con una mentalidad ágil, analizando continuamente los objetivos y las necesidades del negocio para asegurar resultados óptimos. En RevStar, fomentamos una cultura colaborativa y remota donde los equipos comparten ideas libremente, innovan juntos y crecen tanto individual como colectivamente. Al unirte a nosotros, tendrás la oportunidad de trabajar con tecnologías de vanguardia en diversas industrias, entregando productos de valor para clientes que priorizan la calidad y el rendimiento. Creemos en la búsqueda de la mejora, no solo en el desarrollo de aplicaciones cloud-native, sino en la creación de experiencias y resultados significativos que importan. Buscamos un/a Ingeniero/a de Databricks altamente calificado/a para unirse a nuestro equipo. Este rol será práctico, trabajando en estrecha colaboración con arquitectos/as, científicos/as de datos y clientes para construir, optimizar y desplegar soluciones de datos e IA de alto rendimiento. Como Ingeniero/a de Databricks, serás responsable de construir y optimizar pipelines de datos, implementar frameworks de procesamiento de datos y habilitar soluciones de IA/ML dentro de Databricks. Trabajarás en la ingesta, transformación y orquestación de datos, asegurando escalabilidad, rendimiento y seguridad. Este es un rol técnico práctico, que requiere experiencia en Apache Spark, Delta Lake y MLOps, así como experiencia trabajando con arquitecturas de datos a gran escala. Colaborarás con arquitectos/as y stakeholders de negocio para asegurar que las soluciones se alineen con las necesidades del cliente y las mejores prácticas. Por encima de todo, el/la candidato/a ideal encarna los valores fundamentales de RevStar: Automaestría: Tenemos un alto estándar en cómo pensamos, comunicamos y mejoramos. Propiedad: Somos dueños de los resultados, no solo del esfuerzo. Destino Compartido: Nos levantamos o caemos juntos. Responsabilidades Clave: Ingeniería de Datos y Desarrollo de Pipelines: - Desarrollar y optimizar pipelines de datos utilizando Apache Spark y Delta Lake dentro de Databricks. - Implementar flujos de trabajo ETL/ELT, asegurando la ingesta, transformación y almacenamiento eficientes de datos. - Diseñar soluciones basadas en arquitectura Lakehouse que escalen a través de fuentes de datos estructuradas y no estructuradas. - Integrar Databricks con soluciones de almacenamiento en la nube (Azure Data Lake, AWS S3, Google Cloud Storage) para una gestión de datos fluida. Optimización de Rendimiento y Automatización: - Optimizar trabajos de Spark para escalabilidad, eficiencia de costos y baja latencia. - Implementar soluciones de monitoreo y alerta para rastrear el rendimiento de los trabajos y detectar fallos. - Desarrollar procesos automatizados de validación de datos, pruebas y aseguramiento de la calidad. Gestión de Integración IA/ML y MLOps: - Apoyar el entrenamiento y despliegue de modelos de ML dentro de Databricks, integrando con MLflow para seguimiento de experimentos y versionado de modelos. - Colaborar con científicos/as de datos e ingenieros/as de ML para habilitar soluciones de IA escalables. - Implementar pipelines de ingeniería de características e integrar modelos en entornos de producción. Seguridad, Gobernanza y Mejores Prácticas: - Asegurar la seguridad de los datos, el control de acceso y el cumplimiento de estándares de la industria (GDPR, HIPAA, SOC 2, etc.). - Seguir las mejores prácticas de Databricks para linaje de datos, gobernanza y gestión de metadatos. - Documentar procesos, configuraciones y mejores prácticas para uso interno y de clientes. Requisitos Indispensables: - Más de 3 años de experiencia práctica en ingeniería de datos, con enfoque en procesamiento de big data y arquitecturas cloud-native. - Más de 2 años de experiencia práctica con Databricks, incluyendo Apache Spark, Delta Lake y MLflow. - Certificaciones Databricks (Obligatorio): Databricks Certified Data Engineer Associate (o superior). - Dominio de Python, SQL y frameworks basados en Spark. - Experiencia en el desarrollo y optimización de pipelines ETL/ELT a gran escala. - Fuerte comprensión de la arquitectura Lakehouse y soluciones de datos agnósticas a la nube. - Familiaridad con pipelines CI/CD e Infraestructura como Código (IaC) para Databricks (ej. Terraform, Databricks CLI). - Conocimiento de las mejores prácticas de gobernanza de datos, seguridad y cumplimiento. - Experiencia trabajando en entornos de desarrollo Ágil, siguiendo las mejores prácticas de DevOps/MLOps. Requisitos Deseables: - Certificaciones Databricks adicionales (ej. Databricks Certified Machine Learning Associate). - Experiencia con soluciones de streaming en tiempo real (ej. Kafka, Kinesis, Event Hub). - Familiaridad con herramientas de almacenamiento en la nube y orquestación (ej. Apache Airflow, Prefect). - Antecedentes en integración de IA/ML dentro de Databricks, asistiendo en ingeniería de características y despliegue de modelos. - Experiencia trabajando en roles de cara al cliente o entornos de consultoría. Beneficios para Puestos Full-Time W2: - Tiempo libre remunerado (Paid Time Off): Tómate el tiempo que necesites para recargar energías y mantener la productividad. - Entorno de trabajo remoto-first: Colabora desde cualquier lugar mientras te mantienes conectado/a con nuestro equipo global. - Cobertura médica integral: Médico, Dental, Visión. - Plan de jubilación 401(k): Planifica tu futuro con acceso a un programa 401(k) patrocinado por la empresa. - Estipendio anual de aprendizaje y desarrollo: Invierte en tus habilidades con conferencias, certificaciones o cursos. - Mentoría y coaching entre pares: Aprende de ingenieros/as, gerentes de producto y arquitectos/as experimentados/as para acelerar tu crecimiento. - Oportunidades de crecimiento profesional: Exposición a tecnologías de vanguardia en AWS GenAI, datos y nube en diversas industrias. - Salidas de empresa y oportunidades de voluntariado: Construye relaciones y contribuye a la comunidad. - Cultura colaborativa e innovadora: Trabaja junto a talento de primer nivel en un entorno dinámico y de apoyo que valora la curiosidad y la iniciativa.

Responsabilidades

Develop and optimize data pipelines using Apache Spark and Delta Lake within Databricks
Implement ETL/ELT workflows
Design Lakehouse architecture-based solutions
Integrate Databricks with cloud storage solutions
Optimize Spark jobs for scalability, cost efficiency, and low latency
Implement monitoring and alerting solutions
Develop automated data validation, testing, and quality assurance processes
Support ML model training and deployment within Databricks, integrating with MLflow
Collaborate with data scientists and ML engineers to enable scalable AI solutions
Implement feature engineering pipelines and integrate models into production environments
Ensure data security, access control, and compliance
Follow Databricks best practices for data lineage, governance, and metadata management
Document processes, configurations, and best practices

Skills requeridas

Apache SparkDelta LakeMLflowETL/ELTLakehouse architectureCI/CDInfrastructure-as-Code (IaC)Data governanceData securityAgile methodologiesDevOpsMLOpsSelf-MasteryOwnershipShared DestinyCollaborationInnovationCuriosityInitiative

Beneficios

Paid Time Off
Remote-First Working Environment
Comprehensive Health Coverage
401(k) Retirement Plan
Annual Learning & Development Stipend
Peer Mentorship & Coaching
Professional Growth Opportunities
Company Outings & Volunteer Opportunities
Collaborative, Innovative Culture

Trabajos similares

Más ofertas de RevStar

Full Stack Web Developer

RevStarSantiago del Estero Province

Remoto

hace 19 horas

A convenirDirecto de la empresa

Explorar empleos relacionados

Empleos remotos Empleos en Santiago del Estero Province

¿Te interesa empleos en Santiago del Estero Province? Creá una alerta y te avisamos.

Postularte en la empresa

Ingeniero/a Databricks

Descripción del puesto

Responsabilidades

Skills requeridas

Beneficios

Trabajos similares

Senior Data Engineer

Data Engineer

Senior Data Engineer

Senior/Lead Data Engineer – AI-Native Aftermarket Platform

Data Engineer

Data Engineer

Más ofertas de RevStar

Full Stack Web Developer

Explorar empleos relacionados