workablehace 1 díaInclusión laboral

Ingeniero/a de Datos Senior - Pipelines AWS y RAG

JalasoftRemoto · Tiempo completo

Senior7+ años

Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa busca Ingeniero/a de Datos Senior con 7+ años de experiencia para diseñar y operar infraestructura de datos en AWS, enfocándose en pipelines de RAG y sistemas de IA. Se requiere experiencia en AWS, sistemas distribuidos y modelos de lenguaje.

Por qué aplicar

Si sos un/a Ingeniero/a de Datos con experiencia en AWS y te copan los desafíos de IA y RAG, este puesto remoto es para vos. Podés diseñar y operar infraestructura de datos a gran escala, trabajando con tecnologías de punta en un rol clave para la empresa.

Descripción del puesto

Buscamos un/a Senior Data Engineer para diseñar y operar la infraestructura de datos en la nube que potencia nuestras iniciativas de IA. Arquitectarás data lakes a escala de producción en AWS, construirás pipelines de ingesta y observabilidad en tiempo real, y serás responsable de las capas de búsqueda vectorial y embeddings que alimentan nuestros sistemas RAG y agentes autónomos. Experiencia General Requerida: - Más de 7 años en Data Engineering, Sistemas Distribuidos o Arquitectura de Datos. - Más de 4 años arquitectando data lakes a escala de producción, niveles de almacenamiento y streaming de eventos en AWS. - Más de 2 años construyendo sistemas RAG, gestionando embeddings y orquestando modelos fundacionales. Conocimientos y Experiencia: - Arquitectura de Data Lake y Almacenamiento en AWS. - Observabilidad en Tiempo Real y Análisis de Logs. - Optimización, Vectorización y Embeddings en Elasticsearch y OpenSearch. - Pipelines de IA Generativa y Amazon Bedrock. - Ingeniería de Software e Ingesta de APIs. - Nivel de producción en al menos uno de los siguientes lenguajes: C# (.NET Core), Java, Python o Node.js. Experiencia Preferida: - Estrategias de particionamiento de S3, políticas de ciclo de vida y formatos columnares (Parquet, Iceberg) en AWS. - AWS Glue Data Catalog y Lake Formation para control de acceso multi-inquilino y granular. - Optimización de consultas sobre datasets a escala de petabytes usando Amazon Athena y Redshift Spectrum. - Configuración de collectors oTel distribuidos para captura y enrutamiento de logs, trazas y métricas a S3. - Streaming de alto volumen de logs de sistema, capturas de Datadog y eventos de servidor crudos a S3. - CDC en tiempo real desde PostgreSQL usando Debezium o AWS DMS. - Clústeres de Amazon OpenSearch con búsqueda léxica y vectorial de alta dimensionalidad simultánea. - Gestión del ciclo de vida de índices de OpenSearch, estrategias de sharding y mapeos dinámicos a escala. - APIs de modelos fundacionales de Amazon Bedrock (Claude, Titan) para enriquecimiento de datos, clasificación y análisis semántico. - Knowledge Bases para Amazon Bedrock para chunking automático, extracción de metadatos y sincronización de índices vectoriales desde S3. - Pipelines ETL/ELT ingiriendo datos de eventos no estructurados desde APIs SaaS (ej. Pendo, Hotjar, Google Analytics). - Desarrollo de servidores MCP para exponer el contexto y utilidades del data lake a agentes de IA. Beneficios: - Trabajo remoto. - 13 días festivos flotantes. - 15 días de vacaciones por año cumplido. - Buen ambiente de trabajo. Jalasoft es un empleador que ofrece igualdad de oportunidades. Consideramos a todos los candidatos calificados que cumplan con los requisitos descritos en la descripción del puesto sin distinción. Nos comprometemos a tomar decisiones de empleo sin importar la raza, edad, estado civil o social, origen nacional, discapacidad, sexo, identidad o expresión de género, o cualquier otra característica o grupo de candidatos o empleados no relacionada con sus calificaciones y idoneidad para el puesto. Nuestro equipo directivo se compromete a defender esta política con respeto.

Responsabilidades

Diseñar y operar la infraestructura de datos en la nube
Arquitectar data lakes a escala de producción en AWS
Construir pipelines de ingesta y observabilidad en tiempo real
Ser dueño de las capas de búsqueda vectorial y embeddings para sistemas RAG y agentes autónomos

Skills requeridas

Diseño de data lakesOperación de pipelines de datosSistemas distribuidosArquitectura de datosPipelines RAGGestión de embeddingsOrquestación de modelos fundacionalesIngeniería de softwareIngesta de APIsTrabajo en equipoResolución de problemas

Beneficios

13 días festivos flotantes
15 días de vacaciones por año completado
Buen ambiente de trabajo

Trabajos similares

Más ofertas de Jalasoft

Senior AI Integration Engineer

Jalasoft

Remoto

Directo de la empresa · hace 1 día

Automation Tester Engineer - Python + Pytest and AI experience

Jalasoft

Remoto

Directo de la empresa · hace 1 día

AI/ML Engineer: RAG & API Pipelines

Jalasoft

Remoto

Directo de la empresa · hace 2 días

AI/ML Engineer: Agentic Workflows

Jalasoft

Remoto

Directo de la empresa · hace 2 días

Ingeniero/a de Datos Senior - Pipelines AWS y RAG

Descripción del puesto

Responsabilidades

Skills requeridas

Beneficios

Trabajos similares

Senior AWS Data Engineer

Senior Data Engineer

Data Engineer

Data Engineer

Data Engineer - Open Application

Data Engineer - Databricks / AWS - Latin America - Remote

Más ofertas de Jalasoft

Senior AI Integration Engineer

Automation Tester Engineer - Python + Pytest and AI experience

AI/ML Engineer: RAG & API Pipelines

AI/ML Engineer: Agentic Workflows