Ingeniero/a de Datos Senior - Pipelines AWS y RAG
Empresa busca Ingeniero/a de Datos Senior con 7+ años de experiencia para diseñar y operar infraestructura de datos en AWS, enfocándose en pipelines de RAG y sistemas de IA. Se requiere experiencia en AWS, sistemas distribuidos y modelos de lenguaje.
Si sos un/a Ingeniero/a de Datos con experiencia en AWS y te copan los desafíos de IA y RAG, este puesto remoto es para vos. Podés diseñar y operar infraestructura de datos a gran escala, trabajando con tecnologías de punta en un rol clave para la empresa.
Descripción del puesto
Buscamos un/a Senior Data Engineer para diseñar y operar la infraestructura de datos en la nube que potencia nuestras iniciativas de IA. Arquitectarás data lakes a escala de producción en AWS, construirás pipelines de ingesta y observabilidad en tiempo real, y serás responsable de las capas de búsqueda vectorial y embeddings que alimentan nuestros sistemas RAG y agentes autónomos. Experiencia General Requerida: - Más de 7 años en Data Engineering, Sistemas Distribuidos o Arquitectura de Datos. - Más de 4 años arquitectando data lakes a escala de producción, niveles de almacenamiento y streaming de eventos en AWS. - Más de 2 años construyendo sistemas RAG, gestionando embeddings y orquestando modelos fundacionales. Conocimientos y Experiencia: - Arquitectura de Data Lake y Almacenamiento en AWS. - Observabilidad en Tiempo Real y Análisis de Logs. - Optimización, Vectorización y Embeddings en Elasticsearch y OpenSearch. - Pipelines de IA Generativa y Amazon Bedrock. - Ingeniería de Software e Ingesta de APIs. - Nivel de producción en al menos uno de los siguientes lenguajes: C# (.NET Core), Java, Python o Node.js. Experiencia Preferida: - Estrategias de particionamiento de S3, políticas de ciclo de vida y formatos columnares (Parquet, Iceberg) en AWS. - AWS Glue Data Catalog y Lake Formation para control de acceso multi-inquilino y granular. - Optimización de consultas sobre datasets a escala de petabytes usando Amazon Athena y Redshift Spectrum. - Configuración de collectors oTel distribuidos para captura y enrutamiento de logs, trazas y métricas a S3. - Streaming de alto volumen de logs de sistema, capturas de Datadog y eventos de servidor crudos a S3. - CDC en tiempo real desde PostgreSQL usando Debezium o AWS DMS. - Clústeres de Amazon OpenSearch con búsqueda léxica y vectorial de alta dimensionalidad simultánea. - Gestión del ciclo de vida de índices de OpenSearch, estrategias de sharding y mapeos dinámicos a escala. - APIs de modelos fundacionales de Amazon Bedrock (Claude, Titan) para enriquecimiento de datos, clasificación y análisis semántico. - Knowledge Bases para Amazon Bedrock para chunking automático, extracción de metadatos y sincronización de índices vectoriales desde S3. - Pipelines ETL/ELT ingiriendo datos de eventos no estructurados desde APIs SaaS (ej. Pendo, Hotjar, Google Analytics). - Desarrollo de servidores MCP para exponer el contexto y utilidades del data lake a agentes de IA. Beneficios: - Trabajo remoto. - 13 días festivos flotantes. - 15 días de vacaciones por año cumplido. - Buen ambiente de trabajo. Jalasoft es un empleador que ofrece igualdad de oportunidades. Consideramos a todos los candidatos calificados que cumplan con los requisitos descritos en la descripción del puesto sin distinción. Nos comprometemos a tomar decisiones de empleo sin importar la raza, edad, estado civil o social, origen nacional, discapacidad, sexo, identidad o expresión de género, o cualquier otra característica o grupo de candidatos o empleados no relacionada con sus calificaciones y idoneidad para el puesto. Nuestro equipo directivo se compromete a defender esta política con respeto.
Responsabilidades
- Diseñar y operar la infraestructura de datos en la nube
- Arquitectar data lakes a escala de producción en AWS
- Construir pipelines de ingesta y observabilidad en tiempo real
- Ser dueño de las capas de búsqueda vectorial y embeddings para sistemas RAG y agentes autónomos
Skills requeridas
Beneficios
- 13 días festivos flotantes
- 15 días de vacaciones por año completado
- Buen ambiente de trabajo