workablehace 1 díaInclusión laboral

Ingeniero/a de Datos Senior - Pipelines AWS y RAG

JalasoftRemoto · Tiempo completo
Senior7+ años
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa busca Ingeniero/a de Datos Senior con 7+ años de experiencia para diseñar y operar infraestructura de datos en AWS, enfocándose en pipelines de RAG y sistemas de IA. Se requiere experiencia en AWS, sistemas distribuidos y modelos de lenguaje.

Por qué aplicar

Si sos un/a Ingeniero/a de Datos con experiencia en AWS y te copan los desafíos de IA y RAG, este puesto remoto es para vos. Podés diseñar y operar infraestructura de datos a gran escala, trabajando con tecnologías de punta en un rol clave para la empresa.

Descripción del puesto

Buscamos un/a Senior Data Engineer para diseñar y operar la infraestructura de datos en la nube que potencia nuestras iniciativas de IA. Arquitectarás data lakes a escala de producción en AWS, construirás pipelines de ingesta y observabilidad en tiempo real, y serás responsable de las capas de búsqueda vectorial y embeddings que alimentan nuestros sistemas RAG y agentes autónomos. Experiencia General Requerida: - Más de 7 años en Data Engineering, Sistemas Distribuidos o Arquitectura de Datos. - Más de 4 años arquitectando data lakes a escala de producción, niveles de almacenamiento y streaming de eventos en AWS. - Más de 2 años construyendo sistemas RAG, gestionando embeddings y orquestando modelos fundacionales. Conocimientos y Experiencia: - Arquitectura de Data Lake y Almacenamiento en AWS. - Observabilidad en Tiempo Real y Análisis de Logs. - Optimización, Vectorización y Embeddings en Elasticsearch y OpenSearch. - Pipelines de IA Generativa y Amazon Bedrock. - Ingeniería de Software e Ingesta de APIs. - Nivel de producción en al menos uno de los siguientes lenguajes: C# (.NET Core), Java, Python o Node.js. Experiencia Preferida: - Estrategias de particionamiento de S3, políticas de ciclo de vida y formatos columnares (Parquet, Iceberg) en AWS. - AWS Glue Data Catalog y Lake Formation para control de acceso multi-inquilino y granular. - Optimización de consultas sobre datasets a escala de petabytes usando Amazon Athena y Redshift Spectrum. - Configuración de collectors oTel distribuidos para captura y enrutamiento de logs, trazas y métricas a S3. - Streaming de alto volumen de logs de sistema, capturas de Datadog y eventos de servidor crudos a S3. - CDC en tiempo real desde PostgreSQL usando Debezium o AWS DMS. - Clústeres de Amazon OpenSearch con búsqueda léxica y vectorial de alta dimensionalidad simultánea. - Gestión del ciclo de vida de índices de OpenSearch, estrategias de sharding y mapeos dinámicos a escala. - APIs de modelos fundacionales de Amazon Bedrock (Claude, Titan) para enriquecimiento de datos, clasificación y análisis semántico. - Knowledge Bases para Amazon Bedrock para chunking automático, extracción de metadatos y sincronización de índices vectoriales desde S3. - Pipelines ETL/ELT ingiriendo datos de eventos no estructurados desde APIs SaaS (ej. Pendo, Hotjar, Google Analytics). - Desarrollo de servidores MCP para exponer el contexto y utilidades del data lake a agentes de IA. Beneficios: - Trabajo remoto. - 13 días festivos flotantes. - 15 días de vacaciones por año cumplido. - Buen ambiente de trabajo. Jalasoft es un empleador que ofrece igualdad de oportunidades. Consideramos a todos los candidatos calificados que cumplan con los requisitos descritos en la descripción del puesto sin distinción. Nos comprometemos a tomar decisiones de empleo sin importar la raza, edad, estado civil o social, origen nacional, discapacidad, sexo, identidad o expresión de género, o cualquier otra característica o grupo de candidatos o empleados no relacionada con sus calificaciones y idoneidad para el puesto. Nuestro equipo directivo se compromete a defender esta política con respeto.

Responsabilidades

  • Diseñar y operar la infraestructura de datos en la nube
  • Arquitectar data lakes a escala de producción en AWS
  • Construir pipelines de ingesta y observabilidad en tiempo real
  • Ser dueño de las capas de búsqueda vectorial y embeddings para sistemas RAG y agentes autónomos

Skills requeridas

Diseño de data lakesOperación de pipelines de datosSistemas distribuidosArquitectura de datosPipelines RAGGestión de embeddingsOrquestación de modelos fundacionalesIngeniería de softwareIngesta de APIsTrabajo en equipoResolución de problemas

Beneficios

  • 13 días festivos flotantes
  • 15 días de vacaciones por año completado
  • Buen ambiente de trabajo