directohace 23 horas

Senior DevOps Engineer - Infraestructura AWS / IA

Software MindBuenos AiresRemoto · Tiempo completo
Senior6+ años
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de software busca un Senior DevOps Engineer con experiencia en AWS y en infraestructura para IA/LLM para unirse a un equipo LATAM. El rol implica el diseño, provisión y mantenimiento de la infraestructura cloud y CI/CD para un asistente de IA.

Por qué aplicar

Si te copa la infraestructura cloud y tenés experiencia en AWS, este puesto remoto es para vos. Vas a ser clave en el desarrollo de un asistente de IA, diseñando y manteniendo la base tecnológica. Ideal si buscás un rol con impacto directo en un proyecto innovador.

Descripción del puesto

Acerca del Proyecto Software Mind está construyendo un asistente de IA privado y aislado por tenant para la industria de títulos y liquidación de bienes raíces. La plataforma es un sistema "retrieval-first" (RAG) que ingiere correos electrónicos históricos, documentos y metadatos estructurados en un índice vectorial por tenant, y ofrece respuestas fundamentadas, citadas y con peso experto a través de una interfaz de preguntas y respuestas estilo chat con inicio de sesión único (SSO) y registro de auditoría completo. La plataforma es nativa de AWS con un backend Python/FastAPI, frontend Vue.js, vector store OpenSearch/Pinecone y OpenAI/Anthropic/Bedrock como proveedor de LLM. Te unirás a un equipo senior, multifuncional y basado en LATAM, donde la experiencia práctica en entrega de IA, no solo la familiaridad, es la expectativa base. Te encargarás y serás responsable de la infraestructura cloud y la base de CI/CD sobre la que corre todo el proyecto. Tu trabajo estará en el camino crítico desde el primer día: la entrega comienza con el aprovisionamiento del entorno. Diseñarás para el aislamiento de tenant, la observabilidad y la seguridad desde el principio, no como una ocurrencia tardía. Este rol requiere experiencia previa operando infraestructura para cargas de trabajo de producción basadas en IA o LLM. Tus Responsabilidades - Provisionar y configurar una VPC dedicada y un entorno cloud segmentado en AWS. - Construir el pipeline de CI/CD base y mantenerlo y evolucionarlo a través de todas las fases de entrega. - Configurar y gestionar la infraestructura del vector store (OpenSearch/Pinecone en AWS). - Configurar y gestionar el stack de observabilidad: CloudWatch, X-Ray, umbrales de alerta y monitoreo específico de LLM. - Implementar infraestructura como código (IaC) para todos los entornos (dev, staging, producción) usando Terraform o CDK. - Gestionar secretos, configuración de claves de cifrado KMS y controles de acceso con ámbito de tenant. - Configurar la conectividad del proveedor de LLM (OpenAI / Anthropic / Amazon Bedrock nivel empresarial, "zero-data-retention"). - Definir e implementar la estrategia de promoción de entornos alineada con la cadencia de sprints de 2 semanas. - Soportar los requisitos de infraestructura del pipeline de ingesta incremental y la programación nocturna. Habilidades y Experiencia Imprescindibles - Más de 6 años en ingeniería DevOps o de infraestructura cloud; se requiere una sólida especialización en AWS. - Infraestructura como código: Terraform, CloudFormation o AWS CDK. - Herramientas de CI/CD: GitHub Actions, AWS CodePipeline o equivalente. - Servicios AWS Core: VPC, ECS, Lambda, S3, DynamoDB, API Gateway, Cognito, CloudWatch, X-Ray. - Experiencia diseñando y operando entornos cloud multi-tenant con aislamiento de datos a nivel de tenant. Experiencia en IA (Requerido, No Opcional) - Al menos un proyecto operando infraestructura para un sistema de producción integrado con IA/ML o LLM, no solo cargas de trabajo cloud generales. - Experiencia configurando y gestionando infraestructura de vector store (OpenSearch, Pinecone, Weaviate o equivalente) en un entorno de producción. - Familiaridad con APIs de proveedores de LLM (OpenAI, Anthropic o Amazon Bedrock) en una configuración de producción/empresarial, incluyendo la configuración del nivel "zero-data-retention". - Comprensión de las preocupaciones de observabilidad específicas de IA: monitoreo de uso de tokens, perfilado de latencia para llamadas a LLM y registro de respuestas del modelo. Experiencia Deseable - Experiencia con SSO empresarial y federación de identidades: Cognito, Okta o Azure AD. - Experiencia en configuración de entornos cloud HIPAA, SOC 2 o de datos regulados. - Familiaridad con infraestructura de servicios de OCR o procesamiento de documentos (AWS Textract, etc.). Aceptamos postulaciones de países de LATAM. #LI-DNI Somos Software Mind, ¡un equipo increíble de ingenieros listos para potenciar los proyectos de cualquier empresa de primer nivel! ¿Nuestro objetivo? Estar siempre un paso adelante. ¡Conviértete en parte de una empresa multicultural en constante crecimiento con un excelente ambiente de trabajo certificado por Great Place To Work!

Responsabilidades

  • Provisionar y configurar VPC y entorno cloud segmentado en AWS
  • Construir la pipeline CI/CD base y mantenerla
  • Configurar y gestionar la infraestructura del vector store (OpenSearch/Pinecone en AWS)
  • Configurar y gestionar el stack de observabilidad (CloudWatch, X-Ray, umbrales de alerta, monitoreo específico de LLM)
  • Implementar infraestructura como código para todos los entornos (dev, staging, producción) usando Terraform o CDK
  • Gestionar secretos, configuración de claves de cifrado KMS y controles de acceso segmentados por inquilino
  • Configurar conectividad del proveedor LLM (OpenAI / Anthropic / Amazon Bedrock enterprise tier, zero-data-retention)
  • Definir e implementar estrategia de promoción de entornos alineada con la cadencia de sprints de 2 semanas
  • Soportar requisitos de infraestructura de canal de ingesta incremental y programación nocturna

Skills requeridas

Infraestructura como códigoGestión de secretosControles de acceso a nivel de inquilinoEstrategia de promoción de entornosRequisitos de infraestructura de canal de ingesta incrementalMonitoreo de uso de tokensPerfilado de latencia para llamadas LLMRegistro de respuestas de modelosOwnershipDiseño para aislamiento de inquilinosDiseño para observabilidadDiseño para seguridad

Beneficios

  • Excelente ambiente de trabajo
  • Certificado Great Place To Work
¿Te interesa empleos en Buenos Aires? Avisame cuando haya nuevos.