directohace 20 horas

Ingeniero Senior de IA Generativa

C
CookUnity
Remoto · Tiempo completo
Senior
A convenir
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

CookUnity busca un Ingeniero Senior de IA Generativa para liderar la dirección técnica de su plataforma de agentes de IA, enfocándose en el runtime, herramientas, memoria, guardarraíles y evaluación. El rol es práctico y requiere experiencia en LLMs y Python.

Por qué aplicar

Si sos un ingeniero de IA con experiencia en LLMs y Python, este puesto remoto en CookUnity te permite liderar la dirección técnica de su plataforma de agentes de IA. Es una oportunidad para tener un impacto directo en la innovación de una empresa que busca empoderar a los chefs para nutrir al mundo.

Descripción del puesto

Acerca de CookUnity: La comida ha perdido su alma ante la conveniencia moderna. Y con ella, ha perdido el poder de nutrir, inspirar y conectarnos. Por eso, en 2018, se fundó CookUnity como la primera plataforma de su tipo que conecta al mundo con la fuente de la verdadera buena comida: los chefs. Hoy, CookUnity entrega 50 millones de comidas al año de los mejores chefs de la industria a hogares de todo el país. Frescas. Listas para comer. Y elaboradas con la pasión que nutre el cuerpo y el alma. Sin conformarse con eso, CookUnity se expande más allá de la entrega para convertirse en un marketplace en constante innovación, enfocado en nuestra misión singular: empoderar a los chefs para nutrir al mundo. Si esa misión te abre el apetito en más de un sentido, has encontrado la oferta de empleo correcta. El Rol: Hemos puesto agentes de IA frente a los miembros de CookUnity. Nuestro Nutricionista IA habla con las personas, razona sobre nuestro menú y sus objetivos, y toma acciones reales en su nombre, como armar un carrito para la semana. Ya está funcionando en producción, y es el primero de varios agentes que planeamos lanzar. Estamos contratando un Ingeniero Senior de IA para que sea responsable de la dirección técnica de la plataforma debajo de esos agentes: el runtime, las herramientas, la memoria, las barreras de seguridad, la evaluación y la observabilidad de las que todos dependen. Este es un rol práctico, no de supervisión. Construirás agentes de principio a fin, desde un prototipo inicial hasta el runtime de producción que atiende a los miembros y el Terraform que lo implementa. A nivel Staff+ también pensarás algunos agentes por delante, tomando las partes que funcionan y convirtiéndolas en bloques de construcción reutilizables para que el equipo deje de reescribir lo difícil cada vez. Nos importa más tu criterio con los LLMs y agentes que cualquier framework en tu CV. Los frameworks van y vienen. Las partes difíciles (grounding, diseño de herramientas, memoria, seguridad, evaluación, costo, latencia) se quedan. Responsabilidades: - Ser responsable de los agentes de principio a fin. Llevar una funcionalidad desde el prototipo hasta producción: diseño del orquestador y sub-agentes, las herramientas que llama el agente, prompts del sistema, memoria y el contrato de respuesta que el frontend renderiza. Escribes el código que se lanza. - Ser responsable del runtime del agente. Diseñar el runtime de producción para que sea rápido en la ruta de cara al miembro y fácil de depurar cuando algo falla. Esto cubre la orquestación multi-agente, la ejecución real de herramientas a través de una puerta de enlace segura, memoria a corto y largo plazo, y el estado de la sesión. Actualmente se ejecuta en Amazon Bedrock AgentCore y Strands; tendrás una gran influencia en su futuro. - Hacer que las herramientas sean confiables. Construir la capa de herramientas de la que dependen los agentes, como la búsqueda basada en nuestro catálogo real, la recuperación y reordenamiento, y las acciones de carrito y cuenta. Mantener las credenciales y la identidad del miembro fuera de cualquier cosa que el modelo pueda controlar. - Ser responsable de la seguridad. Construir el modelo de seguridad en capas: barreras de seguridad de entrada y salida, manejo de intenciones y aclaraciones, rechazos y límites de PII. Decidir qué se aplica de forma estricta y qué maneja el agente en su propio razonamiento. El asesoramiento nutricional aumenta las apuestas aquí, por lo que esto es importante. - Hacer que la calidad sea medible. Impulsar nuestro trabajo de evaluación: verificaciones estructuradas más LLM-como-juez, con una cola de revisión para los casos en los que los jueces no están de acuerdo. Si no podemos medir si un prompt, modelo o cambio de herramienta ayudó, no lo lanzamos. - Instrumentarlo. Hacer que los agentes sean depurables en producción con líneas de tiempo por sesión y por turno, rastreos de herramientas y barreras de seguridad, y visibilidad de tokens y costos. Cuando una respuesta parece incorrecta, alguien debería poder ver por qué en minutos. - Convertirlo en una plataforma. Tomar los patrones que funcionan y hacerlos reutilizables, para que el próximo agente y el próximo ingeniero hereden las convenciones del runtime, el andamiaje de evaluación y los valores predeterminados de las barreras de seguridad en lugar de empezar de nuevo. - Mejorar al equipo. Establecer la dirección técnica en las bases de código de agentes e infraestructura, y mantener agudas las revisiones de diseño y código. Ayudar a los socios de producto y datos a determinar cuándo un agente es la respuesta correcta y cuándo no. Qué implica el éxito: - Los agentes frente a los miembros mejoran mediblemente, son más precisos y seguros a un menor costo por turno, y podemos demostrarlo en las evaluaciones en lugar de discutirlo. - Lanzar una nueva capacidad de agente cuesta una fracción de lo que solía costar, porque el runtime, la memoria, las barreras de seguridad y los patrones de evaluación son reutilizables. - Las regresiones de calidad y seguridad se detectan en la evaluación y la observabilidad antes de que los miembros las sientan. - Otros ingenieros recurren a tus patrones por defecto y mejoran a partir de cómo revisas y diseñas. Requisitos Mínimos: - Experiencia real en producción construyendo con LLMs y agentes. Este es el único requisito difícil. - Buen juicio en las partes difíciles: grounding y recuperación, diseño de herramientas y contexto, memoria, costo y latencia, seguridad, y cómo saber si algo de esto está funcionando. - Puedes mirar un agente que funciona y ver el patrón reutilizable en él, y sabes cuándo no sobre-ingenierizar. - Sólido conocimiento de Python, más suficiente rango en APIs, cloud e infraestructura como código para ser responsable de una funcionalidad desde la llamada al modelo hasta el despliegue. - Un historial de establecimiento de dirección técnica y mejora de los ingenieros que te rodean. - Puedes pasar de un error de orquestación difícil a una explicación en lenguaje claro de las compensaciones para un stakeholder no técnico. Requisitos Preferidos: - Frameworks de agentes y orquestación, y runtimes de agentes gestionados. - Recuperación y RAG, búsqueda híbrida y reordenamiento, y llamadas a herramientas contra servicios reales. - Trabajo práctico de evaluación (LLM-como-juez, conjuntos de oro, harnesses de regresión), y opiniones sobre sus limitaciones. - Observabilidad de LLM y ajuste de costos/latencia en producción (rastreo, caché de prompts, economía de tokens). - Infraestructura como código (Terraform) y ser responsable de la huella en la nube donde se ejecutan tus agentes (AWS, Bedrock). - Experiencia en una empresa de suscripción DTC, marketplace o un negocio en crecimiento con alta carga operativa. Tecnologías que usarás: Este es el entorno en el que trabajarás cuando te unas. Está aquí para que sepas cómo será tu semana, no como una lista de requisitos. Esperamos que los ingenieros sólidos se adapten a las partes que no han utilizado y nos ayuden a cambiar lo que necesita ser cambiado. - Lenguajes: Principalmente Python, TypeScript en los bordes. - Agentes y orquestación: Orquestación multi-agente Strands en Amazon Bedrock AgentCore, con herramientas expuestas a través de una puerta de enlace MCP gestionada respaldada por Lambda y objetivos OpenAPI. - Observabilidad: Datadog LLM Observability, registro estructurado de sesiones y turnos, instrumentación de caché de prompts y tokens. - Infraestructura: AWS gestionado por Terraform (runtime de Amazon Bedrock AgentCore, puerta de enlace, IAM, memoria, barreras de seguridad), CI/CD de GitHub Actions. - Colaboración: Slack, Notion, Jira, Google Workspace. Beneficios: - Recibe tu pago en USD. - Trabaja de forma remota: diseña la vida que deseas. - Disfruta de 15 días de vacaciones cada año desde la fecha de inicio. - 16 feriados argentinos completamente pagos. - Beneficio de Salud: Estipendio mensual para usar en tu proveedor de salud preferido. - Sabbatical de 5 años: Después de 5 años en CookUnity, obtienes un sabbatical pago de 4 semanas. - Licencia familiar paga. - Licencia por Compasión: 3-5 días cada vez que surja la necesidad. - Beneficios flexibles, a tu manera: una tarjeta prepaga que puedes usar en bienestar, aprendizaje, comida y más. - Entorno de trabajo con IA: acceso empresarial a ChatGPT y Claude para ayudarte a trabajar de manera más inteligente y crecer más rápido. - Entrenador de inglés personalizado. Si te interesa este puesto, por favor envía tu solicitud, y si creemos que podrías encajar, nos pondremos en contacto contigo. ¡Gracias por tu tiempo! CookUnity es un Empleador que Ofrece Igualdad de Oportunidades. Estamos dedicados a crear una comunidad de inclusión y un entorno libre de discriminación o acoso. Todos los solicitantes calificados recibirán consideración para el empleo sin distinción de raza, color, religión, sexo, edad, orientación sexual, identidad de género, origen nacional, estatus de ciudadanía, condición de veterano protegido, información genética o discapacidad física o mental. Una nota rápida para todos los candidatos Hemos visto recientemente un aumento en las estafas de reclutamiento en la industria, y queremos asegurarnos de que tú (y tus datos) te mantengas seguro mientras postulas a CookUnity. También queremos que sepas que nos tomamos esto en serio; a veces, como parte de nuestro proceso, podemos solicitar una breve "prueba de humanidad" para confirmar que nos estamos comunicando con una persona real, no con un suplantador. Aquí tienes algunos consejos para ayudarte a protegerte y saber qué esperar de nosotros: - Postula solo a través de nuestros canales oficiales.

Responsabilidades

  • Ser dueño de los agentes de extremo a extremo (prototipo a producción)
  • Ser dueño del runtime del agente (orquestación, ejecución de herramientas, memoria)
  • Hacer que las herramientas sean confiables (seguridad de credenciales e identidad)
  • Ser dueño de la seguridad (guardarraíles, manejo de intenciones, rechazos, límites de PII)
  • Hacer que la calidad sea medible (evaluación, LLM-as-judge)
  • Instrumentar los agentes para depuración en producción (timelines, traces, visibilidad de tokens y costos)
  • Convertir patrones en plataforma reutilizable
  • Mejorar al equipo (dirección técnica, revisiones de código, colaboración con producto y datos)

Skills requeridas

Juicio con LLMs y agentesGrounding y retrievalDiseño de herramientas y contextoMemoriaSeguridadEvaluaciónCosto y latenciaPythonAPIsCloudInfraestructura como códigoLiderazgo técnicoComunicación con stakeholdersEstablecer dirección técnicaMejorar a otros ingenierosComunicación claraPensamiento crítico

Beneficios

  • Pago en USD
  • Trabajo remoto
  • 15 días de vacaciones
  • 16 feriados argentinos pagos
  • Bono de salud (stipend)
  • Sabbatical de 4 semanas después de 5 años
  • Licencia familiar paga
  • Licencia por compasión
  • Tarjeta prepaga flexible (bienestar, aprendizaje, comida)
  • Acceso a ChatGPT y Claude
  • Coach de inglés personalizado

Explorar empleos relacionados