directohace 1 mes

Ingeniero de Investigación en IA

Senior
A convenir
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de fintech busca un Ingeniero de Investigación en IA para trabajar en metodologías de post-entrenamiento, con foco en comportamientos de agentes y uso de herramientas, para refinar modelos pre-entrenados. El puesto es 100% remoto a nivel mundial.

Por qué aplicar

Si te apasiona la IA y querés trabajar en el futuro de las finanzas digitales, este puesto remoto es para vos. Podrás refinar modelos pre-entrenados y explorar comportamientos de agentes en una empresa líder en el sector.

Descripción del puesto

Únete a Tether y da forma al futuro de las finanzas digitales. En Tether, no solo creamos productos, sino que somos pioneros en una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pago y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en diferentes blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. Innová con Tether: - Tether Finance: Nuestra innovadora suite de productos presenta el stablecoin más confiable del mundo, USDT, utilizado por cientos de millones en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. - Tether Power: Impulsando el crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin utilizando prácticas ecológicas en instalaciones de última generación y geográficamente diversas. - Tether Data: Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como KEET, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. - Tether Education: Democratizando el acceso a la educación digital de primer nivel, empoderamos a las personas para que prosperen en las economías digitales y gig, impulsando el crecimiento y las oportunidades globales. - Tether Evolution: En la intersección de la tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ¿Por qué unirte a nosotros? Nuestro equipo es una potencia de talento global, que trabaja de forma remota desde todos los rincones del mundo. Si te apasiona dejar tu huella en el espacio fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, superando límites y estableciendo nuevos estándares. Hemos crecido rápido, nos hemos mantenido ágiles y hemos asegurado nuestro lugar como líderes en la industria. Si tienes excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar para ti. ¿Estás listo para ser parte del futuro? Sobre el trabajo: Como miembro del equipo de modelos de IA, impulsarás la innovación en metodologías de post-entrenamiento, con un enfoque especial en comportamientos agénticos y uso de herramientas. Tu trabajo refinará modelos pre-entrenados para que no solo ofrezcan inteligencia mejorada y capacidades específicas del dominio, sino que también aprendan a razonar, planificar e invocar autónomamente herramientas externas para resolver tareas y aplicaciones del mundo real de varios pasos en dispositivos edge (es decir, smartphones). Trabajarás en un amplio espectro de sistemas, desde agentes optimizados y eficientes en recursos que se ejecutan en hardware limitado hasta arquitecturas multimodales complejas que integran texto, imágenes y audio, todo optimizado para la toma de decisiones aumentada por herramientas. Esperamos que tengas una profunda experiencia en arquitecturas de modelos de lenguaje grandes (LLM) y una experiencia sustancial en post-entrenamiento para flujos de trabajo agénticos, incluyendo ajuste fino de uso de herramientas (tool use fine-tuning), llamada a funciones (function calling) y aprendizaje por refuerzo a partir de retroalimentación en interacciones de múltiples turnos. Adoptarás un enfoque práctico y basado en la investigación para desarrollar, probar e implementar nuevos algoritmos de post-entrenamiento que desbloqueen el comportamiento dirigido a objetivos, la autocorrección y la invocación confiable de herramientas. Tus responsabilidades incluirán la curación de datos de entrenamiento agénticos (por ejemplo, trayectorias de uso de herramientas, cadenas de razonamiento, interacciones con el entorno), el fortalecimiento del rendimiento base y la identificación, así como la resolución de cuellos de botella en el post-entrenamiento para agentes aumentados por herramientas, a fin de lograr la calidad de modelo SOTA (State-Of-The-Art). El objetivo es construir modelos que no solo sepan, sino que también actúen, usen herramientas y se adapten, superando los límites de lo que la IA agéntica puede lograr. Responsabilidades: - Realizar iniciativas de investigación e ingeniería de extremo a extremo para avanzar en el post-entrenamiento de modelos agénticos y de uso de herramientas para lograr resultados SOTA. - Impulsar mejoras amplias y transversales de modelos, incluyendo facticidad, adherencia a instrucciones, uso de herramientas/funciones, coordinación multiagente y calibración de razonamiento. - Diseñar y mejorar sistemas de post-entrenamiento a gran escala, incluyendo pipelines de datos, flujos de trabajo de entrenamiento, frameworks de evaluación e infraestructura de benchmarks. - Desarrollar rigurosos conjuntos de evaluación y herramientas de diagnóstico para evaluar la preparación del modelo para su implementación. - Fortalecer los bucles de retroalimentación del uso del producto en el mundo real, incorporando señales explícitas e implícitas del usuario en el post-entrenamiento. - Colaborar con los equipos de herramientas, producto y entrenamiento para mejorar la utilidad, confiabilidad y capacidades agénticas de los modelos de frontera. - Enlace estrecho con equipos de investigación, ingeniería y multifuncionales para determinar qué integraciones están listas para producción para su inclusión en lanzamientos importantes de modelos.

Responsabilidades

  • Conducir iniciativas de investigación e ingeniería de extremo a extremo para avanzar en el post-entrenamiento de modelos de agentes y uso de herramientas para lograr resultados SOTA.
  • Impulsar mejoras amplias y transversales de modelos, incluyendo facticidad, adherencia a instrucciones, uso de herramientas/funciones, coordinación multi-agente y calibración de razonamiento.
  • Diseñar y mejorar sistemas de post-entrenamiento a gran escala, incluyendo pipelines de datos, flujos de entrenamiento, marcos de evaluación e infraestructura de benchmarks.
  • Desarrollar rigurosos conjuntos de evaluación y herramientas de diagnóstico para evaluar la preparación del modelo para el despliegue.
  • Fortalecer los bucles de retroalimentación del uso del producto en el mundo real, incorporando señales explícitas e implícitas del usuario en el post-entrenamiento.
  • Colaborar con los equipos de herramientas, producto y entrenamiento para mejorar la utilidad, confiabilidad y capacidades de agente de los modelos de frontera.
  • Enlace estrecho con equipos de investigación, ingeniería y multifuncionales para determinar qué integraciones están listas para producción para su inclusión en lanzamientos importantes de modelos.

Skills requeridas

InvestigaciónIngenieríaModelos de lenguaje grandesPost-entrenamientoComportamiento de agentesUso de herramientasAjuste finoAprendizaje por refuerzoInteracciones multi-turnoRazonamientoPlanificaciónInvocación autónoma de herramientasOptimización de modelosEvaluación de modelosPipelines de datosFlujos de entrenamientoMarcos de evaluaciónInfraestructura de benchmarksComunicación en inglésColaboraciónInvestigaciónIngeniería

Explorar empleos relacionados

¿Te interesa empleos en Buenos Aires? Creá una alerta y te avisamos.