directohace 1 mes

Ingeniero de Investigación en IA

Senior
A convenir
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Empresa de finanzas digitales busca Ingeniero de Investigación en IA para optimizar sistemas inteligentes mediante aprendizaje por refuerzo multi-modal, trabajando de forma 100% remota a nivel global.

Por qué aplicar

Si te apasiona la IA y querés trabajar en finanzas digitales, este puesto remoto es para vos. Podés aplicar tus conocimientos en aprendizaje por refuerzo para optimizar sistemas y ser parte de una empresa que revoluciona el sector a nivel global.

Descripción del puesto

Únete a Tether y da forma al futuro de las finanzas digitales. En Tether, no solo creamos productos, sino que somos pioneros en una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pago y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en diferentes blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. Innovar con Tether: Tether Finance: Nuestra innovadora suite de productos presenta la stablecoin más confiable del mundo, USDT, utilizada por cientos de millones en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. Pero eso es solo el comienzo. Tether Power: Impulsando el crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin utilizando prácticas ecológicas en instalaciones de última generación y geográficamente diversas. Tether Data: Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como KEET, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. Tether Education: Democratizando el acceso a la educación digital de primer nivel, empoderamos a las personas para que prosperen en las economías digitales y gig, impulsando el crecimiento y las oportunidades globales. Tether Evolution: En la intersección de la tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ¿Por qué unirte a nosotros? Nuestro equipo es una potencia de talento global, que trabaja de forma remota desde todos los rincones del mundo. Si te apasiona dejar tu huella en el espacio fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, superando límites y estableciendo nuevos estándares. Hemos crecido rápido, nos hemos mantenido ágiles y hemos asegurado nuestro lugar como líderes en la industria. Si tienes excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar para ti. ¿Estás listo para ser parte del futuro? Sobre el trabajo: Como miembro del equipo de modelos de IA, impulsarás la innovación en el aprendizaje por refuerzo multimodal para avanzar en sistemas inteligentes de próxima generación. Tu trabajo se centrará en optimizar la toma de decisiones y el comportamiento adaptativo en modalidades de datos integradas como texto, imágenes y audio para ofrecer inteligencia mejorada, rendimiento robusto y capacidades específicas del dominio para desafíos del mundo real. Desarrollarás y escalarás técnicas de aprendizaje por refuerzo dentro de arquitecturas multimodales complejas, incluidos modelos generativos basados en difusión y modelos autorregresivos para la comprensión multimodal, así como modelos eficientes en recursos diseñados para entornos de hardware restringidos. Esto incluye la investigación de algoritmos de aprendizaje por refuerzo para modelos multimodales, que abarcan modelos de difusión para imágenes, modelos autorregresivos para el razonamiento multimodal y marcos multimodales unificados. Se espera que tengas una profunda experiencia en el diseño de sistemas de aprendizaje por refuerzo multimodal y una sólida formación en arquitecturas de modelos avanzadas, con un enfoque práctico y basado en la investigación para construir e implementar algoritmos novedosos y marcos de entrenamiento. Diseñarás y desarrollarás infraestructura de RL y estrategias de modelado de recompensas para permitir un entrenamiento eficiente a gran escala, mejorar la estabilidad del entrenamiento y mitigar el 'reward hacking' y modos de falla relacionados. Tus responsabilidades también incluyen la curación de entornos de simulación multimodales y conjuntos de datos de entrenamiento, la mejora del rendimiento de las políticas de referencia en todas las modalidades, y la identificación y resolución de cuellos de botella en el aprendizaje multimodal y la optimización de recompensas. Además, explorarás paradigmas de aprendizaje por refuerzo de próxima generación que aprendan de manera más directa y efectiva a partir de la retroalimentación del entorno, con el objetivo de desbloquear un rendimiento de IA superior y adaptado al dominio en entornos dinámicos del mundo real. Responsabilidades: - Investigar algoritmos de aprendizaje por refuerzo para modelos multimodales, incluyendo enfoques basados en difusión para imágenes, modelos autorregresivos para la comprensión multimodal y marcos unificados que integran múltiples modalidades. - Diseñar y construir infraestructura de aprendizaje por refuerzo que soporte entrenamiento distribuido y escalable en sistemas multimodales, manteniendo la eficiencia y la confiabilidad. - Desarrollar y refinar estrategias de modelado de recompensas que mejoren la estabilidad del entrenamiento, alineen el comportamiento del modelo con los resultados deseados y mitiguen el 'reward hacking' y modos de falla relacionados. - Crear y curar entornos de simulación y conjuntos de datos multimodales para soportar el entrenamiento robusto, la evaluación y la evaluación comparativa de sistemas de aprendizaje por refuerzo. - Diseñar y realizar protocolos rigurosos de evaluación comparativa y de rendimiento para medir el desempeño del modelo, rastrear el progreso frente a las referencias y validar las mejoras en tareas multimodales. - Analizar y optimizar el rendimiento de las políticas en todas las modalidades, identificando cuellos de botella en el entrenamiento, la asignación de crédito y la alineación intermodal. - Investigar y desarrollar paradigmas de aprendizaje por refuerzo de próxima generación que aprendan de manera más efectiva a partir de la retroalimentación del entorno, con el objetivo de lograr un rendimiento superior de vanguardia (SOTA). - Publicar los hallazgos de la investigación en conferencias de primer nivel como ICML, NeurIPS, ICLR, CVPR, ICCV, ECCV, etc.

Responsabilidades

  • Investigar algoritmos de aprendizaje por refuerzo para modelos multi-modales
  • Diseñar y construir infraestructura de RL para entrenamiento distribuido
  • Desarrollar y refinar estrategias de modelado de recompensas
  • Crear y curar entornos de simulación y datasets multi-modales
  • Diseñar y ejecutar protocolos de benchmarking y evaluación
  • Analizar y optimizar el rendimiento de políticas a través de modalidades
  • Investigar paradigmas de aprendizaje por refuerzo de próxima generación
  • Publicar hallazgos de investigación en conferencias de primer nivel

Skills requeridas

Diseño de sistemas de aprendizaje por refuerzo multi-modalArquitecturas de modelos avanzadosInvestigación y desarrollo de algoritmosEntrenamiento de modelosOptimización de toma de decisionesComportamiento adaptativoModelos generativos basados en difusiónModelos autorregresivosModelos eficientes en recursosEntornos de simulación multi-modalEstrategias de modelado de recompensasMitigación de reward hackingComunicación en inglésColaboración

Explorar empleos relacionados

¿Te interesa empleos en Buenos Aires? Creá una alerta y te avisamos.