Empresa de tecnología financiera busca un Ingeniero de Investigación en IA para optimizar el despliegue y la inferencia de modelos de IA, trabajando de forma 100% remota a nivel global.
Si te apasiona la IA y querés trabajar 100% remoto para una empresa que está revolucionando las finanzas digitales a nivel global, este puesto es para vos. Podés aportar a proyectos de vanguardia y crecer en un entorno innovador.
Descripción del puesto
En Tether, no solo creamos productos, sino que somos pioneros en una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pago y cajeros automáticos— integrar sin problemas tokens respaldados por reservas en diversas blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. Innová con Tether: - Tether Finance: Nuestra innovadora suite de productos presenta la stablecoin más confiable del mundo, USDT, utilizada por cientos de millones en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. - Tether Power: Impulsando el crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin utilizando prácticas ecológicas en instalaciones de última generación y geográficamente diversas. - Tether Data: Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como KEET, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. - Tether Education: Democratizando el acceso a la educación digital de primer nivel, empoderamos a las personas para que prosperen en las economías digitales y gig, impulsando el crecimiento y las oportunidades globales. - Tether Evolution: En la intersección de la tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ¿Por qué unirte a nosotros? Nuestro equipo es una potencia de talento global, que trabaja de forma remota desde todos los rincones del mundo. Si te apasiona dejar tu huella en el espacio fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, superando límites y estableciendo nuevos estándares. Hemos crecido rápido, nos hemos mantenido ágiles y hemos asegurado nuestro lugar como líderes en la industria. Si tenés excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar para vos. ¿Estás listo para ser parte del futuro? Sobre el trabajo: Como miembro de nuestro equipo de modelos de IA, impulsarás la innovación en arquitecturas de serving e inferencia de modelos para sistemas avanzados de IA. Tu trabajo se centrará en optimizar el despliegue de modelos y las estrategias de inferencia para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones del mundo real. Trabajarás en un amplio espectro de sistemas, desde modelos eficientes en recursos diseñados para entornos de hardware limitados hasta arquitecturas multimodales complejas que integran datos como texto, imágenes y audio. Esperamos que tengas una profunda experiencia en el diseño y la optimización de pipelines de serving de modelos y frameworks de inferencia, así como una sólida formación en arquitecturas de modelos avanzadas. Adoptarás un enfoque práctico y basado en la investigación para desarrollar, probar e implementar estrategias de serving y algoritmos de inferencia novedosos. Tus responsabilidades incluyen la ingeniería de pipelines de inferencia robustos, el establecimiento de métricas de rendimiento integrales y la identificación y resolución de cuellos de botella en entornos de producción. El objetivo final es permitir un rendimiento de IA de alto rendimiento, baja latencia, baja huella de memoria y escalable que ofrezca valor tangible en escenarios dinámicos del mundo real. Responsabilidades: - Diseñar y desplegar arquitecturas de serving de modelos de última generación que ofrezcan alto rendimiento y baja latencia, optimizando al mismo tiempo el uso de la memoria. - Asegurar que estos pipelines se ejecuten de manera eficiente en diversos entornos, incluidos dispositivos con recursos limitados y plataformas edge. - Establecer objetivos de rendimiento claros, como latencia reducida, mejora de la respuesta de tokens y minimización de la huella de memoria. - Construir, ejecutar y monitorear pruebas de inferencia controladas tanto en entornos de producción simulados como en vivo. - Rastrear indicadores clave de rendimiento como latencia de respuesta, rendimiento, consumo de memoria y tasas de error, con especial atención a las métricas específicas para dispositivos con recursos limitados. - Documentar resultados iterativos y comparar resultados con benchmarks establecidos para validar el rendimiento en diferentes plataformas. - Identificar y preparar datasets de prueba de alta calidad y escenarios de simulación adaptados a los desafíos de despliegue del mundo real, específicamente aquellos encontrados en dispositivos de bajos recursos. - Establecer criterios medibles para garantizar que estos recursos evalúen eficazmente el rendimiento del modelo, la latencia y la utilización de la memoria en diversas condiciones operativas. - Analizar la eficiencia computacional y diagnosticar cuellos de botella en el pipeline de serving monitoreando métricas de procesamiento y memoria. - Abordar problemas como el procesamiento de lotes subóptimo, los retrasos de red y el alto uso de memoria para optimizar la infraestructura de serving en cuanto a escalabilidad y confiabilidad en sistemas con recursos limitados. - Trabajar en estrecha colaboración con equipos multifuncionales para integrar frameworks de serving e inferencia optimizados en pipelines de producción diseñados para aplicaciones edge y on-device. - Definir métricas de éxito claras, como rendimiento mejorado en el mundo real, bajas tasas de error, escalabilidad robusta, uso óptimo de memoria, y asegurar el monitoreo continuo y los refinamientos iterativos para mejoras sostenidas.
Responsabilidades
- Diseñar y desplegar arquitecturas de serving de modelos de última generación
- Optimizar el uso de memoria y la latencia en pipelines de inferencia
- Ejecutar y monitorear pruebas de inferencia controladas
- Identificar y resolver cuellos de botella en entornos de producción
- Preparar datasets de prueba y escenarios de simulación
- Analizar la eficiencia computacional y diagnosticar cuellos de botella
- Integrar frameworks de serving e inferencia optimizados en pipelines de producción
- Definir métricas de éxito y asegurar mejoras continuas
Skills requeridas
Beneficios
- Trabajo 100% remoto
- Oportunidad de trabajar en la vanguardia de la IA y las finanzas digitales
- Colaboración con un equipo global de talento