Ingeniero de Investigación en IA - Remoto Global
Empresa de fintech busca un Ingeniero de Investigación en IA para optimizar el despliegue y la inferencia de modelos de IA, trabajando en arquitecturas de serving y frameworks de inferencia.
Si te apasiona la IA y querés trabajar en la vanguardia de las finanzas digitales, este puesto remoto es para vos. Podés optimizar el despliegue de modelos de IA en una empresa que está revolucionando el sector.
Descripción del puesto
En Tether, no solo creamos productos, sino que somos pioneros en una revolución financiera global. Nuestras soluciones de vanguardia permiten a las empresas —desde exchanges y billeteras hasta procesadores de pago y cajeros automáticos— integrar tokens respaldados por reservas en diversas blockchains de manera fluida. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. Innová con Tether: - Tether Finance: Nuestra innovadora suite de productos presenta el stablecoin más confiable del mundo, USDT, utilizado por cientos de millones en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. - Tether Power: Impulsando el crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin utilizando prácticas ecológicas en instalaciones de última generación y geográficamente diversas. - Tether Data: Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como KEET, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. - Tether Education: Democratizando el acceso a la educación digital de primer nivel, empoderamos a las personas para que prosperen en las economías digitales y gig, impulsando el crecimiento y las oportunidades globales. - Tether Evolution: En la intersección de la tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ¿Por qué unirte a nosotros? Nuestro equipo es una potencia de talento global, que trabaja de forma remota desde todos los rincones del mundo. Si te apasiona dejar tu huella en el espacio fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, superando límites y estableciendo nuevos estándares. Hemos crecido rápido, nos hemos mantenido ágiles y hemos asegurado nuestro lugar como líderes en la industria. Si tenés excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es tu lugar. ¿Estás listo para ser parte del futuro? Sobre el trabajo: Como miembro de nuestro equipo de modelos de IA, impulsarás la innovación en arquitecturas de serving e inferencia para sistemas avanzados de IA. Tu trabajo se centrará en optimizar el despliegue de modelos y las estrategias de inferencia para ofrecer un rendimiento altamente receptivo, eficiente y escalable en aplicaciones del mundo real. Trabajarás en un amplio espectro de sistemas, desde modelos eficientes en recursos diseñados para entornos de hardware limitados hasta arquitecturas multimodales complejas que integran datos como texto, imágenes y audio. Esperamos que tengas una profunda experiencia en el diseño y la optimización de pipelines de serving de modelos y frameworks de inferencia, así como una sólida formación en arquitecturas de modelos avanzadas. Adoptarás un enfoque práctico y basado en la investigación para desarrollar, probar e implementar estrategias de serving y algoritmos de inferencia novedosos. Tus responsabilidades incluyen la ingeniería de pipelines de inferencia robustos, el establecimiento de métricas de rendimiento integrales y la identificación y resolución de cuellos de botella en entornos de producción. El objetivo final es permitir un rendimiento de IA de alto rendimiento, baja latencia, baja huella de memoria y escalable que ofrezca valor tangible en escenarios dinámicos del mundo real. Responsabilidades: - Diseñar y desplegar arquitecturas de serving de modelos de última generación que ofrezcan alto rendimiento y baja latencia, optimizando al mismo tiempo el uso de memoria. - Asegurar que estos pipelines se ejecuten de manera eficiente en diversos entornos, incluidos dispositivos con recursos limitados y plataformas edge. - Establecer objetivos de rendimiento claros, como latencia reducida, respuesta de tokens mejorada y huella de memoria minimizada. - Construir, ejecutar y monitorear pruebas de inferencia controladas tanto en entornos de producción simulados como en vivo. - Rastrear indicadores clave de rendimiento, como latencia de respuesta, rendimiento, consumo de memoria y tasas de error, con especial atención a las métricas específicas de dispositivos con recursos limitados. - Documentar resultados iterativos y comparar resultados con benchmarks establecidos para validar el rendimiento en diferentes plataformas. - Identificar y preparar datasets de prueba de alta calidad y escenarios de simulación adaptados a los desafíos de despliegue del mundo real, específicamente aquellos encontrados en dispositivos de bajos recursos. - Establecer criterios medibles para garantizar que estos recursos evalúen eficazmente el rendimiento del modelo, la latencia y la utilización de la memoria en diversas condiciones operativas. - Analizar la eficiencia computacional y diagnosticar cuellos de botella en el pipeline de serving monitoreando métricas de procesamiento y memoria. - Abordar problemas como el procesamiento de lotes subóptimo, los retrasos de red y el alto uso de memoria para optimizar la infraestructura de serving en cuanto a escalabilidad y confiabilidad en sistemas con recursos limitados. - Trabajar en estrecha colaboración con equipos multifuncionales para integrar frameworks de serving e inferencia optimizados en pipelines de producción diseñados para aplicaciones edge y on-device. - Definir métricas de éxito claras, como rendimiento mejorado en el mundo real, bajas tasas de error, escalabilidad robusta, uso óptimo de memoria, y asegurar el monitoreo continuo y los refinamientos iterativos para mejoras sostenidas.
Responsabilidades
- Diseñar y desplegar arquitecturas de model serving de última generación
- Optimizar el uso de memoria y la latencia
- Asegurar la eficiencia de los pipelines en diversos entornos
- Establecer objetivos claros de rendimiento
- Construir, ejecutar y monitorear pruebas de inferencia
- Rastrear indicadores clave de rendimiento (KPIs)
- Documentar resultados iterativos y comparar benchmarks
- Identificar y preparar datasets de prueba y escenarios de simulación
- Analizar la eficiencia computacional y diagnosticar cuellos de botella
- Integrar frameworks de serving e inferencia optimizados en pipelines de producción