Empresa de finanzas digitales busca Ingeniero de Inferencia de IA para trabajar en el backbone de C++ de su stack de IA local, optimizando modelos para hardware de usuario. El rol es 100% remoto a nivel mundial.
Si te apasiona la IA y querés optimizar modelos en C++ para finanzas digitales, este puesto remoto es para vos. Sumate a una empresa que está revolucionando el sector y trabajá en el backbone de su tecnología.
Descripción del puesto
Únete a Tether y da forma al futuro de las finanzas digitales. En Tether, no solo construimos productos, sino que somos pioneros en una revolución financiera global. Nuestras soluciones de vanguardia empoderan a las empresas —desde exchanges y billeteras hasta procesadores de pago y cajeros automáticos— para integrar sin problemas tokens respaldados por reservas en diferentes blockchains. Al aprovechar el poder de la tecnología blockchain, Tether te permite almacenar, enviar y recibir tokens digitales de forma instantánea, segura y global, todo a una fracción del costo. La transparencia es la base de todo lo que hacemos, garantizando la confianza en cada transacción. Innová con Tether: - Tether Finance: Nuestra innovadora suite de productos presenta la stablecoin más confiable del mundo, USDT, utilizada por cientos de millones en todo el mundo, junto con servicios pioneros de tokenización de activos digitales. - Tether Power: Impulsando el crecimiento sostenible, nuestras soluciones energéticas optimizan el exceso de energía para la minería de Bitcoin utilizando prácticas ecológicas en instalaciones de última generación y geográficamente diversas. - Tether Data: Impulsando avances en IA y tecnología peer-to-peer, reducimos los costos de infraestructura y mejoramos las comunicaciones globales con soluciones de vanguardia como KEET, nuestra aplicación insignia que redefine el intercambio seguro y privado de datos. - Tether Education: Democratizando el acceso a la educación digital de primer nivel, empoderamos a las personas para que prosperen en las economías digitales y gig, impulsando el crecimiento y las oportunidades globales. - Tether Evolution: En la intersección de la tecnología y el potencial humano, estamos ampliando los límites de lo posible, creando un futuro donde la innovación y las capacidades humanas se fusionan de maneras poderosas y sin precedentes. ¿Por qué unirte a nosotros? Nuestro equipo es una potencia de talento global, que trabaja de forma remota desde todos los rincones del mundo. Si te apasiona dejar tu huella en el espacio fintech, esta es tu oportunidad de colaborar con algunas de las mentes más brillantes, superando límites y estableciendo nuevos estándares. Hemos crecido rápido, nos hemos mantenido ágiles y hemos asegurado nuestro lugar como líderes en la industria. Si tienes excelentes habilidades de comunicación en inglés y estás listo para contribuir a la plataforma más innovadora del planeta, Tether es el lugar para ti. ¿Estás listo para ser parte del futuro? Sobre el rol: Serás responsable de la columna vertebral de inferencia detrás de la pila de IA local de QVAC: la capa de sistemas en C++ que hace que los modelos se ejecuten de manera rápida, confiable y predecible en el hardware del usuario real. El rol se centra en la calidad de la ingeniería a nivel de tiempo de ejecución, incluido el comportamiento de inicio, la presión de memoria, el equilibrio entre rendimiento y latencia, y la estabilidad de sesiones largas. Definirás y evolucionarás las abstracciones centrales de las que dependen las funciones de inferencia, para que se puedan agregar nuevas capacidades sin sacrificar el rendimiento o la mantenibilidad. Este es un rol para alguien que disfruta de la resolución de problemas de bajo nivel, la propiedad técnica clara y la construcción de infraestructura en la que otros equipos confían en producción. Tu trabajo habilita directamente experiencias de IA privadas en el dispositivo y ayuda a establecer la base técnica para la próxima generación de productos de IA peer-to-peer de QVAC. Sobre el trabajo: Trabajarás en la capa de C++ que impulsa la IA local, portando y mejorando motores de inferencia como llama.cpp o similares, para que se ejecuten de manera eficiente en dispositivos edge. Tu enfoque estará en el tiempo de ejecución: hacer que los modelos se carguen más rápido, se ejecuten de manera más liviana y funcionen bien en diferentes hardwares. Te asegurarás de que la capa de inferencia sea estable, optimizada y esté lista para su integración con el resto de la pila. Este rol es para ingenieros que desean trabajar cerca del hardware, habilitando IA en el dispositivo rápida y privada sin depender de la infraestructura en la nube. Responsabilidades: - Trabajar en el despliegue de modelos de machine learning en dispositivos edge utilizando los frameworks: llama.cpp, ggml. - Colaborar estrechamente con investigadores para asistir en la codificación, entrenamiento y transición de modelos desde entornos de investigación a producción. - Integrar funciones de IA en productos existentes, enriqueciéndolos con los últimos avances en machine learning.
Responsabilidades
- Desarrollar el backbone de inferencia para el stack de IA local
- Optimizar modelos para que se ejecuten rápida, confiable y predeciblemente en hardware de usuario
- Definir y evolucionar abstracciones centrales para las características de inferencia
- Portar y mejorar motores de inferencia como llama.cpp
- Asegurar que la capa de inferencia sea estable y optimizada
- Colaborar con investigadores para la transición de modelos de investigación a producción
- Integrar características de IA en productos existentes