AI Senior Engineer (Vision)
Se busca AI Senior Engineer (Vision) para trabajar de manera remota en Able, una empresa que desarrolla tecnología con un enfoque en inteligencia artificial aplicada. El rol implica liderar la implementación de visión por computadora y lógica para sistemas de procesamiento de documentos.
Aplicá si te apasiona la inteligencia artificial y la visión por computadora. Este puesto es ideal para aquellos que disfrutan trabajando en la vanguardia de la tecnología.
Descripción del puesto
En 2012, éramos un grupo de ingenieros y diseñadores que decidimos construir cosas, así que lo hicimos. Able comenzó como un centro de ingeniería y producto que construía para una cartera de startups en etapas tempranas. Construimos muchas relaciones mientras desarrollábamos productos que eran reflexivos, efectivos y genuinamente útiles. Pero desde entonces, hemos crecido... y también nuestra ambición. Ahora estamos entrando en nuestro próximo capítulo, definido por la inteligencia artificial aplicada. La IA es una fuerza poderosa en el ciclo de desarrollo de software de extremo a extremo, y estamos creando prácticas que nos permiten entregar software de manera rápida y efectiva, creando valor significativo para nuestros socios. Hoy en día, nuestra mentalidad de constructor nos impulsa a convertirnos en una organización nativa de IA en todas las funciones. Aún estamos evolucionando, y eso es parte de la oportunidad. Si quieres construir, aprender y enfrentar desafíos junto a un equipo ambicioso, construyamos juntos. Esta posición es 100% remota dentro de LatAm. Qué harás: Estamos buscando a alguien que disfrute trabajando en la frontera donde la visión por computadora se encuentra con la lógica. Serás responsable de los "ojos" y el "cerebro" de nuestro sistema: extrayendo datos complejos de documentos visuales y luego orquestando cómo se utiliza ese dato por los Modelos de Lenguaje Grandes. En resumen, alguien que guste de: - Desbloquear datos visuales: construyendo pipelines que puedan "leer" documentos complejos, entendiendo el diseño, las gráficas y el contexto visual utilizando Modelos de Visión-Lenguaje (GPT-4V, Claude 3.5) y Análisis de Diseño. - Orquestar inteligencia: liderando la capa de lógica de la aplicación. Utilizarás LangChain o LangGraph para construir agentes y cadenas que consulten nuestros datos, razonen sobre ellos y generen respuestas. - Manejo nativo de PDFs: manejando la realidad compleja del procesamiento de PDFs (PyMuPDF, análisis de diseño) para preservar la estructura antes de que la IA la vea. - Ingeniería de prompts y lógica: creando prompts complejos y flujos de control para asegurarte de que los modelos interpreten gráficas y diseños financieros con precisión sin alucinar. - Costo y escala: aplicando una mentalidad de optimización de costos (procesamiento por lotes, selección de modelos) para asegurarte de que nuestras capas de visión y orquestación sean económicamente viables. Qué estamos buscando: Queremos trabajar con personas que tengan pasión por colaborar con sus equipos, construir software mientras cultivan relaciones inclusivas y respetuosas con sus compañeros de trabajo. Con aquellos que sean abiertos sobre sus deficiencias y lo que no saben ahora, pero que sigan ansiosos por crecer y cerrar esas brechas. Idealmente, también tendrían: - Orquestación de LLM (imprescindible): experiencia profunda con LangChain, LangGraph o frameworks similares. Sabes cómo manejar ventanas de contexto, llamadas a herramientas y flujos de trabajo agénicos. - Experiencia en IA multimodal: experiencia práctica integrando modelos de visión de última generación (GPT-4V, Claude 3.5 Sonnet) y modelos de incrustación (CLIP). - Especialista en inteligencia de documentos: familiaridad con modelos especializados (por ejemplo, Donut, Pix2Struct) y herramientas como Unstructured.io o Docling. - Dominio del procesamiento de PDFs: dominio de herramientas como PyMuPDF o pdfplumber para extracción de elementos nativos. - Pila de ML de Python: fuerte dominio de PyTorch o TensorFlow. Agradable tener: - Ajuste fino: experiencia ajustando modelos de visión o lenguaje, específicamente para mejorar la precisión en artefactos específicos del dominio como gráficas o tablas financieras. - Conocimiento del dominio: experiencia previa manejando documentos en los sectores de bienes raíces o finanzas. Able está impulsado por personas curiosas y reflexivas que se preocupan por lo que construyen y cómo lo construyen. Estamos invirtiendo activamente en nuestro equipo a través de capacitación en IA, intercambio de conocimientos y experimentación práctica para asegurarnos de que todos crezcan junto con la tecnología. Esta posición es 100% remota dentro de LatAm. Se requiere una fuerte habilidad verbal y escrita en inglés. Como miembro del equipo, puedes esperar: - Trabajar 40 horas a la semana y estar disponible durante las horas normales de trabajo según sea necesario. - Pagos realizados en USD. - 18 días de PTO por año, observación de feriados locales y un descanso anual entre Navidad y Año Nuevo. - Un subsidio de bienestar mensual y cajas de snacks entregadas a tu hogar. Sobre Able: Able construye productos de tecnología en un modelo de cartera. Creemos que las personas, los equipos y los procesos son más importantes que las ideas en sí mismas, así que nos hemos enfocado en reunir a grandes personas y invertir en su crecimiento. Hemos construido productos en una variedad de industrias. Desde medios hasta finanzas, juguetes y atención médica. A veces trabajamos con equipos de gestión para ayudar a sus negocios a crecer más rápido o desbloquear valor utilizando tecnología. Otras veces iniciamos o compramos negocios directamente. Cada vez, buscamos oportunidades para aprovechar la tecnología construida a nivel de cartera para impulsar valor más rápido. Able está comprometido con la inclusión y la diversidad y es un empleador con igualdad de oportunidades. Todos los solicitantes recibirán consideración sin importar raza, color, religión, género, identidad de género, orientación sexual, origen nacional, discapacidad o estatus de veterano. Esto es solo el comienzo de una conversación que nos encantaría tener contigo. Aplica y comencemos esta aventura.
Responsabilidades
- Desarrollar pipelines de visión por computadora
- Orquestar la lógica de aplicaciones
- Procesamiento de PDFs
- Ingeniería de prompts
Skills requeridas
Beneficios
- Pago en USD
- 18 días de vacaciones pagadas al año
- Observancia de feriados locales
- Estipendio mensual para bienestar
- Cajas de snacks entregadas en casa