Ingeniero/a de Datos Senior (Databricks)
Empresa Factored busca un/a Ingeniero/a de Datos Senior con 5+ años de experiencia, enfocado/a en Databricks y Snowflake, para un rol 100% remoto en LATAM. Se requiere experiencia en Python, SQL, y plataformas cloud como AWS.
Si sos un/a Ingeniero/a de Datos Senior con experiencia en Databricks y querés trabajar 100% remoto para una empresa que potencia el talento LATAM, esta es tu oportunidad. Sumate a un equipo que valora el aprendizaje y el crecimiento para trabajar en proyectos de IA y ML para empresas de primer nivel.
Descripción del puesto
Remoto | Puesto de dedicación completa Factored, fundada en Palo Alto por el Dr. Andrew Ng e Israel Niezen, ayuda a empresas de EE. UU. a construir y escalar equipos de IA, ML y Datos de clase mundial, potenciados por el 1% del talento de LATAM, con un propósito definitorio: empoderar a humanos brillantes, liberar su potencial y amplificar su impacto en el mundo. En Factored, serás parte de una comunidad que valora el aprendizaje, la propiedad y la autenticidad, donde tu crecimiento es personal y tus ideas importan. Somos transparentes, curiosos y colaborativos. Buscamos la excelencia, celebramos la diversidad, fomentamos la curiosidad y construimos un entorno donde realmente puedas prosperar. Como Ingeniero de Datos Senior, te involucrarás a tiempo completo en el diseño y la evolución de las arquitecturas de datos que potencian productos inteligentes para organizaciones globales y Fortune 500. Construirás pipelines de alto rendimiento, optimizarás frameworks de procesamiento a gran escala y diseñarás modelos de datos que permitan la analítica, el machine learning y la toma de decisiones a nivel empresarial. Este rol es ideal para ingenieros que se destacan en la navegación de entornos de datos complejos, piensan en términos de sistemas escalables y asumen la responsabilidad de la confiabilidad, calidad y rendimiento de los datos a lo largo de todo el ciclo de vida. Tu trabajo garantizará que los equipos puedan experimentar más rápido, entregar productos más inteligentes y desbloquear insights significativos a través de datos confiables y bien orquestados. Estamos especialmente interesados en candidatos con sólida experiencia práctica en Databricks y Snowflake, y la exposición a modelos de datos o tecnologías basadas en grafos es una gran ventaja. Responsabilidades funcionales: - Desarrollar y mantener procesos ETL (Extract, Transform, Load) utilizando Python. - Escribir consultas SQL eficientes para extraer, manipular y analizar datos de diversas bases de datos. - Diseñar, construir y optimizar pipelines de datos a gran escala utilizando plataformas de datos en la nube modernas como Databricks y Snowflake. - Diseñar y desarrollar técnicas óptimas de procesamiento de datos, incluyendo la automatización de procesos manuales, entrega de datos, validación de datos y aumento de datos. - Colaborar con stakeholders para comprender las necesidades de datos y traducirlas en soluciones escalables. - Diseñar y desarrollar integraciones de API para alimentar diferentes modelos de datos. - Arquitectar e implementar nuevas funcionalidades desde cero, asociándose con ingenieros de IA/ML para identificar fuentes de datos, brechas y dependencias. - Identificar bugs y problemas de rendimiento en toda la pila, incluyendo herramientas de monitoreo y pruebas de rendimiento para garantizar la integridad de los datos y una experiencia de usuario de calidad. - Construir una infraestructura altamente escalable utilizando SQL y tecnologías de big data de AWS. - Mantener los datos seguros y cumpliendo con las normativas internacionales de manejo de datos. - (Deseable) Trabajar con o contribuir a modelos de datos de grafos o bases de datos de grafos (ej. Neo4j) para soportar casos de uso basados en relaciones. Cualificaciones: - Más de 5 años de experiencia profesional entregando código de alta calidad listo para producción. - Sólidas bases en ciencias de la computación, incluyendo estructuras de datos y algoritmos, sistemas operativos, redes de computadoras, bases de datos y programación orientada a objetos. - Experiencia con Python. - Experiencia en la configuración de pipelines de datos utilizando bases de datos SQL relacionales y NoSQL, incluyendo Postgres, Cassandra o MongoDB. - Sólida experiencia con herramientas de procesamiento y almacenamiento de datos como Databricks y Snowflake. - Experiencia con plataformas en la nube como AWS, GCP o Azure. - Experiencia con procesamiento y orquestación, como Spark o Airflow. - Éxito comprobado en la manipulación, procesamiento y extracción de valor de grandes conjuntos de datos. - Experiencia con sistemas de control de versiones, como Git. - Fuertes habilidades analíticas relacionadas con el trabajo con conjuntos de datos no estructurados. - Excelentes habilidades de comunicación verbal y escrita en inglés. - (Deseable) Familiaridad con tecnologías de grafos (ej. Neo4j) o modelado de datos basado en grafos. Nuestros Beneficios: - Propiedad a través de participación accionaria. - Retiro anual de la empresa. - Bono educativo para aprendizaje continuo. - Vacaciones de invierno para toda la empresa. - Días de vacaciones pagas. - Eventos presenciales y meetups opcionales. - Planes de carrera personalizados. - Cultura de alto rendimiento. En Factored, creemos que las personas apasionadas e inteligentes esperan honestidad y transparencia, así como la libertad de hacer el mejor trabajo de sus vidas mientras aprenden y crecen tanto como sea posible. Las grandes personas disfrutan trabajando con otras personas apasionadas e inteligentes, por lo que creemos en contratar correctamente y somos muy selectivos con quién se une a nuestro equipo. Una vez que te contratamos, invertiremos en ti y apoyaremos tu crecimiento profesional y de carrera de muchas maneras significativas. Contratamos personas supremamente inteligentes y talentosas, pero reconocemos que la inteligencia no es suficiente. Quizás lo más importante es que buscamos a aquellos que también son apasionados por nuestra misión y son honestos, diligentes, colaborativos, amables con los demás y divertidos. La vida es demasiado corta para trabajar con personas que no te inspiran. Somos un lugar de trabajo transparente, donde TODOS tienen voz en la construcción de NUESTRA empresa, y donde el aprendizaje y el crecimiento están disponibles para todos en función de sus méritos, no solo de sellos en su currículum. Tan impresionantes como son algunos de los sellos en nuestros currículums, reconocemos que el talento y la pasión humana existen en todas partes y provienen de muchos orígenes, por lo que los sellos importan mucho menos que los resultados. Todos somos hacedores dedicados y altamente enérgicos, enfocándonos vehementemente en la ejecución porque sabemos que el mejor aprendizaje ocurre al hacer. Reconocemos que estamos creando NUESTRA EMPRESA JUNTOS, que no solo es un negocio de alto rendimiento y rápido crecimiento, sino que está cambiando la forma en que el mundo percibe la calidad del talento técnico en América Latina. Nos impulsa el gran impacto positivo que estamos logrando en los lugares donde hacemos negocios y estamos comprometidos a acelerar carreras e invertir en cientos (y esperamos miles) de ingenieros de ciencia de datos y analistas de datos altamente talentosos. En resumen, nuestro negocio se trata de personas, por lo que contratamos a las mejores personas e invertimos tanto como sea posible para que se enamoren de su trabajo, su aprendizaje y su misión. Cuando no estamos obsesionados con la ciencia de datos, nos encanta hacer música juntos, practicar deportes, jugar juegos, bailar salsa, cocinar comida deliciosa, preparar el mejor café, organizar las mejores fiestas y, en general, pasar un buen rato juntos.
Responsabilidades
- Desarrollar y mantener procesos ETL (Extract, Transform, Load) usando Python.
- Escribir consultas SQL eficientes para extraer, manipular y analizar datos de diversas bases de datos.
- Diseñar, construir y optimizar pipelines de datos a gran escala utilizando plataformas de datos en la nube modernas como Databricks y Snowflake.
- Diseñar y desarrollar técnicas óptimas de procesamiento de datos, incluyendo la automatización de procesos manuales, entrega de datos, validación de datos y aumento de datos.
- Colaborar con stakeholders para comprender las necesidades de datos y traducirlas en soluciones escalables.
- Diseñar y desarrollar integraciones de API para alimentar diferentes modelos de datos.
- Arquitectar e implementar nuevas funcionalidades desde cero, asociándose con ingenieros de IA/ML para identificar fuentes de datos, lagunas y dependencias.
- Identificar errores y problemas de rendimiento en toda la pila, incluyendo herramientas de monitoreo de rendimiento y pruebas para garantizar la integridad de los datos y la calidad de la experiencia del usuario.
- Construir una infraestructura altamente escalable utilizando SQL y tecnologías de big data de AWS.
- Mantener los datos seguros y en cumplimiento con las reglas internacionales de manejo de datos.
Skills requeridas
Beneficios
- Participación accionaria (equity)
- Retiro anual de la empresa
- Bono educativo para aprendizaje continuo
- Vacaciones colectivas de invierno
- Días libres remunerados
- Eventos y meetups opcionales presenciales
- Planes de carrera personalizados
- Cultura de alto rendimiento