Data Scientist, Applied AI
Se busca Data Scientist / Machine Learning Engineer para desarrollar y mejorar la infraestructura de datos y análisis en un entorno remoto. El candidato debe tener experiencia en Python, machine learning, deep learning y desarrollo de modelos de lenguaje.
Ideal para profesionales apasionados por machine learning y deep learning que buscan colaborar en un entorno remoto dinámico.
Descripción del puesto
Azumo está buscando un Data Scientist / Ingeniero de Aprendizaje Automático altamente motivado para desarrollar y mejorar nuestra infraestructura de datos y análisis. La posición es FULLY REMOTE, basada en América Latina. Se requiere un nivel de inglés profesional (B2/C1). Esta posición te brindará la oportunidad de colaborar con un equipo dinámico y talentosos científicos de datos en el campo del análisis de grandes datos y la inteligencia artificial aplicada. Si tienes pasión por diseñar e implementar modelos avanzados de aprendizaje automático y aprendizaje profundo, especialmente en el espacio de la Inteligencia Artificial Generativa, este rol es perfecto para ti. Estamos buscando un profesional capacitado con experiencia en Python para proyectos de producción, dominio de técnicas de aprendizaje automático y aprendizaje profundo como CNN y Transformers, y experiencia práctica trabajando con PyTorch. Estamos buscando un Ingeniero de Aprendizaje Automático / Data Scientist versátil para unirse a nuestro equipo de análisis de grandes datos. En este rol híbrido, no solo diseñarás y prototiparás modelos novedosos de ML/DL, sino que también los llevarás a producción de principio a fin, integrando tus soluciones en nuestros pipelines de datos y servicios. Trabajarás en estrecha colaboración con ingenieros de datos, desarrolladores de software y propietarios de productos para garantizar sistemas escalables, mantenibles y de alta calidad. Responsabilidades clave: - Desarrollo y producción de modelos: - Diseñar, entrenar y validar modelos supervisados y no supervisados (por ejemplo, detección de anomalías, clasificación, pronóstico). - Arquitectar e implementar soluciones de aprendizaje profundo (CNN, Transformers) con PyTorch. - Desarrollar y ajustar modelos de lenguaje grandes (LLM) y construir aplicaciones impulsadas por LLM. - Implementar pipelines de generación aumentada por recuperación (RAG) e integrarlos con bases de datos vectoriales. - Construir pipelines robustos para desplegar modelos a escala (Docker, Kubernetes, CI/CD). - Ingeniería de datos y MLOps: - Ingerir, limpiar y transformar grandes conjuntos de datos utilizando bibliotecas como pandas, NumPy y Spark. - Automatizar flujos de trabajo de entrenamiento y servicio con Airflow o herramientas de orquestación similares. - Monitorear el rendimiento de los modelos en producción; iterar sobre la detección de deriva y las estrategias de reentrenamiento. - Implementar prácticas de LLMOps para pruebas automatizadas, evaluación y monitoreo de LLM. - Mejores prácticas de desarrollo de software: - Escribir código Python de producción siguiendo los principios SOLID, pruebas unitarias y revisiones de código. - Colaborar en ceremonias ágiles (Scrum); rastrear el trabajo en JIRA. - Documentar la arquitectura y los flujos de trabajo utilizando PlantUML o herramientas comparables. - Colaboración multifuncional: - Comunicar análisis, diseño y resultados claramente en inglés. - Asociarse con los equipos de DevOps, ingeniería de datos y producto para alinearse con los requisitos y los SLA. Sobre Azumo: Basada en San Francisco, California, Azumo es una innovadora empresa de desarrollo de software especializada en servicios de desarrollo de software de inteligencia artificial. Ayudamos a empresas de todos los tamaños a construir aplicaciones inteligentes combinando experiencia en datos, nube e inteligencia artificial. Nuestros talentosos desarrolladores de inteligencia artificial son confiables para brindar servicios de desarrollo de inteligencia artificial de primer nivel en inteligencia artificial generativa, automatización inteligente y soluciones personalizadas de aprendizaje automático. En Azumo, creemos en el crecimiento profesional y personal. Como empresa de desarrollo de inteligencia artificial reconocida, apoyamos a nuestros ingenieros para dominar las últimas tecnologías y brindar servicios de desarrollo de inteligencia artificial de primer nivel en todo el mundo. Nuestra cultura enfatiza la colaboración, el aprendizaje continuo y la resolución de problemas complejos con soluciones modernas de inteligencia artificial. Creemos en retribuir a nuestra comunidad y dedicaremos tiempo a la filantropía, iniciativas de código abierto y compartir nuestros conocimientos. Si calificas para la oportunidad y estás buscando un desafío, por favor aplica en línea en Azumo/join-our-team o contáctanos en [email protected] Calificaciones mínimas: - Licenciatura o Maestría en Ciencias de la Computación, Ciencias de Datos o campo relacionado. - 5+ años de experiencia profesional con Python en entornos de producción. - Sólido conocimiento de aprendizaje automático y aprendizaje profundo (CNN, Transformers, LLM). - Experiencia práctica con PyTorch o marcos similares (entrenamiento, módulos personalizados, optimización). - Historial comprobado de implementación de soluciones de ML. - Experto en pandas, NumPy y scikit-learn. - Familiaridad con prácticas y herramientas ágiles/Scrum (JIRA, Confluence). - Base sólida en estadísticas y diseño experimental. - Excelente inglés escrito y hablado. Calificaciones preferidas: - Experiencia con plataformas en la nube (AWS, GCP o Azure) y sus servicios específicos de inteligencia artificial como Amazon SageMaker, Google Vertex AI o Azure Machine Learning. - Familiaridad con ecosistemas de grandes datos (Spark, Hadoop). - Práctica en CI/CD y orquestación de contenedores (Jenkins/GitLab CI, Docker, Kubernetes). - Exposición a herramientas MLOps/LLMOps (MLflow, Kubeflow, TFX). - Experiencia con modelos de lenguaje grandes, inteligencia artificial generativa, ingeniería de prompts y pipelines RAG. - Experiencia práctica con bases de datos vectoriales (por ejemplo, Pinecone, FAISS). - Experiencia en la construcción de agentes de inteligencia artificial y el uso de marcos como Hugging Face Transformers, LangChain o LangGraph. - Habilidades de documentación utilizando PlantUML o similar. Beneficios: - Tiempo libre remunerado (PTO) - Días festivos en EE. UU. - Capacitación - Acceso premium gratuito a Udemy - Desarrollo profesional mentorado - Participación en las ganancias - Remuneración en $
Responsabilidades
- Diseñar y implementar modelos de machine learning y deep learning
- Desarrollar y ajustar modelos de lenguaje
- Implementar pipelines de RAG
- Desarrollar pipelines robustos para desplegar modelos a escala
- Ingestir, limpiar y transformar grandes conjuntos de datos
Skills requeridas
Beneficios
- Paid time off (PTO)
- U.S. Holidays
- Training Udemy free Premium access
- Mentored career development
- Profit Sharing