directohace 2 meses

Especialista en Operaciones de Inteligencia Artificial

NewselaRemoto
Senior2+ años

Se busca un Especialista en Operaciones de Inteligencia Artificial para unirse al equipo de ML/AI en Newsela, trabajando en proyectos de Machine Learning y AI, con foco en llevar modelos desde prototipo a producción y mantener servicios funcionando sin problemas.

Por qué aplicar

Ideal para profesionales con experiencia en ML Ops y DevOps que buscan un desafío en un equipo de ML/AI en un entorno remoto.

Descripción del puesto

¿Por qué te encantará este rol? Estamos buscando un ingeniero de ML Ops experimentado para unirse al equipo de ML/AI en Newsela. Este equipo trabaja en proyectos que van desde Machine Learning clásico hasta pipelines de IA/Generación. Este es un rol práctico. Trabajarás en estrecha colaboración con ingenieros de ML/AI, datos y confiabilidad del sitio para llevar modelos desde el prototipo hasta la producción, construir pipelines de datos robustos y mantener nuestros servicios funcionando sin problemas mientras continuamos escalando. Qué estarás haciendo: - Diseñar y mantener pipelines de CI/CD para entrenamiento de modelos de ML, empaquetado y despliegue en nuestros microservicios. - Administrar servicios en contenedores en AWS ECS, optimizando para costo, latencia y disponibilidad. - Automatizar aprovisionamiento de infraestructura y configuración de servicios con Terraform. - Trabajar para mantener y escalar servicios que utilizan proveedores de LLM de terceros. - Construir y mejorar pipelines de datos que alimentan modelos desde BigQuery, S3 y DynamoDB en flujos de trabajo de entrenamiento e inferencia. - Instrumentar servicios con herramientas de observabilidad (Datadog, OpenTelemetry, Langfuse) y establecer SLO para puntos finales de servicio de modelos. - Colaborar con ingenieros de ML para producir nuevos modelos utilizando BentoML, FastAPI y servicio basado en contenedores. Sobre ti: - 2-3 años en ML Ops que soportan características, sistemas y flujos de trabajo de ML/AI con 3-4 años de experiencia previa en DevOps, CloudOps o SRE. - Fuerte dominio de Python. - Experiencia práctica con contenerización Docker y orquestación de contenedores. - Sólido entendimiento de CI/CD para flujos de trabajo de ML en un entorno de producción empresarial. - Experiencia con Infraestructura como Código, preferiblemente Terraform. - Familiaridad con plataformas en la nube — específicamente AWS (ECS, ECR, S3, DynamoDB, CloudWatch) y GCP (BigQuery, Vertex AI). - Experiencia con integración de LLM y observabilidad (OpenAI API, Google GenAI, trazado Langfuse). - Experiencia construyendo y manteniendo pipelines de datos para entrenamiento de ML e ingeniería de características. - Familiaridad con flujos de trabajo de modelado de ML — entrenamiento, evaluación, seguimiento de experimentos (por ejemplo, MLFlow, Weights & Biases) y versionado de modelos. - Experiencia monitoreando y señalando deriva de modelo con el tiempo. - Exposición a modelos y marcos de NLP/NLU como Hugging Face Transformers, spaCy o sentence-transformers. - Conocimiento de bases de datos vectoriales (LanceDB, FAISS) y sistemas de recuperación basados en embeddings. - Experiencia con escalado y mantenimiento de marcos de aprendizaje profundo (TensorFlow, PyTorch) en entornos de producción. - Familiaridad con librerías de ML clásicas (scikit-learn, XGBoost, LightGBM) y herramientas de explicabilidad de modelos (SHAP). - Conocimiento práctico de marcos de servicio de ML como BentoML o similares. - Comodidad trabajando con FastAPI o similares frameworks web asincrónicos de Python. Por favor, ten en cuenta que dada la naturaleza del contrato, este rol no será elegible para participar en beneficios patrocinados por la empresa. Sobre Newsela: Newsela es una empresa líder en tecnología educativa dedicada a un aprendizaje significativo en el aula para cada estudiante. Entregamos soluciones integradas, impulsadas por IA, diseñadas para desbloquear la participación de los estudiantes, empoderar a los docentes y impulsar resultados de aprendizaje significativos. Nuestra suite de productos soporta el desarrollo de conocimientos y habilidades, práctica de escritura, instrucción diaria, evaluación y toma de decisiones informadas por datos en aulas de K-12. Basado en investigaciones de ciencia del aprendizaje, las soluciones de Newsela integran contenido, evaluación y analíticas para ayudar a los educadores a rastrear el progreso, entender los resultados de los estudiantes y entregar instrucción de alto impacto que soporta a cada aprendiz.

Responsabilidades

  • Diseñar y mantener pipelines CI/CD para entrenamiento, empaquetado y despliegue de modelos de ML
  • Gestionar servicios en contenedores en AWS ECS
  • Automatizar aprovisionamiento de infraestructura y configuración de servicios con Terraform
  • Trabajar en servicios que utilizan proveedores de LLM de terceros
  • Crear y mejorar pipelines de datos para workflows de entrenamiento e inferencia
  • Instrumentar servicios con herramientas de observabilidad
  • Colaborar con ingenieros de ML para producir nuevos modelos

Skills requeridas

CI/CD para flujos de trabajo de MLInfraestructura como CódigoNubes públicas (AWS, GCP)Integración de LLM y observabilidadPipelines de datos para MLFlujos de trabajo de modelado de MLMantenimiento de frameworks de aprendizaje profundoBibliotecas de ML clásicasFrameworks de servicio de ML