directohace 1 día

Machine Learning Engineer

Senior
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Se busca Machine Learning Engineer con experiencia en ingeniería de datos para construir, entrenar y desplegar modelos de ML y pipelines de datos en entornos complejos.

Por qué aplicar

Atractivo para ingenieros de ML con experiencia en datos, ofrece carrera remota a largo plazo.

Descripción del puesto

Sumate a Hire Hangar y trabajá con empresas globales en crecimiento mientras construís una carrera remota a largo plazo. INGENIERO DE APRENDIZAJE AUTOMÁTICO (DATOS & IA) Remoto Zonas horarias de EE. UU. (EST - PST) Descripción del rol Estamos buscando un Ingeniero de Aprendizaje Automático capacitado con una sólida base en ingeniería de datos para construir, entrenar y desplegar modelos de aprendizaje automático y canalizaciones de datos en una variedad de entornos complejos. Este rol se encuentra en la intersección de datos e IA — estarás a cargo de todo, desde la obtención, limpieza y estructuración de datos hasta el entrenamiento de modelos, la evaluación del rendimiento y la puesta en producción de soluciones. El candidato ideal piensa rigurosamente sobre la calidad de los datos, comprende el ciclo de vida completo del aprendizaje automático y se siente igualmente cómodo trabajando con grandes conjuntos de datos y ajustando modelos o construyendo canalizaciones de inferencia escalables. Responsabilidades clave - Diseñar, construir y mantener canalizaciones de datos robustas para la ingesta, transformación y ingeniería de características. - Desarrollar, entrenar, evaluar y iterar sobre modelos de aprendizaje automático en tareas de clasificación, regresión, agrupación y NLP. - Ajustar y adaptar modelos pre-entrenados de LLM y modelos de base para casos de uso y conjuntos de datos específicos. - Construir y gestionar infraestructura de MLOps, incluyendo versión de modelos, seguimiento de experimentos y canalizaciones de despliegue. - Trabajar con datos estructurados y no estructurados a gran escala — incluidos texto, datos tabulares y series temporales. - Monitorear el rendimiento de los modelos en producción e implementar estrategias de reentrenamiento y detección de deriva. - Colaborar con equipos de ingeniería y producto para traducir insights de datos en características de IA accionables. - Documentar esquemas de datos, arquitecturas de modelos y lógica de canalización de manera clara y exhaustiva. Calificaciones requeridas - Habilidades sólidas en Python con experiencia práctica en bibliotecas de aprendizaje automático básicas (scikit-learn, PyTorch, TensorFlow o similares). - Experiencia sólida en ingeniería de datos — SQL, canalizaciones ETL y trabajo con conjuntos de datos a gran escala. - Experiencia práctica con entrenamiento de modelos, evaluación, ajuste de hiperparámetros y despliegue. - Familiaridad con LLM y arquitecturas basadas en transformadores; experiencia con ajuste o ingeniería de indicaciones en contextos de producción. - Experiencia con seguimiento de experimentos y herramientas de MLOps (MLflow, Weights & Biases, DVC o similares). - Comprensión sólida de conceptos estadísticos, principios de calidad de datos y métricas de rendimiento de modelos. - Debe tener experiencia previa en trabajo remoto, ser fluido con herramientas y plataformas de colaboración remota (como Slack, Zoom, Google Workspace, Asana o similares) y haber trabajado idealmente con empresas con sede en EE. UU. o Reino Unido. Las solicitudes sin esta experiencia no serán consideradas. Calificaciones preferidas - Experiencia con marcos de procesamiento de datos distribuidos (Spark, Dask o similares). - Familiaridad con bases de datos vectoriales y sistemas de recuperación basados en embeddings. - Antecedentes de trabajo con canalizaciones de datos en tiempo real o en streaming (Kafka, Flink o similares). - Exposición a plataformas de aprendizaje automático nativas de la nube (AWS SageMaker, GCP Vertex AI, Azure ML). - Experiencia con gobierno de datos, seguimiento de linaje o flujos de trabajo de datos conscientes del cumplimiento. Herramientas y tecnología - Python, SQL y bibliotecas básicas de aprendizaje automático/datos (PyTorch, scikit-learn, Pandas, NumPy). - MLOps: MLflow, Weights & Biases, DVC o equivalente. - Almacenes y lagos de datos: Snowflake, BigQuery, Redshift o similares. - Plataformas LLM: Hugging Face, OpenAI, Anthropic o similares. - Infraestructura en la nube: AWS, GCP o Azure. - Google Workspace, Slack, Zoom y herramientas de colaboración remota. Por favor, ten en cuenta: Es crucial que completes el formulario de solicitud en su totalidad. Como parte del proceso de solicitud, se te requerirá que grabes un video. Si tu solicitud es exitosa, recibirás un correo electrónico que confirma los próximos pasos — el video es el primer paso del proceso de entrevista. Si no grabas un video, no podremos considerarte para NINGÚN rol abierto. Conectamos a los mejores talentos con empleadores verificados, pago competitivo y oportunidades de crecimiento real.

Responsabilidades

  • diseñar y construir pipelines de datos
  • desarrollar y entrenar modelos de ML
  • evaluar y desplegar modelos
  • trabajar con grandes conjuntos de datos

Skills requeridas

ingeniería de datosmodelado de datosevaluación de modelosdespliegue de modelostrabajo con grandes conjuntos de datoscolaboración remotatrabajo en equipocomunicación efectiva