workablehace 5 días

Freelance Data Scraping Engineer (Python)

MindriftBuenos AiresRemoto · Por proyecto
Senior3+ años
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Mindrift busca un Freelance Data Scraping Engineer (Python) para un proyecto de web scraping y procesamiento de datos. El rol es remoto y requiere experiencia en Python, web scraping y procesamiento de datos.

Por qué aplicar

Ideal para profesionales técnicos con experiencia en web scraping y procesamiento de datos en Python. Ofrece la oportunidad de trabajar de forma remota en un proyecto desafiante.

Descripción del puesto

Mindrift está buscando Ingenieros de Extracción de Datos con Python altamente capacitados para unirse al proyecto Tendem y dirigir flujos de trabajo de extracción de datos especializados dentro de nuestro sistema híbrido de IA + humanos. En este rol, como Piloto de IA - así es como nos referimos a este rol en Mindrift - colaborarás con Agentes de Tendem que manejan tareas repetitivas, mientras tú proporcionas pensamiento crítico, experiencia en el dominio y control de calidad para entregar resultados precisos y accionables. Esta oportunidad remota a tiempo parcial es ideal para profesionales técnicos con experiencia práctica en extracción de datos web, extracción y procesamiento de datos. Lo que hacemos: La plataforma Mindrift conecta especialistas con proyectos de IA de importantes innovadores tecnológicos. Nuestra misión es desbloquear el potencial de la IA Generativa aprovechando la experiencia del mundo real de todo el mundo. Acerca del rol: Este es un rol freelance para un proyecto de Tendem. Como Ingeniero de Extracción de Datos con Python, manejarás tareas de extracción de datos que requieren precisión técnica para la extracción y el procesamiento web, utilizando varias herramientas como Apify y OpenRouter proporcionadas por nosotros, junto con tus propios enfoques ingeniosos. Responsabilidades clave: - Poseer flujos de trabajo de extracción de datos de extremo a extremo en sitios web complejos, asegurando la cobertura completa, la precisión y la entrega confiable de conjuntos de datos estructurados. - Aprovechar herramientas internas (Apify, OpenRouter) junto con flujos de trabajo personalizados para acelerar la recopilación de datos, la validación y la ejecución de tareas mientras se cumplen los requisitos definidos. - Asegurar la extracción confiable de fuentes web dinámicas e interactivas, adaptando enfoques según sea necesario para manejar contenido renderizado en JavaScript y cambios en el comportamiento del sitio. - Hacer cumplir los estándares de calidad de los datos a través de comprobaciones de validación, controles de consistencia entre fuentes, adherencia a especificaciones de formato y verificación sistemática antes de la entrega. - Escalar operaciones de extracción para grandes conjuntos de datos utilizando procesamiento por lotes eficiente o paralelización, monitorear fallas y mantener la estabilidad contra cambios estructurales menores en el sitio. Compensación: En este proyecto, los contribuyentes pueden ganar hasta $20 por hora equivalente, dependiendo de su nivel y ritmo de contribución. La compensación varía según los proyectos, dependiendo del alcance, la complejidad y la experiencia requerida. Tenga en cuenta que otros proyectos en la plataforma pueden ofrecer niveles de ganancias diferentes según sus requisitos. Cómo empezar: Simplemente aplique a este anuncio, califique y tenga la oportunidad de contribuir a proyectos que coincidan con sus habilidades técnicas, en su propio horario. Desde la codificación y la automatización hasta el ajuste de las salidas de IA, jugarás un papel clave en el avance de las capacidades de IA y las aplicaciones del mundo real. Requisitos: - Al menos 3 años de experiencia relevante en ingeniería de datos, extracción de datos web, automatización o desarrollo de software (requerido). - Licenciatura o Maestría en Ingeniería, Matemáticas Aplicadas, Ciencias de la Computación o campos técnicos relacionados es un plus. - Fuerte experiencia en extracción de datos web con Python (BeautifulSoup, Selenium o similar), incluido contenido dinámico (JS, AJAX, desplazamiento infinito) y API a través de proxies. - Capacidad comprobada para extraer datos de estructuras complejas (jerarquías, páginas archivadas, HTML inconsistente). - Sólido conocimiento en limpieza, normalización y validación de datos, entregando conjuntos de datos estructurados (CSV, JSON, Google Sheets). - Experiencia práctica con LLM y marcos de IA para mejorar la automatización y la resolución de problemas. - Fuerte atención al detalle y compromiso con la precisión de los datos. - Ética de trabajo autodirigida con capacidad para solucionar problemas de forma independiente. - Un enlace a GitHub es un plus. - Dominio del inglés: intermedio-alto (B2) o superior (requerido). ¿Por qué esta oportunidad freelance podría ser una excelente opción para ti? - Trabajar de forma remota completa en tu propio horario con solo una laptop y una conexión a Internet estable. - Obtener experiencia práctica en un entorno híbrido único donde la experiencia humana y los agentes de IA colaboran sin problemas - un conjunto de habilidades distintivo en un campo en rápido crecimiento. - Participar en programas de bonificación basados en el rendimiento que recompensan el trabajo de alta calidad y la entrega constante.

Responsabilidades

  • Extracción de datos
  • Procesamiento de datos
  • Validación de datos
  • Escalado de operaciones de scraping

Skills requeridas

Web scrapingProcesamiento de datosPythonAutomatizaciónValidación de datosAtención al detalleTrabajo independienteResolución de problemas

Beneficios

  • Remoto
  • Flexible schedule
  • Bonus programs
¿Te interesa empleos en Buenos Aires? Avisame cuando haya nuevos.