Ingeniero de Data Scraping Freelance (Python)
Empresa busca Ingeniero de Data Scraping Freelance con experiencia en Python para unirse al proyecto Tendem, realizando tareas de extracción y procesamiento de datos de forma remota.
Si sos un crack de Python y te copa el data scraping, esta es tu chance de laburar remoto en un proyecto copado de IA. Ideal para quienes buscan aplicar su expertise técnico en desafíos reales y sumar experiencia en el mundo de la inteligencia artificial.
Descripción del puesto
Mindrift busca Ingenieros de Python para Data Scraping altamente calificados para unirse al proyecto Tendem y dirigir flujos de trabajo especializados de data scraping dentro de nuestro sistema híbrido de IA + humano. En este rol, "AI Pilot" (así nos referimos a este puesto en Mindrift), colaborarás con "Tendem Agents" que manejan tareas repetitivas, mientras aportas pensamiento crítico, experiencia en el dominio y control de calidad para entregar resultados precisos y accionables. Esta oportunidad remota a tiempo parcial es ideal para profesionales técnicos con experiencia práctica en web scraping, extracción y procesamiento de datos. Qué Hacemos La plataforma Mindrift conecta especialistas con proyectos de IA de los principales innovadores tecnológicos. Nuestra misión es desbloquear el potencial de la IA Generativa aprovechando la experiencia del mundo real de todo el mundo. Sobre el Rol Este es un rol freelance para un proyecto Tendem. Como Ingeniero de Python para Data Scraping, manejarás tareas de data scraping que requieren precisión técnica para la extracción y procesamiento web, utilizando diversas herramientas como Apify y OpenRouter (proporcionadas por nosotros) junto con tus propios enfoques ingeniosos. Responsabilidades Clave - Liderar flujos de trabajo de extracción de datos de extremo a extremo en sitios web complejos, asegurando una cobertura completa, precisión y entrega confiable de conjuntos de datos estructurados. - Utilizar herramientas internas (Apify, OpenRouter) junto con flujos de trabajo personalizados para acelerar la recopilación, validación y ejecución de tareas de datos, cumpliendo con los requisitos definidos. - Asegurar la extracción confiable de fuentes web dinámicas e interactivas, adaptando los enfoques según sea necesario para manejar contenido renderizado por JavaScript y cambios en el comportamiento del sitio. - Aplicar estándares de calidad de datos a través de verificaciones de validación, controles de consistencia entre fuentes, cumplimiento de especificaciones de formato y verificación sistemática antes de la entrega. - Escalar operaciones de scraping para grandes conjuntos de datos utilizando paralelización o procesamiento por lotes eficiente, monitorear fallos y mantener la estabilidad frente a cambios menores en la estructura del sitio. Compensación En este proyecto, los colaboradores pueden ganar hasta el equivalente a $20 por hora, dependiendo de su nivel y ritmo de contribución. La compensación varía entre proyectos según el alcance, la complejidad y la experiencia requerida. Ten en cuenta que otros proyectos en la plataforma pueden ofrecer diferentes niveles de ganancias según sus requisitos. Cómo Empezar Simplemente postúlate a esta oferta, califica y obtén la oportunidad de contribuir a proyectos que coincidan con tus habilidades técnicas, en tu propio horario. Desde codificación y automatización hasta el ajuste fino de resultados de IA, desempeñarás un papel clave en el avance de las capacidades de IA y aplicaciones del mundo real. Requisitos - Al menos 3 años de experiencia relevante en ingeniería de datos, web scraping, automatización o desarrollo de software (requerido). - Título de Grado o Maestría en Ingeniería, Matemáticas Aplicadas, Ciencias de la Computación o campos técnicos relacionados es un plus. - Sólida experiencia en web scraping con Python (BeautifulSoup, Selenium o similar), incluyendo contenido dinámico (JS, AJAX, scroll infinito) y APIs a través de proxies. - Capacidad probada para extraer datos de estructuras complejas (jerarquías, páginas archivadas, HTML inconsistente). - Sólido conocimiento en limpieza, normalización y validación de datos, entregando conjuntos de datos estructurados (CSV, JSON, Google Sheets). - Experiencia práctica con LLMs y frameworks de IA para mejorar la automatización y la resolución de problemas. - Gran atención al detalle y compromiso con la precisión de los datos. - Ética de trabajo autodirigida con capacidad para solucionar problemas de forma independiente. - Un enlace a GitHub es un plus. - Dominio del inglés: Intermedio-alto (B2) o superior (requerido). ¿Por qué esta oportunidad freelance podría ser una gran opción para vos? - Trabaja de forma totalmente remota en tu propio horario con solo una laptop y conexión a internet estable. - Gana experiencia práctica en un entorno híbrido único donde la experiencia humana y los agentes de IA colaboran sin problemas, una habilidad distintiva en un campo en rápido crecimiento. - Participa en programas de bonificación basados en el rendimiento que recompensan el trabajo de alta calidad y la entrega consistente.
Responsabilidades
- Gestionar flujos de extracción de datos de principio a fin
- Asegurar cobertura, precisión y entrega de datasets estructurados
- Utilizar herramientas internas y flujos de trabajo personalizados
- Extraer datos de fuentes web dinámicas e interactivas
- Aplicar estándares de calidad de datos
- Escalar operaciones de scraping para grandes datasets
- Monitorear fallos y mantener estabilidad
Skills requeridas
Beneficios
- Trabajo remoto
- Horario flexible
- Bonos por desempeño
Trabajos similares

Python Software Engineer – Web Scraping - Remoto - 1728
