Ingeniero de Data Scraping Freelance
Empresa busca Ingeniero de Data Scraping Freelance con experiencia en Python para un proyecto remoto de medio tiempo. Se requiere manejo de herramientas de web scraping y procesamiento de datos.
Si te copa la idea de laburar remoto y a medio tiempo en un proyecto de IA, este puesto es para vos. Vas a aplicar tus skills de Python y web scraping para proyectos innovadores, colaborando con agentes de IA y aportando tu pensamiento crítico. Ideal para quienes buscan sumar experiencia en el mundo tech.
Descripción del puesto
Mindrift busca Ingenieros de Python para Data Scraping altamente calificados para unirse al proyecto Tendem y dirigir flujos de trabajo especializados de data scraping dentro de nuestro sistema híbrido de IA + humano. En este rol, "AI Pilot" (así nos referimos a este puesto en Mindrift), colaborarás con "Tendem Agents" que manejan tareas repetitivas, mientras aportas pensamiento crítico, experiencia en el dominio y control de calidad para entregar resultados precisos y accionables. Esta oportunidad remota a tiempo parcial es ideal para profesionales técnicos con experiencia práctica en web scraping, extracción y procesamiento de datos. Qué Hacemos La plataforma Mindrift conecta especialistas con proyectos de IA de los principales innovadores tecnológicos. Nuestra misión es desbloquear el potencial de la IA Generativa aprovechando la experiencia del mundo real de todo el mundo. Sobre el Rol Este es un rol freelance para un proyecto Tendem. Como Ingeniero de Python para Data Scraping, manejarás tareas de data scraping que requieren precisión técnica para la extracción y procesamiento web, utilizando diversas herramientas como Apify y OpenRouter (proporcionadas por nosotros) junto con tus propios enfoques ingeniosos. Responsabilidades Clave - Liderar flujos de trabajo de extracción de datos de extremo a extremo en sitios web complejos, asegurando una cobertura completa, precisión y entrega confiable de conjuntos de datos estructurados. - Utilizar herramientas internas (Apify, OpenRouter) junto con flujos de trabajo personalizados para acelerar la recopilación, validación y ejecución de tareas de datos, cumpliendo con los requisitos definidos. - Asegurar la extracción confiable de fuentes web dinámicas e interactivas, adaptando los enfoques según sea necesario para manejar contenido renderizado por JavaScript y cambios en el comportamiento del sitio. - Aplicar estándares de calidad de datos a través de verificaciones de validación, controles de consistencia entre fuentes, cumplimiento de especificaciones de formato y verificación sistemática antes de la entrega. - Escalar operaciones de scraping para grandes conjuntos de datos utilizando paralelización o procesamiento por lotes eficiente, monitorear fallos y mantener la estabilidad frente a cambios menores en la estructura del sitio. Compensación En este proyecto, los colaboradores pueden ganar hasta el equivalente a $20 por hora, dependiendo de su nivel y ritmo de contribución. La compensación varía entre proyectos según el alcance, la complejidad y la experiencia requerida. Ten en cuenta que otros proyectos en la plataforma pueden ofrecer diferentes niveles de ganancias según sus requisitos. Cómo Empezar Simplemente postúlate a esta oferta, califica y obtén la oportunidad de contribuir a proyectos que coincidan con tus habilidades técnicas, en tu propio horario. Desde codificación y automatización hasta el ajuste fino de resultados de IA, desempeñarás un papel clave en el avance de las capacidades de IA y aplicaciones del mundo real. Requisitos - Al menos 3 años de experiencia relevante en ingeniería de datos, web scraping, automatización o desarrollo de software (requerido). - Título de Grado o Maestría en Ingeniería, Matemáticas Aplicadas, Ciencias de la Computación o campos técnicos relacionados es un plus. - Sólida experiencia en web scraping con Python (BeautifulSoup, Selenium o similar), incluyendo contenido dinámico (JS, AJAX, scroll infinito) y APIs a través de proxies. - Capacidad probada para extraer datos de estructuras complejas (jerarquías, páginas archivadas, HTML inconsistente). - Sólido conocimiento en limpieza, normalización y validación de datos, entregando conjuntos de datos estructurados (CSV, JSON, Google Sheets). - Experiencia práctica con LLMs y frameworks de IA para mejorar la automatización y la resolución de problemas. - Gran atención al detalle y compromiso con la precisión de los datos. - Ética de trabajo autodirigida con capacidad para solucionar problemas de forma independiente. - Un enlace a GitHub es un plus. - Dominio del inglés: Intermedio-alto (B2) o superior (requerido). ¿Por qué esta oportunidad freelance podría ser una gran opción para vos? - Trabaja de forma totalmente remota en tu propio horario con solo una laptop y conexión a internet estable. - Gana experiencia práctica en un entorno híbrido único donde la experiencia humana y los agentes de IA colaboran sin problemas, una habilidad distintiva en un campo en rápido crecimiento. - Participa en programas de bonificación basados en el rendimiento que recompensan el trabajo de alta calidad y la entrega consistente.
Responsabilidades
- Own end-to-end data extraction workflows
- Leverage internal tools (Apify, OpenRouter) alongside custom workflows
- Ensure reliable extraction from dynamic and interactive web sources
- Enforce data quality standards
- Scale scraping operations for large datasets
Skills requeridas
Beneficios
- Performance-based bonus programs