directohace 2 meses

Python Scraping Developer

OnhiresRemoto · Por proyecto
Senior
Este aviso fue publicado originalmente en inglés, así que es probable que necesites inglés para este puesto. La descripción puede estar traducida automáticamente al español; ante la duda, revisá el aviso original con el botón de postularte.

Desarrollador de Python para web scraping en empresa de inteligencia de mercado en crecimiento, con modalidad remota.

Por qué aplicar

Ideal para desarrolladores de Python con experiencia en web scraping que buscan un desafío en una empresa en crecimiento.

Descripción del puesto

Nuestra cliente es una empresa emergente con sede en Berlín que opera de forma remota, y que ofrece soluciones de software y inteligencia de mercado de última generación a la industria automotriz. A medida que la empresa ingresa a una nueva fase emocionante de crecimiento, busca un Desarrollador de Scraping con experiencia en Python para fortalecer su equipo internacional de alto impacto. Si te apasiona abordar desafíos complejos de extracción de datos, construir rastreadores web altamente escalables y garantizar que los sistemas de scraping a gran escala funcionen sin problemas en producción, este rol es para ti. Estarás a cargo de todo el ciclo de vida de nuestras canalizaciones de scraping de alto volumen, garantizando que los datos que recopilamos sean precisos, consistentes y entregados con velocidad. Responsabilidades - Diseño y desarrollo: Desarrollar, probar y desplegar scripts de scraping web y rastreadores robustos utilizando herramientas avanzadas de Python (Playwright, Selenium, Requests, BeautifulSoup, etc.). - Escalabilidad: Diseñar y mantener sistemas de scraping asincrónicos capaces de extracción de datos a gran escala. - Resiliencia: Implementar, monitorear y optimizar estrategias sofisticadas de anti-bloqueo y rotación de proxies para garantizar alta fiabilidad y tiempo de actividad. - Integración: Gestionar y automatizar canalizaciones de ingesta de datos e integraciones fluidas con APIs REST externas. - Excelencia operativa: Depurar, monitorear y mejorar continuamente el rendimiento del scraper, la fiabilidad y la calidad de los datos. - Colaboración: Trabajar en equipo con otros ingenieros para mejorar nuestra infraestructura de scraping central, herramientas, registro y sistemas de monitoreo. - Soporte de DevOps: Ayudar con tareas de DevOps, incluyendo Docker, CI/CD y gestión de entornos Linux. Requisitos - Experiencia central: Experiencia profesional comprobada y práctica en scraping web de alto volumen y extracción de datos utilizando Python. - Profundidad técnica: Comprensión sólida de parseo de HTML, técnicas de automatización de navegador y programación asincrónica. - Marcos: Competencia con marcos líderes de scraping web (por ejemplo, Playwright, Scrapy o Selenium). - Conocimiento web: Fuerte conocimiento de APIs REST, protocolos HTTP y gestión efectiva de proxies. - Habilidades de base de datos: Familiaridad con bases de datos tanto SQL como NoSQL para almacenamiento y procesamiento de datos eficientes. - Infraestructura: Experiencia con Docker, entornos Linux y control de versiones (Git). - Comunicación: Fluido en inglés (escrito y hablado). - Mentalidad: Autodirigido, orientado a detalles y capaz de tomar plena propiedad de proyectos significativos. Ventajas (Puntos de bonificación) - Experiencia con bibliotecas asincrónicas avanzadas (por ejemplo, asyncio) - Comprensión de herramientas de validación de calidad de datos y monitoreo de canalizaciones. Qué ofrecen - Impacto y propiedad: Un alto grado de libertad y la oportunidad de tener un impacto significativo y medible en un negocio emergente en crecimiento. - Flexibilidad: Un alto grado de flexibilidad - nuestra cliente es una empresa que opera de forma remota y apoya activamente el trabajo remoto. - Crecimiento: Un paquete de compensación competitivo y apoyo dedicado para tu desarrollo personal y profesional (formación continua y coaching). - Equipo y atmósfera: Una gran atmósfera de trabajo dentro de un equipo pequeño, talentoso e internacional. - Oficina (opcional): Una oficina moderna ubicada en el campus de la Universidad de Tecnología de Wildau, fácilmente accesible por transporte público (justo fuera de Berlín).

Responsabilidades

  • Diseño y desarrollo de scripts de web scraping
  • Arquitectura de sistemas de scraping escalables
  • Implementación de estrategias anti-bloqueo
  • Integración con APIs
  • Monitoreo y mejora de rendimiento

Skills requeridas

Desarrollo de scripts de web scrapingProgramación asíncronaAutomatización de pruebasIntegración con APIsAutonomíaOrientación al detallePropiedad de proyectosColaboraciónComunicación efectiva

Beneficios

  • Compensación competitiva
  • Oportunidades de crecimiento profesional
  • Atmósfera de trabajo agradable
  • Flexibilidad laboral