Empresa de consultoría y servicios tecnológicos busca un Ingeniero Senior de Plataforma de Datos para construir pipelines de datos y arquitectura lakehouse en AWS para una plataforma científica de datos en la industria biofarmacéutica.
Si te copa la idea de laburar remoto y meterte de lleno en la construcción de arquitecturas de datos para la industria biofarmacéutica, este puesto es para vos. Vas a poder aplicar tus skills en AWS y DataBricks para acelerar la investigación científica.
Descripción del puesto
Solvd Inc. es una consultora y proveedora de servicios tecnológicos nativa de IA en rápida expansión, que impulsa la transformación empresarial en áreas como cloud, datos, ingeniería de software e inteligencia artificial. Trabajamos con organizaciones líderes para diseñar, construir y operar soluciones tecnológicas que generan resultados comerciales medibles. Tras la adquisición de Tooploox, una empresa líder en IA y desarrollo de productos, Solvd ahora ofrece una entrega integral, desde asesoramiento estratégico y diseño de soluciones hasta desarrollo de IA a medida e implementación a escala empresarial. Nuestros centros de capacidad combinan profunda experiencia técnica, metodologías de entrega probadas y conocimiento sectorial específico para abordar desafíos comerciales complejos de manera rápida y efectiva. Buscamos un Senior Data Platform Engineer para unirse a un proyecto de construcción de pipelines de datos y arquitectura lakehouse para una plataforma de datos científicos en la nube, especialmente diseñada para la biofarmacéutica. Trabajarás en la intersección de la ingeniería de datos y las ciencias de la vida, transformando la salida bruta de instrumentos de laboratorio en datos científicos armonizados y accionables que aceleran los resultados de investigación. Este es un trabajo de ingeniería práctico y de extremo a extremo: prototipado de pipelines, análisis de formatos de archivo de instrumentos propietarios, diseño de modelos de datos y entrega de soluciones listas para producción directamente con el cliente. QUÉ HARÁS - Serás responsable de prototipar, implementar y desplegar pipelines de Databricks Lakehouse en AWS. - Investigarás y prototiparás estrategias de adquisición de datos para instrumentación científica de laboratorio. - Construirás analizadores de archivos para ficheros de salida de instrumentos en una amplia gama de formatos: .xlsx, .pdf, .txt, .raw, .fid y binarios específicos del proveedor. - Diseñarás y construirás modelos de datos, pipelines de datos en Python, pruebas unitarias, pruebas de integración y funciones de utilidad. - Trabajarás directamente con los clientes para validar que las soluciones cumplen sus requisitos y resuelven necesidades científicas reales. - Facilitarás análisis post-mortem internos del proyecto para identificar y aplicar mejoras en todos los proyectos. QUÉ APORTAS - Más de 5 años de experiencia profesional en Python y SQL. - Experiencia práctica con la arquitectura Databricks Lakehouse en AWS. - Sólido conocimiento práctico de AWS Redshift (experiencia práctica requerida). - Experiencia en el stack de datos de AWS: ECS, S3, Athena, RDS. - Dominio del desarrollo de pipelines ETL/ELT utilizando Airflow y Python. - Experiencia con bases de datos relacionales: MySQL, MariaDB, Aurora, PostgreSQL, MS SQL Server. - Familiaridad con bases de datos clave-valor y no relacionales. - Excelentes habilidades de comunicación y la confianza para asumir la propiedad de la entrega del proyecto de principio a fin. - Capacidad para gestionar múltiples proyectos simultáneos sin perder calidad ni atención al detalle. - Curiosidad genuina: este rol requiere aprender continuamente nuevos dominios científicos y ecosistemas de instrumentación. DESEABLE - Experiencia con Elasticsearch. - Experiencia o conocimientos en instrumentación científica, flujos de trabajo de laboratorio o datos biofarmacéuticos. - Título de posgrado en Química, Biología, Ciencias de la Computación, Estadística, Salud Pública o un campo relacionado. - Experiencia en el análisis de formatos de archivo binarios propietarios de instrumentos de laboratorio. Al unirte a Solvd, podrás: - Dar forma a proyectos reales impulsados por IA en industrias clave, trabajando con clientes desde la innovación de startups hasta la transformación empresarial. - Ser parte de un equipo global con igualdad de oportunidades para la colaboración entre continentes y culturas. - Prosperar en un entorno inclusivo que prioriza el aprendizaje continuo, la innovación y los estándares éticos de IA. ¿Listo para generar un impacto? Si te entusiasma construir cosas que importan, defender la IA responsable y crecer junto a algunas de las mentes más brillantes de la industria. Postúlate hoy y creemos juntos. Solvd es un empleador que ofrece igualdad de oportunidades.
Responsabilidades
- Prototipar, implementar y desplegar pipelines DataBricks Lakehouse en AWS
- Investigar y prototipar estrategias de adquisición de datos para instrumentación científica de laboratorio
- Construir parsers de archivos para formatos de salida de instrumentos
- Diseñar y construir modelos de datos, pipelines de datos en Python, pruebas unitarias, pruebas de integración y funciones de utilidad
- Validar soluciones con los clientes
- Facilitar post-mortems internos del proyecto