Platform Engineer
Se busca Platform Engineer para empresa de tecnología con stack en Cloudflare Workers y Vercel. Responsabilidades incluyen CI/CD, infraestructura de edge, observabilidad y herramientas de desarrollo en un entorno de monorepo con TypeScript y Python.
Atractivo para desarrolladores experimentados que buscan un desafío en plataforma y tecnologías de vanguardia.
Descripción del puesto
Estamos construyendo una plataforma moderna de entrega de software en infraestructura serverless y de edge. Nuestro stack se ejecuta en Cloudflare Workers y Vercel, y nuestra función de ingeniería de plataforma existe para ayudar a cada ingeniero a enviar código rápidamente, de manera segura y con confianza. Estamos buscando un ingeniero de plataforma para que se encargue de nuestra plataforma de desarrollo interna de principio a fin. Este es un rol de contribuyente individual senior que abarca CI/CD, infraestructura de edge, observabilidad y herramientas de desarrollo en un monorepo de TypeScript y Python. Tratarás a los ingenieros internos como tus usuarios principales y medirás el éxito por su productividad. El rol tiene un claro camino de crecimiento hacia un nivel de ingeniería de Staff o Principal. Responsabilidades clave: - Diseñar y mantener flujos de trabajo de GitHub Actions en un monorepo, incluyendo flujos de trabajo reutilizables, federación OIDC con Cloudflare y Vercel, y una calidad integral de CI que cubra comprobación de tipos, linting, pruebas y SAST. - Ser dueño de la totalidad de la canalización de despliegue desde la rama hasta la vista previa y la producción, incluyendo la firma de artefactos, la generación de SBOM y las prácticas de seguridad de la cadena de suministro. - Instrumentar servicios de Python y TypeScript con OpenTelemetry, ser dueño de la configuración de OTel Collector y establecer una estrategia de observabilidad neutral para proveedores que cubra trazas, registros y métricas en entornos de cómputo de edge. - Definir SLOs con equipos de producto, implementar alertas de presupuesto de error y establecer el contrato de registro a nivel organizacional. - Ser dueño de la configuración de Cloudflare y Vercel como código a través de Terraform o Pulumi, asegurando que todos los cambios de infraestructura sean revisados por PR y versionados. - Construir y mantener CLIs internas y herramientas de estructuración que aprovisionen nuevos servicios pre cableados con CI, OTel y configuración de despliegue. - Mantener un entorno de desarrollo consciente de la IA con sandboxing seguro para agentes y guardrails de gobernanza para código generado por IA que ingresa a la producción. - Rastrear y reportar sobre el impacto de la plataforma: frecuencia de despliegue, tiempo de ciclo de PR, tiempo hasta la producción y satisfacción del desarrollador. Requisitos demostrados: - Experiencia en ingeniería de plataforma, DevOps o ingeniería de experiencia de desarrollador en un contexto profesional. - Proficiència práctica en Python, TypeScript y Bash. - Experiencia profunda con GitHub Actions, Infraestructura como Código (Terraform o Pulumi) y autenticación sin claves basada en OIDC. - Conocimiento de trabajo de OpenTelemetry y prácticas de seguridad de la cadena de suministro de software. - Familiaridad con plataformas de cómputo de edge, particularmente Cloudflare Workers y Vercel. - Comunicación escrita fuerte; capaz de producir documentación y registros de decisión de arquitectura que permitan que la plataforma opere sin intervención directa. - Autodirigido y cómodo dando forma a una función que todavía está en sus primeras etapas de desarrollo. Calificaciones preferidas: - Experiencia con Sigstore o cosign, herramientas de política como código (OPA) o portales de desarrollador internos (Backstage). - Antecedentes en FinOps o atribución de costos en la nube. - Experiencia diseñando sistemas CI/CD que se adapten a agentes de codificación de IA y flujos de trabajo de generación de código no deterministas.
Responsabilidades
- Diseñar y mantener flujos de trabajo de GitHub Actions
- Gestionar la pipeline de despliegue
- Instrumentar servicios con OpenTelemetry
- Definir SLOs y alertas de presupuesto de error
- Gestionar configuración de Cloudflare y Vercel