Research Staff, LLMs
Investigador senior en Deepgram para trabajar en modelos de lenguaje grande (LLMs) y arquitectura de transformadores, con experiencia en investigación de aprendizaje profundo y desarrollo de modelos de lenguaje.
Atractivo para investigadores senior en aprendizaje profundo, ofrece oportunidades de innovación en modelos de lenguaje
Descripción del puesto
Descripción de la empresa Deepgram es la plataforma líder que sustenta la emergente economía de billones de dólares de Voice AI, proporcionando APIs en tiempo real para speech-to-text (STT), text-to-speech (TTS) y construcción de agentes de voz de producción a escala. Más de 200.000 desarrolladores y más de 1.300 organizaciones construyen ofertas de voz que están 'Powered by Deepgram', incluyendo Twilio, Cloudflare, Sierra, Decagon, Vapi, Daily, Cresta, Granola y Jack in the Box. Los modelos de base nativos de voz de Deepgram se acceden a través de APIs en la nube o como software autoalojado y en las instalaciones, con una precisión inigualable, baja latencia y eficiencia de costos. Respaldada por una reciente Serie C liderada por inversores globales líderes y socios estratégicos, Deepgram ha procesado más de 50.000 años de audio y transcrito más de 1 billón de palabras. No hay organización en el mundo que entienda mejor la voz que Deepgram. Ritmo operativo de la empresa En Deepgram, esperamos una mentalidad de inteligencia artificial (IA) - el uso y la comodidad de la IA no son opcionales, son fundamentales para cómo operamos, innovamos y medimos el desempeño. Se espera que todos los miembros del equipo que trabajan en Deepgram utilicen activamente y experimenten con herramientas de IA avanzadas, e incluso construyan sus propias herramientas en su trabajo diario. Medimos la efectividad con la que se aplica la IA para obtener resultados, y el uso constante y creativo de las últimas capacidades de IA es clave para el éxito aquí. Los candidatos deben estar cómodos adoptando nuevos modelos y modos rápidamente, integrando la IA en sus flujos de trabajo y empujando continuamente los límites de lo que estas tecnologías pueden hacer. Además, nos movemos al ritmo de la IA. El cambio es rápido, y puedes esperar que tu trabajo diario evolucione con la misma rapidez. Este no puede ser el rol adecuado si no estás emocionado de experimentar, adaptarte, pensar sobre la marcha y aprender constantemente, o si estás buscando algo altamente prescriptivo con un horario tradicional de 9 a 5. La oportunidad La voz es la modalidad más natural para la interacción humana con las máquinas. Sin embargo, los paradigmas actuales de modelado de secuencia basados en escalar conjuntamente el modelo y los datos no pueden entregar IA de voz capaz de interacción humana universal. Los desafíos están arraigados en problemas de datos fundamentales planteados por el audio: los datos de audio del mundo real son escasos y enormemente diversos, abarcando un vasto espacio de voces, estilos de habla y condiciones acústicas. Incluso si se tuvieran miles de millones de horas de audio accesibles, su alta dimensionalidad inherente crea costos computacionales y de almacenamiento que hacen que el entrenamiento y la implementación sean prohibitivamente costosos a escala mundial. Creemos que se necesitan paradigmas enteramente nuevos para la IA de audio para superar estos desafíos y hacer que la interacción de voz sea accesible para todos. El rol Deepgram está buscando actualmente a un investigador experimentado que haya trabajado extensivamente con Modelos de Lenguaje Grandes (LLM) y tenga un profundo entendimiento de la arquitectura de transformadores para unirse a nuestro personal de investigación. Como miembro del personal de investigación, este individuo debe tener experiencia extensa trabajando en los aspectos técnicos difíciles de los LLM, como la curación de datos, el entrenamiento a gran escala distribuido, la optimización de la arquitectura de transformadores y el entrenamiento de Aprendizaje por Refuerzo (RL). El desafío Estamos buscando investigadores que: - Vean los problemas 'no resueltos' como oportunidades para pioner nuevos enfoques - Pueden identificar el experimento crítico que validará o matará una idea en días, no meses - Tengan la visión de escalar pruebas de concepto exitosas 100 veces - Estén obsesionados con usar la IA para automatizar y amplificar su propio impacto Si te encuentras energizado en lugar de intimidado por estas expectativas - si ya estás pensando en cinco ideas para probar mientras lees esto - podrías ser el investigador que necesitamos. Este rol exige obsesión con los problemas, creatividad en el enfoque y una conducción implacable hacia soluciones elegantes y escalables. Los desafíos técnicos son inmensos, pero el impacto potencial es transformador. Qué harás - Brainstorming y colaboración con otros miembros del personal de investigación para definir nuevas iniciativas de investigación de LLM - Encuesta amplia de la literatura, evaluando, clasificando y destilando métodos actuales - Diseñando y llevando a cabo programas experimentales para LLM - Conduciendo trabajos de entrenamiento de transformadores (LLM) con éxito en infraestructura de cómputo distribuida y desplegando nuevos modelos en producción - Documentando y presentando resultados y conceptos técnicos complejos con claridad para una audiencia objetivo - Mantenerse al día con los últimos avances en aprendizaje profundo y LLM, con un ojo particular hacia sus implicaciones y aplicaciones dentro de nuestros productos Te encantará este rol si - Eres apasionado de la IA y emocionado de trabajar en investigación de LLM de última generación - Tienes interés en producir y aplicar nueva ciencia para ayudarnos a desarrollar y desplegar modelos de lenguaje grandes - Disfrutas construyendo desde cero y amas crear nuevos sistemas - Tienes habilidades de comunicación fuertes y eres capaz de traducir conceptos complejos con claridad - Eres altamente analítico y disfrutas profundizando en análisis detallados cuando es necesario Es importante para nosotros que tengas - 3+ años de experiencia en investigación de aprendizaje profundo aplicado, con un sólido entendimiento hacia las aplicaciones e implicaciones de diferentes tipos de redes neuronales, arquitecturas y mecanismos de pérdida - Experiencia comprobada trabajando con modelos de lenguaje grandes (LLM) - incluyendo experiencia con curación de datos, entrenamiento a gran escala distribuido, optimización de la arquitectura de transformadores y Aprendizaje por Refuerzo (RL) - Experiencia sólida codificando en Python y trabajando con Pytorch - Experiencia con varias arquitecturas de transformadores (auto-regresivas, secuencia a secuencia, etc.) - Experiencia con cómputo distribuido y procesamiento de datos a gran escala - Experiencia previa en conducir programas experimentales y usar resultados para optimizar modelos Sería genial si tuvieras - Entendimiento profundo de transformadores, modelos causales y su arquitectura subyacente - Entendimiento de esquemas de entrenamiento distribuido e inferencia distribuida para LLM - Familiaridad con pipelines de etiquetado y entrenamiento de RLHF - Conocimiento actualizado de técnicas y desarrollos recientes de LLM Beneficios y ventajas Salud holística - Beneficios médicos, dentales, de visión - Subsidio anual de bienestar - Apoyo a la salud mental - Planes de seguro de vida, STD, LTD Combinación de trabajo/vida - PTO ilimitado - Licencia parental generosa pagada - Horario flexible - 12 días festivos pagados en EE. UU. - Subsidio de productividad personal trimestral - Subsidio único para mejoras en la oficina en casa - Plan 401(k) con coincidencia de la empresa - Programas de ahorro de impuestos Aprendizaje continuo - Subsidio de aprendizaje/educación - Participación en charlas y conferencias - Grupos de recursos para empleados - Talleres/sesiones de habilitación de IA *Para candidatos fuera de EE. UU., utilizamos un modelo de Empleador de Registro en muchos países, lo que significa que los beneficios se administran localmente y se rigen por regulaciones específicas de cada país. Debido a esto, los beneficios variarán según la región - en algunos casos, los empleados internacionales reciben beneficios que los empleados de EE. UU. no reciben, y viceversa. A medida que escalamos, continuaremos evaluando dónde podemos crear más alineación, pero una estructura de beneficios global 1:1 no siempre es legalmente u operacionalmente posible. Respaldada por inversores prominentes incluyendo Y Combinator, Madrona, Tiger Global, Wing VC y NVIDIA, Deepgram ha recaudado más de $215M en financiamiento total. ¡Si estás buscando trabajar en tecnología de vanguardia y tener un impacto significativo en la industria de la IA, nos encantaría escuchar de ti! Deepgram es un empleador de igualdad de oportunidades. Queremos que todas las voces y perspectivas estén representadas en nuestra fuerza laboral. Somos un grupo curioso enfocado en la colaboración y hacer lo correcto. Ponemos a nuestros clientes primero, crecemos juntos y nos movemos rápidamente. No discriminamos sobre la base de raza, religión, color, origen nacional, género, orientación sexual, identidad o expresión de género, edad, estado civil, estado de veterano, estado de discapacidad, embarazo, estado parental, información genética, afiliación política o cualquier otro estado protegido por las leyes o regulaciones en los lugares donde operamos. Estamos felices de proporcionar adaptaciones para solicitantes que las necesiten.
Responsabilidades
- Investigación y desarrollo de LLMs
- Experimentación y testing de modelos
- Presentación de resultados
Skills requeridas
Beneficios
- Beneficios médicos, dentales y de visión
- Stipendio de bienestar
- Apoyo mental
- Seguros de vida, discapacidad y muerte