Senior GPU Systems / AI Infrastructure Engineer

CUDA programming GPU kernel optimization parallel computing distributed systems C++Rust Python PyTorch JAX NCCL MPI Ray performance profiling Nsight Triton HIP

Festanstellung📍 New York City💶 Competitive + equity 🏢 75% vor Ort 🌐 Englisch

We are seeking a senior-level engineer to build and optimize next-generation AI infrastructure powering large-scale model training and inference. This role sits at the intersection of GPU systems, kernel optimization, distributed compute, and high-performance AI workloads. You will work directly on the performance layer of modern AI stacks where milliseconds matter, GPUs are saturated, and inefficiencies translate directly into cost and latency at scale. This is a deeply technical role for engineers who are comfortable working close to the metal and care about squeezing every ounce of performance out of modern accelerators including NVIDIA, AMD, and emerging architectures. Key responsibilities include designing and optimizing GPU kernels using CUDA, Triton, and HIP for large-scale AI workloads, building and tuning high-performance inference and training pipelines for LLMs and multimodal models, and working on distributed systems for AI training across multi-node, multi-GPU clusters. You will improve memory bandwidth utilization, kernel fusion, and compute efficiency while contributing to or extending frameworks like PyTorch, JAX, or custom runtimes. The role involves building tooling for profiling, benchmarking, and performance regression detection, and collaborating closely with ML researchers and infrastructure engineers to remove system bottlenecks. We are looking for candidates with 5-10+ years in systems engineering, HPC, GPU computing, or AI infrastructure, deep experience with CUDA programming and GPU kernel optimization, and strong understanding of parallel computing, memory hierarchies, and compute bottlenecks. Experience with distributed systems, high-performance programming languages, and working on training or inference stacks for large-scale ML models is essential. This position offers the opportunity to work on critical performance layers of AI systems with direct impact on cost, latency, and scalability of frontier AI models.

Jetzt bewerben →

Als IT-Freelancer automatisch auf Projekte wie dieses bewerben

Nexus ist die KI-gestützte Plattform für IT-Freelancer, die täglich neue Projektausschreibungen analysiert und passgenaue Bewerbungstexte generiert – vollautomatisch, in Sekunden. Kein manuelles Schreiben mehr: Nexus liest die Ausschreibung, erkennt die gefragten Skills und erstellt einen individuellen Bewerbungstext, den du per Klick versendest.

✓ Projektausschreibungen direkt von Anbietern aus dem DACH-Raum
✓ KI-Bewerbungstext in unter 30 Sekunden – individuell auf jedes Projekt zugeschnitten
✓ Automatischer Versand per E-Mail + Anlage in Pipedrive
✓ Kostenlos starten – keine Kreditkarte erforderlich

Jetzt kostenlos testen →Alle IT-Projekte ansehen

Häufige Fragen zu Nexus

Was ist Nexus und für wen ist es geeignet?: Nexus richtet sich an selbstständige IT-Freelancer, die regelmäßig auf Projektausschreibungen antworten. Die Plattform automatisiert den gesamten Bewerbungsprozess – von der Analyse der Ausschreibung bis zum Versand der Bewerbung.
Wie schreibt Nexus den Bewerbungstext?: Nexus analysiert die Projektbeschreibung mit Claude (Anthropic) und gleicht die Anforderungen mit deinem hinterlegten Profil ab. Der generierte Text ist individuell, professionell und direkt versendbar – du kannst ihn vor dem Absenden noch anpassen.
Welche Projektplattformen werden unterstützt?: Nexus erhält Projekte direkt von Projektanbietern aus dem DACH-Raum – neue Ausschreibungen erscheinen automatisch in deiner Pipeline, ohne dass du Plattformen manuell durchsuchen musst.
Kostet Nexus etwas?: Der Einstieg ist dauerhaft kostenlos. Für professionelle Nutzung mit erweiterten Funktionen gibt es kostenpflichtige Pläne – ohne versteckte Kosten oder automatische Verlängerung.

Nie wieder Bewerbungen schreiben.

Nexus matcht deine Skills und schreibt Bewerbungen automatisch.

Kostenlos registrieren →

Keine Kreditkarte erforderlich

Tipp

Zeiterfassung & Projektverwaltung

Projekte, Stunden und Rechnungen in einer App. Flow ist die schlanke Lösung für IT-Freelancer und Agenturen – kostenlos starten.

Flow ausprobieren

Senior GPU Systems / AI Infrastructure Engineer

Als IT-Freelancer automatisch auf Projekte wie dieses bewerben

Häufige Fragen zu Nexus

Ähnliche Projekte