Senior GPU Systems / AI Infrastructure Engineer
We are seeking a senior-level engineer to build and optimize next-generation AI infrastructure powering large-scale model training and inference. This role sits at the intersection of GPU systems, kernel optimization, distributed compute, and high-performance AI workloads. You will work directly on the performance layer of modern AI stacks where milliseconds matter, GPUs are saturated, and inefficiencies translate directly into cost and latency at scale. This is a deeply technical role for engineers who are comfortable working close to the metal and care about squeezing every ounce of performance out of modern accelerators including NVIDIA, AMD, and emerging architectures. Key responsibilities include designing and optimizing GPU kernels using CUDA, Triton, and HIP for large-scale AI workloads, building and tuning high-performance inference and training pipelines for LLMs and multimodal models, and working on distributed systems for AI training across multi-node, multi-GPU clusters. You will improve memory bandwidth utilization, kernel fusion, and compute efficiency while contributing to or extending frameworks like PyTorch, JAX, or custom runtimes. The role involves building tooling for profiling, benchmarking, and performance regression detection, and collaborating closely with ML researchers and infrastructure engineers to remove system bottlenecks. We are looking for candidates with 5-10+ years in systems engineering, HPC, GPU computing, or AI infrastructure, deep experience with CUDA programming and GPU kernel optimization, and strong understanding of parallel computing, memory hierarchies, and compute bottlenecks. Experience with distributed systems, high-performance programming languages, and working on training or inference stacks for large-scale ML models is essential. This position offers the opportunity to work on critical performance layers of AI systems with direct impact on cost, latency, and scalability of frontier AI models.
Als IT-Freelancer automatisch auf Projekte wie dieses bewerben
Nexus ist die KI-gestützte Plattform für IT-Freelancer, die täglich neue Projektausschreibungen analysiert und passgenaue Bewerbungstexte generiert – vollautomatisch, in Sekunden. Kein manuelles Schreiben mehr: Nexus liest die Ausschreibung, erkennt die gefragten Skills und erstellt einen individuellen Bewerbungstext, den du per Klick versendest.
- ✓ Projektausschreibungen direkt von Anbietern aus dem DACH-Raum
- ✓ KI-Bewerbungstext in unter 30 Sekunden – individuell auf jedes Projekt zugeschnitten
- ✓ Automatischer Versand per E-Mail + Anlage in Pipedrive
- ✓ Kostenlos starten – keine Kreditkarte erforderlich
Häufige Fragen zu Nexus
- Was ist Nexus und für wen ist es geeignet?
- Nexus richtet sich an selbstständige IT-Freelancer, die regelmäßig auf Projektausschreibungen antworten. Die Plattform automatisiert den gesamten Bewerbungsprozess – von der Analyse der Ausschreibung bis zum Versand der Bewerbung.
- Wie schreibt Nexus den Bewerbungstext?
- Nexus analysiert die Projektbeschreibung mit Claude (Anthropic) und gleicht die Anforderungen mit deinem hinterlegten Profil ab. Der generierte Text ist individuell, professionell und direkt versendbar – du kannst ihn vor dem Absenden noch anpassen.
- Welche Projektplattformen werden unterstützt?
- Nexus erhält Projekte direkt von Projektanbietern aus dem DACH-Raum – neue Ausschreibungen erscheinen automatisch in deiner Pipeline, ohne dass du Plattformen manuell durchsuchen musst.
- Kostet Nexus etwas?
- Der Einstieg ist dauerhaft kostenlos. Für professionelle Nutzung mit erweiterten Funktionen gibt es kostenpflichtige Pläne – ohne versteckte Kosten oder automatische Verlängerung.
Nie wieder Bewerbungen schreiben.
Nexus matcht deine Skills und schreibt Bewerbungen automatisch.
Kostenlos registrieren →Keine Kreditkarte erforderlich
Ähnliche Projekte
- Computer Vision Engineer for Robotics Perception StackComputer visionSensor fusionLiDARCameras
- Infrastructure Engineer for Distributed Model TrainingPyTorch DistributedRayCUDAHPC networking
- AI Hardware Security EngineerSecure firmwareHardware root of trustTrusted execution environmentsLow-level systems programming
- AI Inference Platform Engineer - Confidential ComputingKubernetesGPU clustersConfidential computingRust
- Confidential AI Systems Engineer with TEE expertiseTEEsSGXSEVTrustZone
- AI Engineer - LLM and RAG SystemsPythonLLMsRAGembeddings
- Senior NPU Kernel / Operator EngineerC/C++PythonTensor computationNeural network operators
- AI and Telco ArchitectOSSAssuranceFulfillmentInventory
- AI Compute Cluster EngineerHPC networkingKubernetesGPU schedulingAI compute clusters
- AI Telco ArchitectOSSAssuranceFulfillmentInventory
- AI Fullstack EngineerReactTypeScriptJavaPython
- AI Spezialist (m/w/d) – AI SpecialistPythonRKI-ToolsMachine Learning
- Manager KI und Prozessautomatisierung (m/w/d)KIProzessautomatisierungMicrosoft CopilotPower Automate
- AI Data Engineer im Bereich Wissensmanagement BotsPostgreSQLPythonETL/ELT-PipelinesBig Data
- Machine Learning Engineer (m/w/d)Machine LearningTensorFlowPyTorchPython