Senior NPU Kernel / Operator Engineer
Wir suchen einen Senior NPU Kernel / Operator Engineer zur Leitung der Entwicklung und Optimierung hochperformanter Deep Learning Operatoren für eine Next-Generation AI-Accelerator-Plattform. Diese Position konzentriert sich auf Kernel-Design, hardware-bewusste Performance-Optimierung und Korrektheitsprüfung über ein breites Spektrum von Neural Network Workloads.
Zu den Hauptaufgaben gehören die Entwicklung und Optimierung von High-Performance-Operatoren wie Normalization, Reduction, Transpose, Reshape, Gather/Scatter, Quantization/Dequantization und Fused Elementwise Kernels. Sie verantworten die Performance-Optimierung unter Berücksichtigung kritischer Hardware-Constraints wie Memory Bandwidth, SRAM-Nutzung, Data Reuse, DMA-Latenz und Compute Utilization.
Die Rolle umfasst die Entwicklung fortgeschrittener Optimierungsstrategien einschließlich Tiling, Blocking, Vectorization und Memory Scheduling. Sie analysieren und lösen Bottlenecks in Bezug auf Memory Hierarchy, Synchronization Overhead und Data Movement. Die Validierung der Operator-Korrektheit gegen Referenzimplementierungen sowie Benchmarking und Profiling in verschiedenen Umgebungen gehören ebenfalls zu Ihren Aufgaben.
Wir erwarten einen Abschluss in Computer Science, Electrical Engineering oder verwandten Bereichen sowie mindestens 5 Jahre Erfahrung in Accelerator Programming, GPU/NPU Development, Compiler Backend Engineering oder High-Performance Computing. Starke Programmierkenntnisse in C/C++ und Python sowie tiefes Verständnis von Tensor Computation und Neural Network Operatoren sind erforderlich.
Erfahrung mit CUDA, Triton, OpenCL, TVM, MLIR, Halide oder SIMD/DSP-Systemen ist von Vorteil. Die Position bietet die Möglichkeit, an der Spitze der AI-Hardware-Entwicklung zu arbeiten und die Zukunft des maschinellen Lernens mitzugestalten.
Als IT-Freelancer automatisch auf Projekte wie dieses bewerben
Nexus ist die KI-gestützte Plattform für IT-Freelancer, die täglich neue Projektausschreibungen analysiert und passgenaue Bewerbungstexte generiert – vollautomatisch, in Sekunden. Kein manuelles Schreiben mehr: Nexus liest die Ausschreibung, erkennt die gefragten Skills und erstellt einen individuellen Bewerbungstext, den du per Klick versendest.
- ✓ Projektausschreibungen direkt von Anbietern aus dem DACH-Raum
- ✓ KI-Bewerbungstext in unter 30 Sekunden – individuell auf jedes Projekt zugeschnitten
- ✓ Automatischer Versand per E-Mail + Anlage in Pipedrive
- ✓ Kostenlos starten – keine Kreditkarte erforderlich
Häufige Fragen zu Nexus
- Was ist Nexus und für wen ist es geeignet?
- Nexus richtet sich an selbstständige IT-Freelancer, die regelmäßig auf Projektausschreibungen antworten. Die Plattform automatisiert den gesamten Bewerbungsprozess – von der Analyse der Ausschreibung bis zum Versand der Bewerbung.
- Wie schreibt Nexus den Bewerbungstext?
- Nexus analysiert die Projektbeschreibung mit Claude (Anthropic) und gleicht die Anforderungen mit deinem hinterlegten Profil ab. Der generierte Text ist individuell, professionell und direkt versendbar – du kannst ihn vor dem Absenden noch anpassen.
- Welche Projektplattformen werden unterstützt?
- Nexus erhält Projekte direkt von Projektanbietern aus dem DACH-Raum – neue Ausschreibungen erscheinen automatisch in deiner Pipeline, ohne dass du Plattformen manuell durchsuchen musst.
- Kostet Nexus etwas?
- Der Einstieg ist dauerhaft kostenlos. Für professionelle Nutzung mit erweiterten Funktionen gibt es kostenpflichtige Pläne – ohne versteckte Kosten oder automatische Verlängerung.
Nie wieder Bewerbungen schreiben.
Nexus matcht deine Skills und schreibt Bewerbungen automatisch.
Kostenlos registrieren →Keine Kreditkarte erforderlich
Ähnliche Projekte
- Computer Vision Engineer for Robotics Perception StackComputer visionSensor fusionLiDARCameras
- Infrastructure Engineer for Distributed Model TrainingPyTorch DistributedRayCUDAHPC networking
- AI Hardware Security EngineerSecure firmwareHardware root of trustTrusted execution environmentsLow-level systems programming
- AI Inference Platform Engineer - Confidential ComputingKubernetesGPU clustersConfidential computingRust
- Confidential AI Systems Engineer with TEE expertiseTEEsSGXSEVTrustZone
- AI Engineer - LLM and RAG SystemsPythonLLMsRAGembeddings
- AI and Telco ArchitectOSSAssuranceFulfillmentInventory
- Senior GPU Systems / AI Infrastructure Engineer (NYC)CUDA programmingGPU kernel optimizationparallel computingdistributed systems
- AI Compute Cluster EngineerHPC networkingKubernetesGPU schedulingAI compute clusters
- AI Telco ArchitectOSSAssuranceFulfillmentInventory
- AI Fullstack EngineerReactTypeScriptJavaPython
- AI Spezialist (m/w/d) – AI SpecialistPythonRKI-ToolsMachine Learning
- Manager KI und Prozessautomatisierung (m/w/d)KIProzessautomatisierungMicrosoft CopilotPower Automate
- AI Data Engineer im Bereich Wissensmanagement BotsPostgreSQLPythonETL/ELT-PipelinesBig Data
- Machine Learning Engineer (m/w/d)Machine LearningTensorFlowPyTorchPython