Zum Hauptinhalt springen
AI & Machine Learninggerade eben

Senior RL-Spezialist (Reinforcement Learning)

Reinforcement LearningMulti-Armed-Bandit-VerfahrenContextual BanditsThompson SamplingOff-Policy-EvaluationPythonMachine LearningSQLScrumKanbanSAFe
Contracting⏱ 01.07.2026 bis 31.12.2026 + Option📍 München 🏢 25% vor Ort 🌐 Deutsch

Wir suchen einen erfahrenen Senior RL-Spezialisten für ein spannendes Projekt im Bereich Reinforcement Learning. Die Position bietet eine flexible Arbeitsgestaltung mit 75% Remote-Anteil und 25% Präsenz vor Ort. Das Projekt startet im Juli 2026 und läuft zunächst bis Ende 2026 mit Verlängerungsoption.

Ihre Hauptaufgaben umfassen die methodische und technische Ausgestaltung von RL-Lösungen sowie die Konzeption und Implementierung von Exploration- und Bandit-Verhalten. Sie entwickeln Exploration Groups und implementieren RL-Simulationsmodelle. Ein weiterer Schwerpunkt liegt auf der Durchführung und Betreuung von Off-Policy-Evaluations sowie der Definition und Auswahl geeigneter Bandit-Methodiken wie Thompson Sampling, Epsilon-Greedy oder Upper Confidence Bound (UCB). Die fachliche Absicherung des Bandit-Livegangs rundet Ihr Aufgabenspektrum ab.

Wir erwarten sehr gute praktische Erfahrung im Bereich Reinforcement Learning und ein tiefes Verständnis von Exploration vs. Exploitation, Multi-Armed-Bandit-Verfahren und Contextual Bandits. Erfahrung mit Bandit-Methodiken, insbesondere Thompson Sampling, sowie mit Off-Policy-Evaluation sind essentiell. Sie sollten Erfahrung in der Entwicklung und Validierung von Simulationsmodellen mitbringen und sehr gute Kenntnisse in Python, Machine Learning und SQL besitzen. Erfahrung mit agilen Methoden wie Scrum, Kanban oder SAFe rundet Ihr Profil ab.

Die Position ist als Teilzeitprojekt (50%) ausgelegt und erfordert sehr gute Deutschkenntnisse. Dies ist eine hervorragende Gelegenheit, an innovativen RL-Projekten zu arbeiten und Ihre Expertise in einem dynamischen Umfeld einzusetzen.

Als IT-Freelancer automatisch auf Projekte wie dieses bewerben

Nexus ist die KI-gestützte Plattform für IT-Freelancer, die täglich neue Projektausschreibungen analysiert und passgenaue Bewerbungstexte generiert – vollautomatisch, in Sekunden. Kein manuelles Schreiben mehr: Nexus liest die Ausschreibung, erkennt die gefragten Skills und erstellt einen individuellen Bewerbungstext, den du per Klick versendest.

  • ✓ Projektausschreibungen direkt von Anbietern aus dem DACH-Raum
  • ✓ KI-Bewerbungstext in unter 30 Sekunden – individuell auf jedes Projekt zugeschnitten
  • ✓ Automatischer Versand per E-Mail + Anlage in Pipedrive
  • ✓ Kostenlos starten – keine Kreditkarte erforderlich

Häufige Fragen zu Nexus

Was ist Nexus und für wen ist es geeignet?
Nexus richtet sich an selbstständige IT-Freelancer, die regelmäßig auf Projektausschreibungen antworten. Die Plattform automatisiert den gesamten Bewerbungsprozess – von der Analyse der Ausschreibung bis zum Versand der Bewerbung.
Wie schreibt Nexus den Bewerbungstext?
Nexus analysiert die Projektbeschreibung mit Claude (Anthropic) und gleicht die Anforderungen mit deinem hinterlegten Profil ab. Der generierte Text ist individuell, professionell und direkt versendbar – du kannst ihn vor dem Absenden noch anpassen.
Welche Projektplattformen werden unterstützt?
Nexus erhält Projekte direkt von Projektanbietern aus dem DACH-Raum – neue Ausschreibungen erscheinen automatisch in deiner Pipeline, ohne dass du Plattformen manuell durchsuchen musst.
Kostet Nexus etwas?
Der Einstieg ist dauerhaft kostenlos. Für professionelle Nutzung mit erweiterten Funktionen gibt es kostenpflichtige Pläne – ohne versteckte Kosten oder automatische Verlängerung.

Nie wieder Bewerbungen schreiben.

Nexus matcht deine Skills und schreibt Bewerbungen automatisch.

Kostenlos registrieren →

Keine Kreditkarte erforderlich

Ähnliche Projekte