Senior RL-Spezialist (Reinforcement Learning)
Wir suchen einen erfahrenen Senior RL-Spezialisten für ein spannendes Projekt im Bereich Reinforcement Learning. Die Position bietet eine flexible Arbeitsgestaltung mit 75% Remote-Anteil und 25% Präsenz vor Ort. Das Projekt startet im Juli 2026 und läuft zunächst bis Ende 2026 mit Verlängerungsoption.
Ihre Hauptaufgaben umfassen die methodische und technische Ausgestaltung von RL-Lösungen sowie die Konzeption und Implementierung von Exploration- und Bandit-Verhalten. Sie entwickeln Exploration Groups und implementieren RL-Simulationsmodelle. Ein weiterer Schwerpunkt liegt auf der Durchführung und Betreuung von Off-Policy-Evaluations sowie der Definition und Auswahl geeigneter Bandit-Methodiken wie Thompson Sampling, Epsilon-Greedy oder Upper Confidence Bound (UCB). Die fachliche Absicherung des Bandit-Livegangs rundet Ihr Aufgabenspektrum ab.
Wir erwarten sehr gute praktische Erfahrung im Bereich Reinforcement Learning und ein tiefes Verständnis von Exploration vs. Exploitation, Multi-Armed-Bandit-Verfahren und Contextual Bandits. Erfahrung mit Bandit-Methodiken, insbesondere Thompson Sampling, sowie mit Off-Policy-Evaluation sind essentiell. Sie sollten Erfahrung in der Entwicklung und Validierung von Simulationsmodellen mitbringen und sehr gute Kenntnisse in Python, Machine Learning und SQL besitzen. Erfahrung mit agilen Methoden wie Scrum, Kanban oder SAFe rundet Ihr Profil ab.
Die Position ist als Teilzeitprojekt (50%) ausgelegt und erfordert sehr gute Deutschkenntnisse. Dies ist eine hervorragende Gelegenheit, an innovativen RL-Projekten zu arbeiten und Ihre Expertise in einem dynamischen Umfeld einzusetzen.
Als IT-Freelancer automatisch auf Projekte wie dieses bewerben
Nexus ist die KI-gestützte Plattform für IT-Freelancer, die täglich neue Projektausschreibungen analysiert und passgenaue Bewerbungstexte generiert – vollautomatisch, in Sekunden. Kein manuelles Schreiben mehr: Nexus liest die Ausschreibung, erkennt die gefragten Skills und erstellt einen individuellen Bewerbungstext, den du per Klick versendest.
- ✓ Projektausschreibungen direkt von Anbietern aus dem DACH-Raum
- ✓ KI-Bewerbungstext in unter 30 Sekunden – individuell auf jedes Projekt zugeschnitten
- ✓ Automatischer Versand per E-Mail + Anlage in Pipedrive
- ✓ Kostenlos starten – keine Kreditkarte erforderlich
Häufige Fragen zu Nexus
- Was ist Nexus und für wen ist es geeignet?
- Nexus richtet sich an selbstständige IT-Freelancer, die regelmäßig auf Projektausschreibungen antworten. Die Plattform automatisiert den gesamten Bewerbungsprozess – von der Analyse der Ausschreibung bis zum Versand der Bewerbung.
- Wie schreibt Nexus den Bewerbungstext?
- Nexus analysiert die Projektbeschreibung mit Claude (Anthropic) und gleicht die Anforderungen mit deinem hinterlegten Profil ab. Der generierte Text ist individuell, professionell und direkt versendbar – du kannst ihn vor dem Absenden noch anpassen.
- Welche Projektplattformen werden unterstützt?
- Nexus erhält Projekte direkt von Projektanbietern aus dem DACH-Raum – neue Ausschreibungen erscheinen automatisch in deiner Pipeline, ohne dass du Plattformen manuell durchsuchen musst.
- Kostet Nexus etwas?
- Der Einstieg ist dauerhaft kostenlos. Für professionelle Nutzung mit erweiterten Funktionen gibt es kostenpflichtige Pläne – ohne versteckte Kosten oder automatische Verlängerung.
Nie wieder Bewerbungen schreiben.
Nexus matcht deine Skills und schreibt Bewerbungen automatisch.
Kostenlos registrieren →Keine Kreditkarte erforderlich
Ähnliche Projekte
- Product Manager (RL‑Scope) (m/w/d)Product ManagementReinforcement LearningMachine LearningAI/Data-Produktlebenszyklen
- AI Developer/ArchitectPythonAzureAI agentsLLMs
- Applied AI Software Engineer - LangChain, LangGraph, RAG, Knowledge GraphsPythonLangChainLangGraphRAG
- AI-Entwickler mit UX-Mindset für KI AssistentenReactTypeScriptVibeCodingAI/ML
- Senior RAG Engineer-Python/ AIPythonFastAPIFlaskDjango
- Senior Data Analyst / ChatBot AI SpecialistGoogle CloudGeminiDialogflow CX/ESNLU
- Senior Softwareentwickler AI-gestützte Softwareentwicklung (m/w/d)PythonNode.jsGolangJavaScript
- Deep Learning Innovation OfficerPythonRSQLMachine Learning
- KI‑Berater (m/w/d) – ProduktionsumfeldKI-BeratungProduktionsumfeld
- AI & Machine Learning Program & Transformation Lead (m/f/d)AIMachine LearningGenerative AIAutomation
- AI consultant/EngineerAIMicrosoft AI stackMS-FoundryDutch language
- Lead Developer/ Architekt (m/w/d) Amazon Connect / Conversational AI - RemoteAmazon ConnectConversational AIAWS ConnectAWS Bedrock
- Data ScientistPythonSQLMachine LearningDatenanalyse
- Data Scientist (m/w/d)Data SciencePythonMachine LearningStatistik
- Senior/Expert AI Infrastructure & Search Systems ArchitectElasticsearchOpenSearchSolrCloudWeaviate