Aktuelle Preference Optimization (DPO, GRPO) Projekte
1 aktuelle Ausschreibungen
LLM Modeling & Post-Training Engineer
vor 2 TagenLLM Fine-TuningSupervised Fine-Tuning (SFT)Reinforcement Learning from Human Feedback (RLHF)Preference Optimization (DPO, GRPO)Reward ModelingLoRA +6AI & Machine Learning
Nie wieder Preference Optimization (DPO, GRPO)-Bewerbungen schreiben.
Nexus matcht deine Skills und schreibt Bewerbungen automatisch.
Kostenlos registrieren →Keine Kreditkarte erforderlich