Currency

Machine Learning Engineer (RL)

46 - 52 USDNet per hour - B2B
AI/ML

Machine Learning Engineer (RL)

AI/ML

Szlak 77, Kraków +9 Locations

CRODU

Full-time
B2B
Senior
Remote
46 - 52 USD
Net per hour - B2B

Tech stack

    English

    B2

    Python

    advanced

    Machine Learning

    advanced

    Reinforcement Learning

    advanced

Job description

🌴 Forma pracy: fulltime, 100% zdalnie 👈

⏰ Start: ASAP 👈


Cześć! 👋

Dla naszego klienta poszukujemy ML Engineera z doświadczeniem w tworzeniu środowisk reinforcement learning (RL) oraz skalowalnych systemów ewaluacji modeli. Klient to wiodący dostawca rozwiązań do oceny i optymalizacji systemów AI. Z ich rozwiązań korzysta wiele międzynarodowych firm by doskonalic agentów AI i wykrywać problemy wydajnościowe dużych modeli językowych. Firma działa na styku AI, system engineeringu i badań nad AGI.

W zespole będziesz mieć realny wplyw na kształtowanie sposobu, w jaki przyszłe modele AI będą trenowane, dostrajane i oceniane. Będziesz odpowiadać m.in. za projektowanie i implementację zaawansowancyh środowisk RL - dlatego jest to dla nas kluczowa kompetencja. W zakres Twojej odpowiedzialności będzie wchodzić również tworzenie skalowalnych systemów kształtujących zachowanie nowoczesnych modeli AI.

Praca w małym, wysoko wyspecjalizowanym zespole inżynierów i scientists. Ze względu na strefę czasową klienta, chcielibyśmy znaleźć kandydata, który może pracować do godziny 17:00, a okazjonalnie do 18:00.


Codzienne zadania:

📍 Projektowanie i implementacja środowisk RL wspierających dużą skalę eksperymentów i ewaluacji agentów

📍 Budowa pipeline’ów do generowania zadań, dynamicznych zbiorów danych i symulowanych środowisk (o różnej złożoności i losowości)

📍 Tworzenie modeli nagród oraz weryfikatorów, które automatycznie oceniają trajektorie i rozumowanie modeli

📍 Współpraca z infrastructure and systems engineers przy skalowaniu, telemetryzacji i zapewnianiu powtarzalności środowisk

📍 Projektowanie API i frameworków do orkiestracji eksperymentów, resetowania i oceny agentów

📍 Optymalizacja wydajności środowisk, logowania oraz reprodukowalności nagród w środowiskach rozproszonych


Wymagania:

⚡️ 5 lat doświadczenia w obszarze data science, ML infrastructure lub pokrewnych

⚡️ Bardzo dobra znajomość Pythona i programowania systemowego

⚡️ Znajomość koncepcji reinforcement learningu (modelowanie nagród, dynamika środowiska, weryfikacja i ewaluacja agentów)

⚡️ Wiedza z zakresu monitoringu, metryk i pipeline’ów danych dla ewaluacji RL

⚡️ Doświadczenie z frameworkami RL lub symulacyjnymi (Gymnasium, PettingZoo, Isaac Gym, Ray RLlib, itp.)

⚡️ Doświadczenie w projektowaniu skalowalnych pipeline’ów zadań, symulacjach przeglądarkowych lub API (np. Playwright, Selenium) lub frameworków obliczeń rozproszonych

⚡️ Angielski umożliwiający swobodną komunikację w międzynarodowym zespole

Mile widziane:

⚡️ Zainteresowanie obszarem AI safety / AGI alignment


Jak działamy i co oferujemy?

🎯 Stawiamy na otwartą komunikację zarówno w procesie rekrutacji jak i po zatrudnieniu - zależy nam na klarowności informacji dotyczących procesu i zatrudnienia

🎯 Do rekrutacji podchodzimy po ludzku, dlatego upraszczamy nasze procesy rekrutacyjne, żeby były możliwie jak najprostsze i przyjazne kandydatowi

🎯 Pracujemy w imię zasady "remote first", więc praca zdalna to u nas norma, a wyjazdy służbowe ograniczamy do minimum

🎯 Oferujemy prywatną opiekę medyczną (Medicover) oraz kartę Multisport dla kontraktorów

Tech stack

    English

    B2

    Python

    advanced

    Machine Learning

    advanced

    Reinforcement Learning

    advanced

Office location

Published: 17.10.2025

Machine Learning Engineer (RL)

46 - 52 USDNet per hour - B2B
Summary of the offer

Machine Learning Engineer (RL)

Szlak 77, Kraków

CRODU

46 - 52 USDNet per hour - B2B
By applying, I consent to the processing of my personal data for the purpose of conducting the recruitment process. Informacja o przetwarzaniu danych osobowych dla kandydata. |||| Spółki z Grupy CRODU tj. CRODU Sp. z o.o., z siedzibą w Krakowie (31-... MoreThis site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
ADVERTISEMENT: Recommended by Just Join IT