Data Scientist
Opis projektu
Nasz Klient to państwowa jednostka o znaczeniu strategicznym, odpowiedzialna za utrzymanie i rozwój kluczowej infrastruktury w sektorze lotnictwa cywilnego. Instytucja ta pełni nadrzędną rolę w zapewnianiu ciągłości i bezpieczeństwa operacji transportowych na skalę krajową, działając w oparciu o rygorystyczne normy publiczne oraz międzynarodowe standardy regulacyjne.
Zadania:
Zbieranie i przygotowanie danych: pozyskiwanie ze źródeł wewnętrznych/zewnętrznych, czyszczenie, transformacje, agregacje.
Eksploracyjna analiza danych (EDA), profilowanie danych, identyfikacja wzorców, trendów, korelacji i anomalii.
Inżynieria cech i selekcja zmiennych, przygotowanie zestawów treningowych/walidacyjnych/testowych.
Projektowanie, trening, strojenie hiperparametrów i walidacja modeli ML dla klasyfikacji, regresji, szeregów czasowych, NLP itp.
Ocena modeli z użyciem odpowiednich metryk (np. dokładność, precyzja, czułość, F1, ROC‐AUC, RMSE, MAE).
Dokumentowanie eksperymentów, śledzenie wersji danych i modeli, replikowalność wyników.
Współpraca z Product Ownerem przy definiowaniu hipotez, KPI i kryteriów sukcesu.
Planowanie pracy w Scrum, przeglądy wyników i rekomendacji, udział w refinementach.
Przygotowanie modeli do wdrożenia we współpracy z Data/ML Engineerami oraz wsparcie w integracji.
Monitorowanie modeli w środowisku produkcyjnym (drift, stabilność, degradacja), planowanie retraningu.
Analiza i wizualizacja wyników, storytelling danych, przygotowanie materiałów decyzyjnych dla interesariuszy.
Projektowanie i analiza eksperymentów A/B, walidacja zmian modeli lub polityk decyzyjnych.
Badanie i porównywanie nowych algorytmów, narzędzi i bibliotek pod kątem użyteczności w produktach.
Przygotowanie i utrzymanie dokumentacji technicznej, kart modelu i zaleceń dotyczących użycia.
Optymalizacja pracy zespołu przez automatyzację analiz, szablony raportów i bibliotekę narzędziową.
Wymagania:
Wykształcenie wyższe: sztuczna inteligencja, data science, informatyka, matematyka, statystyka, fizyka lub pokrewne.
Doświadczenie w budowie i walidacji modeli ML, prowadzeniu eksperymentów i analiz EDA.
Biegłość w ekosystemie Python do analizy i ML (np. NumPy, pandas, scikit‐learn, biblioteki głębokiego uczenia).
Umiejętność pracy z danymi z baz SQL/NoSQL, przygotowania danych i optymalizacji zapytań.
Znajomość metodyk eksperymentowania, doboru metryk oraz podstaw MLOps (rejestr eksperymentów, monitoring).
Umiejętność interpretacji modeli (np. techniki wyjaśnialności) i przygotowania wniosków dla biznesu.
Doświadczenie w pracy zespołowej, wersjonowaniu kodu, code review i dokumentowaniu.
Biegłe posługiwanie się językiem polskim.
Co oferujemy?
Pracę zdalną z możliwością przyjazdów co jakiś czas do biura w Warszawie.
Pracę na naszym sprzęcie.
Płaską strukturę zarządzania.
Samoorganizujące się zespoły.
Dużo przestrzeni na własną inicjatywę.
Możliwość delegacji na terenie Unii Europejskiej lub Wielkiej Brytanii.
Data Scientist
Data Scientist