Senior AI Engineer

AI/ML

Senior AI Engineer

AI/ML
-, Gdańsk +4 Locations

DEV12 Group

Full-time
B2B
Senior
Remote
3 887 - 4 998 USDNet per month - B2B

Job description

O DEV12 Group
Jesteśmy DEV12 Group – dynamiczną i innowacyjną firmą technologiczną, która łączy kompetencje Software House’u z doświadczeniem twórców własnych produktów. Specjalizujemy się w rozwiązaniach DeepTech i AI w obszarze nowoczesnego marketingu, które wykorzystujemy zarówno w projektach dla naszych klientów, jak i rozwijając nasze autorskie platformy, takie jak AdsMast czy Mastiqo

Twój pierwszy projekt z nami

Budujemy platformę AI na GCP dla dużego klienta enterprise. Pracujemy na realnych danych operacyjnych i marketingowych – przetwarzamy różne horyzonty czasowe, różne granularności i wiele segmentów równolegle.

Infrastruktura jest już częściowo postawiona, ale modele i cała warstwa ML to Twój teren. Nie szukamy kogoś, kto buduje prototypy w Jupyterze i oddaje je dalej. Szukamy inżyniera, który wie, co się dzieje z modelem o 3 w nocy, gdy dane wejściowe nagle zmienią rozkład.


Twój Tech Stack

  • Szeregi czasowe: Rozumiesz dekompozycję sygnału (trend, sezonowość, szum) i różnicę między modelem addytywnym a multiplikatywnym. Znasz Prophet/NeuralProphet, ale wiesz, kiedy sięgnąć po SARIMA(X), ETS, Theta czy gradient boosting z lagged features. Wiesz, kiedy wdrożyć modele głębokie (N-BEATS, TFT), a kiedy to zwykły overkill. Stosujesz poprawną walidację (walk-forward, expanding window) – wiesz, że random split na szeregach czasowych to dyskwalifikacja.

  • Feature Engineering: Projektujesz feature store od zera. Robisz rolling statistics, lagged features, kodujesz sezonowość (Fourier terms). Dodajesz zewnętrzne regresory (święta, pogoda, promocje) bez data leakage. Umiesz agregować dane (kraj → region → punkt) i znasz podejścia hierarchiczne (top-down, bottom-up, middle-out, MinT / OLS).

  • SQL i BigQuery: Piszesz zaawansowane zapytania (Window Functions, CTE, lateral joins, unnesting) z zamkniętymi oczami. Rozumiesz partycjonowanie i klastrowanie. Potrafisz zoptymalizować zapytanie skanujące terabajty (partition pruning, predicate pushdown). Używasz wyłącznie Standard SQL.

  • Python na produkcji: Piszesz modularny kod z jasną odpowiedzialnością, a nie luźne skrypty. Konsekwentnie używasz Type Hints (mypy). Testujesz kod ML (mockowanie danych, walidacja schematów przez Pydantic). Potrafisz sprofilować kod i znaleźć bottleneck w pipeline.

  • MLOps i Deployment: Wersjonujesz modele (MLflow, Vertex AI Experiments, W&B) bo rozumiesz, po co to jest. Wystawiasz modele jako endpointy (Vertex AI / Cloud Run) z health checkiem i graceful shutdown. Zarządzasz cyklem życia (staging, canary, rollback, A/B testing, shadow mode).

  • Monitoring i Data Quality: Śledzisz data drift (PSI, KS-test, Jensen-Shannon) i concept drift. Ustawiasz alerty, zanim błąd dotrze do klienta. Używasz narzędzi typu Great Expectations do walidacji danych wejściowych przed inferencją.

  • Orchestracja (Airflow / Cloud Composer): Budujesz pipeline'y, które są idempotentne, monitorowalne i odporne na awarie. Świadomie oddzielasz workflow treningowy od inferencyjnego. Wiesz, co to backfill i jak bezpiecznie przepuścić go przez dane historyczne.

  • Statystyka i Ewaluacja: Świadomie dobierasz metryki (wiesz, kiedy MAE bije RMSE i dlaczego MAPE leży przy wartościach bliskich zeru). Liczysz interwały predykcji. Tłumaczysz SHAP / feature importance biznesowi bez używania żargonu.

Środowisko pracy (GCP)

  • Na co dzień operujesz na: BigQuery, Vertex AI (Training, Endpoints, Pipelines, Feature Store), Cloud Storage, Cloud Run, Cloud Composer, Pub/Sub.

  • Czytasz i modyfikujesz Terraform (rozumiesz state, potrafisz dopisać zasób bez wysadzenia reszty).

  • Zasada least privilege (IAM) to dla Ciebie standard.

Twarde wymagania

  • 5+ lat komercyjnego doświadczenia w ML, z czego minimum 2 lata na danych czasowych.

  • Minimum jeden model na produkcji, który aktywnie obsługujesz (nie sztuką jest wdrożyć i zapomnieć).

  • Python i SQL na poziomie seniorskim – nie potrzebujesz code review od juniora, żeby wyłapać podstawowe błędy.

  • GCP jako Twoje główne środowisko pracy (nie tylko samo BigQuery).

Mile widziane

  • Dane marketingowe: Media Mix Modelling (Robyn, Meridian), atrybucja wielodotykowa.

  • Hierarchiczne prognozowanie na potężną skalę (setki/tysiące szeregów z GlobalModels, XGBoost/LightGBM).

  • Doświadczenie z mocno sezonowymi branżami (retail, hospitality, FMCG).

  • Doświadczenie z dbt oraz Vertex AI Pipelines (Kubeflow).

Co Oferujemy

  • Wynagrodzenie: 14-18k netto

  • Realny Wpływ: Pełna techniczna odpowiedzialność za kluczową warstwę projektu.

  • Sprzęt: Służbowy sprzęt komputerowy.

  • Elastyczne formy współpracy: umowa o pracę, B2B.

  • Tryb pracy: hybrydowy / zdalnym.

  • Rozwój: umożliwienie rozwoju kompetencji technicznych oraz zdobycia praktycznego doświadczenia

Tech stack

    Machine Learning

    advanced

    Google Cloud Platform

    regular

    AI

    regular

    ML

    regular

    SQL

    regular

    Python

    regular

Office location