Big Data Engineer – Apache Spark

Data

al. Niepodległości 69, Warszawa

Sii

Full-time

B2B, Mandate

Mid

Hybrid

Job description

Sii zapewnia, że wszystkie decyzje związane z zatrudnieniem są podejmowane wyłącznie na podstawie kwalifikacji oraz kompetencji. Zobowiązujemy się do równego i sprawiedliwego traktowania wszystkich, niezależnie od cech prawnie chronionych. W Sii promujemy także różnorodne i inkluzywne środowisko pracy w pełnej zgodności z obowiązującymi przepisami antydyskryminacyjnymi.

Poszukujemy Programisty Big Data z Apache Spark do projektu realizowanego dla klienta z sektora bankowego. Osoba na tym stanowisku będzie rozwijać i utrzymywać rozwiązania oparte na technologii Spark, przetwarzające duże wolumeny danych w środowisku Hadoop Cloudera/Hortonworks. Idealny kandydat posiada doświadczenie w pracy z PySpark, rozumie koncepcje hurtowni danych oraz ma solidne podstawy inżynierii danych i dobrych praktyk programistycznych.

Praca w modelu hybrydowym: 2 razy w miesiącu z biura klienta w Warszawie.

Twoje zadania

Projektowanie i rozwijanie rozwiązań Big Data z wykorzystaniem Apache Spark
Przetwarzanie i integracja danych z różnych źródeł w środowisku Hadoop
Modelowanie danych oraz optymalizacja procesów przetwarzania
Praca z różnymi formatami danych (JSON, PARQUET, ORC, AVRO)
Projektowanie, kodowanie, testowanie i wdrażanie rozwiązań zgodnie z dobrymi praktykami inżynierskimi
Współpraca z zespołami analityków i inżynierów danych w środowisku Agile

Wymagania

Min. 2 lata doświadczenia w programowaniu w Apache Spark (preferowany PySpark)
Bardzo dobra znajomość koncepcji Big Data, hurtowni danych i zarządzania danymi
Doświadczenie w środowisku Hadoop Cloudera/Hortonworks
Umiejętność pracy z dużymi zbiorami danych i ich integracji z wielu źródeł
Znajomość języka SQL na poziomie zaawansowanym
Wykształcenie wyższe techniczne (preferowane kierunki informatyczne lub pokrewne)
Wymagane przebywanie na terenie Polski oraz płynna znajomość języka polskiego

Mile widziane

Doświadczenie w pracy w środowisku Agile
Znajomość Kubeflow i technologii strumieniowych (Apache Kafka, Apache NiFi)
Wiedza z zakresu automatyzacji procesów CI/CD

Benefity, które czekają na Ciebie:

Tytuł Great Place to Work od 2015 roku - to dzięki opiniom pracowników otrzymujemy tytuł i wdrażamy nowe pomysły
Stabilność zatrudnienia - 2,1 MLD PLN przychodu, brak długów, od 2006 roku na rynku
Dzielimy się zyskiem z pracownikami - od 2022 roku przeznaczyliśmy na ten cel już ponad 76 milionów PLN
Bogaty pakiet benefitów - prywatna opieka zdrowotna, platforma kafeteryjna, zniżki na samochody i więcej
Komfortowe miejsce pracy - pracuj w naszych biurach klasy A lub zdalnie
Dziesiątki fascynujących projektów dla prestiżowych marek z całego świata
1 000 000 PLN rocznie na Twoje pomysły - taką kwotą wspieramy pasje i akcje wolontariackie naszych pracowników
Stawiamy na Twój rozwój - meetupy, webinary, platforma szkoleniowa i blog technologiczny – Ty wybierasz
Fantastyczna atmosfera stworzona przez wszystkich Sii Power People

Dołącz do zespołu Sii – rozwijaj umiejętności, zdobywaj doświadczenie i buduj karierę!

Tech stack

Apache Hadoop

regular

SQL

regular

Python

regular

Apache Spark

regular

Apache Kafka

nice to have

Apache Nifi

nice to have

kubeflow

nice to have

Office location

Published: 31.12.2025

About the company

Sii

Sii Polska to czołowy dostawca doradztwa technologicznego, transformacji cyfrowej oraz usług biznesowych i inżynieryjnych. Firma obecna jest na rynku od 2006 roku, zatrudnia ponad 7 300 ekspertów, jedenastokrotnie zdobył...

Company profile

Check similar offers