Currency

Programista Big Data z Apache Spark

Data

Programista Big Data z Apache Spark

Data

al. Niepodległości 69, Warszawa

Sii

Full-time
B2B, Mandate
Mid
Hybrid

Tech stack

    Apache Spark

    regular

    Apache Hadoop

    regular

    Python

    regular

    SQL

    regular

    kubeflow

    nice to have

    Apache Kafka

    nice to have

    Apache Nifi

    nice to have

Job description

Poszukujemy Programisty Big Data z Apache Spark do projektu realizowanego dla klienta z sektora bankowego. Osoba na tym stanowisku będzie rozwijać i utrzymywać rozwiązania oparte na technologii Spark, przetwarzające duże wolumeny danych w środowisku Hadoop Cloudera/Hortonworks. Idealny kandydat posiada doświadczenie w pracy z PySpark, rozumie koncepcje hurtowni danych oraz ma solidne podstawy inżynierii danych i dobrych praktyk programistycznych.

Praca w modelu hybrydowym: 2 razy w miesiącu z biura klienta w Warszawie.


Twoje zadania

  • Projektowanie i rozwijanie rozwiązań Big Data z wykorzystaniem Apache Spark

  • Przetwarzanie i integracja danych z różnych źródeł w środowisku Hadoop

  • Modelowanie danych oraz optymalizacja procesów przetwarzania

  • Praca z różnymi formatami danych (JSON, PARQUET, ORC, AVRO)

  • Projektowanie, kodowanie, testowanie i wdrażanie rozwiązań zgodnie z dobrymi praktykami inżynierskimi

  • Współpraca z zespołami analityków i inżynierów danych w środowisku Agile


Wymagania

  • Min. 2 lata doświadczenia w programowaniu w Apache Spark (preferowany PySpark)

  • Bardzo dobra znajomość koncepcji Big Data, hurtowni danych i zarządzania danymi

  • Doświadczenie w środowisku Hadoop Cloudera/Hortonworks

  • Umiejętność pracy z dużymi zbiorami danych i ich integracji z wielu źródeł

  • Znajomość języka SQL na poziomie zaawansowanym

  • Wykształcenie wyższe techniczne (preferowane kierunki informatyczne lub pokrewne)

  • Wymagane przebywanie na terenie Polski oraz płynna znajomość języka polskiego


Mile widziane

  • Doświadczenie w pracy w środowisku Agile

  • Znajomość Kubeflow i technologii strumieniowych (Apache Kafka, Apache NiFi)

  • Wiedza z zakresu automatyzacji procesów CI/CD

Tech stack

    Apache Spark

    regular

    Apache Hadoop

    regular

    Python

    regular

    SQL

    regular

    kubeflow

    nice to have

    Apache Kafka

    nice to have

    Apache Nifi

    nice to have

Office location

Published: 17.10.2025

About the company

Sii

Sii Polska to czołowy dostawca doradztwa technologicznego, transformacji cyfrowej oraz usług biznesowych i inżynieryjnych. Firma obecna jest na rynku od 2006 roku, zatrudnia ponad 7 300 ekspertów, jedenastokrotnie zdobył...

Company profile

Programista Big Data z Apache Spark

Summary of the offer

Programista Big Data z Apache Spark

al. Niepodległości 69, Warszawa

Sii

By applying, I consent to the processing of my personal data for the purpose of conducting the recruitment process. Wyrażam zgodę na przetwarzanie moich danych osobowych zamieszczonych w niniejszym CV przez Sii sp. z o.o. z siedzibą przy Al. Niepodle... MoreThis site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
ADVERTISEMENT: Recommended by Just Join IT