Big Data Engineer

RTB House S.A.

Warszawa

Type of work

Undetermined

Experience

Senior

Employment Type

B2B

Operating mode

Office

Tech stack

Java

advanced

Kafka

advanced

Kafka Streams

advanced

Hadoop

regular

PostgreSQL

regular

Elastic

regular

Google Big Query

regular

Flume

junior

Logstash

junior

Aerospike

nice to have

Job description

W ramach teamu IT, do zespołu CORE poszukujemy Big Data Engineer .

Twoje zadania:
. Rozwój i utrzymanie rozproszonych systemów przetwarzających duże ilości danych (większość real-time)
na potrzeby naszej platformy RTB
. Optymalizacja tworzonego oprogramowania pod kątem wydajności i zużycia zasobów
. Zapewnienie niezawodności i skalowalności budowanych rozwiązań
. Tworzenie testów wydajnościowych i poprawnościowych dla nowych elementów systemu
. Analiza nowych technologii pod kątem możliwości ich zastosowania w warunkach produkcyjnych
. Rozwój narzędzi monitorujących i analizujących pracę produkcyjnego systemu
. Ciągła optymalizacja istniejących narzędzi i procesów

Wybrane wykorzystywane technologie:
. Java, Python
. Hadoop, Kafka
. Kafka Streams, Flume, Logstash
. Docker, Jenkins, Graphite
. Aerospike, PostgreSQL
. Google Big Query, Elastic

Przykładowe tematy:
Wybrane zagadnienia, którymi zajmowaliśmy się w ostatnim czasie:
. Wymiana frameworka w komponencie przetwarzającym dane (przejście ze Storm-a na Kafka Streams)
. Stworzenie mergera strumieni danych w oparciu o Kafka Client API
. Stworzenie synchronizatora profili użytkowników między DC-kami w oparciu o Kafka Streams
. Stworzenie komponentu wyliczającego agregaty w oparciu o Kafka Client API i filtry Blooma
. Wdrożenie Logstash-a do ładowania i Elastic-a do odpytywania indeksowanych danych
(przejście z Flume + Solr)
. Stworzenie end-to-end monitoringu poprawności i opóźnienia danych
. Wymiana komponentu streamującego dane do BigQuery i HDFS (z Flume na własne rozwiązanie oparte
o Kafka Client API) – w trakcie
. Ciągłe utrzymanie systemu, wykrywanie i rozwiązywanie problemów wydajnościowych, a także skalowanie
ze względu na rosnącą ilość danych

Nasze oczekiwania:
. Biegłość w programowaniu
. Doskonałe rozumienie tego, jak działają złożone systemy informatyczne (od poziomu sprzętu, poprzez
software, aż po algorytmikę)
. Dobra znajomość podstawowych metod tworzenia programów współbieżnych i systemów rozproszonych
(od poziomu wątków do poziomu kontynentów)
. Praktyczna umiejętność obserwowania, monitorowania i analizowania działania produkcyjnych systemów
(oraz wyciągania z tego wartościowych wniosków)
. Umiejętność krytycznej analizy tworzonych rozwiązań pod kątem wydajności (od szacowania teoretycznej
wydajności projektowanych systemów do wykrywania i usuwania faktycznych problemów wydajnościowych
na produkcji)
. Gotowość do pracy w modelu DevOps

Dodatkowymi atutami będą:
. Doświadczenie w tworzeniu systemów rozproszonych
. Dobra znajomość wybranych technologii Big Data takich jak Hadoop, Kafka, Storm, Spark lub Flink
. Znajomość metod i narzędzi profilowania aplikacji (najlepiej Java, zarówno z poziomu JVM-a jak i Linux-a)

Oferujemy:
. Atrakcyjne wynagrodzenie
. Pracę w zespole pasjonatów, którzy chętnie dzielą się swoją wiedzą i doświadczeniem
. Wyjątkowo elastyczne warunki pracy – nie mamy core hours, nie mamy limitów na urlopy, można w dużej
części pracować zdalnie
. Dostęp do najnowocześniejszych technologii i możliwość realnego wykorzystywania ich w projekcie o dużej
skali i wysokiej dynamice
. Sprzęt i oprogramowanie, jakiego potrzebujesz

Dodatkowo zamieszczmy link do naszego FAQ, gdzie znajdują się: stawki, informacje odnośnie firmy, stylu pracy, pracy zdalenj ect.

http://techblog.rtbhouse.com/files/FAQ.pdf