Site Reliability Engineer - SRE
W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość.
Z nastawieniem na wyzwania, ciekawość technologii i zwinność - współtworzymy wyjątkowe rozwiązania IT.
Aktualnie poszukujemy osób na stanowisko: Site Reliability Engineer - SRE
Konkrety:
Stawka: 175 - 190PLN/h na FV
Miejsce pracy/praca zdalna: Zapewniamy pewną swobodę pracy zdalnej, przy czym: ~`2x/tydzień zapraszamy do warszawskiego biura
Wymiar pracy: Fulltime
Sektor: Petrol/Convenience
Projekt: Internetowa platforma do scentralizowanego zarządzania danymi promocyjnymi i analizy danych
Zespół: Praca z różnorodnymi zespołami przy wsparciu Senior SRE/DevOpsa
Proces rekrutacji: 1-etapowy (spotkanie zdalne via MS Teams). Sporadycznie może pojawić się też drugie (krótkie) spotkanie zdalne - połączone z decyzją
Szacowany czas trwania projektu: Długoterminowy
Czas pracy/Strefa czasowa: Standardowe polskie godziny pracy, sporadycznie mogą zdarzyć się on-calle (P1) – ważna jest gotowość do reagowania w godzinach wieczornych, aby być w kontakcie z zespołami z amerykańskiej strefy czasowej.
Technologie używane na projekcie: Azure (budowa i monitorowanie usług, dashboardy), Microservices, Java, Spring, Kubernetes, CI/CD (GitHub, Sonar), SQL i NoSQL, wbudowane mechanizmy monitoringu w Azure.
Do Twoich głównych obowiązków na tym stanowisku należeć będzie:
Nadzorowanie środowiska produkcyjnego i budowa mechanizmów monitoringu w Azure – alerty, dashboardy, procesy weryfikacji incydentów.
Analiza danych i metryk w celu identyfikacji root cause i usprawnienia działania systemów.
Proaktywne i reaktywne reagowanie na incydenty produkcyjne (sporadyczne P1) – umiejętność mapowania zespołów odpowiedzialnych i koordynowania działań.
Ustalanie i śledzenie celów jakościowych (SLI/SLA/SLO) – tworzenie wskaźników i raportów dla zespołu i biznesu.
Współpraca z Product Teamem, DevOpsami i Architektami w celu poprawy jakości komponentów i procesów.
Automatyzacja operacji i procesów – redukcja ręcznej pracy, skalowanie systemów, usprawnienie workflow.
Budowa i utrzymanie procesów umożliwiających proaktywne wykrywanie problemów.
Udział w post-mortem i wdrażanie usprawnień po incydentach.
Ta oferta będzie idealna dla Ciebie, jeśli posiadasz:
Około 6-7 lat doświadczenia w IT, w tym min. 3 lata w utrzymaniu lub wsparciu platform mikroserwisowych.
Praktyczną znajomość Azure (w tym konfiguracja, monitorowanie, skalowanie usług i budowa dashboardów).
Znajomość Java / Spring oraz Kubernetes - umiejętność szybkiego wdrażania i rozumienia architektury mikroserwisów.
Podejście SRE: identyfikacja wąskich gardeł, proponowanie usprawnień, automatyzacja powtarzalnych procesów.
Gotowość do sporadycznych on-call, samodzielność w działaniach kryzysowych i koordynacji zespołów.
Znajomość baz SQL i NoSQL, CI/CD (GitHub, Sonar).
Doświadczenie w monitoringu, konfiguracji alertów, definiowaniu SLI/SLA/SLO.
Umiejętność komunikacji z biznesem i vendorami (w tym z USA) – proaktywne, stanowcze i relacyjne podejście.
Płynny angielski i polski (min. B2+/C1-).
Warto do nas dołączyć, ponieważ oferujemy:
Dużą swobodę pracy zdalnej
Długofalowe stabilne zatrudnienie
Szansę na uczestniczenie w kluczowych projektach dla dużej firmy działającej w bardzo stabilnym sektorze
Atrakcyjne wynagrodzenie (adekwatne do umiejętności i doświadczenia)
Benefity (Lux Med, MultiSport...)
W razie pytań pingnij śmiało na Linkedin'ie do Kuby
Site Reliability Engineer - SRE
Site Reliability Engineer - SRE