Site Reliability Engineer - SRE
W ITLT pomagamy naszym zaprzyjaźnionym firmom przekształcać ambitne pomysły w cyfrową rzeczywistość.
Z nastawieniem na wyzwania, ciekawość technologii i zwinność - współtworzymy wyjątkowe rozwiązania IT.
Aktualnie poszukujemy osób na stanowisko: Site Reliability Engineer - SRE
Konkrety:
Stawka: Jesteśmy w pełni otwarci na Twoją propozycję. Wystarczy wpisać odpowiednią stawkę w formularzu
Miejsce pracy/praca zdalna: Zapewniamy pewną swobodę pracy zdalnej, przy czym: 2-3x/tydzień zapraszamy do warszawskiego biura
Wymiar pracy: Fulltime
Sektor: Petrol/Convenience
Projekt: Internetowa platforma do scentralizowanego zarządzania danymi promocyjnymi i analizy danych
Zespół: 6-8os.
Proces rekrutacji: 1-etapowy (spotkanie zdalne via MS Teams). Sporadycznie może pojawić się też drugie (krótkie) spotkanie zdalne - połączone z decyzją
Szacowany czas trwania projektu: Długoterminowy
Czas pracy/Strefa czasowa: Standardowe polskie godziny pracy
Technologie używane na projekcie: Microservices, Java, Spring, Azure, CI/CD (GitHub, Sonar), SQL, NoSQL, Monitoring & Observability tools
Do Twoich głównych obowiązków na tym stanowisku należeć będzie:
Nadzorowanie środowiska produkcyjnego - monitorowanie dostępności systemów, ustawianie alertów i dbanie o to, żeby platforma działała bez przerw.
Analiza danych i metryk - zbieranie informacji z systemów, aplikacji i chmury (Azure/AWS), żeby znaleźć przyczyny ewentualnych problemów i poprawić wydajność.
Integracja narzędzi monitorujących i powiadomień - zapewnianie, że w przypadku awarii odpowiednie osoby zostaną sprawnie poinformowane.
Ustalanie i śledzenie celów jakościowych (SLI/SLA/SLO) - tworzenie wskaźników i dashboardów, dzięki którym będzie wiadomo, czy system spełnia wymagania biznesu.
Proponowanie i wdrażanie usprawnień procesów - w tym zarządzania zmianą, dostępami, cyklem życia usług i wykorzystaniem zasobów.
Wsparcie w incydentach produkcyjnych - współpracowanie z zespołami wsparcia i produktu
Planowanie zasobów i pojemności - dbanie o to, żeby systemy miały odpowiednie zasoby
Udział w post-mortem - analizowanie incydentów i wprowadzanie zmian, aby problem się nie powtórzył.
Automatyzacja operacji - tworzenie rozwiązań, które redukują ręczną pracę i pozwalają skalować działanie systemów.
Współpraca z Product Teamem, DevOpsami i Architektami - budowanie krytycznych ścieżek produktów i mapowanie zasobów, aby platforma działała sprawnie i stabilnie.
Ta oferta będzie idealna dla Ciebie, jeśli posiadasz:
Doświadczenie IT: min. 7 lat w branży i 3 lata w utrzymaniu lub wsparciu platform mikroserwisowych.
Znajomość chmury: umiejętność praktycznej pracy z Azure (konfiguracja, monitoring, skalowanie usług).
Technologie i architektura: rozumienie microservices, Java / Spring, baz danych SQL i NoSQL, CI/CD (np. GitHub, Sonar).
Monitoring i niezawodność: doświadczenie w konfiguracji alertów, monitoringu i mierników jakości usług (SLI/SLA/SLO).
Podejście SRE: umiejętność identyfikowania problemów, wąskich gardeł i umiejętność proponowania usprawnień, a także automatyzacji powtarzalnych procesów.
Płynny angielski i polski (przynajmniej na poziomie B2+/C1-)
Warto do nas dołączyć, ponieważ oferujemy:
Dużą swobodę pracy zdalnej
Długofalowe stabilne zatrudnienie
Szansę na uczestniczenie w kluczowych projektach dla dużej firmy działającej w bardzo stabilnym sektorze
Atrakcyjne wynagrodzenie (adekwatne do umiejętności i doświadczenia)
Benefity (Lux Med, MultiSport...)
W razie pytań pingnij śmiało na Linkedin'ie do Kuby
Site Reliability Engineer - SRE
Site Reliability Engineer - SRE