Site Reliability Engineer (SRE)
Dołącz do nas jako:
Site Reliability Engineer (SRE)
Departament Technologii i Systemów Informatycznych
Na co dzień w naszym zespole:
rozwijasz i optymalizujesz istniejący system monitoringu infrastruktury IT i środowisk chmurowych,
rozwijasz praktyki SRE: definiowanie oraz egzekwowanie SLO/SLI/SLA, error budgets, standardów niezawodności,
zapewniasz wysoką dostępności, wydajności i skalowalności usług (produkcja i środowiska niższe),
prowadzisz analizy incydentów (RCA), post-mortem’ów oraz wdrażasz działania zapobiegawcze,
automatyzujesz operacje i eliminujesz pracę manualną (IaC, CI/CD, self-healing, automatyczne reakcje na incydenty),
współpracujesz z zespołami developerskimi i infrastrukturalnymi w zakresie niezawodności i obserwowalności systemów,
tworzysz dokumentację techniczną oraz dzielisz się wiedzą w zespole.
Szukamy osoby, która wzmocni nas w utrzymaniu wysokiej dostępności usług oraz przeprowadzi kompleksową optymalizację systemów monitoringu w całej organizacji - od warstwy sieciowej, przez zasoby infrastruktury, aż po aplikacje i doświadczenie użytkownika.
To stanowisko może być Twoje, jeśli:
masz doświadczenie w roli SRE/Platform Engineer w dużych heterogenicznych środowiskach produkcyjnych.
posiadasz bardzo dobrą znajomość Linux, sieci TCP/IP, podstaw bezpieczeństwa i zagadnień HA/DR,
posiadasz praktyczną umiejętność projektowania monitoringu end-to-end (network/infrastructure/app).,
masz doświadczenie z systemami monitoringu i observability (np. Prometheus, Grafana, ELK/EFK, Zabbix),
posiadasz umiejętność analizy wydajności, capacity planningu i tuningu systemów,
masz doświadczenie w pracy z alertingiem, on-call i prowadzeniu RCA/post-mortemów,
jesteś osobą komunikatywną i posiadającą umiejętność pracy przekrojowo z różnymi zespołami.
Atutem będzie:
doświadczenie w administracji ekosystemem aplikacji Dynatrace,
umiejętność wykorzystania narzędzi: Zabbix, Grafana, Prometheus,
doświadczenie w pracy z systemami wirtualizacji i sieciami komputerowymi,
znajomość narzędzi monitoringu środowisk chmurowych (Azure),
znajomość języków skryptowych (np. Bash, Python),
certyfikaty potwierdzające kompetencje w obszarze monitoringu lub administracji systemami.
Twój Pakiet Korzyści
Praca hybrydowa
Nasze zadania realizujemy z domu lub z biura.
Docenienie działania i zaangażowania
Oprócz wynagrodzenia zasadniczego każdy z nas, realizując wyznaczone cele, doceniany jest w ramach systemu premiowego.
Oferta specjalna
Wspieramy Twoje finanse i oferujemy produkty naszej Grupy Kapitałowej na preferencyjnych warunkach (m.in. kredyt hipoteczny, kartę kredytową czy ubezpieczenie) oraz pomagamy odkładać na emeryturę w PPE.
Elastyczność benefitów
Różnimy się, dlatego to Ty wybierasz z jakich benefitów skorzystasz. Mamy dla Ciebie system kafeteryjny lub działania w ramach ZFŚS m.in. dofinansowanie wakacji, wydarzeń kulturalnych, sportowych.
Możliwości rozwoju
U nas masz szerokie perspektywy rozwoju i możesz uczyć się, jak lubisz. Oferujemy dostęp do różnych form nauki – stacjonarnie i cyfrowo.
Wsparcie w zdrowiu i odpoczynku
Dbamy o naszą formę mentalną i fizyczną. Możesz skorzystać z kart sportowych, opieki medycznej LuxMed, stomatologa, rozwiązań wellbeingowych czy dodatkowych godzin wolnych.
Site Reliability Engineer (SRE)
Site Reliability Engineer (SRE)