Senior Site Reliability Engineer
Skierniewicka 10a, Warszawa
TQLO SPÓŁKA Z OGRANICZONĄ ODPOWIEDZIALNOŚCIĄ
Nasz Klient to międzynarodowa organizacja rozwijająca nowoczesną, wysokodostępną platformę digital obsługiwaną przez miliony użytkowników.
Projekt koncentruje się na budowie i utrzymaniu skalowalnej infrastruktury chmurowej, automatyzacji procesów, poprawie niezawodności oraz wdrażaniu dobrych praktyk Site Reliability Engineering (SRE).
Szukamy doświadczonej osoby na stanowisko Senior Site Reliability Engineer, która przejmie odpowiedzialność za rozwój środowisk produkcyjnych, ulepszanie obserwowalności i automatyzację całego cyklu życia aplikacji.
100% zdalnie
CZYM BĘDZIESZ SIĘ ZAJMOWAĆ?
Projektowaniem, wdrażaniem i skalowaniem odpornej infrastruktury w chmurze AWS (wielokrotne konta, środowiska produkcyjne i pre-prod).
Utrzymaniem i rozwijaniem środowisk Kubernetes (EKS) z użyciem Helm, ArgoCD i Terraform, dbając o przewidywalne i audytowalne procesy deployów.
Współpracą z zespołami produktowymi i platformowymi w zakresie dobrych praktyk SRE (SLI/SLO, error budgets, reliability reviews).
Budową i ulepszaniem obserwowalności przy pomocy Dynatrace, Grafana, metryk cloud-native i narzędzi open-source.
Optymalizacją konfiguracji Cloudflare WAF, reguł cache/routing oraz zabezpieczeń perymetrycznych w celu poprawy wydajności i bezpieczeństwa.
Automatyzacją infrastruktury, deployów i rutynowych zadań z wykorzystaniem GitHub Actions, Python/Bash.
Udziałem w incident response, prowadzeniem post-mortemów i przekuwaniem wniosków w realne usprawnienia.
CZEGO OD CIEBIE OCZEKUJEMY?
Minimum 5 lat doświadczenia w roli SRE/DevOps w środowiskach produkcyjnych opartych o AWS (preferowany) lub Azure.
Biegłości w Terraform, Helm, ArgoCD, GitHub Actions.
Bardzo dobrej znajomości Kubernetes (EKS) – autoscaling, rollout strategies, troubleshooting, architektura klastra.
Doświadczenia w budowie i utrzymaniu observability pipelines (logi, metryki, trace’y, SLO/SLI, alerting).
Umiejętności projektowania systemów o wysokiej dostępności i odporności na awarie.
Znajomości zasad CI/CD oraz podejścia GitOps.
Doświadczenia z Cloudflare (DNS, CDN, WAF, rulesets).
Praktyki w pracy z narzędziami monitoringu: Dynatrace, Prometheus, Grafana.
Bardzo dobrej znajomości języka angielskiego (współpraca z zespołami w Europie i USA).
Doświadczenia w incident response: on-call, RCA, post-mortem.
Nice to have:
Przykłady wprowadzonych usprawnień w zakresie SLO/SLI lub redukcji alert fatigue.
Kontrybucje do narzędzi automatyzujących lub poprawiających obserwowalność.
Doświadczenie w prowadzeniu reliability reviews i promowaniu kultury post-mortem.
Zainteresowanie resilience engineering i dzieleniem się wiedzą w obszarze SRE.
DLACZEGO WARTO?
Stabilna długofalowa współpraca w formule B2B bezpośrednio z Klientem końcowym.
Praca w projektach o wysokiej skali i realnym wpływie na działanie platformy używanej przez miliony użytkowników.
Pełna autonomia technologiczna: realny wpływ na architekturę, rozwiązania i standardy niezawodności.
100% pracy zdalnej, elastyczne godziny, środowisko async-friendly.
Dojrzała kultura inżynierska, partnerskie podejście i współpraca z ekspertami z Europy i USA.
Dostęp do nowoczesnego stacku: AWS, EKS, Terraform, ArgoCD, Cloudflare, Dynatrace i narzędzia cloud-native.
TQLO Sp. z o.o. – Agencja Zatrudnienia (KRAZ nr 33580)
Dziękujemy za wszystkie zgłoszenia! Skontaktujemy się z wybranymi osobami.

TQLO to dynamicznie rozwijająca się firma specjalizująca się w rekrutacji IT oraz outsourcingu usług technologicznych. Działa na polskim rynku, dostarczając lokalnie wykwalifikowanych inżynierów, którzy pomagają klientom...
Senior Site Reliability Engineer
Senior Site Reliability Engineer
Skierniewicka 10a, Warszawa
TQLO SPÓŁKA Z OGRANICZONĄ ODPOWIEDZIALNOŚCIĄ