Site Reliability Engineer
O projekcie
Międzynarodowy projekt w sektorze bankowości inwestycyjnej i zarządzania ryzykiem. Zespół odpowiada za rozwój i utrzymanie platformy do obliczania ryzyka kredytowego, wykorzystywanej globalnie.
Projekt obejmuje migrację do środowiska chmurowego oraz budowę nowej generacji silnika obliczeniowego opartego o mikroserwisy i rozwiązania open source. System działa w środowisku hybrydowym (cloud + on-premise) i rozwijany jest zgodnie z podejściem Agile oraz DevOps
Strategiczny, długoterminowy projekt – minimum kilkuletni plan rozwoju i migracji (rozpoczęty w 2023 r., obecnie w fazie aktywnego rozwoju).
Kraków (praca hybrydowa – 2 dni w biurze)
Praca zmianowa (8:00–16:00 / 16:00–24:00) + dyżury on-call (rotacyjnie)
Zakres obowiązków
Utrzymanie i wsparcie aplikacji z naciskiem na niezawodność, dostępność i wydajność
Monitorowanie systemów oraz reagowanie na incydenty produkcyjne
Koordynacja rozwiązywania incydentów (RCA, post-mortem)
Udział w procesach Incident Management, Problem Management, Service Delivery
Rozwój narzędzi observability (monitoring, alerting, capacity management)
Wdrażanie zasad Site Reliability Engineering w celu poprawy stabilności i redukcji „toil”
Współpraca z zespołami międzynarodowymi
Wymagania
Min. 4 lata doświadczenia w rozwoju i/lub wsparciu systemów rozproszonych w Java
Doświadczenie w pracy z aplikacjami produkcyjnymi
Doświadczenie w analizie incydentów i troubleshooting
Znajomość CI/CD (np. Jenkins) oraz narzędzi automatyzacji (Ansible)
Doświadczenie z narzędziami monitoringu (Grafana, InfluxDB, Prometheus, Splunk, Loki lub podobne)
Podstawowa wiedza z zakresu Cloud (mile widziane GCP)
Znajomość relacyjnych baz danych (Oracle, PostgreSQL)
Podstawowa znajomość Unix/Linux
Doświadczenie w pracy w Agile/Kanban
Umiejętność prowadzenia technicznych rozmów z różnymi zespołami
Zobacz, dlaczego warto być w j-labs!
Dołączysz do firmy stworzonej przez inżynierów dla inżynierów, która istnieje na rynku od 15 lat. Obecnie zatrudniamy ponad 500 osób.
j-labs to stabilność i długofalowa współpraca – około 25% załogi to osoby pracujące już ponad 5 lata!
Możesz zmienić projekt – rób to co lubisz, rozwijaj swoje kompetencje, zdobywaj nowe.
Robimy dobre IT albo wcale. Technologie, w których pracujemy to m.in. Java 17/21, Spring, Hibernate, Mikroserwisy, AWS/Azure/GSP/, Terraform, Docker, Kubernetes,Kafka
Eksperci przyciągają ekspertów - średnie doświadczenie naszych inżynierów wynosi 12 lat, a 30% zostaje zatrudnionych z polecenia.
Stawiamy na knowledge sharing i rozwój . Organizujemy Talk4Devs, meet’upy, dajemy Ci przestrzeń do budowania swojej marki osobistej jako prelegent, czy prowadzenia własnych projektów, których rezultaty możesz przedstawiać m.in. na naszym blogu.
Dołącz do Gildii Technologicznej lub stwórz własną - nasze community zrzeszają specjalistów w obszarach: Java, Kotlin, .NET, Frontend, Management, DevOps, Quality Assurance
Mamy zakodowane, że jest czas pracy i czas nie pracy, więc bardzo dbamy o to, aby work life balance został zachowany.
Otrzymaliśmy w tym roku certyfikat Great Place to Work (aż 80% odpowiedzi w ankiecie dotyczącej różnych obszarów wybierało najwyższe noty, jesteśmy w pierwszej 10 firm z najlepszym wynikiem)
Site Reliability Engineer
Site Reliability Engineer