Szukamy doświadczonego Site Reliability Engineer (SRE), który będzie odpowiedzialny za wsparcie aplikacji produkcyjnych w środowisku dużej skali. Idealny kandydat posiada doświadczenie w obsłudze aplikacji Java, umiejętności debugowania, rozwiązywania problemów oraz solidną znajomość środowisk Unix/Linux i baz danych SQL. Rola wymaga pracy w złożonym środowisku serwerowym i ścisłej współpracy z zespołami technicznymi.
- Zapewnianie wsparcia produkcyjnego dla aplikacji klasy enterprise, zarządzanie incydentami produkcyjnymi zgodnie z procesami ITSM.
- Monitorowanie i utrzymanie aplikacji Java oraz środowisk JVM.
- Analiza, debugowanie i rozwiązywanie problemów w środowiskach Unix/Linux.
- Obsługa baz danych SQL oraz tworzenie zapytań i analiz danych wspierających działania utrzymaniowe.
- Współpraca z zespołami developerskimi i operacyjnymi w celu szybkiego reagowania na incydenty oraz poprawy dostępności systemów.
- Praca w dużych środowiskach serwerowych, obsługa środowisk produkcyjnych o wysokiej dostępności.
- Tworzenie i utrzymywanie dokumentacji operacyjnej oraz raportów z incydentów.
- Doświadczenie w wsparciu aplikacji produkcyjnych oraz zarządzaniu incydentami w dużych organizacjach (zgodnie z ITSM).
- Praktyczna znajomość technologii Java oraz środowiska JVM.
- Bardzo dobra znajomość systemów Unix/Linux oraz administracji serwerami.
- Umiejętność pisania zapytań SQL i analizy danych.
- Doświadczenie w debugowaniu i rozwiązywaniu problemów w środowisku produkcyjnym.
- Praca w środowiskach serwerowych o dużej skali (duże farmy serwerów, klastery).
- Wysoko rozwinięte umiejętności komunikacyjne i zdolność pracy w zespole.