Opis stanowiska
- Monitorowanie działania systemu, wykrywanie anomalii, zgłaszanie błędów do zespołów, koordynacja naprawiania błędów
- Reagowanie na alarmy i odpowiednie strojenie tych alarmów, aby wzbudzały się w pożądanych sytuacjach
- Wsparcie obsługi zgłoszeń problemów technicznych od klientów - analiza logów, rekordów w bazach danych
- Wsparcie rozwiązywania błędów wykrytych w testach systemowych i E2E
- Przygotowywanie i uruchamiania data fixów poprawiających masowo dane w systemie oraz współpraca z zespołami które przygotowują skrypty do data fixów, testowanie ich i uruchamianie
- Dyżurowanie (standby) –7 dni raz na 6 tygodni, reagowanie na telefony związane z alarmami, wprowadzanie tymczasowych obejść w systemie do czasu rozwiązania źródłowej przyczyny problemu.
- Asystowanie przy pracach planowych w celu określenia, czy system po upgrade działą prawidłowo (max 2 razy w miesiącu, najczęściej 1 raz w miesiącu)
Wymagania
- Kilkuletnie doświadczenie w utrzymywaniu systemów i wykonywaniu przynajmniej 3 z powyższych czynności wymienionych w zakresie obowiązków
- Umiejętność analizowania przyczyn błędów w logach, bazach danych oraz w danych wystawianych serwisy REST API (json, XML).
- Umiejętność naprawiania skutków błędów (zmiany w bazach danych, skrypty naprawiające)
- Umiejętności analityczne, pozwalające na szybkie zrozumienie procesów biznesowych i technicznych stron działania systemu
- Chęć uczenia się, poznawania złożonej logiki biznesowej i technicznej
- Umiejętność wprowadzania usprawnień, automatyzacji w celu szybszego wykrywania, analizowania i poprawiania błędów
- Odwaga w działaniu, nastawienie na uczenie się na błędach
- Komunikatywność, dobra współpraca wewnątrz zespołu oraz z innymi zespołami.
- Przynajmniej podstawowa znajomość jednego z języków programowania (C, C++, C#, java,,
- go lang lub pokrewne)
Poniższe umiejętności będą dodatkowym atutem, części z nich nauczymy:
- Znajomość Linux i umiejętność pisania skryptów
- Znajomość języka go lang
- Znajomość baz relacyjnych (np., PostgreSQL) i nierelacyjnych (np. MongoDb, Redis)
- Znajomość systemów kolejkowych (kafka, artemis lub inne)
- Znajomość protokołów sieciowych (HTTP/REST, sftp, tcp/ip)
- Znajomość narzędzi: Git, Gitlab, Jenkins, Docker, Jira, Kibana
- Znajomość obszaru ratingu i telekomunikacji
- Protokoły telekomunikacyjne (Diameter, inne) , standardy 3GPP OCS/PCRF
- Doświadczenie w utrzymaniu systemów backendowych lub innych systemów z dużym wolumenem danych i transakcji
Oferujemy
Poszukujemy osób, które mają doświadczenie i lubią utrzymywać systemy, monitorować ich zachowanie i wykrywać anomalie, wyszukiwać błędy, analizować przyczyny tych błędów i poprawiać ich skutki. Zapewniamy ciekawą i rozwijającą pracę przy systemie real-time ratingowym obsługującym miliony użytkowników sieci T-Mobile. Praca hybrydowa (3 dni w tygodniu w biurze w Warszawie, Marynarska 12)