Senior Site Reliability Engineer (SRE) – AI Infrastructure
Budujemy skalowalną i niezawodną platformę pod nowoczesne workloady AI. Szukamy Senior SRE, który czuje się pewnie w chmurze, rozumie Kubernetes „od środka” i chce mieć realny wpływ na stabilność oraz wydajność systemów opartych o AI.
🔧Zakres odpowiedzialności
Projektowanie i utrzymywanie infrastruktury w Google Cloud Platform (GCP) z wykorzystaniem Terraform (IaC)
Zarządzanie i optymalizacja klastrów GKE pod kątem wysokiej dostępności, wydajności i bezpieczeństwa
Utrzymanie i rozwój pipeline’ów CI/CD w modelu GitOps (ArgoCD)
Budowa i rozwój systemów observability (monitoring, alerting, tracing)
Incident Response oraz udział w post-mortemach (blameless)
Capacity planning i optymalizacja kosztów infrastruktury
Wsparcie i konfiguracja platformy Vertex AI
Optymalizacja infrastruktury pod workloady AI (GPU/TPU, memory-intensive workloads)
Współpraca z zespołami Engineering i Tooling przy wdrażaniu i skalowaniu rozwiązań opartych o AI
🧠 Wymagania
Min. 5 lat doświadczenia w pracy z chmurą publiczną (GCP lub AWS; GCP będzie dużym plusem)
Bardzo dobra znajomość Kubernetes (GKE)
Doświadczenie z Terraform i podejściem Infrastructure as Code
Praktyczna znajomość ArgoCD / GitOps
Doświadczenie lub solidne zrozumienie Vertex AI i workloadów AI
Umiejętność projektowania rozwiązań niezawodnych, skalowalnych i kosztowo efektywnych
Podejście: automate everything
Bardzo dobra znajomość języka angielskiego
💰 Oferujemy
B2B: 180–200 PLN/h (w zależności od doświadczenia i zakresu odpowiedzialności)
Praca przy realnych systemach AI w produkcji, nie PoC
Duża autonomia techniczna i wpływ na architekturę
Dojrzałe podejście do SRE (blameless post-mortems, sensowny on-call)
Współpraca w międzynarodowym, technicznie mocnym zespole
Praca zdalna
Przelew w dogodnej formie Krótki 14-dniowy termin płatności faktury
Bogaty pakiet usług prywatnej opieki medycznej
Dostęp do platformy kafeteryjnej MyBenefit (umożliwiającej zamawianie kart Multisport, kart przedpłaconych do Ikea, Zalando, Notino i wielu innych)
Senior Site Reliability Engineer (SRE) – AI Infrastructure
Senior Site Reliability Engineer (SRE) – AI Infrastructure