MACHINE LEARNING TEAM
Jako ML Engineer będziesz pracował nad rozwojem infrastruktury i narzędzi niezbędnych dla rozwiązań opartych o Machine Learning. Będziesz miał decydujący wpływ na efektywność i szybkość nowych eksperymentów, a także na infrastrukturę produkcyjną (low latency, 3e6 zapytań oraz 1e8 ewaluacji modeli na sekundę).
Twoje zadania
- Bliska współpraca z researcherami, identyfikowanie niewydajnych części systemu uczącego
- Tworzenie i utrzymywanie narzędzi pozwalających na szybkie, niezawodne i wygodne eksperymentowanie z nowymi modelami
- Tworzenie narzędzi pozwalających wydajnie przetwarzać duże zbiory danych
- Optymalizowanie krytycznych części systemu uczącego: wyliczania metryk, ewaluacji sieci neuronowych itp.
- Rozwijanie infrastruktury licytującej. Niskopoziomowa optymalizacja (AVX-512, CUDA, ...)
- Opcjonalnie, możliwość poświęcania części czasu na rozwój w obszarze Machine Learningu, eksperymenty, rozwój modeli.
Wykorzystywane technologie
- Python, Java, Scala
- Spark, Hadoop
- Google Cloud Platform, BigQuery
- Pandas, NumPy
- PyTorch, TensorFlow - znajomość będzie plusem
Nasze wymagania
- Biegłość w projektowaniu i implementowaniu systemów informatycznych
- Umiejętność tworzenia przyjaznych, wszechstronnych narzędzi
- Umiejętność krytycznej analizy tworzonych rozwiązań pod kątem wydajności (od szacowania teoretycznej wydajności projektowanych systemów do wykrywania i usuwania problemów wydajnościowych na produkcji)
Dodatkowymi atutami będą
- Doświadczenie w tworzeniu systemów rozproszonych
- Dobra znajomość narzędzi do analizy danych w Pythonie, takich jak Pandas, NumPy
- Dobra znajomość wybranych technologii Big Data takich jak Hadoop, Kafka, Storm, Spark lub Flink
- Znajomość narzędzi dla Machine Learningu: Torch, PyTorch, TensorFlow
Przykładowe tematy
- Rozwój infrastruktury zarządzającej procesami obliczeniowymi, lokalnie i w chmurze
- Stworzenie mechanizmu współdzielonej przestrzeni dyskowej dla maszyn uczących
- Stworzenie narzędzi do interaktywnej ekstrakcji cech z ustrukturyzowanych danych
- Wykorzystanie akceleratorów obliczeń w infrastrukturze produkcyjnej
W zamian oferujemy
- Atrakcyjne wynagrodzenie
- Pracę w zespole pasjonatów, którzy z chęcią dzielą się swoją wiedzą i umiejętnościami
- Wyjątkowo elastyczne warunki pracy — nie mamy core hours, nie mamy limitów na urlopy, można w dużej części pracować zdalnie
- Sprzęt i oprogramowanie, jakiego potrzebujesz
- Dostęp do najnowocześniejszych technologii i możliwość realnego wykorzystywania ich w projekcie o dużej skali i wysokiej dynamice
- Możliwość wykorzystania posiadanej wiedzy i kompetencji w praktycznych zastosowaniach — przy optymalizacji algorytmów obsługujących setki milionów internautów i kupujących miesięcznie miliardy odsłon reklamowych w modelu RTB, bazując na obszernych zbiorach danych
Więcej informacji: techblog.rtbhouse.com/jobs/