Senior Data Scientist / AI Engineer

Python

Nowogrodzka 62c, Warszawa

Sages

Undetermined

Mandate, Permanent

Senior

Office

4 181 - 6 968 USD

Gross per month - Mandate

4 181 - 6 968 USD

Gross per month - Permanent

Job description

Szukamy do naszego zespołu specjalisty uczenia maszynowego (data scientist), ze szczególnym naciskiem na problematykę analizy obrazów i/lub analizę języka naturalnego.

O nas i o projekcie

Jesteśmy zespołem realizującym projekty związane z zastosowaniami metod sztucznej inteligencji w biznesie i nauce. Zajmujemy się rozwiązaniami wykorzystującymi przetwarzanie języka naturalnego, analizę obrazów i automatyzację procesów. Obecnie, realizujemy projekt dofinansowany przez Narodowe Centrum Badań i Rozwoju, który może radykalnie zmienić rzeczywistość osób z niepełnosprawnościami.

W ramach dofinansowanego projektu powstaną rozwiązania oparte na sztucznej inteligencji, które rozpoznawać będą właściwą kolejność odczytywania elementów dokumentów, a także będą generować tekstowe opisy zdjęć, wykresów, czy tabel. Dzięki temu możliwe będzie wykorzystanie systemów odczytywania tekstu do przekazania pełnej treści dokumentów, które oryginalnie nie były dostosowane do standardów dostępności. Opracowana zostanie również metoda identyfikowania znaczeń trudnych i rzadkich słów, skrótów, a także słów w innych językach, niż język zrozumiały dla odbiorcy. Punktem odniesienia dla prowadzonych prac będzie uznany i szeroko stosowany na świecie wytyczne WCAG (Web Content Accessibility Guidelines), które identyfikują kluczowe problemy w odbiorze treści przez osoby z niepełnosprawnościami. Do tej pory wytyczne musiały być implementowane poprzez czasochłonną, ręczną pracę osób tworzących lub redagujących treści. Obecnie, możliwe będzie wykorzystanie metod w pełni automatycznych, które dramatycznie obniżą koszty i czas przygotowania dokumentów zgodnie ze standardami dostępności.

W pracy korzystamy z nowoczesnych narzędzi programistycznych i narzędzi służących do analizy i przetwarzania danych. Jesteśmy współautorami narzędzi open source służących do przetwarzania języka naturalnego (spaCy), a także wielu zasobów, które leżą u podwalin metod analizy języka polskiego.

Do Twoich codziennych zadań należeć będą:

nadzorowanie pracy kilkuosobowego zespołu data scientists, pracującego nad rozwiązaniem jednego z problemów postawionych w projekcie
tworzenie rozwiązań opartych na metodach uczenia maszynowego, w szczególności w obszarze przetwarzania języka naturalnego (NLP) i/lub analizy obrazów (CV)
modelowanie danych na podstawie zbiorów treningowych
opracowanie koncepcji tworzenia i doskonalenia zbiorów treningowych i efektywnego wykorzystania dostępnych danych
implementacja prototypów rozwiązań, które wykorzystywać będą wytworzone modele uczenia maszynowego
ewaluacja rozwiązań sztucznej inteligencji
wdrażanie modeli uczenia maszynowego w formie produkcyjnej

Wymagamy

doświadczenia w programowaniu przy użyciu pythona
bardzo dobrej znajomości bibliotek typu numpy, pandas
doświadczenia w modelowaniu danych, w szczególności z wykorzystaniem metod głębokiego uczenia
dobrej znajomości bibliotek typu keras, tensorflow, pytorch
umiejętności prowadzenia eksperymentów na danych, wyciągania wniosków i proponowania kreatywnych rozwiązań w zakresie tworzonych rozwiązań opartych na danych

Mile widziane: