Python Developer

Python

Nowogrodzka 62c, Warszawa

Sages

Undetermined

Mandate, Permanent

Mid

Office

2 227 - 3 341 USD

Gross per month - Mandate

2 227 - 3 341 USD

Gross per month - Permanent

Job description

Szukamy do naszego zespołu programisty Python, specjalizującego się w rozwiązaniach opartych na analizie danych i modelach uczenia maszynowego.

O nas i o projekcie

Jesteśmy zespołem realizującym projekty związane z zastosowaniami metod sztucznej inteligencji w biznesie i nauce. Zajmujemy się rozwiązaniami wykorzystującymi przetwarzanie języka naturalnego, analizę obrazów i automatyzację procesów. Obecnie, realizujemy projekt dofinansowany przez Narodowe Centrum Badań i Rozwoju, który może radykalnie zmienić rzeczywistość osób z niepełnosprawnościami.

W ramach dofinansowanego projektu powstaną rozwiązania oparte na sztucznej inteligencji, które rozpoznawać będą właściwą kolejność odczytywania elementów dokumentów, a także będą generować tekstowe opisy zdjęć, wykresów, czy tabel. Dzięki temu możliwe będzie wykorzystanie systemów odczytywania tekstu do przekazania pełnej treści dokumentów, które oryginalnie nie były dostosowane do standardów dostępności. Opracowana zostanie również metoda identyfikowania znaczeń trudnych i rzadkich słów, skrótów, a także słów w innych językach, niż język zrozumiały dla odbiorcy. Punktem odniesienia dla prowadzonych prac będzie uznany i szeroko stosowany na świecie wytyczne WCAG (Web Content Accessibility Guidelines), które identyfikują kluczowe problemy w odbiorze treści przez osoby z niepełnosprawnościami. Do tej pory wytyczne musiały być implementowane poprzez czasochłonną, ręczną pracę osób tworzących lub redagujących treści. Obecnie, możliwe będzie wykorzystanie metod w pełni automatycznych, które dramatycznie obniżą koszty i czas przygotowania dokumentów zgodnie ze standardami dostępności.

W pracy korzystamy z nowoczesnych narzędzi programistycznych i narzędzi służących do analizy i przetwarzania danych. Jesteśmy współautorami narzędzi open source służących do przetwarzania języka naturalnego (spaCy), a także wielu zasobów, które leżą u podwalin metod analizy języka polskiego.

Do Twoich codziennych zadań należeć będą:

pozyskiwanie, wstępna analiza i przetwarzanie danych
tworzenie zbiorów uczących i współpraca z anotatorami,
tworzenie narzędzi do anotacji danych
implementacja produktów opartych na modelach uczenia maszynowego,
ewaluacja rozwiązań sztucznej inteligencji i testowanie produkcyjne,
inżynieria danych w procesie uczenia maszynowego.

Wymagamy

doświadczenia w programowaniu przy użyciu pythona
bardzo dobrej znajomości bibliotek typu numpy, pandas
inżynieria danych
znajomość SQL i praktycznych umiejętności związanych z pracą przy bazach danych
znajomości frameworków webowych typu Flask, Django

Mile widziane:

znajomość rozwiązań chmurowych do tworzenia i uruchamiania rozwiązań opartych na danych (AWS, GCP)
znajomość problematyki przetwarzania języka naturalnego
znajomość problematyki analizy obrazów
znajomość problematyki konteneryzacji rozwiązań