#1 Job Board for tech industry in Europe

Senior Data Scientist / AI Engineer
Python

Senior Data Scientist / AI Engineer

Warszawa
Type of work
Undetermined
Experience
Senior
Employment Type
Mandate, Permanent
Operating mode
Office

Tech stack

    Pandas

    master

    Python

    advanced

    NumPy

    advanced

    Keras/Tensorflow/Pytorch

    advanced

    spaCy/NLTK/OpenCV

    regular

Job description

Online interview
Szukamy do naszego zespołu specjalisty uczenia maszynowego (data scientist), ze szczególnym naciskiem na problematykę analizy obrazów i/lub analizę języka naturalnego.

O nas i o projekcie

Jesteśmy zespołem realizującym projekty związane z zastosowaniami metod sztucznej inteligencji w biznesie i nauce. Zajmujemy się rozwiązaniami wykorzystującymi przetwarzanie języka naturalnego, analizę obrazów i automatyzację procesów. Obecnie, realizujemy projekt dofinansowany przez Narodowe Centrum Badań i Rozwoju, który może radykalnie zmienić rzeczywistość osób z niepełnosprawnościami. 

W ramach dofinansowanego projektu powstaną rozwiązania oparte na sztucznej inteligencji, które rozpoznawać będą właściwą kolejność odczytywania elementów dokumentów, a także będą generować tekstowe opisy zdjęć, wykresów, czy tabel. Dzięki temu możliwe będzie wykorzystanie systemów odczytywania tekstu do przekazania pełnej treści dokumentów, które oryginalnie nie były dostosowane do standardów dostępności. Opracowana zostanie również metoda identyfikowania znaczeń trudnych i rzadkich słów, skrótów, a także słów w innych językach, niż język zrozumiały dla odbiorcy. Punktem odniesienia dla prowadzonych prac będzie uznany i szeroko stosowany na świecie wytyczne WCAG (Web Content Accessibility Guidelines), które identyfikują kluczowe problemy w odbiorze treści przez osoby z niepełnosprawnościami. Do tej pory wytyczne musiały być implementowane poprzez czasochłonną, ręczną pracę osób tworzących lub redagujących treści. Obecnie, możliwe będzie wykorzystanie metod w pełni automatycznych, które dramatycznie obniżą koszty i czas przygotowania dokumentów zgodnie ze standardami dostępności.

W pracy korzystamy z nowoczesnych narzędzi programistycznych i narzędzi służących do analizy i przetwarzania danych. Jesteśmy współautorami narzędzi open source służących do przetwarzania języka naturalnego (spaCy), a także wielu zasobów, które leżą u podwalin metod analizy języka polskiego.

Do Twoich codziennych zadań należeć będą:

  • nadzorowanie pracy kilkuosobowego zespołu data scientists, pracującego nad rozwiązaniem jednego z problemów postawionych w projekcie
  • tworzenie rozwiązań opartych na metodach uczenia maszynowego, w szczególności w obszarze przetwarzania języka naturalnego (NLP) i/lub analizy obrazów (CV)
  • modelowanie danych na podstawie zbiorów treningowych
  • opracowanie koncepcji tworzenia i doskonalenia zbiorów treningowych i efektywnego wykorzystania dostępnych danych
  • implementacja prototypów rozwiązań, które wykorzystywać będą wytworzone modele uczenia maszynowego
  • ewaluacja rozwiązań sztucznej inteligencji
  • wdrażanie modeli uczenia maszynowego w formie produkcyjnej

Wymagamy

  • doświadczenia w programowaniu przy użyciu pythona
  • bardzo dobrej znajomości bibliotek typu numpy, pandas
  • doświadczenia w modelowaniu danych, w szczególności z wykorzystaniem metod głębokiego uczenia
  • dobrej znajomości bibliotek typu keras, tensorflow, pytorch
  • umiejętności prowadzenia eksperymentów na danych, wyciągania wniosków i proponowania kreatywnych rozwiązań w zakresie tworzonych rozwiązań opartych na danych

Mile widziane:

  • znajomość rozwiązań chmurowych do tworzenia i uruchamiania rozwiązań opartych na danych (AWS, GCP)
  • znajomość problematyki konteneryzacji rozwiązań