Szukamy do naszego zespołu specjalisty uczenia maszynowego (data scientist), ze szczególnym naciskiem na problematykę analizy obrazów i/lub analizę języka naturalnego.
O nas i o projekcie
Jesteśmy zespołem realizującym projekty związane z zastosowaniami metod sztucznej inteligencji w biznesie i nauce. Zajmujemy się rozwiązaniami wykorzystującymi przetwarzanie języka naturalnego, analizę obrazów i automatyzację procesów. Obecnie, realizujemy projekt dofinansowany przez Narodowe Centrum Badań i Rozwoju, który może radykalnie zmienić rzeczywistość osób z niepełnosprawnościami.
W ramach dofinansowanego projektu powstaną rozwiązania oparte na sztucznej inteligencji, które rozpoznawać będą właściwą kolejność odczytywania elementów dokumentów, a także będą generować tekstowe opisy zdjęć, wykresów, czy tabel. Dzięki temu możliwe będzie wykorzystanie systemów odczytywania tekstu do przekazania pełnej treści dokumentów, które oryginalnie nie były dostosowane do standardów dostępności. Opracowana zostanie również metoda identyfikowania znaczeń trudnych i rzadkich słów, skrótów, a także słów w innych językach, niż język zrozumiały dla odbiorcy. Punktem odniesienia dla prowadzonych prac będzie uznany i szeroko stosowany na świecie wytyczne WCAG (Web Content Accessibility Guidelines), które identyfikują kluczowe problemy w odbiorze treści przez osoby z niepełnosprawnościami. Do tej pory wytyczne musiały być implementowane poprzez czasochłonną, ręczną pracę osób tworzących lub redagujących treści. Obecnie, możliwe będzie wykorzystanie metod w pełni automatycznych, które dramatycznie obniżą koszty i czas przygotowania dokumentów zgodnie ze standardami dostępności.
W pracy korzystamy z nowoczesnych narzędzi programistycznych i narzędzi służących do analizy i przetwarzania danych. Jesteśmy współautorami narzędzi open source służących do przetwarzania języka naturalnego (spaCy), a także wielu zasobów, które leżą u podwalin metod analizy języka polskiego.
Do Twoich codziennych zadań należeć będą:
- nadzorowanie pracy kilkuosobowego zespołu data scientists, pracującego nad rozwiązaniem jednego z problemów postawionych w projekcie
- tworzenie rozwiązań opartych na metodach uczenia maszynowego, w szczególności w obszarze przetwarzania języka naturalnego (NLP) i/lub analizy obrazów (CV)
- modelowanie danych na podstawie zbiorów treningowych
- opracowanie koncepcji tworzenia i doskonalenia zbiorów treningowych i efektywnego wykorzystania dostępnych danych
- implementacja prototypów rozwiązań, które wykorzystywać będą wytworzone modele uczenia maszynowego
- ewaluacja rozwiązań sztucznej inteligencji
- wdrażanie modeli uczenia maszynowego w formie produkcyjnej
Wymagamy
- doświadczenia w programowaniu przy użyciu pythona
- bardzo dobrej znajomości bibliotek typu numpy, pandas
- doświadczenia w modelowaniu danych, w szczególności z wykorzystaniem metod głębokiego uczenia
- dobrej znajomości bibliotek typu keras, tensorflow, pytorch
- umiejętności prowadzenia eksperymentów na danych, wyciągania wniosków i proponowania kreatywnych rozwiązań w zakresie tworzonych rozwiązań opartych na danych
Mile widziane:
- znajomość rozwiązań chmurowych do tworzenia i uruchamiania rozwiązań opartych na danych (AWS, GCP)
- znajomość problematyki konteneryzacji rozwiązań