Szukamy do naszego zespołu programisty Python, specjalizującego się w rozwiązaniach opartych na analizie danych i modelach uczenia maszynowego.
O nas i o projekcie
Jesteśmy zespołem realizującym projekty związane z zastosowaniami metod sztucznej inteligencji w biznesie i nauce. Zajmujemy się rozwiązaniami wykorzystującymi przetwarzanie języka naturalnego, analizę obrazów i automatyzację procesów. Obecnie, realizujemy projekt dofinansowany przez Narodowe Centrum Badań i Rozwoju, który może radykalnie zmienić rzeczywistość osób z niepełnosprawnościami.
W ramach dofinansowanego projektu powstaną rozwiązania oparte na sztucznej inteligencji, które rozpoznawać będą właściwą kolejność odczytywania elementów dokumentów, a także będą generować tekstowe opisy zdjęć, wykresów, czy tabel. Dzięki temu możliwe będzie wykorzystanie systemów odczytywania tekstu do przekazania pełnej treści dokumentów, które oryginalnie nie były dostosowane do standardów dostępności. Opracowana zostanie również metoda identyfikowania znaczeń trudnych i rzadkich słów, skrótów, a także słów w innych językach, niż język zrozumiały dla odbiorcy. Punktem odniesienia dla prowadzonych prac będzie uznany i szeroko stosowany na świecie wytyczne WCAG (Web Content Accessibility Guidelines), które identyfikują kluczowe problemy w odbiorze treści przez osoby z niepełnosprawnościami. Do tej pory wytyczne musiały być implementowane poprzez czasochłonną, ręczną pracę osób tworzących lub redagujących treści. Obecnie, możliwe będzie wykorzystanie metod w pełni automatycznych, które dramatycznie obniżą koszty i czas przygotowania dokumentów zgodnie ze standardami dostępności.
W pracy korzystamy z nowoczesnych narzędzi programistycznych i narzędzi służących do analizy i przetwarzania danych. Jesteśmy współautorami narzędzi open source służących do przetwarzania języka naturalnego (spaCy), a także wielu zasobów, które leżą u podwalin metod analizy języka polskiego.
Do Twoich codziennych zadań należeć będą:
- pozyskiwanie, wstępna analiza i przetwarzanie danych
- tworzenie zbiorów uczących i współpraca z anotatorami,
- tworzenie narzędzi do anotacji danych
- implementacja produktów opartych na modelach uczenia maszynowego,
- ewaluacja rozwiązań sztucznej inteligencji i testowanie produkcyjne,
- inżynieria danych w procesie uczenia maszynowego.
Wymagamy
- doświadczenia w programowaniu przy użyciu pythona
- bardzo dobrej znajomości bibliotek typu numpy, pandas
- inżynieria danych
- znajomość SQL i praktycznych umiejętności związanych z pracą przy bazach danych
- znajomości frameworków webowych typu Flask, Django
Mile widziane:
- znajomość rozwiązań chmurowych do tworzenia i uruchamiania rozwiązań opartych na danych (AWS, GCP)
- znajomość problematyki przetwarzania języka naturalnego
- znajomość problematyki analizy obrazów
- znajomość problematyki konteneryzacji rozwiązań