Lokalizacja: Suchy Dwór k/Wrocławia lub HO
Zatrudnienie: B2B / UoP (część etatu - 20h/tyg.)
Doświadczenie: Mid
Dołącz do naszego Zespołu AI i zbuduj z nami firmowe repozytorium wiedzy.
Stworzyliśmy zespół AI, w skład którego wchodzą już doświadczony Mentor/Architekt oraz kreatywny Inżynier AI. Teraz szukamy trzeciej, kluczowej osoby, która pomoże nam w projekcie. Twoim głównym zadaniem będzie stworzenie i zarządzanie centralnym repozytorium wiedzy, które stanie się fundamentem dla naszych zaawansowanych automatyzacji opartych na AI (Claude, Gemini).
To nie jest standardowa praca programisty – to pozycja dla kogoś, kto chce specjalizować się w przygotowywaniu danych dla najnowszych systemów AI.
Co będziesz robić?
Twoim głównym celem będzie budowa i utrzymanie repozytorium wiedzy w PostgreSQL.
Inżynieria i Integracja Danych:
Projektowanie i implementacja potoków danych (ETL/ELT) do pobierania informacji z różnorodnych źródeł:
Poczta e-mail: Integracja z ok. 30 skrzynkami Microsoft 365 (przez Graph API).
Dokumenty: Przetwarzanie i ekstrakcja treści z setek dokumentów (PDF, Word, Excel).
Bazy danych: Pobieranie i synchronizacja danych z istniejących baz SQL (SQL Server).
Czyszczenie, strukturyzacja i przygotowywanie danych do dalszego wykorzystania przez modele AI.
Zapewnienie jakości i spójności danych w repozytorium.
Budowa Repozytorium Wiedzy dla AI:
Projektowanie i implementacja schematu bazy danych PostgreSQL zoptymalizowanej pod kątem wyszukiwania semantycznego.
Implementacja procesów chunkingu (dzielenia dokumentów na mniejsze fragmenty) i wektoryzacji danych.
Ścisła współpraca z Inżynierem AI w celu udostępniania danych jako kontekst dla zapytań do modeli językowych.
Wsparcie i Utrzymanie:
Monitorowanie procesów ETL i zapewnienie ich niezawodności.
Optymalizacja zapytań i wydajności bazy danych PostgreSQL.
Wspieranie zespołu w zakresie dostępu do danych i ich jakości.
Twój profil
Musisz mieć:
Python - solidne fundamenty i doświadczenie w przetwarzaniu danych (np. z użyciem biblioteki Pandas).
SQL i PostgreSQL - zaawansowane umiejętności, w tym projektowanie schematów, optymalizacja zapytań i zarządzanie bazą.
Doświadczenie w ETL / Inżynierii Danych - praktyczna umiejętność budowania procesów do ekstrakcji i transformacji danych.
Integracje API - podstawowe doświadczenie w pracy z API (REST, OAuth), szczególnie w kontekście pobierania danych.
Będzie dużym plusem:
Doświadczenie z Microsoft Graph API do integracji z Outlook/SharePoint.
Znajomość bibliotek do parsowania dokumentów (np. pypdf, python-docx).
Praktyczna znajomość Dockera do konteneryzacji skryptów.
Podstawowa wiedza na temat LLM i systemów RAG.
Doświadczenie z rozszerzeniem pgvector dla PostgreSQL.
Umiejętności miękkie:
Skrupulatność i dbałość o szczegóły - jakość danych jest kluczowa.
Umiejętność współpracy - będziesz blisko pracować z pozostałymi członkami zespołu AI.
Samodzielność w rozwiązywaniu problemów związanych z danymi.
Co oferujemy?
Atrakcyjne wynagrodzenie (dla 1/2 etatu)
5,000 - 10,000 PLN netto
Rozwój i technologie
Praca z najnowszymi modelami AI i możliwość nauki od seniorów w zespole.
Net per month - B2B
Gross per month - Permanent
Check similar offers