Architekt ds. Automatyzacji AI

Python

Architekt ds. Automatyzacji AI

Python
Part-time
Permanent, B2B
Mid
Hybrid
1 377 - 2 754 USD
Gross per month - Permanent
1 377 - 2 754 USD
Net per month - B2B

Job description

Lokalizacja: Suchy Dwór k/Wrocławia lub HO

Zatrudnienie: B2B / UoP (część etatu - 20h/tyg.)

Doświadczenie: Mid


Dołącz do naszego Zespołu AI i zbuduj z nami firmowe repozytorium wiedzy.

Stworzyliśmy zespół AI, w skład którego wchodzą już doświadczony Mentor/Architekt oraz kreatywny Inżynier AI. Teraz szukamy trzeciej, kluczowej osoby, która pomoże nam w projekcie. Twoim głównym zadaniem będzie stworzenie i zarządzanie centralnym repozytorium wiedzy, które stanie się fundamentem dla naszych zaawansowanych automatyzacji opartych na AI (Claude, Gemini).

To nie jest standardowa praca programisty – to pozycja dla kogoś, kto chce specjalizować się w przygotowywaniu danych dla najnowszych systemów AI.


Co będziesz robić?

Twoim głównym celem będzie budowa i utrzymanie repozytorium wiedzy w PostgreSQL.


Inżynieria i Integracja Danych:

  • Projektowanie i implementacja potoków danych (ETL/ELT) do pobierania informacji z różnorodnych źródeł:

    • Poczta e-mail: Integracja z ok. 30 skrzynkami Microsoft 365 (przez Graph API).

    • Dokumenty: Przetwarzanie i ekstrakcja treści z setek dokumentów (PDF, Word, Excel).

    • Bazy danych: Pobieranie i synchronizacja danych z istniejących baz SQL (SQL Server).

  • Czyszczenie, strukturyzacja i przygotowywanie danych do dalszego wykorzystania przez modele AI.

  • Zapewnienie jakości i spójności danych w repozytorium.


Budowa Repozytorium Wiedzy dla AI:

  • Projektowanie i implementacja schematu bazy danych PostgreSQL zoptymalizowanej pod kątem wyszukiwania semantycznego.

  • Implementacja procesów chunkingu (dzielenia dokumentów na mniejsze fragmenty) i wektoryzacji danych.

  • Ścisła współpraca z Inżynierem AI w celu udostępniania danych jako kontekst dla zapytań do modeli językowych.


Wsparcie i Utrzymanie:

  • Monitorowanie procesów ETL i zapewnienie ich niezawodności.

  • Optymalizacja zapytań i wydajności bazy danych PostgreSQL.

  • Wspieranie zespołu w zakresie dostępu do danych i ich jakości.


Twój profil


Musisz mieć:

  • Python - solidne fundamenty i doświadczenie w przetwarzaniu danych (np. z użyciem biblioteki Pandas).

  • SQL i PostgreSQL - zaawansowane umiejętności, w tym projektowanie schematów, optymalizacja zapytań i zarządzanie bazą.

  • Doświadczenie w ETL / Inżynierii Danych - praktyczna umiejętność budowania procesów do ekstrakcji i transformacji danych.

  • Integracje API - podstawowe doświadczenie w pracy z API (REST, OAuth), szczególnie w kontekście pobierania danych.


Będzie dużym plusem:

  • Doświadczenie z Microsoft Graph API do integracji z Outlook/SharePoint.

  • Znajomość bibliotek do parsowania dokumentów (np. pypdf, python-docx).

  • Praktyczna znajomość Dockera do konteneryzacji skryptów.

  • Podstawowa wiedza na temat LLM i systemów RAG.

  • Doświadczenie z rozszerzeniem pgvector dla PostgreSQL.


Umiejętności miękkie:

  • Skrupulatność i dbałość o szczegóły - jakość danych jest kluczowa.

  • Umiejętność współpracy - będziesz blisko pracować z pozostałymi członkami zespołu AI.

  • Samodzielność w rozwiązywaniu problemów związanych z danymi.


Co oferujemy?

  • Atrakcyjne wynagrodzenie (dla 1/2 etatu)

    • 5,000 - 10,000 PLN netto

  • Rozwój i technologie

    • Praca z najnowszymi modelami AI i możliwość nauki od seniorów w zespole.

Tech stack

    PostgreSQL

    regular

    ETL

    regular

    oauth

    regular

    REST API

    regular

    Pandas

    regular

    SQL

    regular

    Python

    regular

    LLM

    nice to have

    Docker

    nice to have

    Microsoft Graph API

    nice to have

Office location

Published: 15.07.2025