#1 Job Board for tech industry in Europe

AI Developer – Document Intelligence (Python/NLP/OCR/GenAI)
New
AI/ML

AI Developer – Document Intelligence (Python/NLP/OCR/GenAI)

47 - 53 USD/hNet per hour - B2B
47 - 53 USD/hNet per hour - B2B
Type of work
Full-time
Experience
Mid
Employment Type
B2B
Operating mode
Remote

Tech stack

    English

    C1

    Machine Learning

    regular

    NLP

    regular

    LLM

    regular

    Information Extraction

    regular

    Open-source OCR Tools

    regular

    Document AI

    regular

    Python

    regular

    Generative AI

    regular

Job description

Online interview

Lokalizacja: Zdalnie, z okazjonalnymi wizytami w biurze

Forma współpracy: Full-time / B2B

Branża: Bankowość

Start: ASAP / do ustalenia

Czas trwania projektu: Min. 12 miesięcy z możliwością przedłużenia

Język projektu: Angielski


Opis projektu:

Poszukujemy doświadczonego AI Developera, który wniesie silne kompetencje w obszarze Document AI, Information Extraction oraz Generative AI. Projekt obejmuje rozwój i wdrażanie modeli do ekstrakcji i klasyfikacji danych z dokumentów strukturalnych i niestrukturalnych (PDF, skany, obrazy), z wykorzystaniem narzędzi OCR i NLP oraz nowoczesnych podejść opartych na GenAI.


Zakres obowiązków:

  • Projektowanie i wdrażanie modeli do ekstrakcji danych z dokumentów
  • Tworzenie rozwiązań klasyfikujących dokumenty przy użyciu NLP i GenAI
  • Przetwarzanie dokumentów różnego typu (umowy, faktury, CV, wnioski itp.)
  • Integracja open-source narzędzi OCR z pipeline’ami NLP/ML
  • Współpraca z zespołami biznesowymi i developerskimi
  • Udział w pełnym cyklu tworzenia rozwiązań: od prototypu do produkcji
  • Praca w środowisku Agile/DevOps z CI/CD


Wymagania kluczowe – czego szukamy:

  1. Doświadczenie w Document AI / Information Extraction
  • Praktyczna praca z dokumentami strukturalnymi i niestrukturalnymi
  • Wykorzystanie NLP/OCR do ekstrakcji danych (np. nazwy, daty, adresy)
  • Tworzenie modeli klasyfikujących i wyodrębniających informacje z dokumentów
  1. Generative AI w kontekście dokumentów
  • Zastosowanie LLM (np. GPT, LLaMA) do klasyfikacji lub ekstrakcji treści
  • Znajomość technik takich jak prompting lub fine-tuning
  • Umiejętność wyjaśnienia realnego use-case GenAI z dokumentami
  1. Znajomość open-source OCR tools
  • Praca z narzędziami takimi jak: Tesseract, LayoutLM, DocTR, PaddleOCR
  • Rozumienie ich ograniczeń i decyzji, kiedy użyć własnego modelu lub API
  1. Bardzo dobre umiejętności w Python + ML/NLP
  • Swobodne programowanie w Pythonie
  • Znajomość pipeline’ów ML (np. scikit-learn, spaCy, Hugging Face)
  • Użycie RegEx, OpenCV, NLP do przetwarzania tekstów i obrazów
  1. Zdolność do projektowania rozwiązań od A do Z
  • Umiejętność zaproponowania podejścia do typowych zadań (np. klasyfikacja faktury vs. CV)
  • Przenoszenie wiedzy między projektami, myślenie inżynierskie i analityczne



47 - 53 USD/h

Net per hour - B2B

Apply for this job

File upload
Add document

Format: PDF, DOCX, JPEG, PNG. Max size 5 MB

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Informujemy, że administratorem danych jest emagine z siedzibą w Warszawie, ul.Domaniewskiej 39A (dalej jako "administra...more