LLM + Audio Developer
Szukamy programistki lub programisty na poziomie mocnego Juniora lub Regulara, który chce rozwijać się w obszarze przetwarzania mowy, audio oraz modeli językowych (LLM). Rola ma charakter badawczo-inżynieryjny i obejmuje zarówno pracę z danymi, jak i trenowanie oraz ewaluację modeli ASR i TTS. To dobra propozycja dla osób, które lubią eksperymentować, szybko prototypować rozwiązania i realnie wpływać na jakość systemów opartych o mowę.
Oferujemy
Umowa B2B 100-110 zł/h netto B2B
100% remote
Angielski B2
Obowiązki
Na tym stanowisku będziesz odpowiedzialna/y za przygotowanie i rozwój wielojęzycznych datasetów audio, w tym ich czyszczenie, normalizację oraz augmentację. Twoja praca będzie obejmować trenowanie, testowanie i porównywanie modeli automatycznego rozpoznawania mowy (ASR) oraz syntezy mowy (TTS), a także eksperymentowanie z nowymi architekturami, metodami augmentacji i technikami poprawy jakości danych.
Istotną częścią roli będzie prototypowanie i wdrażanie rozwiązań wykorzystujących LLM do pracy z tekstem, tłumaczeń oraz walidacji danych. Będziesz również prowadzić eksperymenty badawcze ukierunkowane na poprawę jakości rozpoznawania i syntezy mowy oraz pracować z dużymi wolumenami plików audio i danymi w formatach CSV i JSON.
Wymagania
Szukamy osoby z podstawową wiedzą z zakresu audio oraz DSP (Digital Signal Processing), która ma doświadczenie w pracy z danymi — w szczególności w ich czyszczeniu i augmentacji (mile widziane doświadczenie z danymi audio). Oczekujemy znajomości modeli ASR, takich jak Whisper czy NVIDIA NeMo, oraz modeli TTS, np. Piper, Kokoro, Zonos czy Coqui, a także podstawowego rozumienia phonemizerów i normalizacji tekstu w systemach TTS.
Ważne jest również doświadczenie w pracy z modelami językowymi (OpenAI, Gemini, Azure, HuggingFace) w kontekście przetwarzania tekstu, tłumaczeń oraz walidacji danych. W codziennej pracy niezbędna będzie dobra znajomość Pythona, środowiska Linux oraz Bash, a także podstawy DevOps. Szukamy osoby, która potrafi szybko prototypować rozwiązania, swobodnie porusza się w pracy badawczej i chętnie testuje nowe podejścia.
Na poziomie technicznym oczekujemy doświadczenia z bibliotekami takimi jak:
torch, transformers, datasets, huggingface_hub, openai, librosa, soundfile, torchaudio, numpy, pandas, scipy.
LLM + Audio Developer
LLM + Audio Developer