Senior Data Modeller

38 - 44 USDNet per hour - B2B
Data

Senior Data Modeller

Data
Śródmieście, Warszawa

Be in IT

Go to company profile
B2B Contract
B2B
Senior
Remote
38 - 44 USDNet per hour - B2B

Job description

Be in IT to firma rekrutacyjna, wyspecjalizowana w poszukiwaniu Specjalistów z branży technologii informatycznych. Obecnie, dla naszego klienta, poszukujemy osoby na stanowisko: Senior Data Modeller. 

Zakres obowiązków:

  • Długofalowa współpraca z międzynarodową, topową firmą consultingową realizującą projekty IT dla dużych i średnich organizacji z sektorów tj. automotive, finanse, bankowość oraz produkcja.

  • Poszukujemy 2 Senior Data Modellerów z dużym doświadczeniem w modelowaniu danych naukowych, biomedycznych lub badawczych, najlepiej w obszarach takich jak life sciences, badania translacyjne, biologia przyczynowa, genetyka, biologia chorób, knowledge engineering, harmonizacja danych lub regulowane środowiska danych badawczych.

  • Osoby na tym stanowisku będą wspierać projekt Causal Biology Tech Build, którego celem jest: rozwój i integracja wiedzy na temat przyczynowych oraz mechanistycznych podstaw chorób, zwiększenie liczby wniosków dotyczących zależności przyczynowych pomiędzy genami a chorobami, udostępnienie naukowcom R&D zintegrowanych produktów danych zgodnych z zasadami FAIR, umożliwiających szybkie wyszukiwanie informacji i podejmowanie decyzji.

Oczekujemy:

  • Prowadzenie strategii modelowania danych w obszarach harmonizacji danych, walidacji pipeline’ów, grafów wiedzy oraz produktów danych FAIR.

  • Przekładanie niejednoznacznych wymagań naukowych na przejrzyste kanoniczne modele danych.

  • Podejmowanie decyzji dotyczących ponownego wykorzystania, rozszerzania i mapowania ontologii wraz z dokumentowaniem uzasadnienia.

  • Definiowanie trwałych identyfikatorów oraz spójnych pól provenance we wszystkich zasobach danych.

  • Prowadzenie procesów przeglądu, zatwierdzania, wersjonowania i publikowania schematów danych.

  • Wczesna identyfikacja ryzyk związanych z modelowaniem danych, w tym: braków w metadanych, konfliktów pomiędzy ontologiami, problemów z jakością danych źródłowych, braków w lineage danych, ryzyk dotyczących kompatybilności z systemami downstream.

  • Projektowanie modułowych, wielokrotnego użytku i przyszłościowych modeli danych, zgodnych z zasadami FAIR oraz standardami organizacji.

  • Kandydaci powinni posiadać doświadczenie z: LinkML lub podobnymi frameworkami do modelowania schematów danych, tworzeniem schematów w formacie YAML, narzędziami do obsługi ontologii biomedycznych i kontrolowanych słowników, zasobami ontologicznymi, takimi jak HGNC, Ensembl, UniProt, MONDO, HPO, EFO, UBERON, Cell Ontology, Gene Ontology, ChEBI, OBI, LOINC, UCUM, ECO, SEPIO oraz Relation Ontology, technologiami modelowania semantycznego, takimi jak RDF, OWL, JSON-LD, SHACL, ShEx i SPARQL, modelowaniem grafów wiedzy, narzędziami typu schema registry lub model registry, katalogami danych i rejestrami metadanych, zarządzaniem słownikami danych, modelowaniem lineage i provenance danych, narzędziami do walidacji schematów i kontroli jakości danych, podejściami do mapowania danych źródłowych do modelu kanonicznego, oceną metadanych zgodnie z zasadami FAIR.

  • Bardzo dobre doświadczenie w konceptualnym, logicznym i kanonicznym modelowaniu danych dla złożonych domen biomedycznych lub naukowych.

  • Umiejętność modelowania encji biomedycznych, takich jak: geny, targety terapeutyczne, choroby, wskazania medyczne, fenotypy, mechanizmy biologiczne, biomarkery, tkanki, typy komórek, modalności testów i badań, dowody naukowe, pochodzenie danych, zależności przyczynowe. Duże doświadczenie w harmonizacji danych, w tym: mapowanie danych źródłowych do modelu kanonicznego, dopasowywanie kontrolowanych słowników, stosowanie trwałych identyfikatorów, modelowanie lineage i provenance danych. Praktyczne doświadczenie z LinkML lub podobnymi frameworkami do modelowania schematów danych, obejmujące: klasy, sloty i atrybuty, zakresy wartości, identyfikatory, pola wymagane, ograniczenia, kardynalność, opisy, powiązania z ontologiami.

  • Bardzo dobra znajomość zasad FAIR Data, w tym: findability, accessibility, interoperability, reusability, persistent identifiers, standardy metadanych, provenance, wersjonowanie schematów.

  • Doświadczenie w pracy z ontologiami biomedycznymi i kontrolowanymi słownikami, takimi jak: HGNC, Ensembl, UniProt, MONDO, Disease Ontology, HPO, EFO, UBERON, Cell Ontology, Gene Ontology, Reactome, KEGG, ChEBI, OBI, LOINC, UCUM, ECO, SEPIO, Relation Ontology, PATO.

  • Umiejętność definiowania reguł walidacyjnych i kontroli jakości danych, w tym: walidacja terminów ontologicznych, sprawdzanie zakresów wartości, kontrola wymaganych pól, weryfikacja spójności identyfikatorów i etykiet, kontrola spójności pomiędzy polami, weryfikacja kompletności informacji o pochodzeniu danych.

  • Umiejętność projektowania modeli danych wspierających: pipeline’y danych, API, grafy wiedzy, produkty danych FAIR, procesy analityczne, zapytania i potrzeby użytkowników z obszaru R&D. Doświadczenie w zarządzaniu cyklem życia schematów danych, w tym: repozytoria schematów oparte na GitHubie, semantic versioning, changelogi, wersjonowane releasy, słowniki danych, katalogi metadanych, analiza wpływu zmian na systemy downstream.

  • Umiejętność współpracy z zespołami i interesariuszami, takimi jak: Scientific Knowledge Engineering, eksperci domenowi Causal Biology, Data Engineering, Knowledge Graph Engineering, Product Management, Data Stewards, zespoły platformowe.

Oferujemy:

  • Długofalowa współpraca z wynagrodzeniem w przedziale 140-160 PLN netto/godz. + VAT.

  • Wsparcie przy zakładaniu i prowadzeniu działalności gospodarczej, dla osób bez takiego doświadczenia. 

  • Sprawny proces rekrutacyjny - dwie rozmowy techniczne z managerami, online (każda maksymalnie po godzinie). 

  • Współpraca w pełni zdalna, także w godzinach EST/UK. 

  • Benefity - prywatna opieka medyczna, karta Multisport. 

  • Nowoczesny sprzęt zapewniany przez firmę, wraz z softem i konfiguracją.

Tech stack

    English

    B2

    DATA MODELLING

    advanced

Office location

About the company

Be in IT

Be in IT to firma specjalizująca się w branży IT oraz oprogramowaniu, oferująca nowoczesne rozwiązania dla biznesu.
Company profile

Senior Data Modeller

38 - 44 USDNet per hour - B2B
Summary of the offer

Senior Data Modeller

Śródmieście, Warszawa
Be in IT
38 - 44 USDNet per hour - B2B
By applying, I consent to the processing of my personal data for the purpose of conducting the recruitment process. Oświadczam, że zapoznałem się z klauzulą informacyjną, zgodnie z Rozporządzeniem Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia... MoreThis site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.