Wywiady

Dzięki Data Science dążymy do tego, by potencjalny pacjent nie stał się pacjentem. Wywiad z dyrektorami IQVIA

IQVIA

Piotr i Maciej z IQVIA omówili ostatnio działania związane z big data w ramach rozwiązań Real World & Analytics firmy IQVIA. Poniżej znajduje się transkrypcja tego wywiadu i dogłębne wyjaśnienie wykorzystania big data do napędzania rozwoju opieki zdrowotnej.

English version here

IQVIA określa się jako „The Human Data Science Company”. Co to dla Was oznacza, jak to rozumiecie?

Piotr Kaczor: Termin ‘human data science’ jest nawet dla nas dość nowy. To połączenie badań nad człowiekiem, jego fizjologią, zachowaniami, szeroko pojętym zdrowiem a komputerową analizą danych opartą na statystyce czy uczeniu maszynowym.

Żyjąc w dzisiejszym świecie niemal w każdej sekundzie generujemy potężne ilości danych, w tym informacji o swoim samopoczuciu (ciśnienie / saturacja / oddech), przyjmowanych lekach, przebytych zabiegach, pokonanych kilometrach, swoim stylu odżywiania, zwyczajach czy formie spędzania wolnego czasu. Każde z tych zdarzeń ma potencjalny wpływ na nasze zdrowie – to obecne, ale przede wszystkim to przyszłe.

Człowiek od setek lat formułował tezy dotyczące zdrowego stylu życia czy sposobów leczenia konkretnych dolegliwości. Dzięki współczesnej technice mamy okazję nie tylko poprzeć te tezy liczbami, ale też odkryć kilka dodatkowych, nieznanych dotychczas zależności w oparciu o gromadzone dane.

Maciej Piotrowski: Termin ten dobrze oddaje też, gdzie są nasze główne kompetencje i najsilniejsze punkty. Pomagamy klientom i pośrednio pacjentom, tworząc rozwiązania oparte na Data Science — odnajdywanie zależności, wyciąganie wniosków i przewidywanie zdarzeń na podstawie danych. Przy czym w naszym przypadku są to dane o człowieku, pacjencie lub potencjalnym pacjencie. Wiele z naszych rozwiązań do tego właśnie dąży, żeby potencjalny pacjent (osoba zagrożona jakąś komplikacją lub chorobą) nie stał się pacjentem.

Czyli mamy aspekt ludzki (human), danych (data), ale sam termin „Data Science” ma również bardzo techniczne konotacje jako dziedzina inżynieryjna. I to też jest ważne, jesteśmy firmą skupioną na konkretnej dziedzinie, ale do szpiku kości technologiczną! 

Czym zajmuje się dział Real World Solutions w IQVIA?

Piotr Kaczor: Dział RWS zajmuje się właśnie gromadzeniem danych medycznych na poparcie sformułowanych wniosków lub generowanie nowych spostrzeżeń w oparciu o te dane. Od prób klinicznych, poprzez ankiety, informacje sprzedażowe, informacje o wizytach w placówkach medycznych, dane o działaniach niepożądanych leków, roszczenia u ubezpieczycieli, po analizę wiadomości z portali społecznościowych czy danych gromadzonych przez zakładane na ciało urządzenia.

Wszystkie te informacje są poddawane starannej obróbce pod kątem prywatności (ryzyko identyfikacji pojedynczej osoby, utraty danych), spójności (wewnątrz zbioru, pomiędzy zbiorami, ale też pomiędzy dostawcami danych) oraz jakości (eliminacja danych niereprezentatywnych, uzupełnianie braków w danych). Tak przygotowane dane są przechowywane w formie zapewniającej wydajne raportowanie lub wysyłkę do odbiorcy końcowego.

Maciej Piotrowski: Następnie bierzemy te dane, o których mówimy „analytically ready data”, i używamy ich do analityki. Od prostych ekstraktów danych, przez interaktywne eksploracje danych w stylu Business Intelligence aż po dedykowane aplikacje analityczne, pozwalające budować tzw. kohorty (grupy pacjentów, których historia medyczna spełnia pewne, często bardzo złożone kryteria) i na tych kohortach uruchamiać zaawansowane modele statystyczne i Machine Learningowe. Tworzymy również aplikacje bliżej czasu rzeczywistego, które np. analizują wyniki badań pacjentów i podnoszą alert, jeśli odkryją zagrożenie zdarzenia niepożądanego.

Aplikacje te dostępne są w trybie SaaS, ale pracujemy również klientami, budując dla nich dedykowane modele, adresujące bardzo specyficzne przypadki. 

Pracujemy również z klientami, aby pomóc im przetworzyć ich dane do postaci, w której mogą być częścią międzyośrodkowych sieci badawczych, jak EHDEN czy OHDSI. 

Zajmujecie się głównie analityką medycznych danych. Co jest głównym celem Waszej pracy?

Piotr Kaczor: Jesteśmy częścią globalnej organizacji i wdrażamy projekty międzynarodowe. Zatrudniamy osoby na różnych poziomach doświadczenia i specjalizacji – developerów, testerów, architektów, scrum-masterów, product-ownerów, people-managerów. Polska część naszego zespołu (około 100 osób w Polsce, w Warszawie lub zdalnie) skupia się na tworzeniu ekosystemu aplikacji w obszarze Big Data, tzw. Data Factory, które są używane do przetwarzania „brudnych” danych ze świata (Real World Data) i tworzenia z nich czystych, jednorodnych, statystycznie poprawnych zbiorów danych. 

Maciej Piotrowski: Uściśliłbym, że zajmujemy się nie tyle stricte analityką, co tworzeniem narzędzi i platform, które pozwalają taką analitykę robić szybko, wydajnie i powtarzalnie. To, co jest istotnym elementem naszych rozwiązań to fakt, że muszą być skalowalne — powinny pozwalać na użycie w wielu krajach, do danych pochodzących z różnych źródeł i służących do różnych celów. To prawdziwa sztuka i duże wyzwanie — zaprojektować i zbudować systemy tak, żeby spełniły dzisiejsze potrzeby i dały się łatwo rozszerzyć na przypadki, o których w tej chwili nie wiemy.

W jaki sposób zebrane dane mogą pomagać w tworzeniu najlepszych rozwiązań dla pacjentów?

Piotr Kaczor: Gromadzone przez nas dane umożliwiają analizę m.in. trendów epidemiologicznych jednocześnie w wielu krajach na świecie. Dodatkowo pozwalają zidentyfikować pacjentów zagrożonych chorobą lub zaostrzeniem. To z kolei umożliwia placówkom medycznym udostępniającym nam dane kontakt z pacjentem i reakcję wyprzedzającą, pozwalając na zapobieganie wystąpieniu choroby lub jej wykrycie na wczesnym etapie zaawansowania.

Wiedząc, na jakie schorzenia leczą się pacjenci w danej placówce, jesteśmy też w stanie podpowiedzieć optymalne miejsca do przeprowadzania prób klinicznych nowo testowanych leków. Na podstawie otrzymywanych recept z kolei możemy szacować długość i skuteczność terapii (dawki leków, okres przyjmowania), a nawet sugerować zmianę leczenia w kierunku bardziej skutecznych specyfików.

Jakie dane zbieracie w IQVIA? W jaki sposób je filtrujecie?

Piotr Kaczor: W naszym dziale koncentrujemy się na zbieraniu tzw. ‘Electronic Medical Records’, w skrócie EMR, czyli wszelkich danych związanych z kontaktem pacjenta z placówką medyczną. Będą to zatem informacje słownikowe o pacjencie, placówce, lekarzu oraz powiązane z nimi zdarzenia medyczne (diagnozy, zgłoszone problemy, alergie, recepty, wykonane testy laboratoryjne i ich wyniki, szczepienia, skierowania, czy wywiad rodzinny).

Jak wspominaliśmy wcześniej, dane te, zgodnie z RODO (lub stosownymi normami światowymi jak GDPR czy HIPAA), są wstępnie anonimizowane (zamiana identyfikatorów, detekcja i zamiana fragmentów tekstu w polach tekstowych) i wykonywana jest ocena ryzyka reidentyfikacji. W wyniku przeprowadzonej oceny konieczne mogą być dalsze modyfikacje danych, zmierzające do ograniczenia ryzyka reidentyfikacji (np. wiek pacjenta powyżej 100 lat czyni go silnie identyfikowalnym w danym regionie kraju). Następnie dane są sprawdzane pod kątem legalności (placówka z ważną umową) oraz jakości przesyłanych danych.

Warto przy tym nadmienić, że IQVIA nie jest prawnym właścicielem większości posiadanych danych, a ich zakup jak zwykle wiąże się z opłatą. W efekcie, w przeciwieństwie do firm z sektora finansowego lub sprzedaży, IQVIA z założenia nie posiada wszystkich danych rynkowych i z większą swobodą przedkłada poprawność danych nad ich kompletność. Wątpliwej jakości dane są odrzucane, a wszelkie braki w danych (z powodu odrzucenia lub braku umowy na dostarczanie) są uzupełniane po załadowaniu do hurtowni. 

Maciej Piotrowski: Podkreśliłbym aspekt zapewnienia, że pacjenci nie mogą zostać zidentyfikowani. Jest to prawdopodobnie najbardziej fundamentalna cecha naszych rozwiązań, która wymusza np. wielostopniowe (w różnych fizycznych lokalizacjach i operowane przez różne podmioty) procesowanie.

To, co wyróżnia nasze rozwiązania to fakt, że nie tylko aplikujemy transformacje, ale jak wspomniał Piotr, używamy metodyki i rozwiązań, które kwantyfikują ryzyko identyfikacji. Czyli nie tylko usuwamy pewne wrażliwe informacje i mamy nadzieję, że to wystarczy, ale rygorystycznie sprawdzamy i obliczamy, czy to ryzyko faktycznie zostało obniżone do zadanego poziomu.

Kto korzysta z Waszej pracy, z zebranych przez Was danych?

Piotr Kaczor: Nasze dane to ogromna kopalnia wiedzy dla placówek medycznych, instytucji zdrowia publicznego, firm farmaceutycznych, lekarzy, firm ubezpieczeniowych i wielu innych. Nasi klienci cenią przede wszystkim możliwość analizy danych i formułowania wniosków w oparciu o dane z wielu krajów jednocześnie. Ufają jakości i poprawności prezentowanych informacji. Chcą korzystać z doświadczenia, jakie IQVIA (a wcześniej IMS i QUINTILES) zgromadziła, będąc od lat światowym liderem w branży zdrowotnej.

Gdziekolwiek widzisz dopisek: ‘na podstawie danych firmy analitycznej IQVIA z 2022 roku’ – to mogą być dane, które nasz dział gromadzi.

Maciej Piotrowski: Co ciekawe, zdarza się, że sami nie wiemy, do jakich badań zostaną użyte nasze dane. Zapewniamy ich jakość i dostępność, mając na uwadze pewne zastosowania, a często okazuje się, że dane znajdują drugie i trzecie życie, pomagając w projektach, których początkowo nawet sobie nie wyobrażaliśmy. Współpracujemy z wieloma zespołami, które dostarczają projekty dla bardzo różnych segmentów użytkowników, od dużych firm farmaceutycznych przez MedTech, Biotech, ubezpieczycieli, szpitale, na krajowych i regionalnych rządach kończąc.

Jak trafiliście do IQVIA? 

Piotr Kaczor: W moim przypadku to dość ciekawa historia. Od czasu studiów byłem zainteresowany nowinkami w dziedzinie hurtowni danych. Pracując w Wielkiej Brytanii miałem okazję dobrze poznać dość innowacyjną jak na tamte czasy technologię Netezza. Niestety po powrocie do Polski okazało się, że jedyne miejsce pracy związane z tą technologią wiązało się z próbą sprzedaży tej technologii na okolicznych rynkach. Ja jednak chciałem przede wszystkim dostarczać wartość w oparciu o nowe technologie, nie zaś je reklamować czy pisać.

Gdy szukałem pracy, natrafiłem na ofertę firmy IMS (dawna IQVIA). Oferta dotyczyła ‘developera baz danych Oracle’, ale krótka weryfikacja profili pracowników z USA (tam mieści się siedziba firmy) pozwoliła mi stwierdzić, że gdzieś w tej firmie jest dział pracujący z Netezza. Zaryzykowałem — zdecydowałem się aplikować na stanowisko, jednocześnie  zaznaczając, że interesuje mnie wyłącznie praca z ówczesnym (jak się później okazało) dyrektorem działu hurtowni danych.

Miałem szczęście – trafiłem na managera, który widząc moją pasję, skontaktował mnie z wybraną osobą, a ta zgodziła się przyjąć pracownika w Polsce, by wesprzeć nowo powstałe hurtownie danych w Wielkiej Brytanii i Niemczech oraz zapewnić rozwój technologii w regionie. IQVIA otworzyła dla mnie miejsce pracy, którego w tym regionie wcześniej nie planowała. A wszystko dzięki otwartości umysłów dwóch ludzi, których za to do dziś podziwiam.

Maciej Piotrowski: Ja również całe zawodowe życie miałem do czynienia z danymi i analityką. Przez pewien czas pełniłem „szersze” role (np. jako Chief Technology Officer byłem odpowiedzialny za wszystkie aspekty IT i wytyczanie kierunków technologicznego rozwoju i innowacji), natomiast najwięcej frajdy miałem przy pracy nad tematami związanymi z danymi i tym, jakie cuda można na ich podstawie wyczarować.

Dość długo szukałem firmy, dla której dane to core business, a która równocześnie byłaby na tyle zaawansowana technologicznie i złożona biznesowo, żebym mógł dalej rozwijać się w kierunku wytyczania strategii, tworzenia platform, produktów i rozwiązań. IQVIA jest takim miejscem. Chociaż przyznaję, że złożoności biznesowej i technologicznej nie doceniałem — jest to firma, której ciągle się uczę i mam wrażenie, że zmienia i rozwija się tak szybko, że nigdy nie zgłębię więcej niż ułamka jej możliwości.

Jakie stanowiska wcześniej zajmowaliście? Od czego zaczynaliście w IT?

Piotr Kaczor: Swoją karierę zawodową zaczynałem już na trzecim roku studiów. Firma też notabene z branży pokrewnej, farmaceutycznej – jako administrator bazy danych. Później pracowałem dla wielu innych sektorów – kolejno w branżach: telekomunikacyjnej, sprzedaży detalicznej, kilku instytucjach finansowych, paliwowej. Zajmowałem się nawet monitoringiem infrastruktury sieciowej czy szkoleniami z podstaw SQL.

Pracowałem w Polsce, w firmach lokalnych i korporacjach międzynarodowych, w Wielkiej Brytanii w firmie wykonującej analizy danych na rynku amerykańskim. Zawsze z bazami danych, z ciągle rosnącym ich wolumenem. Od pierwszej tradycyjnej hurtowni w Oracle, przez erę tzw. appliance (logika baz danych wspomagana sprzętowo) w Teradata, potem Netezza. Następnie już w ramach IQVIA – Cloudera BigData, a w ostatnich latach DataBricks czy SnowFlake. Przez dwa lata byłem analitykiem, kolejne dwa – developerem. Potem zacząłem projektować systemy baz danych jako architekt aplikacji – łącznie około pięciu lat.

Ostatnie pięć lat to z kolei praca z większą liczbą zespołów implementacyjnych jednocześnie – trochę w roli architekta aplikacji, trochę eksperta technologicznego, trochę jako architekt systemowy, a czasami jako wsparcie operacyjne.

Maciej Piotrowski: Moja ścieżka była dość typowa, przynajmniej na początku. Zaczynałem jako developer w Hewlett-Packard w obszarze Hurtowni Danych i Business Intelligence, później jako Technical Leader i Architekt Rozwiązań. Dzięki HP poznałem specyfikę pracy w globalnej korporacji i, głównie dla globalnych korporacji.

Następnie kilka lat spędziłem w consultingu w małej szwajcarskiej firmie, doradzając klientom z branży finansowej. Dużo klientów, dużo projektów, ciekawe i szybko zmieniające się otoczenie, ale brakowało mi możliwości realnego wpływania na rzeczywistość oraz sprzężenia zwrotnego — czy strategie, które definiuję dla klientów faktycznie działają? Nieustające podróże po świecie też dołożyły się do tego, że wróciłem do stabilniejszego świata amerykańskich korporacji.

Pełniłem różnorodne role jak choćby wspomniana wcześniej pozycja CTO, ale zawsze związane z architekturą i technologią. Nauczyłem się jednak, że udane rozwiązanie IT to dużo więcej niż poprawny design i doskonałe komponenty. Od kilku lat staram się jak najlepiej wykorzystać tę wiedzę i doświadczenie w IQVIA, gdzie po raz pierwszy w moim życiu zawodowym tworzę platformy i rozwiązania, które mogą poprawić ludzkie życie i zdrowie.  

Co najbardziej Wam się podoba w Waszej obecnej pracy w IQVIA?

Maciej Piotrowski: Właśnie ten aspekt tworzenia rozwiązań, które robią coś bardziej znaczącego, niż optymalizacja zysków z reklam. Nic nie ujmując licznym kolegom i koleżankom, którzy właśnie tym się zajmują 🙂 

Pracujemy na styku dwóch bardzo dynamicznych branży – technologii i medycyny – nie ma czasu na stanie w miejscu, trzeba nieustająco rozwijać zarówno ludzi, jak i nasze platformy i produkty. Bardzo cenię sobie decyzyjność i elastyczność – mimo dużych rozmiarów firma nie nakłada sztucznych ograniczeń, które utrudniałyby tworzenie “cutting edge” rozwiązań. Na szczęście w IQVIA jest ogromna pula ekspertów z przeróżnych dziedzin, jest więc od kogo się uczyć i u kogo szukać inspiracji.

Piotr Kaczor: W swojej pracy od początku ceniłem możliwość pracy w gronie międzynarodowym. Różnice regionalne i kulturowe dają mi wspaniałą okazję na poznanie nie tylko zwyczajów innych ludzi, ale też pozwalają ‘spojrzeć na świat cudzymi oczami’ i przez to lepiej zrozumieć otaczającą nas rzeczywistość.

Uwielbiam też pracę w obszarze hurtowni danych, zwłaszcza gdy wolumen danych jest na tyle duży, by efektywne jego przetwarzanie było wymagające, a uzyskiwane rezultaty trudne z góry do przewidzenia. Dodatkowo lubię prowadzić prezentacje, prowadzić szkolenia, dzielić się wiedzą lub spostrzeżeniami. Na szczęście moja praca daje mi z roku na rok coraz więcej okazji ku temu.

Jaką widzicie przyszłość dla analityki i AI w zakresie usług medycznych?

Piotr Kaczor: To bardzo interesujące pytanie. Z jednej strony sztuczna inteligencja w medycynie to olbrzymi potencjał zarówno w zakresie odkrywania wiedzy, jak i automatyzacji wielu kosztownych dziś procesów. Jak dobrze wiemy, danych z roku na rok przybywa wykładniczo – nie sposób zatem na drodze prostej analizy odszukać i przetworzyć istotne dla nas informacje.

Z drugiej – to spore ryzyko, bo współczesne algorytmy coraz rzadziej prezentują w sposób jasny i jednoznaczny, jak doszły do podanych wniosków (można co najwyżej ocenić dokładność modelu na bazie danych testowych). I choć generowane komputerowo wnioski i modele są na ogół poprawne, kluczowa wydaje się kwestia jakości danych prowadzących do podejmowanych decyzji. Weźmy jako przykład ocenę stanu zdrowia pacjenta – jak komputerowo ocenić, czy lekko zaczerwieniona ręka pacjenta to zwykłe otarcie, rumień czy reakcja alergiczna?

Niewykluczone, że przyszłość analityki w medycynie będzie zależała właśnie od prawidłowości oceny rzeczywistości i jakości wprowadzanych danych. Z zafałszowanych danych ciężko w końcu o prawidłowe wnioski.

Maciej Piotrowski: W pełni zgadzam się z Piotrem. Jakość i szybka dostępność danych może nie jest tematem sexy, ale mającym ogromny wpływ na użyteczność tworzonych przez nas systemów. Dobrym przykładem jest to, jak mało AI pomógł klinicznie podczas walki z COVID-19 (mimo setek stworzonych rozwiązań). Jeśli dane nie są odpowiednio przygotowane, sztuczna inteligencja uczy się np. rozróżniać pacjentów stojących od leżących lub młodszych od starszych (zamiast mniej lub bardziej zagrożonych powikłaniami) – takie błędy naprawdę zostały popełnione w pandemii!

Widzimy coraz więcej rozwiązań opartych na Sztucznej Inteligencji dopuszczanych do zastosowań klinicznych, choćby w radiologii czy przy tworzeniu nowych leków. Ale chciałbym zwrócić uwagę na dwa obszary, prowadzące do zwiększenia użyteczności i zakresu AI w medycynie. 

Pierwszym jest ochrona danych i prywatności. Widzimy tu bardzo dynamiczny rozwój – rozwiązania pozwalające na uczenie modeli bez dostępu do danych źródłowych, centralne przetwarzanie danych przy zachowaniu pełnej kontroli nad tym, kto, kiedy i do czego ich używa, tworzenie rozproszonych sieci właścicieli danych, którzy bez wymieniania się danymi razem prowadzą badania i ulepszają modele czy publikowanie danych tak, by były użyteczne, ale nie pozwalały na zidentyfikowanie pacjenta. Tematy takie, jak federated learning, confidential computing czy differential privacy będą z pewnością otwierać nowe furtki w rozpowszechnianiu sztucznej inteligencji. 

Drugim jest explainability, czyli funkcjonalność, dzięki której model AI tłumaczy nam, czemu zwraca taki a nie inny wynik (rekomendację, predykcję, klasyfikację, etc.). Widzimy to we wdrożeniach AI w kontekście klinicznym – dużo większę użyteczność i wartość mają rozwiązania, które pozwalają personelowi medycznemu samodzielnie podejmować decyzje (z wsparciem AI). A żeby AI mógł być dobrym doradcą i pomocnikiem, musi umieć jasno wytłumaczyć nie tylko co, ale również dlaczego sugeruje.


Jako wiodąca światowa firma zajmująca się danymi i analizą zdrowia ludzkiego, IQVIA ma do czynienia z danymi rzeczywistymi — ze źródeł związanych z wynikami w heterogenicznych populacjach pacjentów oraz z big data, czyli niezwykle dużymi zbiorami danych, które przy analizie obliczeniowej ujawniają wzorce, trendy i skojarzenia.

Aby osiągnąć cel, jakim jest zrozumienie funkcjonowania opieki zdrowotnej w ponad 100 krajach na całym świecie, IQVIA czerpie dane z miliona źródeł, które dają dostęp do 100 miliardów rekordów opieki zdrowotnej, w tym 600 milionów anonimowych rekordów pacjentów w ponad 100 krajach. Obsługa tych danych wymaga ogromnej infrastruktury technologicznej. 

Częścią ogromnej infrastruktury technologicznej jest Data Factory, która przetwarza elektroniczną dokumentację medyczną (EMR), w tym dane dotyczące pseudoanonimowych pacjentów i lekarzy, wizyt lekarskich, recept, badań laboratoryjnych, diagnoz, szczepień, alergii, problemów z opieką zdrowotną i innych. The Data Factory zatrudnia ponad 100 członków zespołu w Polsce, Francji, Wielkiej Brytanii i Niemczech.

Piotr Kaczor. Associate director, IT Architecture w IQVIA jest odpowiedzialny za kompleksowe projektowanie hurtowni danych dla służby zdrowia dla lokalnych zespołów IQVIA na całym świecie. Obejmuje to projektowanie i wdrażanie systemów przetwarzania danych dla EMR oraz ich rozwój (jakość danych, aplikacje i hurtownie oraz rozwój referencyjnej bazy danych). Jego 15-letnie doświadczenie obejmuje pracę z BigData od 2016 roku, a wcześniej z technologią Oracle, Teradata i IBM PureData for Analytics (Netezza).

Maciej Piotrowski. Dyrektor, IT Architecture w IQVIA jest odpowiedzialny za definiowanie strategii technologicznej dla organizacji rozwiązań Real World & Analytics w IQVIA, ze szczególnym uwzględnieniem systemów danych. Jest odpowiedzialny za definiowanie i wdrażanie strategii technologicznej dla produktów z obszaru transformacji danych, analityki i sztucznej inteligencji.

Od ponad ośmiu lat pracuje jako redaktorka, dziennikarka i copywriterka, a od niedawna dba o treści oraz rozwój portalu poświęconego branży IT. Autorka wywiadów, tekstów eksperckich, newsów.

Podobne artykuły

[wpdevart_facebook_comment curent_url="https://justjoin.it/blog/data-science-iqvia" order_type="social" width="100%" count_of_comments="8" ]