Inżynierowie NVIDIA stworzyli bardzo dokładny generator ludzkich twarzy
– Generative adversarial networks (GAN) uczą się generować zupełnie nowe obrazy, które naśladują wygląd prawdziwych zdjęć – czytamy w filmie przygotowanym na potrzeby publikacji wyników pracy trzech inżynierów NVIDIA. Opracowali oni algorytm, który z jednego zdjęcia profilowego (takiego jaki mamy np. w dowodzie osobistym) potrafi stworzyć kilkadziesiąt zdjęć wymyślonych postaci.
Spis treści
Jedno zdjęcie, tysiące interpretacji
Film przygotowany przez inżynierów wzbudził ogromne zainteresowanie, choć nie został udostępniony w trybie publicznym (tzn. nie znajdziemy go wpisując tytuł w wyszukiwarce YouTube). Od 12 grudnia obejrzało go ponad ćwierć miliona internautów, a to za sprawą takich stron jak reddit, hackernews czy polskiego wykop.pl. Inżynierowie pracujący w Nvidia pochwalili się w nim swoimi dokonaniami.
Trudno odmówić im tego, że mieli czym się pochwalić. Stworzyli bowiem model, który pozwala na wygenerowanie dowolnego zdjęcia fikcyjnej postaci. Wystarczy, że do bazy dodamy np. nasze zdjęcie profilowe, które będzie pewnego rodzaju bazą, a program przekształci je według swojego „pomysłu”. I tak fotografia kilkuletniego chłopca może przekształcić się w młodzieńca, mężczyznę i starca, dziewczynkę, dziewczynę, kobietę i staruszkę.
Automatyzacja
GAN pozwala nie tylko zmienić wiek, ale płeć czy kolor skóry. Zmianie ulega także długość nosa, uszu, szerokość ust, rozmieszczenie oczu, mimika twarzy, gęstość włosów i wiele innych czynników. To wszystko powoduje, że jedno zdjęcie może służyć do wytworzenia kilkudziesięciu innych. Tero Kerras FI, który opublikował film, ale jest też współautorem projektu, pod materiałem na YouTube zamieścił link do pracy tłumaczącej działanie algorytmu.
Tero Karras, Samuli Laine oraz Timo Aila proponują światu „nowy generator poprawiający stan techniki w zakresie tradycyjnych wskaźników jakości dystrybucji”. Ich dzieło pozwala na zautomatyzowanie procesu generowania twarzy. Niestety nie odpowiadają, czemu dokładnie miał by służyć. Pokazali jednak możliwości generatora, które można zastosować np. do edycji obrazu, czy tworzenia grafik od podstaw.
Problemy generatorów
W pracy naukowej opisali problemy, z którymi zazwyczaj spotykają się zainteresowani tematem generowania obrazów. Pisali o tym, że problemy sprawiało tło, czy też o tym, że wygenerowane zdjęcia jakościowo bardzo różniło się od oryginału. Zazwyczaj kontury postaci zostawały zamazane, co powodowało, że zdjęcie traciło na wiarygodności. Zdaje się, że ten problem właśnie rozwiązano, o czym dowiecie się z poniższego materiału.
Kilka miesięcy temu pisaliśmy o Ianie Goodfellow, który opracował GAN — dzięki niemu społeczność otrzymała narzędzie, które na zasadach open source może rozwijać według własnej wizji. Ian opracował algorytm wykorzystujący dwie sieci neuronowe. Jedna, działa jak fałszerz obrazu, a druga jak znawca sztuki — obie opierają swoją wiedzę na tym samym zbiorze danych. Pierwsza tworzy “własnoręczne” podpisy i zdjęcia. Druga analizuje dzieło tak, by rozpoznać, czy nie jest podróbką jakiegoś innego utworu. Więcej na ten temat dowiecie się z tego artykułu.