Fotografia zagrożona? Sztuczna inteligencja zamieni bazgroły w piękny krajobraz
GauGAN, nowy system stworzony przez lidera wśród dostawców kart graficznych, może stać się poważnym zagrożeniem dla zawodowych fotografów. W zaledwie kilka sekund technologia jest w stanie zamienić zwykłe gryzmoły w zapierające dech w piersiach krajobrazy.
Spis treści
Zamień szkice w fotorealizm
Najnowsze dziecko Nvidii, GauGAN, dzięki wykorzystaniu generatywnych sieci kontradyktoryjnych (GAN to zbiór algorytmów sztucznej inteligencji zdolny do samodzielnego uczenia się) pozwala nawet niewprawnym użytkownikom na zmianę zwykłych szkiców w fotorealistyczne krajobrazy w okamgnieniu.
Oferuje on trzy narzędzia do szkicowania: wiadro z farbą, pióro oraz ołówek. Aby stworzyć potencjalne dzieło sztuki konieczne jest też wybranie danego obiektu spośród dostępnych opcji, takich jak góra, chmura czy trawa. Narysowanie prostego obiektu składającego się z kilku kresek i kolorowych plam może dać piorunujący efekt. Zresztą zobaczcie sami.
Chodzi o detale
“Początkujący malarz może ustawić pędzel na płótnie, aby stworzyć oszałamiający krajobraz zachodzącego słońca, skaliste, pokryte śniegiem szczyty odbijające się w szklistym jeziorze – aby skończyć z czymś, co wygląda bardziej jak wielobarwny kleks”, czytamy na blogu Nvidii. “Ale model głębokiego uczenia się opracowany przez firmię NVIDIA Research może zrobić coś wręcz przeciwnego: zamienia gryzmoły w fotorealistyczne arcydzieła z zapierającą dech w piersiach łatwością”.
Oczywiście bliższe przyjrzenie się detalom wygenerowanego w ten sposób obrazu zdradza pewne niedoskonałości. Nie mamy przecież do czynienia z “tworzeniem” prawdziwych zdjęć, a wygenerowanym przez maszynę zlepkiem pikseli, który może je mniej lub bardziej przypominać. Tak czy inaczej należy uznać system za naprawdę zaawansowany, a można spodziewać się, że dalszy rozwój zaowocuje jeszcze lepszym produktem.
Sprytny algorytm
Cel przyświecający twórcom systemu GauGAN był jeden: na podstawie dostępnych informacji nauczyć algorytm tak wypełniać teksturami namalowane przez użytkownika obszary, aby efekt był jak najbardziej realistyczny. GAN, zbiór algorytmów sztucznej inteligencji zdolny do samodzielnej nauki, cechuje oczywiście pewne ograniczenie: nie jest on w stanie zrozumieć struktury świata fizycznego. Mimo tego mogą one dawać bardzo zadowalające wyniki dzięki umiejętnemu połączeniu dwóch elementów: generatora i dyskryminatora. Generator odpowiedzialny jest za tworzenie obrazów, które następnie przedstawia dyskryminatorowi. Ten drugi, wyszkolony poprzez obcowanie z rzeczywistymi obrazami, jest w stanie nauczyć generator, jak poprawić jakość tworzonych przez niego syntetycznych obrazów.
Droga do doskonałości
W obecnej formie GauGAN tworzy jedynie krajobrazy złożone z ziemi, wody i nieba, ale podstawowa sieć neuronowa jest zdolna do wypełniania obrazów innymi elementami, jak budynki czy drogi. Co ciekawe, GauGAN jest niederministyczny, co oznacza, że prawdopodobieństwo, że dwaj użytkownicy, którzy stworzą identyczny szkic przy wykorzystaniu tych samych ustawień, otrzymają dokładnie taki sam efekt jest znikome. Wszystko to dzięki zastosowaniu elementu losowego w kodzie, który ma wykluczać takie sytuacje.
GauGAN to nie pierwsze świetne narzędzie do tworzenia obrazów “udających” prawdziwe zdjęcia. Technologia Content-Aware Fill, za którą również odpowiada Nvidia, przy wykorzystaniu sztucznej inteligencji świetnie radzi sobie z wypełnianiem brakujących elementów zdjęcia w sposób kontekstowy. Przypomina to funkcję znaną z Photoshopa o tej samej nazwie. Od kilku lat Nvidia udoskonala również system generujący wyglądające jak zwykłe zdjęcia twarzy obrazy bazujące na portretach tysięcy rzeczywistych osób.
Źródło: spidersweb.pl