• Post comments:1 Komentarz

AI Art z punktu widzenia ilustratora

AI Art – wstęp

Jeśli pasjonujesz się malowaniem i tworzeniem, zakładam, że temat nie jest Ci obcy. A może jeszcze nie obił Ci się o uszy? Zazdroszczę!

Spróbuję opisać, co kryje się pod terminem AI Art i przedstawić moje przemyślenia związane z tematem, który rozpala do czerwoności fora internetowe i sekcje komentarzy na YouTube.

Na programowaniu się nie znam, więc działanie generatorów AI opiszę pobieżnie. Skupię się na swojej ocenie wpływu nowej technologii na pracę w zawodzie ilustratora. I nie ukrywam, że obaw mam więcej. Strachy trzeba oswajać, zamiast je pielęgnować, zatem zanurkujmy w wartki nurt postępów generatorów AI.

Możesz wysłuchać mojej opinii w poniższym filmie lub przeczytać szerszą wersję poniżej.

Co to AI Art/ sztuka SI?

Krótko: powstała niesamowita technologia, o której nam się nie śniło, ale sposób jej zastosowania i wprowadzenia woła o pomstę do nieba. Wierzę, że prędzej, czy później powstaną etyczne modele z na podstawie bazy danych z domeny publicznej i artystów, którzy zezwolą na taki użytek swoich prac. Używanie tak stworzonej technologii nie powinno budzić już zastrzeżeń natury moralnej. Inną sprawą jest, czy w ogóle chcemy jej używać.

Dłużej:

Postępy

Tematem generatorów obrazków zaczęłam interesować się w marcu, ale prace nad nimi trwały od lat. Idea opisania pomysłu słowami i otrzymania wyniku w postaci obrazu była ekscytująca!

Wygenerowane w Dream od Wombo

Po zabawach Dall-E Mini i aplikacją Dream od Wombo wzięłam się za testowanie nowo- pojawiających się na opcji: Disco Diffusion, Dall-E2 i MidJourney. Pierwsze obrazki miały mnóstwo anatomicznych błędów, artefaktów, ale już wtedy ich kolorystyka, tekstury robiły wrażenie. W lipcu, kiedy jakość wyników znacznie się poprawiła, a praca wygenerowana w MidJourney wygrała konkurs , jasne stało się dla mnie, że przyszłość może nie przedstawiać tak kolorowo i świetliście, jak na zwycięskiej pracy.

Ghost in the shell czy kradzież stulecia? Jak działają generatory

Tzw. modele AI (lub SI w polskiej wersji) nie mają inteligencji ani świadomości. Są to modele sieci neuronowych (neural networks). Zwał jak zwał, ale faktem jest, że ich możliwości zadziwiają!

Wpisujesz opis i puff! Dzieje się magia i wyskakuje ilustracja, o której Ci się nawet nie śniło, a co dopiero mówić o namalowaniu jej samodzielnie. Czasem opis wymaga doszlifowania i kilku tur generowania, by uzyskać zadowalający efekt. Często w ogóle nie jest możliwe uzyskanie dokładnego odwzorowania pomysłu. Nadal jest to porównywanie kilku-kilkunastu minut generowania i poprawiania opisów z godzinami malowania i latami nauki, by osiągnąć podobny poziom dopracowania ilustracji. To robi wrażenie, prawda?

To nie magia sprawia, że piksele układają się w określony wzór. To algorytm wytrenowany na ogromnych bazach danych zawierających indeksy niezliczonych ilości obrazów z Internetu wraz z ich opisami. Najpopularniejsza taka baza (korzysta z niej np. Stable Diffusion) to Laion-5B. Zawiera 5 miliardów zindeksowanych obrazów. Od dostępnych w domenie publicznej, przez obrazy chronione prawem autorskim po przypadki dokumentacji medycznej. Naturalnie nikt nie pytał właścicieli o zgodę na umieszczenie tych danych w indeksie i użycie ich do treningu tzw. modeli AI.

Baza powstała na potrzeby researchu, więc nie łamie praw autorskich w dzisiejszym ich brzmieniu, ale czy wykorzystywanie tych danych do treningu modeli jest w pełni legalne? Czy można to określić, jeśli dzisiejsze prawa autorskie w ogóle nie brały pod uwagę takiego użytku?

Same modele nie generują wyników, tworząc kolaże z prac znajdujących się w bazach danych, choć efekt czasem może na to wskazywać i jak najbardziej jest możliwe wygenerowanie obrazu bardzo przypominającego styl artysty zawartego w opisie (prompt). Ich sposób działania jest bardziej skomplikowany. Mówienie o tym, że generatory „kradną” jest moim zdaniem dużym uproszczeniem.

Czy można mówić o nadużyciu i wykorzystywaniu prac artystów? Jakość wyników zależy od jakości i ilości ilustracji i zdjęć zindeksowanych w bazie danych, a użytkownicy wielokrotnie w opisach zawierają nazwiska artystów, by odwzorować ich styl. Nawet wiedząc, że styl nie podlega ochronie autorskiej, uważam, że można.

Bitwa o prawa autorskie

Entuzjaści AI Art wskazują, że modele tworzą tak samo, jak ludzie: patrzą na zindeksowane ilustracje i obrazy w Internecie, używają ich jako referencji i „uczą się” je odtwarzać uważając, by ich nie powielać 1:1 (mechanizm overfitting). Z tymi różnicami, że robią to szybciej, mają nieskończenie większą możliwość zapamiętywania i odtwarzania raz „zobaczonych” wzorów. I nigdy nie zapominają. Dlatego nic nie da usunięcie obrazów z bazy danych po tym, jak model już zostanie wytrenowany. Konieczne byłoby usunięcie całego modelu.

Myślę, że to właśnie stoi za wypuszczeniem najpopularniejszego z nich -Stable Diffusion jako open source. Znajduje się dziś na milionach komputerów użytkowników i nie da się go wymazać odgórnie. To taka moja teoria spiskowa.

Jednocześnie tzw. „overfitting” ma zapobiec w utworzeniu wyniku zbyt podobnego do materiału wejściowego („nauczonego” w treningu), choć bywa z tym różnie.

Wracając do schematu uczenia się przez modele i artystów. Można wyszukać wiele podobieństw i różnic, ale myślę że to zupełnie bez sensu. Model po prostu nie jest człowiekiem, kropka.

Dlatego uważam, że legalność „treningu” modeli na materiałach chronionych przez prawa autorskie również jest mocno śliska. Wszelkie prawa zostały stworzone dla ludzi, biorąc pod uwagę ich możliwości i ograniczenia. Mam nadzieję, że wkrótce pojawią się legalne zapisy pozwalające odzyskać kontrolę nad tym, do czego używane są ich dzieła. W US właśnie złożony został pozew przeciwko Stable Diffusion, MidJourney i… Deviantart (popularny serwis dla artystów i twórców).

Również popularny serwis stockowy Getty Images wystosował pozew przeciwko Stability AI (firma stojąca za Stable Diffusion)

Ai art – zagrożenia

Prawa autorskie

Z grubsza ruszyliśmy najbardziej kontrowersyjny wątek, czyli obecność materiałów chronionych prawami autorskimi bez zgody autorów w danych do treningu bez możliwości ich usunięcia z powstałych modeli.

Po drugie — kto będzie odpowiadał za naruszenie praw autorskich, w przypadku, gdy użytkownik użyje modelu do wygenerowania pracy podchodzącej pod plagiat i zacznie na niej zarabiać. On sam? Twórcy modelu?

Modele nie mają własnej świadomości, nie podejmują świadomych decyzji, generując na podstawie opisów użytkowników. W marcu sąd w US odmówił przyznania praw autorskich wygenerowanemu obrazowi (źródło).

Stephen Thaler’s AI creation, A Recent Entrance to Paradise

Trudno też powiedzieć, kto jest autorem w przypadku, kiedy użytkownik dostarcza opis (występuje w roli klienta/art directora/ wizjonera, ale nie sprawcy/artysty), wyniki generatora oparte są na algorytmie i w dużej mierze przypadkowe. Na stronach z regulaminami np.  MidJourney znajdziemy zapis, że dysponujemy pełnią praw komercyjnych do stworzonych przez algorytm wyników, co stoi w sprzecznością z decyzją sądu w US. Zabawne tez jest, że kilka wersów dalej MidJourney całą odpowiedzialność prawną za ewentualne problemy z naruszeniami praw autorskich zrzuca na użytkownika. Myślę, że wygląda to co najmniej podejrzanie.

Użytkownicy mogą też wytrenować model na własnej bazie danych. Wszystko jest w porządku, gdy tworzymy ją na podstawie własne lub dostępne w domenie publicznej materiały. Niemniej nagminnie powstają na ściągniętych z Internetu obrazach ilustratorów bez ich zgody w celu odtworzenia ich stylu. Najbardziej wredne przykłady to model odtwarzający styl Kim Jung Gi zaraz po jego śmierci…

… albo konkurs na model najwierniej odtwarzający styl Sam Does Art.

AI idzie po Twoją pracę

Można spodziewać się, że w niejednej firmie szefostwo zastanowi się nie raz, czy na pewno potrzebuje studia graficznego, ilustratorów, fotografów, jeśli całkiem niezłe efekty może osiągnąć człowiek bez większej wiedzy artystycznej, ale potrafiący wpisać opis do generatora. Ten zaś za niewielką subskrypcję (MidJourney) lub za darmo (Stable Diffusion) wypluje z siebie dziesiątki wariacji.

To się już dzieje. Ludzie tracą pracę. Artyści nie są pierwszymi i nie będą ostatnimi ofiarami automatyzacji. Jednak nie znam bardziej bezczelnego przykładu „wysiudania” ludzi z zawodu przy (moim zdaniem bezprawnym) użyciu ich własnych dzieł przeciwko nim samym, na masową skalę…

Szybko okaże się, że generatory świetnie sobie radzą z ogólnymi tematami, kiedy nie ma szczegółowej wizji obrazu. W sytuacji, kiedy dokładnie wiemy, czego chcemy, często produkują koszmarki. Edytowanie tych wyników często zabierze więcej czasu niż zlecenie tego zadania od początku profesjonaliście. Tak jest na ten moment. Ale rozwój i ulepszanie modeli przyprawia o zawrót głowy i dziś możemy się śmiać z powykręcanych anatomicznie postaci o zbyt dużej liczbie palców i zębów, ale może to się zmienić szybciej, niż podejrzewamy.

Tworzenie vs edytowanie

Nie zgadzam się z marketingowymi chwytami firm stojącymi za głównymi modelami, przedstawiającymi je, jako kolejne narzędzie w palecie artystycznej. Owszem, można je tak wykorzystywać, mając własne umiejętności. Jednak częściej widzę ich użycie, jako zamienników artysty. Usuwają cały proces tworzenia, a wraz z nim człowieka i większość jego decyzji. Zastępują obraz stworzony z intencją, która stoi za każdym artystycznym wyborem; opisem i dość przypadkowym efektem.

Wielu twierdzi, że artyści nadal będą potrzebni, nawet bardziej niż kiedykolwiek, by edytować efekty generowania. Tylko…nie wiem jak Ty, ale mi nigdy nie marzyła się praca polegająca na edytowaniu ilustracji stworzonych przez kogoś innego. Bez różnicy czy mówimy o innym artyście, czy sieciach neuronowych.

Trudna konkurencja

Zalew wygenerowanych treści obrazkowych i brak bariery (umiejętności artystyczne) w ich dostępności w niejednym chytrzejszym umyśle zrodzą pytanie „po co płacić człowiekowi” lub „po co tyle płacić”. Spodziewać się można, będzie to argument w negocjowaniu cen (w większości przypadków i tak zaniżonych).

Kiedy zaczynałam swoją przygodę z ilustrowaniem, brałam zlecenia niezbyt ciekawe, słabo płatne, ale pozwalające mi nabrać doświadczenia i utrzymać się z rysowania (z tym na początku było różnie). Brałam się za: okładki i ilustracje książek (nie zawsze najwyższych lotów), zamówienia prywatne, portrety. Były to głównie zlecenia dla osób i wydawnictw, którym nie zależało na moim pomyśle czy stylu. Po prostu potrzebowali ilustracji, byle tanio.

Można spodziewać się, że ten rodzaj klientów z radością powitał możliwość zapłaty dużo mniejszej kwoty za wygenerowane obrazki. Zmniejszenie ilości ofert zapewne podniesie poprzeczkę wejścia do zawodu. Możliwe, że niejednokrotnie przyjdzie łączyć pracę na etacie z pracą artystyczną „po godzinach”.  To nie było rzadkością już wcześniej i ma tę zaletę, że pozwala być nieco bardziej wybrednym w wybieraniu zleceń. Zamiast brać się za średniej jakości realizacje, można dzięki temu wybierać tylko te, w które naprawdę chcemy się zaangażować i pokazać w swoim portfolio. Zakładając, że ma się po pracy siłę na malowanie.

Modele produkują niezliczone ilości obrazów w krótkim czasie, co powoduje zalew mediów społecznościowych, a nawet galerii internetowych (DeviantArt, ArtStation, Behance). Przebić się z własną twórczością jest trudniej niż kiedykolwiek. To również problem dla osób poszukujących artystów do współpracy. Dodatkowym zadaniem jest teraz sprawdzenie, czy upatrzona kandydat faktycznie posiada umiejętności, których im potrzeba, czy jedynie potrafi dobrze wpisywać opisy do generatora.

W przypadku znanych artystów istnieje kolejny problem. Wpisując nazwisko Grzegorza Rutkowskiego w Google, zobaczymy mnóstwo obrazów i tylko niektóre faktycznie są jego autorstwa. Wiele z nich to wyniki promptów zawierających „by Gregor Rutkowski”, „in the style of…” Z pewności uderza to w jego markę osobistą.

Kolejne zagadnienie to socjal media. Algorytmy od lat rzucają pod nogi kłody artystom, premiując częstotliwość wrzucanego contentu ponad jego jakość. Wygenerowane obrazki można wrzucać w posty choćby co 5 min. Nie jesteśmy w stanie konkurować o uwagę w tej kategorii z tworami AI.

Jakiego opisu użyłeś?

Wymieszanie AI Art z pracami stworzonymi bez ich użycia wprowadza niemały zamęt. Niejednokrotnie ludzie, patrząc na piękny obraz, z góry zakładają, że to dzieło np. MidJourney i wypytują o szczegóły opisu, co jest dość zabawne.

Mniej zabawne jest, kiedy artyści oskarżają siebie nawzajem o użycie modelu, kiedy to nie miało miejsca, bo styl zbyt przypomina AI Art (jeśli trochę się poogląda tego typu obrazów, jest się w stanie wyłapać wspólne, charakterystyczne cechy). Domyślać się tylko mogę, jak wkurzeni muszą być ci, których stylistyka jest podobna do preferowanej przez użytkowników modeli (czyli ci, których prace trendują na ArtStation…)

Zupełnie nie śmieszą przypadki, kiedy ludzie sprzedają wygenerowane obrazy za duże pieniądze, twierdząc, że stworzyli je sami od podstaw. Takie sytuacje zdarzają się np. na Fiverr czy Etsy.

I jasne, spora ilość zagrożeń nie jest winą technologii jako takiej, ale sposobu jej używania przez ludzi. Niestety, bez jasnych praw regulujących działanie generatorów i jasnego potępienia tego typu działań, tak właśnie przedstawia się krajobraz. Mętnie.

Walka z wiatrakami

Nie mam tu na myśli walki o nowe modele wytrenowane na „czystej” bazie danych. Wierzę, że ta gra jest warta świeczki, nawet jeśli „nieetyczne” modele będą dalej hulać po sieci. Ważne jest nazwanie złem tego, co jest niewłaściwe oraz stworzenie prawnych ram dla działania technologii, również po to, by móc się cieszyć jej możliwościami.

Nawet w takim przypadku modele będą stanowić duże zagrożenie dla pracy ilustratorów, jaką znamy dzisiaj. Do konkurencji będziemy wszak stawać z mistrzami średniowiecza, renesansu, baroku… i ciągle rozwijającą się technologią usuwającą barierę czasu i umiejętności.

I choć to brzmi pesymistycznie, myślę, że w dłuższej perspektywie, może nam wyjść to na dobre. O tym, mam nadzieję, w kolejnym odcinku sagi „AI Art i co dalej?” 

Teraz do korzyści! Bo są oczywiście!

Ai art- korzyści

Na chwilę załóżmy, że dostępne są już generatory wytrenowane na bazach danych zawierających tylko obrazy z domeny publicznej i dzieła artystów, którzy wyrazili na to zgodę i odchodzi nam problem etyczny. Wtedy zaczyna się prawdziwa zabawa!

Generatory pomysłów

Czujesz, że chcesz rysować, ale nie wiesz co? Spędzasz godziny, przerzucając sieć i nic nie budzi Twojego zainteresowania, a kartka lub płótno w programie graficznym wciąż pozostaje puste. Tymczasem wystarczy zbitka słów i kilka powtórzeń w generowaniu by model wypluł z siebie ich dziesiątki we wskazanym kierunku.

Wbrew pozorom im mniej doprecyzowane obrazy w wynikach, tym lepiej, więcej pola dla Twojej wyobraźni! Łatwiej dojrzeć coś ciekawego w teksturach, kolorach i kształtach i użyć tego zalążka, z którego wykiełkuje Twój pomysł.

Jeśli wyniki są bardziej dopowiedziane, może kusić, by ich użyć i po prostu malować na nich, edytować i przekształcać. To na pewno też będzie ciekawe, zwłaszcza jako ćwiczenie. Jednak osobiście zawsze będę bardziej zainteresowana obrazami, które artysta namalował od podstaw niż przekształceniami.

Nie wiem jak Ty, ale dla mnie zawsze tworzenie było bardziej atrakcyjne niż odtwarzania. Możliwe, że dlatego miałam czasem problemy z poprawnym wykonaniem ćwiczeń z natury 🙂

Materiały do ćwiczeń

Wiele można powiedzieć o AI Art, ale jedno jest bezsprzeczne: często potrafi zrobić wrażenie. Nawet jeśli po bliższym przyjrzeniu okazuje się, że zupełnie nie ma sensu i najczęściej obrazom brakuje przekazu. A jednak przykuwają uwagę. Myślę, że ciekawym ćwiczeniem jest zastanowienie się, dlaczego niektóre z nich nam się podobają. Czy to gra kolorów, kontrast, światło, kompozycja, kształty? Wykonanie szybkich studiów z obrazków, które wpadły nam w oko, zawsze może nauczyć nas czegoś nowego.

Co prawda studiowanie kadrów z filmów czy obrazów mistrzów ma tę wielką przewagę, że są one ogólnie uznawane za dzieła nie bez powodów, więc uczysz się na przykładach, które odniosły sukces i zdobyły uznanie publiki.

Palety kolorystyczne

To pierwsza rzecz, która rzuciła mi się w oczy przy przeglądaniu galerii MidJourney — piękne połączenia barw. Stworzyłam sobie nawet kilka palet dla Procreate na podstawie wygenerowanych obrazków. Sprawdzanie jak się sprawdzają w różnych kombinacjach to nieźle ćwiczenie i dobra zabawa.

Tablice inspiracyjne , obrazy referencyjne

Na pewno dużym powodzeniem będzie cieszyło się wykorzystanie wygórowanych obrazów do inspiracji, stworzenia sobie wyobrażenia o jakimś miejscu lub postaci w tworzonej przez nas książce, lub komiksie. Zupełnie jak w przypadku korzystania z inspiracji pracami innych artystów, tak długo, jak tworzymy coś nowego, swojego, odmiennego nie ma nic złego w takim użytku.

Co do używania AI Art jako obrazów referencyjnych — na pewno sprawdzi się w projektowaniu lokacji, postaci, kostiumów. Jednak byłabym ostrożna w kwestii odwzorowywania zwłaszcza anatomii postaci czy perspektywy. Z tymi tematami modele nie radzą sobie jeszcze najlepiej.

Personalny model z Twoją bazą danych

Ta opcja bardzo mnie ciekawi. Możliwość wytrenowania własnego modelu w oparciu o bazę danych zawierającą tylko Twoje obrazy mogą całkiem wiernie odtwarzać Twój styl. Mogłoby to znacznie przyśpieszyć pracę nad własnymi ilustracjami przy zachowaniu spójności stylistycznej.

Choć myślę o takim użytku bardziej jako o ciekawostce niż narzędziu w mojej pracy jako ilustratora. Bardzo istotne dla mnie jest, by mieć pełną kontrolę nad powstającym obrazem i pracowanie nad własnymi pomysłami. Największą radość sprawia mi też proces tworzenia. Odtwarzanie i edytowanie jest na dłuższą metę nudne. Niemniej zawsze ciekawi mnie jak dany obraz wyglądałby w różnych wersjach i tu myślę, taki model może okazać się bardzo przydatny.

Chociaż…być może są przypadki, w których mogłabym oddać nieco swojej mocy sprawczej w zamian za większą efektywność np. stworzenie własnego komiksu lub animacji 2D – przedsięwzięcia, które powstają latami, a dzięki tej technologii wydają się, być całkiem realne.

Unikalna autentyczność

Im szerszą popularnością będą cieszyć się „obrazki z puszki”, im większą przestrzeń zajmą na stronach internetowych, tym szybciej się znudzą. W świecie, który coraz bardziej odkleja się od twardej ziemi i dryfuje bezrefleksyjnie w stronę nienamacalnej cyber-rzeczywistości tym jaskrawiej zaznacza się potrzeba kontaktu z drugim człowiekiem, wymiany myśli i emocji. I nic nie jest w stanie lepiej ich wyrazić niż sztuka tworzona przez człowieka. W obrazie interesuje mnie nie tylko wynik, ale i twórca stojący za dziełem, emocje, które chciał wyrazić, historia, jaką chciał opowiedzieć, proces, który temu towarzyszył, wybory, których musiał dokonać.

To wszystko jest usunięte lub mocno spłaszczone w procesie generowania. To jak przeczytanie tylko ostatniej strony w książce. Wiem, jak się skończyło, ale zupełnie mnie to nie obchodzi.

Wierzę, że ludzi myślących podobnie, jest więcej („i wierzę mocno w to, że ten świaaaaat, nie zgninie dzięki nim! Nie!”)

Tryumfalny powrót technik tradycyjnych

W sytuacji, kiedy boty przeczesujące Internet są w stanie zindeksować obrazy nawet z personalnych domen i serwów (tak było z moją) poczucie, że ktoś nas mocno robi w konia (używa naszej pracy i nic nie możemy na to poradzić), powoduje dużą frustrację. Zauważyłam u siebie i innych ilustratorów nawrót miłości do technik tradycyjnych. W tym obszarze jest bezpieczniej. Bot nie włamie się do naszej szuflady i nie uprowadzi z niej świeżo skończonej akwareli, czy gwaszu (chyba).

Tworząc tradycyjnie, nie ma wątpliwości, że za efektem stoją nasze umiejętności. Brak magicznych guzików, które po naciśnięciu tworzą efekt „wow”. W Photoshopie czy Procreate też ich nie znajdziesz, ale zadziwiające jest, jak wiele ludzi tak właśnie sobie wyobraża malowanie cyfrowe i nie widzi większej różnicy pomiędzy digital paintingiem a generowaniem obrazów przez model. Kiedy jesteś tylko Ty, puste płótno, farby i pędzle nikt nie podważa Twojego autorstwa i prawa do tego, co tworzysz.

Oswajanie strachu

I tak (z mojej perspektywy) wygląda krajobraz po pojawieniu tzw. AI ART. Panuje chaos i burza emocji, jak zawsze, kiedy wpływamy na nieznane wody. I oburzenie, bo naszych dzieł używa się jako wioseł (a może nawet jako łodzi) i nie mamy wpływu na obrany kierunek.

🎶Hoping for the best, but expecting the worst🎶

Jestem pełna najgorszych przeczuć, jeśli chodzi o pracę w zawodach kreatywnych, ale wróżenie, jak będzie się to przedstawiało za rok lub 5 lat to jak długoterminowa prognoza pogody — będzie padało albo nie będzie padało.

Ten post powstał po to, by zebrać fakty, przewidywania, emocje i rozważyć na spokojnie co złego może się stać, a co dobrego? A jeśli to najgorsze i twórcy faktycznie zostaną zastąpieni przez modele, czy przestaniesz tworzyć? Bo ja, za cholerę nie! A ty?

Chętnie dowiem się, jak Ty to widzisz? Czy są jakieś plusy i minusy, które pominęłam? Podpowiem, że są, ale ten post jest już o wiele za długi. Jakie emocje wywołuje u Ciebie ten temat? Zostaw komentarz, bardzo jestem ciekawa!