czwartek, 28 marca, 2024
Strona głównaKulturaAlgorytm jak wielcy malarze. AI Midjourney podbija internet

Algorytm jak wielcy malarze. AI Midjourney podbija internet

Zostałem przez los wyposażony w dwie cechy, które razem są wyjątkowo niesatysfakcjonujące: bogatą wyobraźnię i irytujący brak talentu do rysunku. Przez szkolną plastykę byłem w stanie prześliznąć się na czwórkach, ale to by było tak naprawdę na tyle. Porządny algorytm tworzący grafiki z zadanego mu tekstu, a takim jest Midjourney, to dla mnie objawienie.

Midjourney poproszony o przedstawienie siebie, czyli „Robota-malarza przy pracy” malowanego akwarelą. Wszystkie grafiki w niniejszym tekście są oczywiście autorstwa algorytmu.

AI Midjourney. Co to jest i jak to działa?

W największym skrócie Midjourney to program, działający w oparciu o nauczanie maszynowe, który jest w stanie generować grafiki na podstawie wpisanych do niego fraz tekstowych. Jego twórcy przedstawiają się jako „niezależne laboratorium badawcze badające nowe nośniki myśli i poszerzające możliwości wyobraźni gatunku ludzkiego”. Tak, powiecie, w ostatnich miesiącach widzieliśmy dziesiątki prac wykonanych przez takie algorytmów, a większość była co najwyżej inspiracją do memów. Ten jednak ma w sobie coś wyjątkowego.

Obsługa Midjourney jest prosta, a do otwartej bety każdy może się zapisać pod tym linkiem przy użyciu konta Discordzie. Wpisujemy w języku angielskim komendę dotyczącą tego, co chcemy zobaczyć, wpisujemy żądany styl, parametry obrazu albo docelową kolorystykę, i jazda. Jezus Chrystus w kresce z anime? Nie ma sprawy. Pejzaż Nowego Jorku namalowany przez Van Gogha? Okej. Kubistyczny Voldemort? Proszę bardzo.

Algorytm tak samo dobrze radzi sobie ze stylem historycznym, współczesnym dark fantasy, jak i obrazkiem przypominającym wykorzystanie octane render w 8K. Co ciekawe, potrafi w zabawny sposób zaciąć się przy portretach – gdy poprosimy o czyjś wizerunek w stylu danego malarza, otrzymamy… mieszankę twarzy jednego i drugiego. Zdecydowanie lepiej wychodzą też postaci w całości wyobrażone, niż te rzeczywiste.

Midjourney najpierw przedstawia nam cztery warianty obrazka (w rodzaju szkiców), spośród których wybieramy ten, który ma stać się pełnoprawnym dziełem. Możemy też zamówić kolejne cztery szkice zbliżone do jednego z zaoferowanych, albo też zresetować całość. Gdy dostaniemy pełnowartościową grafikę, możemy dodatkowo podkręcić albo zredukować poziom detali.

Zauważyłem jednak, że program najlepiej sobie radzi, jeśli pozostawi mu się pewną swobodę – czasem im bardziej ogólne jest polecenie, tym bardziej zaskakujący rezultat możemy otrzymać. W porównaniu z tym, co potrafią inne popularne generatory grafik oparte na AI – takie jak Dall-E Mini czy Craiyon – znajdujemy się tu bowiem na zupełnie nowym poziomie kreatywności.

Największa wada algorytmu? Jedynym narzędziem do jego obsługi w obecnej fazie jest czat gamingowy Discord, a nasze grafiki są generowane w czasie rzeczywistym w pokojach, z których w tym samym czasie korzystają dziesiątki innych osób. Delikatnie mówiąc, nie jest to idealna metoda działania. Dość, że gdy czat się zatnie, czeka nas przekopywanie się przez dziesiątki obrazków „zamówionych” wtedy przez szereg innych osób.

Podstawowa, próbna wersja Midjourney kończy się zaskakująco szybko. Zanim rozgryziemy nie do końca oczywisty system komend i to, które prompty mają jaki efekt na końcowe dzieło, nasz dostęp do algorytmu wygasa. Producent oferuje kilka wersji abonamentu, z czego najtańszy kosztuje 10 dolarów + VAT i pozwala na generację grafiki ok. 200 razy (co w praktyce da nam mniej więcej 100 obrazków).

AI Midjourney. Czy można komercyjnie wykorzystać grafiki?

No dobrze, to teraz czas na najważniejsze pytania: co z użytkiem komercyjnym i kto ma prawa autorskie do grafik? W tekście o generującym kontent słowny bocie OpenAI GPT-3 – który jest duchowym bliźniakiem Midjourney – pisałem o tym problemie tak:

„Czy przyznać prawa autorskie użytkownikowi, który wprowadził do programu dane polecenie? Dać je twórcom programu, którzy jednak nawet nie widzieli tekstu na oczy? A może powstaje konieczność przyznania takiej AI własnej podmiotowości prawnej?

Ale kto miałby reprezentować jej interesy, skoro może nadaje się ona do pisania wierszy, ale sama z siebie nie skontaktuje się z prawnikiem, by zatrudnić go w sądzie przeciwko potencjalnemu plagiatorowi. Może należałoby wskazać, że twórczość algorytmu będzie należeć po prostu do wolnej domeny.

Ale na jakich zasadach można będzie z niej korzystać? Czy mogę wykorzystać wiersz napisany przez AI w kampanii promocyjnej mojej firmy? Patrząc po tempie rozwoju sztucznej inteligencji w porównaniu z tym, z czego dotychczas korzystaliśmy, musimy wkrótce zacząć udzielać odpowiedzi na takie pytania.”

Twórcy Midjourney wybrali to ostatnie rozwiązanie – pozwalają na użycie obrazków na wolnych zasadach przez każdego w dowolnym celu, o ile nie wykorzystuje ich osoba pracująca dla firmy, która zarabia więcej niż milion dolarów rocznie. Ale tu też nie ma takiego zakazu, po prostu musi wykupić plan biznesowy, który stanowi najdroższą wersję abonamentu na stronie. Im więcej generuje się kontentu, tym lepiej dla algorytmu, który też w ten sposób nadal się uczy.

AI Midjourney. Cyfrowy geniusz czy epigon bez duszy?

Wiele osób jednak twierdzi, że to, co generują algorytmy tego rodzaju, to nie jest prawdziwa sztuka. W tej bowiem wymagane jest istnienie nieprzerwanego łańcucha artysta-dzieło-odbiorca. Ponieważ AI nie ma świadomości, to nie wie, dlaczego dana grafika w ogóle została stworzona, a jego grafika nie może zostać umiejscowiona w żadnym kontekście. W efekcie dostajemy wyłącznie tanie odtwórstwo, nawet jeśli jest ono poprawne formalnie. Na przykład algorytm, któremu każemy namalować McDonald’s w stylu Beksińskiego, tylko w marny sposób skopiuje styl sanockiego mistrza.

Ktoś powiedział „McDonald’s w stylu Beksińskiego”? Tu zresztą pojawia się kolejny problem – czy algorytm wykorzystujący złote łuki (zastrzeżony znak towarowy) nie narusza czasem prawa, a jeśli tak, to kto miałby za to odpowiadać? A czy naruszyłby je sam Beksiński, gdyby namalował i sprzedał ten obraz?

Nie mogę się zgodzić z takim postawieniem sprawy. Większość artystów świata nie żyje w próżni i mniej lub bardziej otwarcie inspiruje się różnymi stylami i modami. Czasem ta inspiracja zamienia się w niemal otwarty plagiat (kanadyjski casus Amandy PL, która „zbyt mocno” zainspirowała się stylem Norvala Morriseau). Algorytm, który szkolił się na bazie danych, w której zgromadzono miliardy grafik, od ludzkiego artysty różni się głównie brakiem samoświadomości. Jeśli poprosimy go pracę w stylu dark fantasy, to oczywista rzecz, że bot dokona uśrednienia prac wielu artystów tworzących w tym stylu. Czy jednak zastosuje ten mechanizm inaczej niż człowiek, który na co dzień zajmuje się tworzeniem takich ilustracji i namalował ich już w życiu tysiące, a widział setki tysięcy?

O ile w przypadku bota piszącego teksty kultury nie widzę (póki co) większego zagrożenia dla dziennikarzy czy pisarzy, o tyle ilustratorzy czy plakaciarze już dziś mogą poczuć się zaniepokojeni. Ale umówmy się, kiedy ostatnio były dla nich dobre czasy? Rynek pracy w dziedzinie artystycznych sztuk wizualnych jest wyjątkowo agresywny i bez genialnego algorytmu, który zacznie rozpychać się na nim łokciami. Graficy pewnie na tym stracą, ale z drugiej strony oni również zyskują potężne narzędzie do poszukiwania inspiracji, a może nawet do produkcji szkiców czy półproduktów do swoich prac (choć ktoś powie, że prawdziwemu artyście to nie przystoi).

Inny zarzut krytyków dotyczy tego, że algorytmy takie jak Midjourney posłużą do generacji ton kiczu i bezguścia. Być może to prawda, ale w przypadku własnego użytku sytuacja przypomina mema o robieniu sobie kanapki w Subwayu: bracie, to ty wybierasz pieczywo i składniki. Z drugiej strony, algorytm tylko jeszcze bardziej sprawi, że na grafiki zaczniemy patrzeć nie jako na dzieło sztuki, tylko jak na kontent. To pierwsze to coś, co ma wartość samą w sobie, chcemy je chłonąć, przeżywać, w miarę możliwości zatrzymać. Zaś to drugie nam się spodoba podczas manicznego scrollowania, wrzucimy je na stories na Instagramie, a po tygodniu o nim zapomnimy, bo zatonie w morzu podobnego kontentu.

Czytaj także:

AI Midjourney. Galeria

Oczywiście ten tekst były niepełny bez przedstawienia małej próbki umiejętności Midjourney. Najpierw kilka prac odtwórczych w stylu danego artysty, a potem prezentacja umiejętności algorytmu bez zadanego stylu. O wykonanie części poprosiłem ja, a niektórych użytkownik Twittera Michał Jadczak.

Jeszcze jedna próbka obrazu, którego nie namalował Beksiński. Fot. Twitter/Mischa von Jadczak
Skyline Nowego Jorku z widocznym One World Trade Center, którego nie namalował Van Gogh. Słabość? Popatrzcie na odbicia w wodzie.

Futurystyczna Warszawa. Fot. Twitter/Mischa von Jadczak
Prompt brzmiał: „Papież w błyszczącej zbroi palący miasto”
Prompt brzmiał: „Polscy kosmiczni husarze lądujący na Księżycu”.
„Sznaucer-superbohater czuwający nad miastem”

Polecamy:

Bartłomiej Król
Bartłomiej Król
Prawnik, publicysta, redaktor. Na TrueStory pisze głównie o polityce zagranicznej i kulturze, chociaż nie zamierza się w czymkolwiek ograniczać.
ARTYKUŁY POWIĄZANE

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

NajNOWsze

NajPOPULARNIEJsze