Umělá inteligence, generování obrázků a DALL-E

oil painting sheep, dall-e, AI

Jasně, že jsem to taky vyzkoušela – generování obrázků pomocí „umělé inteligence“ (AI), konkrétně pomocí DALL-E.

Funguje to jednoduše. V podstatě se někomu snažíte vysvětlit, co má namalovat, a podle toho, jak blbě to chápe, ladíte popis, abyste se dobrali výsledku :-) Popíšete, co na obrázku má být, jak to má vypadat, co objekty/osoby dělají, vztah mezi nimi (např. že někdo něco drží, někdo je na pozadí něčeho), jak vypadá okolí, v jakém stylu to má být vyobrazeno (možností je spousta: fotografie, olejomalba, komiks, výšivka, plastelínová animace…). Dobře funguje jakoby reverzní přístup: představit si, pomocí jakých labelů, tagů by se dal popsat finální obrázek, a ty použít.

AI se skvěle daří dělat varianty motivů a stylů, které už existují, ke kterým má dostatečně velký „katalog“, z něhož může vybírat (věci jako fashion fotografie, růžové prasátko nebo třeba dívka s tygrem ve stylu anime). Krásně tedy zvládne futuristické fotky majáků, UFO nad krajinou vyšité křížkovou výšivkou, egyptskou nástěnnou malbu hrocha nebo třeba malby punk ovcí z úvodního obrázku (celou kolekci růžových ovcí najdete zde ;-)). Běžná témata a spojení jí tedy ani není potřeba moc popisovat, protože má dostatek dat, „ví“, jak věc vypadá, a umístí vše do vhodného kontextu. (Třeba na strohé zadání „table with fruit, photography“ tak zobrazí ovoce na stole hezky naaranžované nebo rovnou v míse.)

Ancient Egyptian mural hippo, dall-e, AI

AI (a nejen tahle obrázková) funguje jako takový lorem ipsum generátor – splnit požadavek, dodat něco, co bude na první pohled vypadat věrohodně. Ale při bližším zkoumání narazíte na „chyby“, věci, které nesedí. Nedá se jí věřit. A čím neobvyklejší požadavek, tím víc se to projeví.

Situace, které nezná, které „neviděla“, neobvyklá spojení, ke kterým nemá vzorové příklady a nemá je z čeho nakombinovat, neumí sama vymyslet… Třeba zadání „žlutý hroch v trenýrkách jí letadlo“ jí dělá problém. Jakoby neumí vzít hrocha a aplikovat na něj žlutou barvu – většinou nakreslí klasicky šedého. A představit si, jak by asi tak mohl jíst letadlo? No, spíš se fyzicky prolínají :-D (Naproti tomu „hroch jí mrkev“ zvládá samozřejmě dobře.)

hippo drawing, dall-e, AI
Yellow hippo which is wearing orange polka-dot short trousers is eating a jet fighter.

hippo, dall-e, AI

A yellow hippo standing on two legs and wearing a polka dot shorts. Hippo is eating a small model of a fighter aircraft. Clay animation, detailed.

AI totiž vlastně není žádná „inteligence“ a věci „nevytváří“. Je to jen obří algoritmus natrénovaný na neuvěřitelně velkém souboru obrázků všech možných stylů a témat, které kombinuje – na základě natrénovaných „znalostí“ vygeneruje obrázek, který odpovídá zadání. Snad by se dalo říct, ze je to obří databáze převedená do souboru pravidel, do matematického modelu vztahů. Hledat v takové databázi by trvalo hrozně dlouho, pomocí statistiky se tedy převedla do „modelu“, který odpověď nalezne „rychle“.

Proto také vznikla debata, zda takovéto AI generátory neporušují autorská práva. Byly totiž trénovány na obrázcích z internetu bez vědomí jejich autorů; u některých známých umělců lze dokonce přímo nechat vygenerovat obrázek v jejich stylu. Odlišnost od umělecké inspirace je v tom, že ačkoliv se tyto výtvory můžou zdát originální, je to dáno jen množstvím a kvalitou (originalitou) „dat“ – AI v podstatě nepřidává nic vlastního, jen manipuluje data (získaná jinde) podle naučených pravidel. Je to vlastně doslovný příklad „standing on the shoulders of giants“, protože bez předcházejících výtvorů by opravdu vůbec nemohla existovat.

Pro určité účely tedy generování obrázků pomocí AI funguje skvěle. Nepřináší invenci, ale umí nakreslit variace všeho, co už vytvořeno bylo. Může se hodit k tvorbě editoriálních fotografií, ilustrací nebo rychlého převedení představy do „náčrtku“. V podstatě ideální nástroj, a co teprve v kombinaci s ChatGPT, ke generování contentu (to je ale ošklivé slovíčko; tedy té výplně, aby bylo v médiích kolem čeho navěsit reklamu).

Ale aby se AI nezastavila na tom, co umí teď (a vizuální tvorba se líně nezacyklila na vykrádání minulosti), dál budou potřeba tvůrci, kteří přinášejí nové nápady, tvoří nová díla a objevují nové styly. (Zatím?)

Příklady :-)

Zkoušela jsem, jak by AI DALL-E ztvárnila některá témata z mých obrazů a jestli bych ji zvládla dovést k tomu, aby splnila moji představu – tedy jestli by uměla namalovat obraz místo mě. To se mi nepodařilo, ale některé výtvory byly zajímavé.

oil painting, pig in universe, dall-e, AI
A painting of a small cute pig, dressed in an astronaut suit with a glass helmet, stars reflecting on the helmet, floating in a vast universe consisting of food, stars and planets. Bright colors on dark blue background. Oil painting style with a bit of a comics look.

hippo with a spoon, universe, dall-e, AI
hippo with a spoon, universe, dall-e, AI

Painting of a pink hippo holding a big spoon, flying in a polka dot pot-like shaped rocket in a space, surrounded by colorful stars and food.

Když se člověku některý konkrétní výtvor líbí, lze si v DALL-E nechat vygenerovat jeho další variace. To mě moc nezaujalo, protože se většinou odchýlily jiným směrem, než bych si představovala, a naopak ztratily ten look & feel, který se mi líbil na původním obrázku.

Ale tahle variace mi připadala kouzelná.

hippo with a spoon, universe, dall-e, AI

Celou kolekci hrochů jedlíků ve vesmíru si můžete prohlédnout zde.

Publikováno v rubrice programování, psaní o umění, štítky , , , , .

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *