Rudolf Rosa: Dokázali jsme, že doba, kdy AI zvládne napsat divadelní hru, je velmi blízko

Umělou inteligenci dostal na divadelní prkna. Přesto přiznává, že stroj možná nemůže tvořit umění, protože nemá vnitřní potřebu cosi vyjádřit. Přečtěte si, kde vidí budoucnost AI v umění Rudolf Rosa, výzkumný pracovník z Ústavu formální a aplikované lingvistiky MFF UK.

Jako hlavní řešitel projektu THEaiTRE společně s dalšími odborníky vyvíjíte systém generování scénářů divadelních her za pomoci umělé inteligence. Jak vypadá tvůrčí proces?

Základem je neuronový jazykový model GPT-2 od konsorcia OpenAI, který má „načteno“ asi 8 milionů anglických článků z internetu. Když takovému modelu zadáme začátek textu, snaží se vygenerovat pokračování tak, aby navazovalo na již napsanou část. V našem projektu do modelu vložíme začátek scény, tedy popis výchozí situace a první repliky jednotlivých postav. Model pak už generuje další repliky. Lidský operátor má ale možnost do procesu zasahovat. Může zahodit vygenerovaný text, který se mu nelíbí, a nechat model vytvořit alternativní pokračování. Jelikož model funguje jen v angličtině, text se rovnou automaticky překládá naším překladačem CUBBITT do češtiny.

Umělá inteligence naráží při zpracování textu na řadu limitů, často bývá označována za nekorektní a stereotypizující. Potýkali jste se s podobnými překážkami?

Nevyřešených problémů je zde skutečně mnoho. Jazykové modely vznikají na základě všemožných textů, které v daném množství rozhodně není možné ručně procházet, kontrolovat a filtrovat. Modely se proto z textů napsaných lidmi nepřímo učí i všemožné lidské nešvary – rasismus, sexismus a tak dále. I naší první hře jsou právem vyčítány podobné nedostatky. Navíc to, co diváci vidí v divadle, je ještě výběr toho lepšího. Naším cílem ale bylo výstupy modelu příliš nepřikrašlovat a ukázat, jak skutečně dnes vypadají automaticky generované výstupy. Proto jsme v textu různé nedokonalosti zachovali.

Jaké postupy kromě zásahu lidských operátorů se dají využít k eliminaci chyb?

Odstraňováním předsudků či zaujatosti v jazykových modelech se výzkum aktivně zabývá. Obvykle hovoříme o takzvaném debiasingu, tedy zbavování modelu různých biasů neboli předsudků. Řekněme, že model nevyváženě hovoří o ženách a mužích – šéf je automaticky muž a asistentka automaticky žena. V takovém případě lze například předzpracovat trénovací data a náhodně v nich muže a ženy popřehazovat. Obecně se ale dá říci, že model jen modeluje to, co viděl v datech. Nejčastější cesta k nápravě je proto v nějaké úpravě dat. Ta se ale skutečně dobře zatím udělat neumí – mimo jiné i proto, že sami nedokážeme přesně definovat a oddělit, co je v pořádku a co už nikoli. Třeba snídani dětem do školy může stejně dobře připravit otec jako matka, ale kojit děti bude spíše matka než otec. Informace o mužích a ženách zkrátka nelze zcela zahodit, tím bychom se jen dostali do jiných problémů.

AI: Když robot píše hru
Herec Jacob Erftemeijer v divadelní hře AI: Když robot píše hru.

V čem je AI naopak lepší než člověk?

Když se to celé udělá dobře, může být AI naopak férovější než člověk. To znamená rozhodovat se jen podle relevantních informací a nenechat se ovlivnit informacemi nerelevantními.

Kde se původně zrodil nápad využít umělou inteligenci na prknech, která znamenají svět?  Existují nějaké podobné projekty v zahraničí?

Hlavním impulzem bylo 100. výročí od premiéry divadelní hry R.U.R. od Karla Čapka, tedy hry, v níž se poprvé objevil robot. Náš projekt jako první dokázal uvést divadelní hru, která trvá skoro hodinu, a přitom 90 % scénáře napsala umělá inteligence. Předchozí projekty buď stvořily mnohem kratší díla, jako například film Sunspring, nebo je podíl umělé inteligence výrazně menší. Do této kategorie patří třeba britský muzikál Beyond the Fence z roku 2016 či australská hra Lifestyle of the Richard and Family, jež měla premiéru o dva roky později. Trochu odlišně s AI pracuje skupina Improbotics, která využívá automatické generování replik živě přímo na pódiu. Jedna postava dostává repliky do sluchátka a druhá postava podle toho divoce improvizuje. Všechny nám známé předchozí projekty ale byly v angličtině. Náš výtvor je tedy zároveň první automaticky vygenerovanou divadelní hrou v českém jazyce. S umělou inteligencí u nás ale již dříve pracovala například sbírka básní Poezie umělého světa.

Jaké ohlasy jste dostali na první hru napsanou robotem, kterou uvádí Švandovo divadlo a jejíž loňskou online premiéru zhlédlo 13 500 diváků?

Reakce byly smíšené. Málokdo byl ze hry vysloveně nadšen, ale také málokdo ji ztrhal jako úplný nesmysl. Obecně se dá říci, že dle reakcí a recenzí je naše hra přibližně na úrovni horší hry slabšího lidského autora. Již to, že automaticky generovanou hru lze vůbec posuzovat podobně jako hry napsané skutečnými lidmi, považujeme za velký úspěch a doklad významného pokroku AI v posledních letech. Vesměs slyšíme v hodnocení hry slova jako absurdní nebo těžko srozumitelná. Zároveň ale v divadle na představeních sledujeme, že se diváci na mnoha místech zasmějí, což bereme jako důkaz toho, že se modelu podařilo vygenerovat různá vtipná místa – ačkoli to asi bude spíše náhodou než cíleně.

Švandovo divadlo
První divadelní hru napsanou umělou inteligencí uvedlo Švandovo divadlo na Smíchově.

Jak jste si výslednou hru vyhodnotili vy, tvůrci?

Pokud bychom se vrátili k otázce, kterou si náš projekt klade, tedy jestli umělá inteligence dokáže napsat divadelní hru, tak podle vyznění recenzí zatím spíše ne. Nicméně před zhlédnutím divadelní hry byli mnozí přesvědčeni, že doba, kdy tohle bude možné, je velice daleko nebo že k tomu nikdy nedojde. Náš projekt řadu lidí přesvědčil, že tato doba naopak může být velmi blízko. Jsou zde však principiální problémy, na které zatím neznáme odpověď. Zejména jde o to, že stroj na rozdíl od člověka nemá žádnou vnitřní potřebu svou tvorbou cosi vyjádřit, tvoří prostě jen tak. Podobá se tedy spíše lidskému autorovi, který tvoří bezduchá díla bez vyšších cílů jen tak pro peníze. Je docela dobře možné, že stroj zkrátka nemůže tvořit skutečně hodnotné umění. Může skvěle zvládnout techniku, řemeslo, tvořit formálně dokonalé výsledky. Díla ale nebudou mít žádnou myšlenku, žádnou skutečnou uměleckou hodnotu.

Takže záplavu divadelních her vygenerovaných umělou inteligencí v budoucnu očekávat nemáme?

Obecně je umělá inteligence dobrá spíše na nudné, opakující se činnosti, ostatně i robotická automatizace se objevuje především v takových oblastech. V umění naopak hledáme jakousi novost a originalitu. V jistém smyslu má umělecké dílo hodnotu, jen pokud je nové a nejde pouze o napodobeninu něčeho, co už tu stokrát bylo. A přesně na tohle se umělá inteligence moc nehodí. Věřím, že za pár let může AI vygenerovat divadelní hru, která nebude trpět mnoha nedostatky, jimiž trpí naše hra. Takové dílo bude formálně kvalitní, ale nepříliš umělecky hodnotné. Umím si představit použití automatického generování například pro psaní scénářů nekonečných televizních seriálů, kde je to skutečně do značné míry pořád to samé dokola a nejsou zde kladeny vysoké umělecké nároky. Tohle by nás bavilo zkusit, zatím ale takovou spolupráci domluvenou nemáme.

„Obecně je umělá inteligence dobrá spíše na nudné, opakující se činnosti, ostatně i robotická automatizace se objevuje především v takových oblastech. V umění naopak hledáme jakousi novost a originalitu.“

Chystáte jiné související projekty?

Nedávno jsme připravili návrh projektu společně s AV ČR na neuronové modelování české poezie, kde ovšem cílem nebude jen generování básní, ale půjde hlavně o prostředek k poznávání existující poezie. Model umí vypozorovat pravidelnosti, zákonitosti, a vzory. Je pro něj těžké vytvořit novou zajímavou báseň, ale věříme, že by mohl dobře zvládnout vygenerovat báseň typickou například pro daného autora nebo epochu – jaksi zprůměrovat a vydestilovat esenci například českého romantismu. Ve spojení s aktuálními tématy se pak otevírají další možnosti. Mohli bychom se třeba dočíst, co by takový Mácha napsal o globálním oteplování. V úplném zárodku je pak myšlenka projektu s pražskou Městskou knihovnou a českou spisovatelkou Julií Novákovou. Chtěli bychom vytvořit nějaký nástroj, který by pomáhal začínajícím spisovatelům. Tito autoři se řemeslu teprve učí, takže by jim mohlo pomoci, když je AI upozorní na různé formální nedostatky jejich práce. Umělá inteligence by jim mohla navrhnout, jak vylepšit například vznikající povídku – zkrátka doporučit, co tam doplnit, aby se povídka více podobala již existujícím úspěšným textům. Samozřejmě se to ale nesmí přehnat, aby zde stále byl dostatečný prostor na vlastní kreativitu a osobitost autora.

Scénář divadelní hry vznikal v angličtině a byl automaticky překládán do češtiny nástrojem CUBBITT, na jehož vývoji se podílíte. V čem je CUBBITT jiný než ostatní strojové překladače typu DeepL nebo Google Translator?

Všechny dnešní překladače jsou podobné. Je to hluboká neuronová síť, obvykle typu Transformer, natrénovaná na velkém množství dvojjazyčných textů. DeepL i Google zvládají spoustu jazyků, což je jejich síla. CUBBITT zvládá jazyků jen pár, ale zato se kolegové při jeho vývoji mohli na tyto jazyky detailněji zaměřit. Podle našich měření tak stále platí, že CUBBITT dosahuje na překladu mezi angličtinou a češtinou vyšší kvality než konkurenční překladače. V čem přesně se CUBBITT liší, je obtížné říci, protože zatímco CUBBITT je open-source a jeho fungování je podrobně popsáno ve vědeckých článcích, o komerčních překladačích takové informace nejsou k dispozici. Předpokládáme, že architektura neuronové sítě je u všech modelů stejná, ale u CUBBITTu si Martin Popel, hlavní vývojář CUBBITTu, prostě mohl dovolit dát víc práce s vyladěním jednotlivých parametrů speciálně na češtinu.

Martin Popel
Hlavním vývojářem překladače CUBBITT je Martin Popel, výzkumník z Ústavu formální a aplikované lingvistiky MFF UK.

Překladač CUBBITT mimo jiné pomáhá lidem prchajícím před válkou na Ukrajině s překonáním jazykové bariéry. Co bylo při vývoji ukrajinsko-české verze nejtěžší?

Pro ukrajinštinu bylo klíčové sehnat dostatek dvojjazyčných textů, což se ale naštěstí podařilo, takže překladač mohl být během několika týdnů vytvořen skutečně z nuly. Od česko-anglického překladače se liší hlavně těmi trénovacími daty, architektura modelu je stejná a parametry jsme také nastavili podobně. Z vlastností dat rovněž plynou některé nedokonalosti překladače, například je obtížné překládat názvy menších českých či ukrajinských měst, protože ty se v trénovacích textech vyskytují málo nebo vůbec. Překladač proto někdy české město „přeloží“ jako ukrajinské město – třeba Jihlava se nám dlouho překládala jako Žytomyr. Na tomhle ale kolegové usilovně pracují a model se v tom stále zlepšuje. Stejně jako u angličtiny vykazuje CUBBITT i u překladu mezi češtinou a ukrajinštinou vyšší kvalitu překladu než konkurence.

Kromě robopsychologie a výzkumu umělých neuronových sítí se věnujete také popularizaci vědy. Jak se vám daří motivovat mladé lidi ke studiu umělé inteligence?

Vědu se snažím popularizovat dlouho, ale jestli to má reálné dopady, to neumím změřit. Pokouším se ale lidem zprostředkovávat ono nadšení, se kterým se vědě věnujeme. Často se třeba podílím na dni otevřených dveří, děláme různé přednášky pro střední školy a podobně. Doufáme, že tím snad někoho k vědě a našemu oboru přilákáme, či alespoň nikoho neodradíme.

Napadají vás další způsoby, jak vzbudit zájem o umělou inteligenci u širší veřejnosti?

S kolegyní Terezou Hannemann jsme založili skupinu AI v kontextu, kde se snažíme dívat na umělou inteligenci v různých oborech lidské činnosti. V rámci tohoto projektu pořádáme přednášky, připravujeme interaktivní exponát do Kampusu Hybernská, a také se v rámci Univerzity Karlovy staráme o kurz Elements of AI, což je online kurz umělé inteligence pro každého. Do budoucna máme i další plány a nápady. Společně s pivovarem Svijany například zkoušíme vymyslet AI hospodu, kde by si hosté mohli vyzkoušet různé nové technologie a dozvědět se něco o jejich fungování. Tímto způsobem bychom rádi zacílili i na část veřejnosti, kterou většina naší komunikace spíše míjí.