Logo

Problém není AI, ale sociální sítě. Bez nich by deepfake byl satirou pro kamarády

30. listopadu 2024

foto: použito se svolením Matyáše Boháčka

Když mu bylo šest, naprogramoval svůj první web. Na střední škole vytvořil aplikaci na překlad znakového jazyka, která zaujala OSN. Po maturitě odešel do Kalifornie, na Stanford, jednu z nejlepších univerzit světa a líheň nejúspěšnějších technologických firem. Pod vedením špičkových vědců tu zkoumá nástrahy umělé inteligence, hned v úvodu vytvořil pro televizi CNN virtuální kopii slavného moderátora. Matyáš Boháček, 20 let.

Stihl jste toho docela dost, za dvacet let života…

Vidíte a já přitom celou dobu dělám jen to, co mě baví a naplňuje. Takže byť je to škola a práce, ve finále bych to dělal i jen tak, ve svém volném čase. Vždycky jsem věděl, že chci dělat něco s technologiemi, co bude k užitku i ostatním. Bavil mě ten sociální aspekt.

Co vás fascinuje na umělé inteligenci?

Že kombinuje celou řadu různých věd dohromady. Na jedné straně je to hodně technický obor, vyžadující hluboké porozumění kódování a softwaru, zároveň ale ovlivňuje sociální vědy nebo neurovědu. Vždycky jsem se zajímal o hodně věcí najednou, takže v tom mi AI přijde úplně skvělá.

Ve svém výzkumu na Stanfordu zkoumáte její rizika. Vytvořili jste aplikaci na rozeznávání takzvaných deepfake videí, která se tváří jako reálná, ale jsou vytvořená umělou inteligencí. Jak funguje?

Momentálně používáme dva systémy. Jeden je postavený na specifických rysech konkrétních osobností – typově třeba politiků nebo celebrit, u kterých je větší riziko zneužití. Náš model se podívá na stovky hodin materiálu, jako jsou proslovy, rozhovory nebo výstupy ve filmech. A naučí se, jak osoba kombinuje gesta a rysy v obličeji. Všichni totiž máme velmi silné osobní rysy, je to skoro něco jako behaviorální DNA, když to přeženu. Systémy na tvorbu deepfake se většinou soustředí jen na prostor okolo pusy, který „přeanimují“, protože se snaží lidem vložit slova do úst. Náš systém je schopný odhalit, že došlo k manipulaci, která nekoresponduje se zbytkem těla. Funguje ale u hodně známých lidí, nedá se využít pro každého z nás, tam máme jiný systém.

Jaký?

Myšlenka, která za ním stojí, je hrozně jednoduchá, proto ho mám tak rád. Všiml jsem si, že když se v deepfake videích dívám lidem na ústa a zacpu si přitom uši, vůbec nevím, co ti lidé říkají. Když se ale díváte na reálného člověka, máte aspoň trochu představu, co říká. S mým profesorem Hanym Faridem jsme proto navrhli systém, který dělá dvě věci. Prvním je jen přepis audia. V druhém kroku se podívá na video, ignoruje přitom audio a jen z pohybu úst predikuje, co osoba řekla. Máme pak dva texty, v případě reálných videí jsou velmi podobné, při deepfake velmi odlišné.

Jsou aplikace dostupné pro běžnou veřejnost?

Nejsou. Kdybychom je dali volně přístupné na internet, mohla by je druhá strana využít ve svůj prospěch. Zpřístupňujeme je jen konkrétním organizacím, kterým věříme, že jim jde o to, kultivovat veřejný prostor a informovat pravdivě veřejnost.

Byly použity i během nedávných prezidentských voleb v USA?

Ke konkrétnímu využití našich systémů se bohužel nemůžu vyjadřovat.

Přečtěte si také

Možnost zpochybnit cokoliv

Tak se pojďme bavit obecně. Americké volby byly živnou půdou pro šíření dezinformací, objevila se právě i deepfake videa…

To určitě, příkladů byla spousta. Nejen deepfake videí, ale i obrázků. Řešila se však i reálná fotka z akce (demokratické kandidátky) Kamaly Harris, lidé poukazovali na jisté zvláštnosti na fotce, protikandidát Donald Trump tvrdil, že obrázek je vytvořený umělou inteligencí. Vidím posun v tom, že spolu s umělou inteligencí nepřišla jen zfalšovaná videa a fotografie, ale vlastně i možnost cokoliv – video, audio nebo fotku – zpochybnit. To je hrozně nebezpečné, protože vést demokracii v prostoru, kde si nemůžeme ani říct, že dva plus dva jsou čtyři, je velmi náročné.

Jaké nejzásadnější dezinformace nebo deepfakes jste v amerických volbách zaznamenal?

Bylo jich několik, ale není žádný jeden deepfake, který by nejvíce ovlivnil celou kampaň. A to je podle mě ten point. Lidé mají pocit, že jeden deepfake změní všechno. Samozřejmě že se to asi může stát. Ale za mě jde hlavně o systematické, postupné podrývání systému, vysílání spousty deepfakes na všechny strany. Pár z nich se uchytí v nějakých menších skupinách, pak to uhasne, po nějakém čase přijde zas něco jiného… Děje se to postupně, třeba už dva roky před volbami. Řada respondentů v různých průzkumech navíc uvádí, že deepfake videa a dezinformace ovlivnila témata, nad kterými přemýšlejí. To je nebezpečné. Pro mě osobně byl asi nejzajímavější deepfake obrázek vytvořený umělou inteligencí, na kterém je Donald Trump s několika svými údajnými afroamerickými podporovateli. To je asi nejvýstižnější AI obrázek tohoto volebního období.

Je tohle něco, co se bude do politiky čím dál víc vměšovat?

Je. A my teď máme možnost se proti tomu postavit, upravit legislativu. Za mě to není ani tak problém umělé inteligence, jako spíš problém sociálních sítí. Bez sítí, jako je X, Facebook nebo Instagram, je deepfake možná fajn satira pro jednotlivce nebo pro pár lidí, kterým to ukážete na mobilu, ale jinak nemá žádný dopad. Jsou to ale sociální sítě, které deepfake více zobrazují lidem, kteří jsou pak náchylní tomu věřit a nejsou schopní kriticky rozlišit, jestli to je reálné. V Evropě už jsou určité snahy o změnu legislativy, aby platformy musely označovat videa nebo fotky upravené nebo vytvořené AI a netlačit jejich dosah. V Americe je to komplikovanější, protože odpůrci takové legislativy se odkazují na svobodu slova a na americkou ústavu. Takže v USA to ještě bude velké téma.

Takže tady pořád bude viset otázka, jestli fotku, video nebo audio někdo upravil?

Podle mě se ta otázka změní. Už se nebudeme ptát, co je falešné, ale co je reálné. Je to možná trochu deprimující, na druhou stranu věřím, že tu jsou i pozitiva. Už máme technologii, která je schopná odhalit, kde, jak a kdo vytvořil nějaký kus obsahu, ať je to video, obrázek, nebo audio. To je naše velká zbraň pro ověřování autenticity.

Jste schopen i poznat, kdo dezinformaci nebo deepfake vytvořil?

Většinou ne, pokud osoba nebo skupina nemá profil, kde prezentuje svou identitu.

Jak těžké je udržet krok s druhou stranou? Deepfake videa přece jen vypadají stále dokonaleji, reálněji…

Je to tak. Ale většina velkých hráčů chápe, že je potřeba to řešit, a naopak s námi spolupracují na tvorbě obrany proti těmto technologiím. Co mě naopak znepokojuje, jsou online komunity, které vyvíjejí věci mimo mainstream. Jejich doménou je hlavně výroba pornografie, dokážou vložit tvář nebo i celé tělo nějaké osoby do pornografické nahrávky. Často jsou to děti nebo mladiství. Velká vylepšení kvality deepfake videí vyšla právě z těch komunit.

Přečtěte si také

Virtuální moderátor spíchnutý za den

Vy sám jste vytvořil virtuálního moderátora stanice CNN, kterého dokonce nepoznali ani samotní lidé ze CNN. Jak jste se k tomu dostal?

Naše laboratoř spolupracuje s různými médii a organizacemi a CNN, velká americká televize, se nás tehdy ptala na nějaká již existující deepfake videa. Jednoho z producentů při té příležitosti napadlo, jestli pro ně nemůžeme vytvořit deepfake jejich velmi známého moderátora Andersona Coopera. Já jsem to dostal za úkol. Během dne jsem spíchnul něco velmi jednoduchého, nebylo to perfektní, ale bylo to docela přesvědčivé. Ukázali jsme to producentovi a pak se to začalo nabalovat. Někoho napadlo tohle, někoho tamto a najednou se z toho stala celá hodinová show, kdy ji náš AI moderátor otevřel a představil téma pořadu. Až pak byl blízký záběr na reálného Andersona Coopera, který řekl, že je to jeho AI verze.

Jaké byly reakce?

Přišly ze všech směrů. Byly pochvalné, že je to super způsob, jak lidi upozornit na to, že jsme náchylní uvěřit deepfake a dezinformacím. Ale ozvalo se také hodně lidí z výzkumu, kteří tvrdili, že to je kontraproduktivní, dělá to špatnou image AI a mohlo by to podrývat podporu jejího výzkumu.

Nejste sami součástí problému, když ukážete, jak snadné je lidi uvést v omyl?

S profesorem Hanym Faridem jsme o tom hodně diskutovali a dospěli jsme k tomu, že je důležité upozornit veřejnost, jak jednoduché to je. Řada lidí totiž byla přesvědčená, že něco takového dokážou vytvořit jen hollywoodská studia nebo experti, kteří mají týmy a sofistikované počítače. A najednou student, co zrovna vyšel ze střední školy a byl první týdny v Americe, na svém laptopu bez cizí pomoci z volně dostupných nástrojů udělal něco, co odvysílali na CNN. Podle nás to byla tak zásadní zpráva, že jsme si řekli, že o tom musíme informovat. Vydali jsme článek, kde jsme celý proces popsali. Ale spoustu věcí jsme vynechali, abychom neposkytovali návod, jak to udělat.

Mladí lidé dnes s umělou inteligencí pracují běžně. Do Česka jste o tom přijel přednášet i na konferenci Future Port Youth. Kde vidíte jejich potenciál?

Jsme ve věku, kdy si nějak nastavujeme cíle – a zároveň už žijeme obklopeni umělou inteligencí. Takže naše myšlenky a představivost jsou už úplně jinde, než to bylo před deseti lety. Na Stanfordu jsou kolem mě lidé, kteří si dali jako svůj osobní cíl vyřešit rakovinu pomocí AI. Jsou tam lidé, kteří nás chtějí posunout nejen na Mars, ale i dál. A byť to jsou idealisté a vizionáři, tak mít takové možnosti uvažování je super. Je potřeba mít velké cíle, abychom se posouvali. Řada lidí si taky neuvědomuje náš potenciál. Česko má super pozici z AI hodně těžit. Máme tady skvělé školy, velmi dostupné vzdělávání, silný technologický potenciál a podhoubí různých škol a firem a snadný přístup počítačům. To všechno dohromady může být skvělý recept, abychom se pomocí AI vybudovali na víc technologickou společnost.

Matyáš Boháček (20)

Umět vypnout

Umíte být bez AI?

Snažím se pravidelně vypínat, být bez mobilu, jinak bych se asi zbláznil.

Jak často to děláte?

Moje pravidlo je, že soboty jsou bez práce. Na bakaláři je těžké to dodržovat, ale s kamarády ze školy se snažíme jednou za dva tři týdny vyjet někam k moři nebo na túru do národního parku. Nebo na filmy do San Franciska, kde pořád mají stará americká kina s neonovými štíty a pouští staré filmy za 5 dolarů a můžete tam sedět i čtyři hodiny. V Americe je kultura práce hodně podstatná, všichni musí být hyperproduktivní, ale je potřeba umět i vypnout, třeba si jenom číst. Můj oblíbený žánr je dystopie, což možná v kontextu AI zní vtipně. Číst Kurta Vonneguta nebo beatniky je ale super. A hrozně rád chodím na místa, kde se zavřeli na víkend, byli na tripu a psali ty zásadní knížky.

Podpořte Reportér sdílením článku