Problém není AI, ale sociální sítě. Bez nich by deepfake byl satirou pro kamarády
30. listopadu 2024
30. listopadu 2024
Když mu bylo šest, naprogramoval svůj první web. Na střední škole vytvořil aplikaci na překlad znakového jazyka, která zaujala OSN. Po maturitě odešel do Kalifornie, na Stanford, jednu z nejlepších univerzit světa a líheň nejúspěšnějších technologických firem. Pod vedením špičkových vědců tu zkoumá nástrahy umělé inteligence, hned v úvodu vytvořil pro televizi CNN virtuální kopii slavného moderátora. Matyáš Boháček, 20 let.
Vidíte a já přitom celou dobu dělám jen to, co mě baví a naplňuje. Takže byť je to škola a práce, ve finále bych to dělal i jen tak, ve svém volném čase. Vždycky jsem věděl, že chci dělat něco s technologiemi, co bude k užitku i ostatním. Bavil mě ten sociální aspekt.
Že kombinuje celou řadu různých věd dohromady. Na jedné straně je to hodně technický obor, vyžadující hluboké porozumění kódování a softwaru, zároveň ale ovlivňuje sociální vědy nebo neurovědu. Vždycky jsem se zajímal o hodně věcí najednou, takže v tom mi AI přijde úplně skvělá.
Momentálně používáme dva systémy. Jeden je postavený na specifických rysech konkrétních osobností – typově třeba politiků nebo celebrit, u kterých je větší riziko zneužití. Náš model se podívá na stovky hodin materiálu, jako jsou proslovy, rozhovory nebo výstupy ve filmech. A naučí se, jak osoba kombinuje gesta a rysy v obličeji. Všichni totiž máme velmi silné osobní rysy, je to skoro něco jako behaviorální DNA, když to přeženu. Systémy na tvorbu deepfake se většinou soustředí jen na prostor okolo pusy, který „přeanimují“, protože se snaží lidem vložit slova do úst. Náš systém je schopný odhalit, že došlo k manipulaci, která nekoresponduje se zbytkem těla. Funguje ale u hodně známých lidí, nedá se využít pro každého z nás, tam máme jiný systém.
Myšlenka, která za ním stojí, je hrozně jednoduchá, proto ho mám tak rád. Všiml jsem si, že když se v deepfake videích dívám lidem na ústa a zacpu si přitom uši, vůbec nevím, co ti lidé říkají. Když se ale díváte na reálného člověka, máte aspoň trochu představu, co říká. S mým profesorem Hanym Faridem jsme proto navrhli systém, který dělá dvě věci. Prvním je jen přepis audia. V druhém kroku se podívá na video, ignoruje přitom audio a jen z pohybu úst predikuje, co osoba řekla. Máme pak dva texty, v případě reálných videí jsou velmi podobné, při deepfake velmi odlišné.
Nejsou. Kdybychom je dali volně přístupné na internet, mohla by je druhá strana využít ve svůj prospěch. Zpřístupňujeme je jen konkrétním organizacím, kterým věříme, že jim jde o to, kultivovat veřejný prostor a informovat pravdivě veřejnost.
Ke konkrétnímu využití našich systémů se bohužel nemůžu vyjadřovat.
To určitě, příkladů byla spousta. Nejen deepfake videí, ale i obrázků. Řešila se však i reálná fotka z akce (demokratické kandidátky) Kamaly Harris, lidé poukazovali na jisté zvláštnosti na fotce, protikandidát Donald Trump tvrdil, že obrázek je vytvořený umělou inteligencí. Vidím posun v tom, že spolu s umělou inteligencí nepřišla jen zfalšovaná videa a fotografie, ale vlastně i možnost cokoliv – video, audio nebo fotku – zpochybnit. To je hrozně nebezpečné, protože vést demokracii v prostoru, kde si nemůžeme ani říct, že dva plus dva jsou čtyři, je velmi náročné.
Bylo jich několik, ale není žádný jeden deepfake, který by nejvíce ovlivnil celou kampaň. A to je podle mě ten point. Lidé mají pocit, že jeden deepfake změní všechno. Samozřejmě že se to asi může stát. Ale za mě jde hlavně o systematické, postupné podrývání systému, vysílání spousty deepfakes na všechny strany. Pár z nich se uchytí v nějakých menších skupinách, pak to uhasne, po nějakém čase přijde zas něco jiného… Děje se to postupně, třeba už dva roky před volbami. Řada respondentů v různých průzkumech navíc uvádí, že deepfake videa a dezinformace ovlivnila témata, nad kterými přemýšlejí. To je nebezpečné. Pro mě osobně byl asi nejzajímavější deepfake obrázek vytvořený umělou inteligencí, na kterém je Donald Trump s několika svými údajnými afroamerickými podporovateli. To je asi nejvýstižnější AI obrázek tohoto volebního období.
Je. A my teď máme možnost se proti tomu postavit, upravit legislativu. Za mě to není ani tak problém umělé inteligence, jako spíš problém sociálních sítí. Bez sítí, jako je X, Facebook nebo Instagram, je deepfake možná fajn satira pro jednotlivce nebo pro pár lidí, kterým to ukážete na mobilu, ale jinak nemá žádný dopad. Jsou to ale sociální sítě, které deepfake více zobrazují lidem, kteří jsou pak náchylní tomu věřit a nejsou schopní kriticky rozlišit, jestli to je reálné. V Evropě už jsou určité snahy o změnu legislativy, aby platformy musely označovat videa nebo fotky upravené nebo vytvořené AI a netlačit jejich dosah. V Americe je to komplikovanější, protože odpůrci takové legislativy se odkazují na svobodu slova a na americkou ústavu. Takže v USA to ještě bude velké téma.
Podle mě se ta otázka změní. Už se nebudeme ptát, co je falešné, ale co je reálné. Je to možná trochu deprimující, na druhou stranu věřím, že tu jsou i pozitiva. Už máme technologii, která je schopná odhalit, kde, jak a kdo vytvořil nějaký kus obsahu, ať je to video, obrázek, nebo audio. To je naše velká zbraň pro ověřování autenticity.
Většinou ne, pokud osoba nebo skupina nemá profil, kde prezentuje svou identitu.
Je to tak. Ale většina velkých hráčů chápe, že je potřeba to řešit, a naopak s námi spolupracují na tvorbě obrany proti těmto technologiím. Co mě naopak znepokojuje, jsou online komunity, které vyvíjejí věci mimo mainstream. Jejich doménou je hlavně výroba pornografie, dokážou vložit tvář nebo i celé tělo nějaké osoby do pornografické nahrávky. Často jsou to děti nebo mladiství. Velká vylepšení kvality deepfake videí vyšla právě z těch komunit.
Naše laboratoř spolupracuje s různými médii a organizacemi a CNN, velká americká televize, se nás tehdy ptala na nějaká již existující deepfake videa. Jednoho z producentů při té příležitosti napadlo, jestli pro ně nemůžeme vytvořit deepfake jejich velmi známého moderátora Andersona Coopera. Já jsem to dostal za úkol. Během dne jsem spíchnul něco velmi jednoduchého, nebylo to perfektní, ale bylo to docela přesvědčivé. Ukázali jsme to producentovi a pak se to začalo nabalovat. Někoho napadlo tohle, někoho tamto a najednou se z toho stala celá hodinová show, kdy ji náš AI moderátor otevřel a představil téma pořadu. Až pak byl blízký záběr na reálného Andersona Coopera, který řekl, že je to jeho AI verze.
Přišly ze všech směrů. Byly pochvalné, že je to super způsob, jak lidi upozornit na to, že jsme náchylní uvěřit deepfake a dezinformacím. Ale ozvalo se také hodně lidí z výzkumu, kteří tvrdili, že to je kontraproduktivní, dělá to špatnou image AI a mohlo by to podrývat podporu jejího výzkumu.
S profesorem Hanym Faridem jsme o tom hodně diskutovali a dospěli jsme k tomu, že je důležité upozornit veřejnost, jak jednoduché to je. Řada lidí totiž byla přesvědčená, že něco takového dokážou vytvořit jen hollywoodská studia nebo experti, kteří mají týmy a sofistikované počítače. A najednou student, co zrovna vyšel ze střední školy a byl první týdny v Americe, na svém laptopu bez cizí pomoci z volně dostupných nástrojů udělal něco, co odvysílali na CNN. Podle nás to byla tak zásadní zpráva, že jsme si řekli, že o tom musíme informovat. Vydali jsme článek, kde jsme celý proces popsali. Ale spoustu věcí jsme vynechali, abychom neposkytovali návod, jak to udělat.
Jsme ve věku, kdy si nějak nastavujeme cíle – a zároveň už žijeme obklopeni umělou inteligencí. Takže naše myšlenky a představivost jsou už úplně jinde, než to bylo před deseti lety. Na Stanfordu jsou kolem mě lidé, kteří si dali jako svůj osobní cíl vyřešit rakovinu pomocí AI. Jsou tam lidé, kteří nás chtějí posunout nejen na Mars, ale i dál. A byť to jsou idealisté a vizionáři, tak mít takové možnosti uvažování je super. Je potřeba mít velké cíle, abychom se posouvali. Řada lidí si taky neuvědomuje náš potenciál. Česko má super pozici z AI hodně těžit. Máme tady skvělé školy, velmi dostupné vzdělávání, silný technologický potenciál a podhoubí různých škol a firem a snadný přístup počítačům. To všechno dohromady může být skvělý recept, abychom se pomocí AI vybudovali na víc technologickou společnost.
Student Stanfordovy univerzity, zabývá se umělou inteligencí. Vyvíjí aplikace na rozpoznání takzvaných deepfake videí a dezinformací. Spolupracuje s jedním z předních světových odborníků na AI, profesorem Hanym Faridem. Svůj první web naprogramoval v šesti letech, vyvinul také překladač znakového jazyka, který zaujal i v OSN. Spolupracoval s americkou CNN.
Snažím se pravidelně vypínat, být bez mobilu, jinak bych se asi zbláznil.
Moje pravidlo je, že soboty jsou bez práce. Na bakaláři je těžké to dodržovat, ale s kamarády ze školy se snažíme jednou za dva tři týdny vyjet někam k moři nebo na túru do národního parku. Nebo na filmy do San Franciska, kde pořád mají stará americká kina s neonovými štíty a pouští staré filmy za 5 dolarů a můžete tam sedět i čtyři hodiny. V Americe je kultura práce hodně podstatná, všichni musí být hyperproduktivní, ale je potřeba umět i vypnout, třeba si jenom číst. Můj oblíbený žánr je dystopie, což možná v kontextu AI zní vtipně. Číst Kurta Vonneguta nebo beatniky je ale super. A hrozně rád chodím na místa, kde se zavřeli na víkend, byli na tripu a psali ty zásadní knížky.
Podpořte Reportér sdílením článku
Nejvíc jí baví rozhovory se zajímavými lidmi.