Leckoho by napadlo, že firmy, které spravují terabajty kvalitních dat svých klientů, budou mít ohromný náskok v boji o tu nejlepší AI na světě. Představte si například, že by Adobe cvičila svůj obrázkový generátor Firefly pomocí děl profesionálů, kteří používají její úložiště Creative Cloud.
Až tak jednoduché to ale není, autoři si totiž konečně začínají uvědomovat svoji cenu a fakt, že bez jejich potu a stovek hodin práce by dnešní obrázkové generátory nenakreslily ani černý čtvereček.

Obrázkové generátory umějí lusknutím prstů kouzlit jen díky tomu, že před nimi někdo skutečně kouzlil v Photoshopu – a zpravidla dlouhé hodiny
Dobře to ilustruje právě kauza okolo společnosti Adobe, která svým uživatelům nedávno zaslala žádost o schválení nových podmínek služby. Někteří z nich přitom z textu (údajně chybně) vyčetli, že dávají firmě poměrně širokou licenci na jejich obsah uložený na Creative Cloud.
Nebojte se, vaši grafiku rozhodně nepoužíváme
Na sociálních sítích se brzy poté strhla lavina kritiky, která nakonec přinutila Adobe upravit podmínky takovým způsobem, aby byly lépe čitelné. Hlavní poselství přitom zní: Nebojte se, v žádném případě nám nedáváte souhlas k tomu, abychom nad vašimi daty cvičili jakoukoliv AI.
We don’t train generative AI on customer content. We are adding this statement to our Terms of Use to reassure people that is a legal obligation on Adobe. Adobe Firefly is only trained on a dataset of licensed
Adobe na blogu ubezpečuje uživatele Creative Cloud
Firma zároveň připomíná, že tak tomu nebylo ani před tím – Firefly cvičila výhradně nad daty, ke kterým měla speciální licenci. Podobné zpřesnění podmínek ale není v dnešní době vůbec na škodu a stejný krok by měli provést i ostatní.
Relativně obecnou podmínku široké licence totiž najdete prakticky u každé webové služby, která nějakým způsobem spravuje vaše data. Zpravidla ale nejde o to, že by je snad (zne)užívala pro své vlastní komerční účely (u sociálních sítí je to složitější), ale o to, že licenci k úpravám a šíření chráněného díla potřebuje prostě proto, aby mohla fotografii v JPEG transformovat do jiného formátu, vylepšit (tedy de jure vytvořit odvozené dílo) a ukázat ostatním na zdi (tedy šířit).
Implicitní zákaz učení by měl být normou
Pokud by se z této kauzy stala norma, bude to v nejlepším pořádku. I když tu dnes totiž kdekdo šermuje slovy, kdo všechno kvůli AI přijde o práci, trošku se zapomíná na to, že se většina obrázkových i jiných generátorů přinejmenším v raných verzích učila na (zdánlivě) volně dostupných informacích na internetu.
Transparentní doložení dat, na kterých se AI učila, bude vyžadovat také nový Akt o umělé inteligenci, který letos schválila Evropská unie. V plnou platnost vstoupí až za několik let
V tomto světle je naprosto legitimní otázka, proč by měl jednou grafik X přijít o práci kvůli obrázkovému generátoru Y, který jej kvalitativně předčí pouze díky tomu, že se kdysi v minulosti učil na jeho chráněných dílech a dílech jeho kolegů, kterým ale tvůrce takové AI nezaplatil ani halíř.
S dalším rozvojem umělé inteligence je tedy třeba stále dokola připomínat, že vaše data jsou pouze a jedině vaše a žádný operátor by je neměl bez vašeho svolení používat ke strojovému učení a vlastnímu obohacení.