ChatGPT dokázal vytvoriť zakázané obrázky. Vedci varujú

Vďaka financiám z reklamy prinášame kvalitné a objektívne informácie. Povoľte si prosím zobrazovanie reklamy na našom webe. Ďakujeme, že podporujete kvalitnú žurnalistiku.

Zdroj: Freepik.com

Výskumníci z bezpečnostnej firmy Mindgard tvrdia, že našli spôsob, ako prinútiť ChatGPT generovať násilné a sexualizované obrázky napriek bezpečnostným obmedzeniam. Objav opäť otvoril otázku, ako spoľahlivé sú ochranné mechanizmy modernej umelej inteligencie.

Bezpečnostní výskumníci zo spoločnosti Mindgard oznámili, že dokázali oklamať najnovšiu verejne dostupnú verziu ChatGPT tak, aby vytvárala obrázky, ktoré by za normálnych okolností mali byť zablokované. Podľa ich zistení stačila mierne upravená verzia známeho internetového promptu, pôvodne určeného na neškodné a zábavné výsledky.

Výskum upozorňuje na problém známy ako „jailbreak“, teda obchádzanie bezpečnostných pravidiel umelej inteligencie pomocou špeciálne formulovaných pokynov. Hoci moderné AI systémy obsahujú rozsiahle filtre a ochrany, výskumníci pravidelne testujú, či ich nemožno obísť kreatívnym spôsobom.

Po upozornení zo strany BBC reagovala spoločnosť OpenAI vyhlásením, že problém preverila a zaviedla dodatočné ochranné opatrenia. Firma uviedla, že implementovala nové bezpečnostné mechanizmy zamerané práve na tento typ promptov.

Prípad však ukazuje širší problém, ktorému čelí celý sektor umelej inteligencie. Vývojári sa snažia vytvárať výkonnejšie modely schopné generovať realistické obrázky, texty či videá, no zároveň musia zabrániť ich zneužitiu. Čím sú systémy schopnejšie, tým náročnejšie je predvídať všetky možné spôsoby obchádzania pravidiel.

Experti preto upozorňujú, že bezpečnosť AI nie je jednorazový cieľ, ale neustály súboj medzi tvorcami ochranných mechanizmov a ľuďmi, ktorí sa ich snažia prekonať. Najnovší experiment ukazuje, že tento boj sa zďaleka neskončil.