Nový trik: Poézia vraj dokáže oklamať aj najlepšiu AI
Máte vypnuté reklamy
Vďaka financiám z reklamy prinášame kvalitné a objektívne informácie. Povoľte si prosím zobrazovanie reklamy na našom webe. Ďakujeme, že podporujete kvalitnú žurnalistiku.
Zdroj: Freepik.com
Výskumníci tvrdia, že stačí básnička – a chatbot môže pomôcť aj s tým, čo má prísne zakázané. Znie to absurdne, ale dáta hovoria jasne.
Keď sa povie „nebezpečná poézia“, väčšina si predstaví pubertálny smútok, nie návod na výrobu jadrovej zbrane. Lenže nová štúdia ukazuje, že básne môžu byť oveľa silnejšie, než by si najtvrdší literárny kritik pomyslel. A umelá inteligencia sa na nich nechá nachytať prekvapivo ľahko.
Každý chatbot má zabudované poistky, aby neodpovedal na otázky typu „ako sa vyrába bomba“ alebo „ako ublížiť človeku“. Problém je, že tieto ochrany sú len také dobré, ako sú chytré metódy, ktoré ich obchádzajú. A výskumníci z Icaro Lab prišli na postup, ktorý pôsobí ako zlý vtip: všetko skryť do rýmov a metafor.
Modely, ktoré by priamu otázku odmietli, zrazu reagujú ochotne, ak je „zakázaná téma“ napísaná ako lyrická báseň. A výsledky sú desivé: úspešnosť obídenia dosahovala až 62 percent. V praxi to znamená, že AI pod vplyvom veršov poskytla rady v oblastiach, kde by nemala – od výroby zbraní až po nebezpečné témy ako sebapoškodzovanie či zneužívanie.
Do testov zahrnuli známe modely: GPT od OpenAI, Google Gemini, DeepSeek, MistralAI a Claude od Anthropicu. Podľa výskumníkov práve GPT-5 a Claude Haiku 4.5 boli najodolnejšie a kládli odpor aj vo veršoch, zatiaľ čo ostatné modely sa nechali „ukecať“ výrazne ľahšie.
Ako píše Wired, samotné báseň-hacky štúdia nezverejnila. Dôvod je jednoduchý: boli vraj príliš nebezpečné na to, aby sa dostali na internet. A úprimne – po tom, čo výskum ukázal, sa tomu dá len ťažko čudovať.
Poézia tak dostala úplne nový rozmer. Nielenže vie roztopiť srdce, ale zjavne vie roztopiť aj bezpečnostné mantinely umelej inteligencie. A to je celkom nepríjemná metafora, aj bez rýmov.