Image by Solen Feyissa, from Unsplash

Studie zjistila, že hlavní AI agenti jsou náchylní k převzetí

Doba čtení: 3 minut

Poprvé zveřejněno: Aug 13, 2025

Aktualizováno 2krát od zveřejnění

Autor Kiara Fabbri Bývalá redaktorka technických novinek
Překladatel Lokalizační a překladatelský tým Lokalizační a překladatelské služby

Některé z nejčastěji používaných AI asistentů od společností Microsoft, Google, OpenAI a Salesforce mohou být převedeny do rukou útočníků s minimálním nebo žádným zapojením uživatele, podle nového výzkumu od Zenity Labs.

Máte spěch? Zde jsou rychlé fakty:

ChatGPT byl napaden, aby získal přístup k propojeným účtům Google Drive.
Microsoft Copilot Studio nechtěně zveřejnil databáze CRM od více než 3 000 agentů.
Google Gemini by mohl být využit k šíření falešných informací a phishingu.

Na konferenci Black Hat USA zaměřené na kybernetickou bezpečnost byly prezentovány zjištění, která ukazují, že hackeři mohou krást data, manipulovat s pracovními postupy a dokonce se vydávat za uživatele. V některých případech mohou útočníci získat „paměťovou trvalost“, což jim umožňuje dlouhodobý přístup a kontrolu.

„Mohou manipulovat s pokyny, otrávit zdroje znalostí a zcela změnit chování agenta,“ řekl Greg Zemlin, manažer produktového marketingu ve společnosti Zenity Labs, serveru Cybersecurity Dive. „To otvírá dveře sabotaži, narušení provozu a dlouhodobé dezinformaci, zejména v prostředích, kde se od agentů očekává, že budou činit nebo podporovat kritická rozhodnutí.“

Výzkumníci demonstrovali celé řetězce útoků proti několika hlavním podnikovým platformám AI. V jednom případě byl OpenAI’s ChatGPT unesen pomocí injekce e-mailového podnětu, což umožnilo přístup k propojeným datům Google Drive.

Bylo zjištěno, že Microsoft Copilot Studio uniká databáze CRM, přičemž na internetu bylo identifikováno více než 3 000 zranitelných agentů. Platforma Einstein od společnosti Salesforce byla manipulována tak, aby přesměrovala komunikaci zákazníků na e-mailové účty ovládané útočníky.

Mezitím by bylo možné přeměnit Google Gemini a Microsoft 365 Copilot na vnitřní hrozby schopné krást citlivé konverzace a šířit falešné informace.

Navíc se výzkumníkům podařilo napálit Googlovu umělou inteligenci Gemini tím, že ji přiměli k ovládání chytrých domácích zařízení. Tento hack vypnul světla, otevřel žaluzie a zapnul kotel bez příkazů obyvatelů.

Zenity odhalilo své zjištění, což některé firmy přimělo k vydání oprav. „Oceňujeme práci společnosti Zenity, která identifikovala a zodpovědně nahlásila tyto techniky,“ řekl mluvčí Microsoftu Cybersecurity Dive. Microsoft uvedl, že hlášené chování „již není efektivní“ a že agenti Copilot mají na místě bezpečnostní opatření.

OpenAI potvrdil, že opravil ChatGPT a provozuje program odměn za nalezení chyb. Salesforce uvedl, že opravil nahlášený problém. Google oznámil, že nasadil „nové, vrstvené obrany“ a zdůraznil, že „mít vrstvenou obrannou strategii proti útokům na vstupní výzvy je zásadní,“ jak uvedl Cybersecurity Dive.

Zpráva poukazuje na rostoucí bezpečnostní obavy, jak se AI agenti stávají běžnějšími na pracovištích a jsou důvěryhodní pro zvládání citlivých úkolů.

V dalším nedávném vyšetřování bylo oznámeno, že hackeři mohou krást kryptoměny od Web3 AI agentů vložením falešných vzpomínek, které přebíjí normální zabezpečení.

Bezpečnostní chyba existuje v ElizaOS a podobných platformách, protože útočníci mohou použít kompromitované agenty k převodu finančních prostředků mezi různými platformami. Trvalá povaha blockchainových transakcí znemožňuje vrácení ukradených peněz. Nový nástroj, CrAIBench, má za cíl pomoci vývojářům posílit obranu.

Studie zjistila, že hlavní AI agenti jsou náchylní k převzetí

Jsme rádi, že se vám náš článek líbil!