Analyse: Hack van Instagram-AI-chatbot legt risico's van automatisering bloot
In dit artikel:
Een beveiligingsfout in Meta's nieuwe Instagram-ondersteuningschatbot maakte begin juni dat aanvallers toegang kregen tot prominente accounts en die konden overnemen. De hack, uitgevoerd in het weekend vóór 3 juni, trof onder meer de inactieve Obama White House-pagina, de beautyketen Sephora en een hoge functionaris van de U.S. Space Force. Onderzoeksjournalisten en getroffen gebruikers melden dat aanvallers via de AI het wachtwoord konden resetten zonder dat er onafhankelijke identiteitscontrole plaatsvond.
Het incident legt een fundamenteel probleem bloot in Metas streven om accountbeheer en klantenservice te automatiseren: de AI-agent kreeg bevoegdheden om gevoelige acties uit te voeren, maar ontbeerde de juiste toegangscontroles. Beveiligingsonderzoekers en ex-medewerkers noemen dit een architectuurgat dat hackers exploiteren met zogenaamde “prompt-injectie”-aanvallen — technieken waarmee misleiders de instructies aan een model manipuleren zodat het ongewenste taken uitvoert.
Meta zegt het lek inmiddels te hebben gedicht en bezig te zijn met het beveiligen van de getroffen accounts, maar gaf weinig technische details. De gebeurtenis verergerde zorgen bij beleggers over Metas grote AI-investeringen en personeelsinkrimpingen; het aandeel daalde meer dan 5%. Een van de slachtoffers, beveiligingsonderzoeker Jane Wong, rapporteerde meerdere resetpogingen en uiteindelijk verlies van toegang tot haar accounts voordat die hersteld waren.
Experts benadrukken dat dit geen uniek Meta-probleem is: zodra bedrijven AI brede bevoegdheden geven zonder robuuste waarborgen, ontstaan nieuwe aanvalsvectoren. Voorbeelden van eerdere prompt-aanvallen variëren van foutieve verkooporders tot misleidende medische adviezen. Beveiligingsspecialisten pleiten voor strengere controles, meer menselijke tussenkomst bij gevoelige handelingen en duidelijke limieten voor wat AI zelfstandig mag doen om soortgelijke misbruiken in de toekomst te voorkomen.