Проверката за безопасност, която трябва да спре AI агент за програмиране от изпълнението на опасна команда, може да бъде лесно заобиколена чрез трик в обвивката (shell), който е публично известен от десетилетия.
Ново изследване от Adversa AI, което назовава заобикалянето GuardFall, установи, че то работи срещу десет от единадесетте популярни агента с отворен код за писане на код и компютърно използване, които фирмата е тествала. Само един от тях, Continue, е бил разработен така, че да бъде устойчив.