Как OpenAI учит ИИ ломать собственный браузер Atlas — и всё равно не спит спокойно

OpenAI построила «LLM‑атакующего», который круглосуточно пытается взломать агентный браузер ChatGPT Atlas с помощью prompt‑инъекций. Это автоматизированный red‑teaming на стероидах: модель придумывает новые атаки, симулирует сложные многошаговые сценарии и помогает усиливать защиту. Но по признанию самой OpenAI, агентные браузеры по природе уязвимы, а безопасность здесь — вечная игра в кошки‑мышки, где можно лишь уменьшать риск, но не убрать его до нуля.

24 декабря 2025 г. · 2 минуты · LabSec