Если в 2023‑м ИИ учился говорить, а в 2024‑м — не слишком позорно программировать, то 2025‑й стал тем годом, когда модель сказала: «Ладно, отойди, я сама всё сделаю» — и, к удивлению, действительно сделала.

Саймон Уиллиссон в своём обзоре года фиксирует редкую ситуацию: почти каждый громкий AI‑хайп 2023–2024 вдруг обзавёлся рабочими, приземлёнными реализациями. Причём и в мире проприетарных гигантов, и в лагере открытых моделей, где особенно заметно усилились азиатские игроки — для России это, кстати, дополнительный простор для суверенных и гибких решений.

«Разум», который умеет дебажить

Главный поворот — «reasoning‑модели». OpenAI с o1/o3, затем целый зоопарк от других лабораторий: LLM перестают выдавать единый угадывающий ответ и начинают шагать по задачам, как человек на черновике. RLVR учит их решать проверяемые задачки (математика, код), и этот навык переносится в реальную работу: сложные баги, глубокие запросы к поиску, цепочки действий с инструментами.

Здесь же рождение агентов: если считать агентом «LLM, которая в цикле вызывает инструменты ради цели», то 2025‑й — год их массового приземления.

Coding‑агенты: «пойду, пока ИИ пишет PR»

Отдельный жанр — coding‑агенты. Anthropic тихо выпускает Claude Code, OpenAI — Codex CLI, Google — Gemini CLI, вслед тянутся Qwen и Mistral, IDE интегрируют всё это внутри. Классический сценарий: модель пишет код, запускает, смотрит ошибки, снова переписывает.

Следующий уровень — асинхронные агенты: Claude Code for web, Codex web, Jules. Вы формулируете задачу, закрываете ноутбук, а через час получаете pull request. Особенно удобно, когда правок много, а вы — в метро с телефоном.

Командная строка, YOLO и подписка за $200

Терминал из игрушки энтузиастов превращается в серьёзный рынок: только Claude Code Anthropic оценивает в $1 млрд годового оборота. Естественное следствие — режимы «YOLO» без подтверждений, когда агент может всё. Удобно, но опасно: от случайного rm -rf до утечек через prompt‑инъекции. Отсюда и популярность концепции «нормализации отклонений» и разговоров о будущей «катастрофе Challenger» для AI.

Между делом на рынке закрепляется новый ценник: подписки по $200+ в месяц для тех, кто сжигает миллионы токенов coding‑агентами, оказываются выгоднее прямой оплаты по токенам.

Китайские open‑weight и длинные задачи

2025‑й неожиданно проходит под знаком китайских открытых моделей: DeepSeek, Qwen, GLM, MiniMax и другие забирают верхние строчки рейтингов по качеству. Многие выкладываются под Apache/MIT, что критично для тех же российских разработчиков, ориентирующихся на открытый стек.

Параллельно METR показывает: глубина задач, которые модели решают автономно, растёт как на дрожжах — с получаса до нескольких часов человеко‑работы, и это всего за пару лет.

Картинки по промпту и Nano Banana

Массовый пользовательский взрыв — промпт‑редактирование изображений: новый gpt‑image от OpenAI, затем дешёвые и улучшенные версии. Китайский Qwen выпускает собственные генераторы, которые можно крутить на потребительском железе.

Гугл же выстреливает брендом года — Nano Banana: модель, которая не только хорошо слушается промпта, но и уверенно пишет текст на картинках и генерирует настоящие инфографики. Практически идеальный инструмент для презентаций и визуалов.

Безопасность, «летальная триада» и slop

По мере того как агенты получают доступ к реальному миру, более мрачные темы выходят на первый план: prompt‑инъекции, краденые секреты, браузеры с ИИ, у которых к вашим куки и банковским данным уже совсем недалеко. Для особо опасных сценариев Саймон вводит термин «летальная триада» — пересечение трёх вещей: приватные данные, возможность говорить наружу и контакт с непроверенным контентом.

На другом конце спектра — культурный феномен slop: низкокачественная AI‑бурда, забивающая интернет. В 2025 её официально признают словом года, но надежда на то, что курация и здоровый скепсис пользователей всё‑таки победят, остаётся.

Новый словарь и программирование с телефона

2025‑й дарит ещё с десяток ярких терминов: vibe coding, context engineering, slopsquatting, «asynchronous coding agents». Сам Саймон строит армию из 110 маленьких HTML‑инструментов, половину которых, по его признанию, собрал почти целиком с телефона, разговаривая с ИИ.

И это, пожалуй, главный итог года: LLM перестали быть экзотикой и превратились в повседневный слой — от экспериментов на кухне разработчика до больших промышленных конвейеров. Вопрос на 2026‑й звучит просто: сумеем ли мы использовать эту мощь ответственно — и не утонуть в собственном slop по пути?