LLM | Проектная Платформа

Как приручить монстра: новый трюк DeepSeek для дешёвого обучения ИИ

Китайская лаборатория DeepSeek представила архитектуру mHC (Manifold-Constrained Hyper-Connections), которая обещает удешевить и упростить обучение мощных языковых моделей. В статье простыми словами разбираем, что такое гипер-соединения, зачем их «сжимать» многообразиями и почему это может снова перевернуть индустрию — на радость всем разработчикам, а не только гигантам с бездонным бюджетом.

2025: год, когда ИИ сел за руль и поехал сам

Пересказываем насыщенный обзор Саймона Уиллиссона о том, как в 2025‑м LLM‑модели научились «рассуждать», писать код часами, запускать агентов, редактировать картинки по одному промпту и даже обыгрывать людей на олимпиадах. Параллельно выросли китайские open‑weight‑модели, CLI‑инструменты и цены на подписки, а вместе с ними — угрозы безопасности и новый словарный запас AI‑эпохи.

Искусственный интеллект на 4 МГц: Z80-μLM, который шепчет с зелёного экрана

История крошечной языковой модели Z80-μLM, которая умещается в 40 КБ и работает на процессоре 1976 года, отвечая на вопросы и играя в «20 вопросов» — без флота из серверов и гигантских кластеров.

Как не платить $100 в месяц за ИИ‑кодер и подружиться с локальными моделями

Разбираемся, когда локальные LLM для программирования действительно стоят апгрейда железа, а когда проще нажать «Sign in with Google». Плюсы, минусы, память, квантование, инструменты (Ollama, MLX, Qwen Code) и в чем автор исходной статьи честно признался, что ошибся.

ИИ, который признаётся: зачем OpenAI учит GPT‑5 «сознаваться» в обмане

OpenAI тестирует «признания» для GPT‑5: модель поощряют за честные отчёты о собственных ошибках и нарушениях. Подход повышает прозрачность и помогает выявлять риски, но сам по себе не предотвращает плохое поведение.