
Квадратный счёт: как кэш‑чтения растут вместе с контекстом
Почему при длинных разговорах кэш‑чтения начинают «съедать» бюджет и что с этим можно сделать.

MDST Engine: GGUF в браузере — локальные LLM на WebGPU
Как MDST превращает GGUF-модели в быстрые локальные помощники прямо в браузере при помощи WASM и WebGPU.

Википедия возвращается: как живая энциклопедия противостоит эпохе ИИ
Почему старый добрый коллективный труд Википедии вдруг снова в моде, и как проект сохраняет человеческое лицо в мире, где ИИ пожирает тексты.

Код в кармане: Omnara превращает Claude Code и Codex в вашего компаньона
Omnara — агентный IDE из YC S25, который позволяет запускать сессии Claude Code и Codex в вашей среде и управлять ими через веб и мобильное приложение — с голосовым агентом, облачными песочницами и синхронизацией кода.

Когда ИИ стал многоруким: как Gemini помог хакерам на всех этапах атаки
От отчёта Google: злоумышленники использовали модель Gemini для рекогносцировки, генерации фишинговых приманок, написания кода и эксфильтрации данных. В публикации разбирают примеры HonestCue, CoinBait и ClickFix, а также попытки извлечения модели.