
Квадратный счёт: как кэш‑чтения растут вместе с контекстом
Почему при длинных разговорах кэш‑чтения начинают «съедать» бюджет и что с этим можно сделать.

Почему при длинных разговорах кэш‑чтения начинают «съедать» бюджет и что с этим можно сделать.

Как MDST превращает GGUF-модели в быстрые локальные помощники прямо в браузере при помощи WASM и WebGPU.

Почему старый добрый коллективный труд Википедии вдруг снова в моде, и как проект сохраняет человеческое лицо в мире, где ИИ пожирает тексты.

Omnara — агентный IDE из YC S25, который позволяет запускать сессии Claude Code и Codex в вашей среде и управлять ими через веб и мобильное приложение — с голосовым агентом, облачными песочницами и синхронизацией кода.

От отчёта Google: злоумышленники использовали модель Gemini для рекогносцировки, генерации фишинговых приманок, написания кода и эксфильтрации данных. В публикации разбирают примеры HonestCue, CoinBait и ClickFix, а также попытки извлечения модели.