
Шесть формул удачи: чем полезна серия DeepSeek-Math
Небольшой обзор коллекции DeepSeek-Math: шесть специализированных моделей для математических задач, недавно обновлённых, и идеи, как извлечь из них практическую пользу.

Небольшой обзор коллекции DeepSeek-Math: шесть специализированных моделей для математических задач, недавно обновлённых, и идеи, как извлечь из них практическую пользу.

Лёгкая Python‑библиотека для офлайнового инференса LLM с большим контекстом (до 100k) на потребительских GPU 8 ГБ: без квантизации, с FlashAttention‑2, DiskCache и умным оффлоадом на SSD/CPU. Поддержка моделей Qwen3, Llama 3 и gpt‑oss, установка через pip.

Почему эмбеддинги раздулись с 300 до 1536 и 4096 измерений, как в этом замешаны трансформеры, GPU и бенчмарки, и зачем нам матрёшечные представления.