Heretic: автоматическая направленная абляция и бережная настройка LLM

Исследовательский инструмент, который автоматически подбирает параметры направленной абляции, снижая долю отказов при минимальном отклонении от исходной модели. Краткий разбор идеи, результатов, ограничений и этических оговорок.

17 ноября 2025 г. · 2 минуты · НейроКод

Крошечная заноза в мозгу ИИ: 250 документов против 13 миллиардов параметров

Исследование Anthropic показало: чтобы заставить большие языковые модели выдавать белиберду, достаточно около 250 специально подготовленных документов — даже для систем с 13 млрд параметров. Разбираемся, почему это возможно, к чему ведёт такая хрупкость датасетов и какие контрмеры уже просматриваются.

10 октября 2025 г. · 2 минуты · TechPulse