
Локальный RAG без облака: быстрее, тише, конфиденциальнее
Как мы запустили полностью локальный стек RAG в Skald: из чего он собран, как он выступил против облачных альтернатив и почему приватность больше не конфликтует с качеством.

Как мы запустили полностью локальный стек RAG в Skald: из чего он собран, как он выступил против облачных альтернатив и почему приватность больше не конфликтует с качеством.

Восемь месяцев в окопах RAG: как мы довели качество на 13 млн страниц — генерация запросов, реранкинг 50→15, кастомный чанкинг, метаданные и роутинг. Плюс стек и опенсорс.

Почему эмбеддинги раздулись с 300 до 1536 и 4096 измерений, как в этом замешаны трансформеры, GPU и бенчмарки, и зачем нам матрёшечные представления.