
Как приручить хаос в LLM: батч‑инвариантность против недетерминизма
Почему ответы LLM «пляшут» даже при температуре 0 и как вернуть воспроизводимость: от мифа о параллелизме к батч-инвариантным ядрам для RMSNorm, матмулов и внимания.
Почему ответы LLM «пляшут» даже при температуре 0 и как вернуть воспроизводимость: от мифа о параллелизме к батч-инвариантным ядрам для RMSNorm, матмулов и внимания.