
Как приручить монстра: новый трюк DeepSeek для дешёвого обучения ИИ
Китайская лаборатория DeepSeek представила архитектуру mHC (Manifold-Constrained Hyper-Connections), которая обещает удешевить и упростить обучение мощных языковых моделей. В статье простыми словами разбираем, что такое гипер-соединения, зачем их «сжимать» многообразиями и почему это может снова перевернуть индустрию — на радость всем разработчикам, а не только гигантам с бездонным бюджетом.



