
Когда 30‑миллиардный Qwen заходит в бар… на Raspberry Pi
Как ByteShape с помощью ShapeLearn научили Qwen3‑30B работать в реальном времени на Raspberry Pi 5, Intel i7 и современных GPU, не жертвуя качеством ради бессмысленной экономии битов.

Как ByteShape с помощью ShapeLearn научили Qwen3‑30B работать в реальном времени на Raspberry Pi 5, Intel i7 и современных GPU, не жертвуя качеством ради бессмысленной экономии битов.

История крошечной языковой модели Z80-μLM, которая умещается в 40 КБ и работает на процессоре 1976 года, отвечая на вопросы и играя в «20 вопросов» — без флота из серверов и гигантских кластеров.