
Пиксели и слова на одной волне: MMaDA-Parallel думает параллельно
MMaDA-Parallel — параллельная мультимодальная диффузионная модель, где текст и изображение взаимодействуют на каждом шаге денойза. Благодаря ParaBench и обучению с ParaRL система устраняет накопление ошибок и повышает кросс-модальную согласованность, показывая +6,9% к выравниванию вывода относительно SOTA.



