众所周知,LeCun 不喜自回归,并且还提出了一种名为联合嵌入预测架构(JEPA)的新方向,并且该方向也一直在有新成果涌现。 然而,自回归模型的成功也是有目共睹的,尤其是在语言领域。那么,生成式预训练在自然语言上的成功能否在视觉领域重现呢? 近日,密歇根大学、纽约大学、普林斯顿大学和弗吉尼亚大学的一个联合研究团队对此给出了肯定答案。 只不过,他们不是训练模型输出用于下游任务的特征,而是让它们生成嵌 ...