Meta

Meta发布的新模型Llama 4引发质疑，代码能力不佳且存在作弊嫌疑。内部员工爆料称在训练过程中曾混入多个基准测试集以获得良好表现。多位AI研究人员指出Llama 4的表现远逊于SOTA模型，网友普遍对其失望。

2025-04-07 34

Meta最新基础模型Llama 4发布后遭遇差评如潮。代码能力受质疑，尤其是经典‘氛围编程’小球测试表现不佳。竞技场排名成绩参差不齐，且存在数据泄露和版权问题的疑虑。

2025-04-07 39

一篇来自‘一亩三分地’论坛的帖子爆料称Meta的新大模型Llama 4训练效果未达开源SOTA基准，公司采取混入测试集数据以满足目标的做法引发争议。此外，TechCrunch质疑Meta在LM Arena排行榜上提交的版本可能与公开版不同，并认为这种行为可能误导开发者。

2025-04-07 38