MegaMath 是一個包含3710億tokens的開源數學推理預訓練數據集,覆蓋網頁、代碼和高質量合成數據三大領域。它首次在規模上超越了DeepSeek-Math Corpus(120B),代表從‘隻靠網頁’到‘面向推理’的重大跨越。
2025-04-14 14
沒有賬号?注冊  忘記密碼?