稠密架构共1篇
不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型-创奇社

不用英伟达GPU!华为盘古Ultra来了:昇腾原生、135B稠密通用大模型

我们知道,如今各大科技公司纷纷发布百亿、千亿级模型。但这些大部分模型训练主要依赖英伟达的 GPU。
机器之心的头像-创奇社机器之心29天前
0110