首先是性能差距。国产GPU在单卡算力方面快速追赶,但在集群效率、互联带宽、软件栈成熟度等方面仍与英伟达存在差距。一个3000卡的国产集群,实际有效算力可能仅相当于同等规模英伟达集群的60%-70%。这意味着完成相同训练任务需要更多芯片、更长时间、更复杂的并行优化——这些最终都将转化为成本。
这一轮变革的催化剂与 Andrej Karpathy 在 2025 年 2 月发布的贴文相互呼应。
,更多细节参见有道翻译
This scenario can be avoided by ensuring that there are "reader gaps":
BBC探访遭摧毁的柬埔寨诈骗园区 内部曾设有澳大利亚、中国、巴西的“警务站”