华为昇腾AI芯片受挫,DeepSeek被迫回归Nvidia训练大模型

2025-08-14 16:04

中国AI明星企业DeepSeek在训练新一代R2模型时遭遇重大技术瓶颈。原计划采用华为昇腾芯片进行训练,但因性能不足被迫回归Nvidia平台,导致产品发布延期。这一事件揭示了中国在AI芯片领域追赶国际领先水平仍面临严峻挑战,也反映出技术自主与性能需求之间的现实矛盾。

技术雄心遭遇现实困境

DeepSeek作为中国AI领域的明星企业,在今年1月成功推出R1模型后,受到了来自官方的明确压力——要求其使用华为昇腾芯片而非Nvidia产品。据金融时报报道,三位知情人士透露,这种政治导向的技术选择最终导致了严重的技术问题。在训练新一代R2模型时,团队遭遇了'持续性的技术问题',这些问题如此根本性,以至于整个项目陷入停滞。这也直接导致原定5月的发布计划被取消,使公司在竞争激烈的AI市场中陷入被动。

训练与推理的技术鸿沟

要理解这一困境的技术本质,必须区分AI训练和推理两个阶段。训练就像送学生上大学进行多年高强度学习,需要巨大的算力和稳定性支撑;而推理则相对简单,如同向毕业生提问。DeepSeek发现,华为的芯片或许能够应对最终的'考试'(推理),但还无法胜任严苛的'大学课程'(训练)。据行业分析机构Tirias Research 2024年报告显示,Nvidia在AI训练领域的性能领先优势仍然保持在2-3代水平,这种技术差距在复杂模型训练中表现得尤为明显。

技术支援未能破解困局

面对技术困境,华为甚至派出了自己的工程师团队亲赴DeepSeek办公室,试图帮助其在昇腾芯片上运行R2模型。但即使有专家现场支持,团队仍然无法完成成功的训练运行。这一情况在业内并不令人意外——华为CEO任正非早在今年初就坦言'美国夸大了华为的成就',公司'还没有那么伟大',并承认其最好的芯片仍然落后一代。这种技术差距在需要处理海量参数和复杂计算图的大模型训练中表现得尤为突出。

政策导向与技术现实的冲突

尽管面临技术挑战,中国政府仍在积极推动科技巨头优先使用本土硬件。金融时报报道称,企业现在必须为采购Nvidia的出口合规芯片H20提供理由说明。这种政策导向是培育国内冠军企业战略的一部分,但可能迫使企业做出技术上次优的选择。据IDC 2024年AI基础设施报告显示,中国企业在AI芯片选择上面临着性能差距达40%以上的现实挑战,这在追求模型性能极限的竞赛中是一个不容忽视的差距。

结语

DeepSeek的案例再次证明,在AI这场全球竞赛中,工程技术规律仍然占据主导地位。尽管有着自上而下的政策指导和民族自豪感的驱动,但性能王冠目前仍牢牢戴在Nvidia头上。中国正在布局长远游戏,但在追求技术自主的道路上,企业如何平衡政策要求与技术现实,将成为决定其全球竞争力的关键因素。这场芯片之争的最终结局,将如何重塑全球AI产业格局?