上海交大实现千亿级大模型全栈国产化部署，AI教学科研进入新纪元

author 阅读：60 2025-02-24 02:58:40 评论：0

上海交通大学近日利用华为昇腾Atlas 800T A2算力集群，成功部署了DeepSeek全系列大模型，成为国内首个实现千亿级大模型全栈国产化部署的高校。此次部署涵盖DeepSeek-R1和DeepSeek-V3等核心模型，将服务于教学、科研和学校管理等多个方面。

这一突破得益于昇腾先进架构的高性能和华为提供的专业服务支持。针对高校的特殊需求，上海交大在部署过程中实现了三大技术突破：首先，通过优化昇腾Ascend核间通信，仅用4台Atlas 800服务器就完成了DeepSeek-R1和DeepSeek-V3千亿参数模型的推理，硬件成本降低了65%；其次，基于昇腾AI原生平台，实现了算力资源的动态分配，提高了资源利用率；最后，通过昇腾处理器和MindSpore框架的深度适配，DeepSeek-V3在复杂数学推理任务中的端到端时延显著缩短。

DeepSeek系列模型已于2025年2月4日正式上线华为昇腾社区，方便用户一键获取。上海交大师生现在可以通过网页或APP申请使用DeepSeek模型，用于学习和科研。上海交通大学鲲鹏昇腾科教创新卓越中心将进一步推动DeepSeek模型与课程和科研的融合，探索AI赋能的学习和科研新模式。该中心致力于推动基于鲲鹏昇腾技术的校企合作和产教融合，将人工智能技术融入师生的学习和科研中，助力学校走在科技前沿。

本文 timi45.com 原创，转载保留链接！网址：https://timi45.com/post/1613.html

可以去百度分享获取分享代码输入这里。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。