上海交大实现千亿级大模型全栈国产化部署,AI教学科研进入新纪元
上海交通大学近日利用华为昇腾Atlas 800T A2算力集群,成功部署了DeepSeek全系列大模型,成为国内首个实现千亿级大模型全栈国产化部署的高校。此次部署涵盖DeepSeek-R1和DeepSeek-V3等核心模型,将服务于教学、科研和学校管理等多个方面。
这一突破得益于昇腾先进架构的高性能和华为提供的专业服务支持。针对高校的特殊需求,上海交大在部署过程中实现了三大技术突破:首先,通过优化昇腾Ascend核间通信,仅用4台Atlas 800服务器就完成了DeepSeek-R1和DeepSeek-V3千亿参数模型的推理,硬件成本降低了65%;其次,基于昇腾AI原生平台,实现了算力资源的动态分配,提高了资源利用率;最后,通过昇腾处理器和MindSpore框架的深度适配,DeepSeek-V3在复杂数学推理任务中的端到端时延显著缩短。
DeepSeek系列模型已于2025年2月4日正式上线华为昇腾社区,方便用户一键获取。上海交大师生现在可以通过网页或APP申请使用DeepSeek模型,用于学习和科研。上海交通大学鲲鹏昇腾科教创新卓越中心将进一步推动DeepSeek模型与课程和科研的融合,探索AI赋能的学习和科研新模式。该中心致力于推动基于鲲鹏昇腾技术的校企合作和产教融合,将人工智能技术融入师生的学习和科研中,助力学校走在科技前沿。
本文 timi45.com 原创,转载保留链接!网址:https://timi45.com/post/1613.html
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。
