书签 分享 收藏 举报 版权申诉 / 150

类型deepseek大模型生态报告.pdf

  • 上传人:爱吃****子
  • 文档编号:176335
  • 上传时间:2025-03-25
  • 格式:PDF
  • 页数:150
  • 大小:3.51MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    deepseek 模型 生态 报告
    资源描述:

    1、 I deepseek 大模型生态报告 赛迪研究院电子信息研究所赛迪研究院电子信息研究所 2025 年年 2 月月 I 目 录 一、DeepSeek 大模型背景.1(一)深度求索公司情况.1(二)模型迭代历程.2(三)研发团队情况.3 1.北京大学罗福莉.4 2.北京大学高华佐.4 3.北京邮电大学曾旺丁.5 4.北京大学朱琪豪.5 5.北京大学代达劢.6 6.北京大学王炳宣.6 7.浙江大学梁文锋.7 二、DeepSeek 大模型应用现状.8(一)国内情况.8(二)全球情况.10 三、DeepSeek 大模型技术特点.11(一)技术创新.11 1.压缩:从结构到量化.11(1)多层注意力 M

    2、LA.12(2)FP8 混合精度训练框架.13 2.并行:对硬件的极限使用.16(1)DualPipe 跨节点通信.16(2)无辅助损失的负载均衡策略.18(3)底层通信优化.20 3.总结.20(二)训练成本.21 四、DeepSeek 大模型产业生态.22(一)企业.22 II 1.DeepSeek 系列新模型正式上线昇腾社区,华为小艺已接入 DeepSeek.22 2.三大运营商全面接入 DeepSeek.23 3.多家公司宣布接入 DeepSeek.23 4.微软、英伟达、亚马逊全部接入 DeepSeek!.25 5.燧原科技实现全国各地智算中心 DeepSeek的全量推理服务部署.2

    3、6 6.多家券商也积极“拥抱”DeepSeek.26(二)生态.27 1.Deepseek 应用 27 日登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜.27 2.DeepSeek 在开源社区 GitHub 上的 Star 数首次超越 OpenAI.28 3.国家超算互联网正式上线 DeepSeek.29 4.传 DeepSeek 正准备适配中国国产 GPU.29 5.DeepSeek 的风,火速吹遍了终端企业.30(三)应用.32 1.文学.32 2.编程.32(四)基础设施.35 五、DeepSeek 大模型产业影响.35(一)对人工智能技术的影响.35 1.吴恩达谈 Deep

    4、Seek:中国 AI 迎头赶上,扩大算力并不是 AI 进步的唯一途径.35 2.蒸馏技术将成为行业突破口.36(二)对产业生态的影响.37 1.DeepSeek 开源对于企业战略价值.37 2.DeepSeek 是否真的绕开了 CUDA?.39 3.DeepSeek 会导致对智算中心的需求大幅减少吗?.39 III(三)对国际竞争的影响.46 1.DeepSeek 的崛起,冲击了全球科技供应链的核心玩家.46 2.AI 低成本化,最大输家可能不是 Nvidia,而是依赖大模型收费的 AI 公司.46 3.AI 进入创业黄金时代.47 4.DeepSeek 的崛起引发了全球资本市场的剧烈震荡.4

    5、7 六、国内相关表态.48(一)国家层面.48 1.中国常驻联合国代表傅聪回答记者提问.48 2.外交部发言人郭嘉昆主持例行记者会.49(二)地方层面.49 1.广东.49 2.郑州.49 3.北京经济技术开发区.49 七、各国相关表态.50(一)美国.50 1.龙头企业单位.50(1)英伟达.50(2)OpenAI.51(3)谷歌.52(4)苹果.52(5)微软.52 2.美国联邦政府.52(1)美议员推动立法促中美 AI 全面脱钩.53(2)美国海军禁止官兵使用 DeepSeek 大模型.53 3.美国地方政府.54(1)得克萨斯州宣布禁止政府设备使用DeepSeek.54 IV(二)英国

    6、及欧洲.54 1.龙头企业单位.54(1)英国阿兰图灵研究所.54(2)德国墨卡托中国研究中心.54(3)英国利兹大学.55(4)荷兰阿斯麦.55 2.政府及公共机构.55(1)意大利.55(2)爱尔兰.55(3)法国.55(三)韩国.56 1.龙头企业单位.56(1)韩国.56(2)LG.56(3)三星.56 2.政府及公共机构.56(1)韩国代理总统崔相穆将 DeepSeek 称之为“新的冲击”.57(2)韩国祥明大学.57(四)其他国家.57 1.政府及公共机构.57(1)澳大利亚.58(2)日本.58(3)印度.58 八、DeepSeek 大模型的经验启示.58(一)技术.58 1.中

    7、科院为何难现 DeepSeek 式突破.58(1)制度基因的先天性分野.58(2)创新效率的量子级差距.60(3)体制突围的艰难探索.62(4)破局之道:构建科技创新共同体.63(5)超越二元对立的创新哲学.64 V 2.王凡、刘少山:中国如何引领全球具身智能?DeepSeek 的战略启示AI 观察.64(1)DeepSeek 的突破对具身智能的启示.65(2)DeepSeek:推动中国 AGI 领域自主创新.66(3)具身智能:人工智能从虚拟世界走向物理世界.67(4)上下文强化学习:具身智能的发展方向.68(5)具身智能的应用前景与行业变革.70(6)政策建议:开源发展、标准化和产业化落地

    8、.71(7)结论:把握技术机遇,领导未来的全球 AI 竞争.72(8)本文作者.72 3.专家观点|鲁传颖:人工智能重塑国家安全的范式和逻辑.72(1)人工智能赋能国家安全.73(2)人工智能技术安全对国家安全的深层次影响.77(3)人工智能时代的国家安全治理体系.82 4.巴黎 AI 峰会,李飞飞教授开幕演讲:当前才是“首个真正的 AI 时代”.86(1)人工智能的历史与起源.87(2)现代 AI 三大关键要素.88(3)2012 年之后的 AI 突破.91(4)大模型与近期 AI 进展.92(5)空间与具身智能的兴起.94(6)以人为本的 AI 与三大核心价值.94(7)AI 治理:理性、

    9、务实与多方协作 96 VI 5.人工智能驱动信息技术体系重构与再造兼评中国至 2050 年信息科技发展路线图.98(1)路线图和三元融合的重要预判与近 15 年发展的比较.99(2)未来 10 年信息技术体系重构与再造的创新机遇与挑战.106(3)发展对策.121(二)企业.123 1.DeepSeek 的创新三重门.123(1)小天才们的胜利.123(2)华为式的军团平推.125(3)原创(哲学性)思想.129(4)DeepSeek 跨越第三重门了吗?.130 2.DeepSeek 颠覆了什么?大模型“国产之光”破局的启示.131(1)击穿三大定式.132(2)实现三大跃升.134(3)超越

    10、技术的启示.136(三)地方.138 1.为什么 DeepSeek 没有出现在浦东张江.138 1 一、DeepSeek 大模型背景(一)(一)深度求索公司情况深度求索公司情况 DeepSeek,全称“杭州深度求索人工智能基础技术研究有限公司”,简称“深度求索”,于 2023 年 7 月 17 日由幻方量化创立,位于杭州市拱墅区,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术,法定代表人、执行董事兼总经理为裴湉。2024 年 1 月 5 日,该公司发布第一个大模型 DeepSeek LLM。之后,相继发布 DeepSeek-Coder、DeepSeek-VL、DeepSe

    11、ek V2、DeepSeek V3 等模型。其中,DeepSeek V2 模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注,被称为“AI 界的拼多多”。2025 年 1 月 20日,该公司正式发布 DeepSeek-R1 模型,并同步开源模型权重。DeepSeek-R1 性能逼近 OpenAI o1 正式版,推理成本却仅为 OpenAI o1 的几十分之一。1 月 27 日,DeepSeek 应用登顶苹果美国地区应用商店免费 App 下载排行榜,在美区下载榜上超越了 ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek 成为中国区第一。1 月 28 日,De

    12、epSeek 发布开源多模态模型 Janus-Pro,其中 70 亿参数版本的 Janus-Pro-7B 模型在使用文本提示的图像生成排行榜中优于OpenAI 的 DALL-E 3 和 Stability AI 的 Stable Diffusion。2 2025 年 2 月 8 日,QuestMobile 数据显示,DeepSeek 在1 月 28 日的日活跃用户数首次超越豆包,随后在 2 月 1 日突破 3000 万大关,成为截至 2025 年 2 月史上最快达成这一里程碑的应用。(二)(二)模型迭代模型迭代历程历程 中国初创企业深度求索(DeepSeek)研发大语言模型时据报绕过了美国人工

    13、智能巨头英伟达的 CUDA 框架,为DeepSeek 在未来适配中国国产晶片做好准备。DeepSeek 通过优化算法架构,显著提升了算力利用效率,打破了算力至上的传统认知。DeepSeek-R1 的惊艳之处是通过重新设计训练流程、以少量 SFT 数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。DeepSeek-R1 的效果示意:更少的 GPU(或其他AI 芯片)带来同样的效果高 DeepSeek-R1 提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。DeepSeek-R1 反而通过优化,DeepSeek-R1 可能实现了算力与性能的近似线性关系

    14、。每增加一张 GPU,模型推理能力可 稳定提升,无需依赖复杂的外部监督机制。这一特性直接验证了“算力即性能”的 Scaling Law,为 AI 芯片市场及 AI Infra市场提供了明确的增量需求逻辑。DS 不仅在推理模型上实现了突破,在多模态方面也保持了进步,并于近日开源发布了 Janus-Pro 多模态模型。基于 3 算法工程方面的优化,DS 能够实现性价比更高的模型推理能力(价格低、效率高、性能强、可部署在端侧平台),并有望以强大的推理能力和多模态感知能力,重塑机器人交互与决策,同时通过低成本、高效率的解决方案,加速具身智能的普及与应用。(三)研发团队情况(三)研发团队情况 DeepS

    15、eek 团队最大的特点之一就是年轻。团队成员中,应届生和在读生占据了相当大的比例,他们活跃在公司的各个项目和研究领域中。这些年轻人思维敏捷、充满活力,对新技术和新方法有着敏锐的洞察力和强烈的探索欲望,为DeepSeek 的发展注入了源源不断的动力和创新活力。在DeepSeek 团队中,来自清华大学和北京大学的应届生尤为突出。他们不仅在学术上有着扎实的功底和丰富的研究成果,而且在实际工作中也展现出了卓越的能力和潜力。许多关键的技术创新和项目成果,都离不开这些清北应届生的贡献。他们将所学知识与实际问题相结合,不断突破技术瓶颈,推动 DeepSeek 在 AI 领域的持续进步。有些团队成员从Deep

    16、SeekLLMv1 开始就加入了公司,并一直参与到了DeepSeek-v3 的开发和研究中。他们见证了 DeepSeek 大模型从无到有、从弱到强的全过程,积累了丰富的经验和深刻的理解。这些全程参与的成员,对 DeepSeek 的技术发展和产品 4 迭代起到了至关重要的作用,他们的经验和见解为公司未来的发展提供了宝贵的参考和指导。1.北京大学罗福莉北京大学罗福莉 罗福莉,女,95 后,出生于四川,本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。罗福莉 2019 年曾在国际顶级会议 ACL 上发表 8 篇论文,其中 2 篇为第一作者。罗福莉的职业生涯始于阿里巴巴达摩院,罗福莉主导开发了多语言预训练模型VECO,并推动了 AliceMind 的开源工作。2022 年,罗福莉转战 DeepSeek,参与了 MoE 大模型 DeepSeek-V2 的研发。2024 年 12 月,网传罗福莉被小米创始人雷军以千万年薪招募,担任小米 AI 实验室的大模型团队负责人。12 月 31 日,罗福莉的高中班主任告诉红星新闻记者,罗福莉还没决定去小米,还在考虑。2.北京大

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:deepseek大模型生态报告.pdf
    链接地址:https://wenku.chochina.com/doc/176335.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开