【AI】DeepSeek行业应用与实践-智灵动力.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI DeepSeek 行业 应用 实践 灵动
- 资源描述:
-
1、智灵动力 李祖希行业应用与实践DeepSeek基础模型、深度思考(R1)、联网搜索DeepSeek受到市场热捧 日活数据:上线仅20天,日活用户数量突破2000万大关,日活增长速度超过ChatGPT。下载数据:自1月26日首次登上苹果App Store全球下载排行榜榜首以来,在140个国家的苹果App Store下载排行榜中始终保持第一的位置;发布前18天内的下载量达到1600万次,几乎是同期ChatGPT下载量的两倍;印度市场贡献了所有平台下载量的15.6%。云厂商接入:微软Azure、英伟达、阿里云、华为云、腾讯云、百度云等众多云厂商纷纷宣布上线R1,还推出“零代码”“超低价”等优惠活动。
2、DeepSeek-R1:强化学习驱动的全能推理引擎 DeepSeek-R1是由幻方量化旗下AI公司深度求索(DeepSeek)研发的先进推理模型,特别擅长数学、代码和自然语言推理等复杂任务。该模型采用大规模强化学习技术进行后训练,在仅有少量标注数据的情况下显著提升了模型性能,并且通过智能训练场动态生成题目和实时验证解题过程来进一步增强推理能力。2025年1月20日,DeepSeek-R1正式发布,并同步开源其模型权重,采用MIT许可协议,极大地降低了AI应用的门槛并促进了开源社区的发展。DeepSeek-R1实现了高性能与低成本的良好平衡,API服务定价极具竞争力。开源许可:完全开源,采用MI
3、T许可协议,允许自由使用、修改、分发和商业化。技术特点:利用大规模强化学习技术,仅需少量标注数据即可提升性能;构建智能训练场以动态调整和优化模型推理能力。DeepSeek与其他模型的横向对比DeepSeek-R1在多个基准测试中取得了优异成绩,如在Arena排名中位列全类别大模型第三,风格控制类模型分类中与OpenAI o1并列第一。使用DeepSeek的多条路径API接口适用场景:集成DeepSeek模型到第三方应用(如聊天机器人、数据分析工具等)。支持模型:DeepSeek-R1、DeepSeek-Math等系列模型。开源模型使用部分模型(如DeepSeek-MoE)已在GitHub开源,
4、支持本地部署。访问GitHub仓库获取模型权重及推理代码。百度云:https:/ 系列(1.5B-671B)、DeepSeek-V3(参数量为 671B)、DeepSeek-Janus 系列(视觉相关多模态模型)、DeepSeek-Coder 和 DeepSeek-Coder-V2、DeepSeek-VL(视觉-语言模型)实 时 动 态 决 策亚毫秒级响应动态奖励函数容错机制1多模态因果推理跨模态对齐反事实推理不确定性量化2复杂系统优化超大规模组合优化多目标权衡实时重规划3知识密集创造海量知识索引跨学科概念联结可解释性生成4DeepSeek潜能领域算法设计与优化对于需要复杂算法设计和优化的项目
5、,DeepSeek-R1可以提供有力支持,帮助研究人员快速探索不同的算法实现,并进行性能评估。数据分析与建模在处理大规模数据集时,DeepSeek-R1能够高效地进行数据分析,识别模式并建立预测模型,适用于科学研究中的数据驱动发现。代码开发与调试编写、调试和优化复杂的软件代码,通过分析程序运行日志和错误信息,自动定位问题根源,提出有效的解决方案。模拟与预测对未来市场趋势、产品表现或系统行为进行模拟和预测,构建多种未来情景,评估不同策略的效果。对话与互动通过较好的逻辑推理、情感分析及上下文理解能力,在对话互动中提供高度个性化和一致性的用户体验。多源信息整合与跟踪从多个来源(如新闻、社交媒体、市场
6、报告等)收集信息,并整合为可操作的洞察;能够持续跟踪关键指标的变化,及时发现潜在风险并发出预警。两者均以“AI自动化程度”为线索,但“L1-L5阶段”更为贴近该线索,强调AI在逐步减少人类干预的过程中实现完全自主,聚焦自动化发展的渐进演变。相较之下,Altman的AGI五阶段更具实践导向。AI自动化L1-L5:渐进提升 全能自理对比维度Sam Altman的AGI五阶段AI自动化L1-L5异同点辅助性阶段阶段1:狭义AI,AI在特定任务中提供辅助。L1:辅助自动化,AI简化流程,提供工具支持。两者均以AI提供辅助为基础,帮助人类提高效率。部分自主阶段阶段2-3:AI在复杂任务中提供帮助,需人类
7、监督。L2-L3:AI部分自动化,能独立生成内容但需人类设定条件。均强调AI在逐步减少人为干预的过程中具备部分自主能力。高级自主阶段阶段4:通用AGI,AI具备高度自主性,解决广泛任务。L4:高级自动化,AI独立创作,有一定创新能力。都体现了AI的自主性,但Altman更关注形成可落地的应用节点。完全自主阶段阶段5:超级AGI,AI超越人类,具备自我反思与创新能力。L5:完全自动化,AI超越人类水平,具备自我反思与创新能力。两者都预见AI超越人类,但Altman更侧重于实践,L5侧重自动化的程度。部 分 自 动 化条 件 自 动 化高 级 自 动 化辅 助 自 动 化完 全 自 动 化Agen
8、tsOrganizationsChatbotsReasonersInnovators生成机制:语料预学 推理输出具体框架:以“我喜欢吃苹果。”为例语料预训练模型训练假设我们有一个句子我喜欢吃苹果。作为我们训练语料的一部分。在训练期间,模型将尝试学习句子的模式和结构。GPT-4使用了一种叫做多头注意力的技术,这允许模型在不同的注意力头中关注输入的不同方面。这可以帮助模型更好地理解输入的复杂性。模型可能会看到我喜欢吃并尝试预测出苹果。通过这种方式,模型学习了词汇,语法,以及一些语义和上下文关系。参数学习通过预测任务,模型学习了一组参数,这些参数可以捕捉到输入文本的模式,它们将在训练过程中不断调整,
展开阅读全文
