书签 分享 收藏 举报 版权申诉 / 112

类型【AI】DeepSeek行业应用与实践-智灵动力.pdf

  • 上传人:爱吃****子
  • 文档编号:169351
  • 上传时间:2025-03-11
  • 格式:PDF
  • 页数:112
  • 大小:16.17MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    AI DeepSeek 行业 应用 实践 灵动
    资源描述:

    1、智灵动力 李祖希行业应用与实践DeepSeek基础模型、深度思考(R1)、联网搜索DeepSeek受到市场热捧 日活数据:上线仅20天,日活用户数量突破2000万大关,日活增长速度超过ChatGPT。下载数据:自1月26日首次登上苹果App Store全球下载排行榜榜首以来,在140个国家的苹果App Store下载排行榜中始终保持第一的位置;发布前18天内的下载量达到1600万次,几乎是同期ChatGPT下载量的两倍;印度市场贡献了所有平台下载量的15.6%。云厂商接入:微软Azure、英伟达、阿里云、华为云、腾讯云、百度云等众多云厂商纷纷宣布上线R1,还推出“零代码”“超低价”等优惠活动。

    2、DeepSeek-R1:强化学习驱动的全能推理引擎 DeepSeek-R1是由幻方量化旗下AI公司深度求索(DeepSeek)研发的先进推理模型,特别擅长数学、代码和自然语言推理等复杂任务。该模型采用大规模强化学习技术进行后训练,在仅有少量标注数据的情况下显著提升了模型性能,并且通过智能训练场动态生成题目和实时验证解题过程来进一步增强推理能力。2025年1月20日,DeepSeek-R1正式发布,并同步开源其模型权重,采用MIT许可协议,极大地降低了AI应用的门槛并促进了开源社区的发展。DeepSeek-R1实现了高性能与低成本的良好平衡,API服务定价极具竞争力。开源许可:完全开源,采用MI

    3、T许可协议,允许自由使用、修改、分发和商业化。技术特点:利用大规模强化学习技术,仅需少量标注数据即可提升性能;构建智能训练场以动态调整和优化模型推理能力。DeepSeek与其他模型的横向对比DeepSeek-R1在多个基准测试中取得了优异成绩,如在Arena排名中位列全类别大模型第三,风格控制类模型分类中与OpenAI o1并列第一。使用DeepSeek的多条路径API接口适用场景:集成DeepSeek模型到第三方应用(如聊天机器人、数据分析工具等)。支持模型:DeepSeek-R1、DeepSeek-Math等系列模型。开源模型使用部分模型(如DeepSeek-MoE)已在GitHub开源,

    4、支持本地部署。访问GitHub仓库获取模型权重及推理代码。百度云:https:/ 系列(1.5B-671B)、DeepSeek-V3(参数量为 671B)、DeepSeek-Janus 系列(视觉相关多模态模型)、DeepSeek-Coder 和 DeepSeek-Coder-V2、DeepSeek-VL(视觉-语言模型)实 时 动 态 决 策亚毫秒级响应动态奖励函数容错机制1多模态因果推理跨模态对齐反事实推理不确定性量化2复杂系统优化超大规模组合优化多目标权衡实时重规划3知识密集创造海量知识索引跨学科概念联结可解释性生成4DeepSeek潜能领域算法设计与优化对于需要复杂算法设计和优化的项目

    5、,DeepSeek-R1可以提供有力支持,帮助研究人员快速探索不同的算法实现,并进行性能评估。数据分析与建模在处理大规模数据集时,DeepSeek-R1能够高效地进行数据分析,识别模式并建立预测模型,适用于科学研究中的数据驱动发现。代码开发与调试编写、调试和优化复杂的软件代码,通过分析程序运行日志和错误信息,自动定位问题根源,提出有效的解决方案。模拟与预测对未来市场趋势、产品表现或系统行为进行模拟和预测,构建多种未来情景,评估不同策略的效果。对话与互动通过较好的逻辑推理、情感分析及上下文理解能力,在对话互动中提供高度个性化和一致性的用户体验。多源信息整合与跟踪从多个来源(如新闻、社交媒体、市场

    6、报告等)收集信息,并整合为可操作的洞察;能够持续跟踪关键指标的变化,及时发现潜在风险并发出预警。两者均以“AI自动化程度”为线索,但“L1-L5阶段”更为贴近该线索,强调AI在逐步减少人类干预的过程中实现完全自主,聚焦自动化发展的渐进演变。相较之下,Altman的AGI五阶段更具实践导向。AI自动化L1-L5:渐进提升 全能自理对比维度Sam Altman的AGI五阶段AI自动化L1-L5异同点辅助性阶段阶段1:狭义AI,AI在特定任务中提供辅助。L1:辅助自动化,AI简化流程,提供工具支持。两者均以AI提供辅助为基础,帮助人类提高效率。部分自主阶段阶段2-3:AI在复杂任务中提供帮助,需人类

    7、监督。L2-L3:AI部分自动化,能独立生成内容但需人类设定条件。均强调AI在逐步减少人为干预的过程中具备部分自主能力。高级自主阶段阶段4:通用AGI,AI具备高度自主性,解决广泛任务。L4:高级自动化,AI独立创作,有一定创新能力。都体现了AI的自主性,但Altman更关注形成可落地的应用节点。完全自主阶段阶段5:超级AGI,AI超越人类,具备自我反思与创新能力。L5:完全自动化,AI超越人类水平,具备自我反思与创新能力。两者都预见AI超越人类,但Altman更侧重于实践,L5侧重自动化的程度。部 分 自 动 化条 件 自 动 化高 级 自 动 化辅 助 自 动 化完 全 自 动 化Agen

    8、tsOrganizationsChatbotsReasonersInnovators生成机制:语料预学 推理输出具体框架:以“我喜欢吃苹果。”为例语料预训练模型训练假设我们有一个句子我喜欢吃苹果。作为我们训练语料的一部分。在训练期间,模型将尝试学习句子的模式和结构。GPT-4使用了一种叫做多头注意力的技术,这允许模型在不同的注意力头中关注输入的不同方面。这可以帮助模型更好地理解输入的复杂性。模型可能会看到我喜欢吃并尝试预测出苹果。通过这种方式,模型学习了词汇,语法,以及一些语义和上下文关系。参数学习通过预测任务,模型学习了一组参数,这些参数可以捕捉到输入文本的模式,它们将在训练过程中不断调整,

    9、以更准确地预测下一个词。模型推理模型训练完成后,可以用它来生成新的文本或回答问题。假设我们向模型提出一个问题:我应该吃什么水果?,模型会考虑这个输入,根据它在训练过程中学到的知识来生成一个答案。模型可能会回答你可以试试苹果。注意力机制在推理过程中,模型会使用注意力机制技术来决定哪些输入词对生成答案最重要。例如,在上面的问题中,模型可能会认为吃和水果这两个词最重要,因为这两个词直接相关于应该选择哪种水果。自回归生成GPT-4模型在生成文本时是自回归的,这意味着它一次生成一个词,然后将这个词添加到输入序列中,以生成下一个词。这一过程持续进行,直到生成一个结束符号,或达到了设定的最大。多头注意力1.

    10、设定明确的目标与上下文说明任务的具体目标(如获取信息、生成文本、分析数据等)提供背景信息,以减少模型的猜测针对不同的场景,给出期望的输出类型(如表格、列表、总结等)2.激活角色与思维模式设定模型为某种特定的身份,如技术专家、教师或HR指导模型使用某种特定的写作风格(如正式、非正式、技术性等)让模型模拟某种特定的思维模式,如批判性思维、创造性思维等3.逐步拆解复杂任务将复杂问题分解为多个独立的步骤在每一步操作结束后,请求模型总结或验证中间结果合并多个子任务的输出,形成完整的解决方案或总结4.引导深入推理与思考让模型分步骤推导出答案,要求“思维链”推理要求模型在作答前进行简要的自我反思或验证要求模

    11、型解释每一步的思路,而不仅仅是给出最终答案5.提供参考材料与外部资源向模型提供外部参考文献或文本,并要求根据这些材料生成答案要求模型在作答时引用或链接到具体的来源集成外部工具(如代码执行)来完成复杂的计算或查找任务6.动态反馈与迭代优化在收到回答后,指出模型的误差或不足,并要求修正让模型根据前一轮的输出进行自我改进请求模型总结多轮对话中的关键点,确保连贯性和准确性提示词工程:精准指引 效能增益 1.TASTE框架Task(任务):定义模型主要任务或生成内容。Audience(目标受众):明确说明目标受众。Structure(结构):为输出的内容提供明确的组织结构,包括段落安排、论点展开顺序或其

    12、他逻辑关系。Tone(语气):指定模型回答时的语气或风格。Example(示例):例子或模板可帮助模型理解输出风格或格式。2.ALIGN框架Aim(目标):明确任务的最终目标。Level(难度级别):定义输出的难度级别。Input(输入):指定需要处理的输入数据或信息,或要求模型依据某些事实或条件进行推理。Guidelines(指导原则):提供模型在执行任务时应该遵循的规则或约束。Novelty(新颖性):明确是否需要模型提供原创性、创新性的内容,是否允许引用已有知识。提示词框架:逻辑锚定 思维引导示例Aim:创建一篇关于“可持续发展”的文章,解释其核心理念。Level:适合高中生阅读,不需要

    13、专业术语。Input:提供目前的环境问题的背景,讨论应对全球变暖的策略。Guidelines:文章应使用简洁明了的语言,并避免复杂的技术概念。Novelty:要求结合最新的环境数据,提出新颖的观点和解决方案。示例Task:写一篇关于数据隐私的重要性的简短博客文章。Audience:普通的互联网用户,非技术背景。Structure:文章需要有明确的开头、中间讨论和结尾,开头提出问题,中间介绍原因和影响,结尾提供建议。Tone:采用友好、易懂的语气。Example:类似于纽约时报科技专栏的风格。DeepSeek使用技巧1扔掉提示词模板,贴合真实需求DeepSeek 是推理型大模型,非指令型使用时无

    14、需复杂专业提示词,应基于真实场景与具体需求提问例如准备与比亚迪供应商谈判,直接说明自身情况与想了解的内容,如“我下周要和供应商谈判,但对动力电池一窍不通。帮我用最通俗的语言说明”,这样能获得更实用的分析和谈判话术。本页内容参考:鹤竹子DeepSeek使用技巧2巧用“说人话”提示词DeepSeek 回复有时较抽象,添加“说人话”或详尽版提示词可使回答更通俗易懂例如:回答内耗相关内容时,加“说人话”前很抽象,添加后用日常场景解释,更易理解。【请用以下规范输出:1.语言平实直述,避免抽象隐喻;2.使用日常场景化案例辅助说明;3.优先选择具体名词替代抽象概念;4.保持段落简明(不超过5行);5.技术表

    15、述需附通俗解释;6.禁用文学化修辞;7.重点信息前置;8.复杂内容分点说明;9.保持口语化但不过度简化专业内容;10.确保信息准确前提下优先选择大众认知词汇】本页内容参考:鹤竹子DeepSeek使用技巧3运用深度思考提示词DeepSeek 深度思考能力强,但因用户暴增,响应策略调整,思考时间缩短。使用“请在你的思考分析过程中同时进行批判性思考至少 10 轮,务必详尽”等核心提示词,可恢复其深度思考时间,让它像思考伙伴一样提供更优质回答。本页内容参考:鹤竹子DeepSeek使用技巧4借助文风转换功能利用“模仿 xxx 的文风,撰写关于 xxxxx 的一篇 xx 文体”提示词,可实现文风转换。它更

    16、适合模仿经典作家,虽难以 100%还原,但能抓住神韵。如模仿王勃写赋、鲁迅写作风格等,还可结合万能公式“我要 xx,要给 xx 用,希望达到 xx 效果,但担心 xx 问题.”,达到特定写作目的。本页内容参考:鹤竹子现阶段无法完全信任任何一种大模型不同大模型在数据与文本处理中的表现:大模型代码与数据处理文本处理Claude 3.5 Sonnet更适合Agent设计,主动执行任务、自我修正能力强,仅需少量人工指导。最佳,数字准确,行文流畅但仍需调整。GPT 4o主动性较低,响应简洁。类似PPT要点,细节不足。DeepSeek R1分析详尽但代码执行积极性不足。行文飘逸,细节欠缺。o3-mini细节不够丰富(即使要求保留更多)数据处理中的局限性案例:要求Claude 3.5 Sonnet将美国301对华关税清单与一份中国出口产品目录进行匹配,并做一些计算初始匹配成功率:40%问题发现:AI忽略了HS 6位码小数点后的0修改后匹配率提升至80%结论:AI可加速数据处理,但最终结果仍需人工审核。文本归纳与生成的局限性AI生成的文字是专业和非专业的分水岭:文字从业者:内容错误多,堆砌感重。非从业

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:【AI】DeepSeek行业应用与实践-智灵动力.pdf
    链接地址:https://wenku.chochina.com/doc/169351.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开