书签 分享 收藏 举报 版权申诉 / 99

类型北大《DeepSeek内部研讨系列:DeepSeek与AIGC应用》【北京大学】20250220.pdf

  • 上传人:财***
  • 文档编号:180687
  • 上传时间:2025-05-20
  • 格式:PDF
  • 页数:99
  • 大小:14.29MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    DeepSeek内部研讨系列:DeepSeek与AIGC应用 北京大学 北大 DeepSeek 内部 研讨 系列 AIGC 应用 20250220
    资源描述:

    1、DeepSeek内部研讨系列-DeepSeek与AIGC应用AI肖睿团队(孙萍、周嵘、李娜、张惠军、刘誉)2025年2月20日 北大青鸟人工智能研究院 北大计算机学院元宇宙技术研究所 北大教育学院学习科学实验室摘要1.本次讲座为DeepSeek原理和应用系列研讨的讲座之一,主要介绍DeepSeek的基本概念,以及大模型技术和AIGC工具应用,不需要大家具备专业的AI或IT技术背景。2.本次讲座首先分析当前备受瞩目的DeepSeek-R1 的概念、优势和历史地位。然后进一步探讨 大模型和AIGC的底层工作机制,旨在帮助读者突破工具应用的局限,理解DeepSeek和AIGC的深层次价值。最后,介绍

    2、如何科学选择与高效使用 AI 工具,为大家提供更具深度与实用性的应用场景的指导,给听众带来更落地的AI应用价值。3.尽管 DeepSeek-R1 以其低成本和开源策略为行业带来变革,但当前网络上的大量相关内容仅停留在工具应用层面,易对初级AI应用人员造成概念和思维方式的误导,这也是本次讲座希望解决的问题。3 01详解DeepSeek R102AIGC的概念和应用03AIGC的能力揭秘04选择AIGC工具目 录详解DeepSeek-R1PART 01简介本部分介绍了DeepSeek-R1模型的技术特性、发展历程、应用场景及其在AIGC领域的定位。首先介绍人工智能的发展历程,以及大模型相关术语,并

    3、对比DeepSeek-R1与其他模型的性能表现。DeepSeek-R1以其低成本、开源策略和卓越的推理能力脱颖而出,尤其在复杂逻辑推理、数学和编程任务中表现优异。随后介绍DeepSeek公司的背景、市场定位以及DeepSeek-R1的技术原理和应用场景,揭示了其在推理密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,并列举接入该模型的第三方应用。通过对人工智能发展历史以及DeepSeek-R1的介绍和分析,本部分旨在为听众提供一个对DeepSeek的客观、全面的认识,并理解该模型在AIGC领域的重要地位和应用潜力。人工智能发展历程2023年GPT-4AIGC的发展历程1950s-19

    4、90S1990s-2010S2010s-2022年大模型相关术语 多模态 文本、图片、音频、视频 AI工具(国内)DeepSeek、豆包、Kimi、腾讯元宝、智谱清言、通义千问、秘塔搜索、微信搜索.通用模型 大语言模型(LLM,Large Language Model)视频模型 多模态模型 行业模型(垂直模型、垂类模型)教育、医疗、金融等大模型的关键发展生成模型ref:中文大模型基准测评2024年度报告(2025.01.08)推理模型生成模型与推理大模型的对比比较项GPT-4o(生成模型)DeepSeek-R1(推理模型)模型定位专注于通用自然语言处理和多模态能力,适合日常对话、内容生成、翻译

    5、以及图文、音频、视频等信息处理、生成、对话等。侧重于复杂推理与逻辑能力,擅长数学、编程和自然语言推理任务,适合高难度问题求解和专业领域应用,在中文表达上容易出彩。推理能力在日常语言任务中表现均衡,但在复杂逻辑推理(如数学题求解)上准确率较低。在复杂推理任务表现卓越,尤其擅长数学、代码推理任务,在部分基准测试(如 GPQA)中准确率高于 GPT-4o。多模态支持支持文本、图像、音频乃至视频输入,可处理多种模态信息。当前主要支持文本输入,不具备图像处理等多模态能力。应用场景适合广泛通用任务,如对话、内容生成、多模态信息处理以及多种语言相互翻译和交流;面向大众市场和商业应用。适合需要高精度推理和逻辑

    6、分析的专业任务,如数学竞赛、编程问题和科学研究;在思路清晰度要求高的场景具有明显优势,比如采访大纲、方案梳理;在对中文语言表达和情感表达方面有明显优势。用户交互体验提供流畅的实时对话体验,支持多种输入模态;用户界面友好,适合大众使用。可展示大部分链式思考过程,便于专业用户理解推理过程;界面和使用体验具有较高的定制性,但整体交互节奏较慢。推理模型的优劣势优势劣势-演绎或归纳等推理能力强(如谜题、数学证明)-响应速度慢且计算成本高(需要更多推理时间)-链式思维推理出色(善于分解多步骤问题)-基于知识的任务更容易出错(容易产生幻觉)-擅长复杂决策任务-处理简单任务的时候效率低(容易过度思考)-可以呈

    7、现思考过程常见推理模型DeepSeek R1OpenAI o1OpenAI o3-miniGemini 2.0Grok3Kimi 1.5火爆全网的DeepSeek-R1爆火原因DeepSeek-R1的推理能力进入了第一梯队(媲美OpenAI o1),但训练和推理成本低、速度快、全部开源DeepSeek打破了硅谷传统的“堆算力、拼资本”的大模型发展路径对AI行业的重大影响DeepSeek-R1以低成本和开源特性打破以往头部企业巨头割据局面DeepSeek-R1的API定价仅为行业均价的1/10,推动了中小型企业低成本接入AI,对行业产生了积极影响DeepSeek-R1促使行业开始从“唯规模论”转

    8、向更加注重“性价比”和“高效能”方向010203打破垄断价格下调推动创新DeepSeek公司2025年1月20日推出DeepSeek-R1推理模型作为由知名私募巨头幻方量化孕育而生的公司,DeepSeek获得了强大的资金支持和行业影响力,幻方量化与九坤投资、明汯投资、灵均投资并称量化私募领域的“四大天王”,管理资金规模均超过600亿元。这为DeepSeek提供了清晰的市场定位和投资者背景DeepSeek专注于开发先进的大语言模型(LLM)和相关技术,旨在通过这些技术推动人工智能在多个领域的应用和创新DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一

    9、家创新型科技企业,专注于人工智能基础技术的研究与开发公司成立背景与发展历程大语言模型(LLM)的创新应用投资者背景与市场定位里程碑DeepSeek产品信息官方渠道官网:新闻:https:/api- Eval编码任务通过率是65.2%在需要逻辑思考的测试里很棒,比如DROP任务F1分数能达到92.2%,AIME 2024的通过率是79.8%应用的范围适合大规模的自然语言处理工作,像对话式AI、多语言翻译还有内容生成等等,能给企业提供高效的AI方案,满足好多领域的需求适合学术研究、解决问题的应用和决策支持系统等需要深度推理的任务,也能拿来当教育工具,帮学生锻炼逻辑思维DeepSeek-R1 工作原

    10、理让模型进行慢思考思维链(Chain of Thought)在不损失能力的情况下缩小模型蒸馏(Distillation)让模型自我探索和训练强化学习(Reinforcement Learning)DeepSeek R1论文:https:/ DeepSeek R1论文图解:https:/ 版本模型名称DeepSeek-R1-671B满血版,能力最强DeepSeek-R1-Distill-Qwen-7B蒸馏版,能力稍弱-实际上是增加了推理能力的Qwen或Llama模型DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R

    11、1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B部署DeepSeek-R1 满血版的算力要求和性能DeepSeek-R1的优势理科能力强,且准确率高 数学推理 代码生成 复杂任务处理DeepSeek-R1 的局限通用能力 R1 的通用能力(尤其是生成能力)低于DeepSeek-V3 R1的幻觉仍旧比较明显(可能源于R1的中文语言表达能力更强)语言混杂 R1 在处理非中英文问题时,偶尔会出现语言混杂现象 这个现象在R1 Zero版本中更加明显提示词工程 使用 few-shot 提示可能会降低R1性能 使用过多的过程指导指令可能会降低R1的推理能力De

    12、epSeek-R1 应用场景 推理密集型任务 编程任务中的代码生成、算法设计,媲美Claude 3.5 Sonet 数学问题求解、科学推理和逻辑分析等需要复杂推理的场景。教育与知识应用 可用于解决教育领域的问题,支持知识理解与解答。可用于科研任务的实验设计、数据分析和论文撰写。文档分析与长上下文理解 适合处理需要深入文档分析和理解长上下文的任务,例如复杂信息提取与整合。开放领域问答与写作 在内容生成、问题回答以及创造性写作中具有广泛应用,例如生成高质量文本或进行内容编辑。如何使用DeepSeek R1 DeepSeek官方网站和官方app 腾讯系 腾讯元宝 微信AI搜索 腾讯ima个人知识库

    13、AI搜索 秘塔搜索 纳米AI搜索 知乎直答 其它接入DeepSeek-R1的产品 Molly R1(向量智能)问小白接入DeepSeek R1第三方服务的厂家 互联网大厂:腾讯:腾讯元宝、ima、微信、腾讯云 百度:百度搜索、文小言 字节跳动:豆包、扣子、飞书 阿里:钉钉 互联网小厂:科大讯飞、知乎、秘塔、纳米AI搜索、AI初创公司:零一万物、阶跃星辰、minmax、AI应用公司(教育类):学而思、北大青鸟、网易有道、猿辅导、作业帮、.手机厂商:华为、荣耀、魅族、.其它云服务平台:三大运营商、云服务商(硅基流动等)AIGC的概念和应用PART 02简介本部分着重介绍人工智能生成内容(AIGC)

    14、的定义、应用范围及其在各行业的实际影响:首先梳理AIGC相关的术语,包括AI、AGI、生成式AI和决策式AI等,明确了其在人工智能领域的定位。随后,详细列举AIGC在文本、图像、音频和视频生成方面的多样化应用,并探讨其在电商、新闻传媒、影视、游戏、教育和金融等行业的具体实践,展示AIGC在提升效率、降低成本和增强创新方面的核心价值。此外,还分析AIGC带来的挑战,如数据隐私、伦理问题、生成质量控制以及对就业结构的影响。通过深入探讨AIGC的应用现状和未来趋势,本部分旨在帮助读者全面理解AIGC的潜力和影响,为应对技术变革提供参考。本部分的内容参考了人工智能通识课(微课版)和相关的视频(B站的思

    15、睿观通)初 识 AIGC眼花缭乱的名词眼花缭乱的名词AI(人工智能)AGI(通用人工智能)(artificial general intelligence)AI Generated Content(人工智能生成内容)决策式AIAIGCChatGPT生成式AIAIGC能干什么生成视频生成音频生成文本生成图像生成内容AI文本 Perplexity 知乎直答 秘塔AI搜索引擎 纳米AI搜索 微信搜索(DeepSeek R1、元宝)小红书的笔记助手 短视频平台的内容创意 自动回复机器人 企业微信的智能回复 英国广播公司(BBC)的Juicer 彭博社的Cyborg 新华社的快笔小新 人民日报的创作大脑

    16、 第一财经的DT稿王 微软“小冰”出版诗集 AI撰写剧本电影阳春 百万字小说天命使徒 清华大学的机忆之地 Cursor Windsurf MarsCode GitHub Copilot 阿里云通义灵码新闻作品创作社交媒体代码AI搜索AI绘画太空歌剧院2022年8月,获得比赛“数字艺术/数字修饰照片”一等奖AI绘画AI绘画新西湖繁胜全景图全景图是一副百米画卷,再现了当下西湖边的景观特色、生活场景,还有一些已经消失的景观,比如曾经闻名遐迩的大佛寺。图中包含5000个建筑,作者白小苏说如果这些建筑都要自己亲手画,一天画10个都要500天。最后他借助于AI技术,在一年内完成了作品AI音频语音对话语音克隆创作音乐AI视频千秋诗颂视频特效杜 甫视频添加图片AIGC 的 行 业 应 用AIGC的行业应用各行各业.电商行业01其它行业(教育、金融.)06新闻传媒03内容广告02影视行业04游戏行业05电商行业商品3D模型改善购物体验AI模特产品拍摄降本增效虚拟主播提升直播带货效率内容广告全流程参与提高效率雪花啤酒虚拟偶像提升品牌宣传效果录音语音转写智能新闻写作智能视频剪辑应用场景拓展应用功能升级应用形

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:北大《DeepSeek内部研讨系列:DeepSeek与AIGC应用》【北京大学】20250220.pdf
    链接地址:https://wenku.chochina.com/doc/180687.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开