书签 分享 收藏 举报 版权申诉 / 52

类型2024大模型技术及其在金融行业的应用探索-星环科技-2024.11.21-51页.pdf

  • 上传人:星**
  • 文档编号:163737
  • 上传时间:2025-02-05
  • 格式:PDF
  • 页数:52
  • 大小:12.60MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    2024 模型 技术 及其 金融 行业 应用 探索 科技 2024.11 21 51
    资源描述:

    1、星 环 科 技,构 建 明 日 数 据 世 界S h a p i n g t h e F u t u r e D a t a W o r l dCopyright 2024 Transwarp.All Rights R星环信息科技(上海)股份有限公司 大模型技术及其在金融行业的应用探索星环科技:東方 2024年11月21日Copyright 2024 Transwarp.All Rights Reserved.目录目录701背景知识02大模型应用体系建设03大模型在金融行业的应用探索星环科技,构建明日数据世界 无涯问知:让知识即刻呈现,让回答值得信赖 扫码体验无涯Copyright 2024

    2、Transwarp.All Rights R构建明日数据世界01背景知识Copyright 2024 Transwarp.All Rights Reserved.ChatGPTChatGPT引发的巨大关注生成毁灭人类计划引关注和对于大语言模型的思考一些关于ChatGPTChatGPT的评论1.1.埃隆马斯克和比尔盖茨都对ChatGPT表示了高度评价。马斯克认为ChatGPT“厉害得吓人”,而比尔盖茨则认为ChatGPT的问世具有重大的历史意义,这种人工智能技术的诞生不亚于互联网或个人电脑的诞生。2.2.英伟达CEOCEO黄仁勋也对ChatGPT给予了高度评价,他盛赞ChatGPT的诞生堪比iP

    3、hone问世。3.3.澎湃新闻将2022年11月30日视为可能改变人类历史的日子,他们认为ChatGPT不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木取火时刻”。20222022年1111月3030日,OpenAIOpenAI的生成式对话模型服务ChatGPTChatGPT发布ChatGPTChatGPT带来的震撼1.1.技术突破:基于大规模预训练技术和更长的上下文长度,这使得它在对话流畅性、多轮对话、复杂语义理解等多个传统的NLP任务上取得了巨大的进展。2.2.用户体验:ChatGPT的交互体验非常接近人类,它能够理解和生成自然语言,这使

    4、得用户感觉与一个真正有逻辑思维和语言交流能力的真人进行交流。3.3.研究范式改变:它的出现改变了NLP的研究范式,从传统的统计学习方法和词嵌入方法,到预训练加微调范式,再到如今的大语言模型。4.4.应用潜力:其展示出了在众多领域的应用潜力。产业界积极进行场景实践。5.5.社会影响:引发了对AI技术的广泛讨论,包括其在伦理、安全和隐私方面的挑战。甚至已经符号化。9GPT-4接受图灵测试Does GPT-4 pass the Turing test?arXiv.2310.20216People cannot distinguish GPT-4 from a human in Turing test

    5、 arXiv.2405.08007Copyright 2024 Transwarp.All Rights Reserved.大模型发展历程Geoffrey Hinton提出逐层无监督预训练方式,缓解深度学习模型梯度消失问题。20062006Tomas Mikolov和他的团队提Word2Vec词向量模型。20132013Ian Goodfellow等人首次提出GAN生成式对抗网络概念。20142014Google提出Transformer架构。开创性的进步,引领NLP新纪元。20172017基于Transformer架构的与训练微调,模型在多种NLP任务上的性能。20182018参数规模达到惊

    6、人的1750亿。对算力的巨大需求正式拉开。20202020OpenAI正式发布ChatGPT,引发社会广泛关注。20222022超大规模多模态预训练大模型。2023202310Copyright 2024 Transwarp.All Rights Reserved.通常包含数十亿甚至数千亿个参数,这些参数在训练过程中被调整以最小化损失函数。为了训练这些模型,需要大量的数据。这些数据可以是文本、图像、音频或其他类型的数据,用于训练模型识别模式和做出预测。由于模型的规模和数据量,大模型通常需要大量的计算资源,如高性能的GPU集群,以及大量的内存和存储空间。大模型由于其复杂性,通常具有很强的泛化能力

    7、,能够在未见过的数据上也表现出良好的性能。处理和理解多种不同类型的数据输入和输出,例如文本、图像、视频和音频等。使得模型可以跨不同领域和应用场景迁移知识,提供更全面和深入的理解。大模型通常可以在一个任务上预训练,然后在其他相关任务上进行微调,这种迁移学习的能力使得模型可以适应新的数据和任务。大模型的大(强)11Copyright 2024 Transwarp.All Rights Reserved.大语言模型的众多优秀能力为产业深度利用打下坚实基础12基于常识的推理n广泛的常识:大模型通过在大规模文本数据上的预训练,学习到了语言的潜在结构、语法规则和语义关系,因此具备了广泛的常识。例如,它们可

    8、以理解和生成涉及各种主题的文本,从科学知识到日常对话。n推理能力:大模型能够进行逻辑推理和问题解决。例如,在算术或逻辑推理任务中,通过构建思维链提示技术,模型能够分步骤解决问题,类似于人类的思考过程。n理解能力:大模型能够理解复杂的指令和上下文信息,这使得它们在执行任务时更加精准。例如,它们可以根据邮件的主题自动撰写回复,理解用户的需求并生成合适的内容。n上下文学习:大模型能够根据上下文信息进行学习和预测,这使得它们在处理具有上下文依赖性的任务时更加有效。例如,它们可以根据对话历史理解和生成连贯的回应。n语言生成能力:大模型能够创造性地生成新的内容,包括文本、图像等。例如,它们可以撰写文章、故

    9、事,甚至生成代码,展现出强大的语言创造能力。n多任务能力:大模型在预训练后能够泛化到多个下游任务,无需大量针对特定任务的训练数据。例如,GPT-3模型在多种自然语言处理任务上展现出了令人瞩目的成果。n多模态理解能力:最新的大模型如GPT-4展示了更强的推理与多模态理解能力,能够处理包括文本、图像在内的多种类型的数据。文学创作以上结果由星环无涯问知生成,www.wuya-Copyright 2024 Transwarp.All Rights Reserved.大模型产业发展-政策端:各级对大模型技术应用的支持与管理政策13国家级引导政策:新一代人工智能发展规划:这份规划由国务院于2017年发布,

    10、旨在抢抓人工智能发展的重大战略机遇,构筑我国人工智能发展的先发优势,加快建设创新型国家和世界科技强国。关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见:由科技部等六部门于2022年印发,目的是落实新一代人工智能发展规划,系统指导各地方和各主体加快人工智能场景应用,推动经济高质量发展。生成式人工智能服务管理暂行办法:该政策旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益。“数据要素”三年行动计划(2024-20262024-2026年)(征求意见稿):由国家数据局起草,提出支持开展通用人工智能大模型和垂直领域人工智能大模型训练,以发挥数据要素乘数效应,赋能经济

    11、社会发展。地方支持政策:北京市促进通用人工智能创新发展的若干措施:该政策旨在充分发挥政府引导作用和创新平台催化作用,整合创新资源,加强要素配置,营造创新生态,重视风险防范,推动本市通用人工智能实现创新引领和理性健康发展。北京市促进未来产业创新发展实施方案:此方案旨在抢抓新一轮科技和产业变革机遇,促进未来产业创新发展,推动北京教育、科技、人才优势转化为产业优势。北京市加快建设具有全球影响力的人工智能创新策源地实施方案(2023-20252023-2025年):该方案的目标是高水平建设北京国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区,加快建设具有全球影响力的人工智能创新策源地。北京

    12、市推动“人工智能+”+”行动计划(2024-20252024-2025年):这个行动计划的目标是通过实施标杆型应用工程、示范性应用项目和商业化应用成果,力争到2025年底形成3至5个先进可用、自主可控的基础大模型产品、100个优秀的行业大模型产品和1000个行业成功案例。上海市推动人工智能大模型创新发展若干措施(2023-20252023-2025年):这份通知由上海市经济和信息化委员会、上海市发展和改革委员会、上海市科学技术委员会、中共上海市委网络安全和信息化委员会办公室、上海市财政局联合制定。它旨在推动上海大模型创新发展,构建开放安全创新生态,加快打造人工智能世界级产业集群。推动区块链、大

    13、模型技术赋能生产性互联网服务平台发展实施方案:由上海市经济和信息化委员会、上海市商务委员会联合发布,目的是推动区块链、大模型等前沿技术与平台深度融合,促进生产性互联网服务平台的高质量发展。上海市推进“人工智能+”+”行动 打造“智慧好办”政务服务实施方案:这份通知由上海市人民政府办公厅发布,目的是推进政务服务领域“人工智能+”行动,打造快捷易办的“智慧好办”政务服务品牌。上海打造未来产业创新高地发展壮大未来产业集群行动方案:由上海市人民政府发布,旨在贯彻落实创新驱动发展战略,全力做强创新引擎,培育发展新动能,打造未来产业创新高地、发展壮大未来产业集群。在20242024年3 3月发布的政府工作

    14、报告中,中央政府明确了对人工智能产业的顶层设计,主要聚焦于供给侧的“创新生产力”和需求侧的“促进内需”两大领域。报告提出了针对数据资源、计算能力、市场环境和应用场景的多项具体措施,以推动人工智能产业的全面发展。各地AI大模型产业支持政策还有:北京、上海、山东、广东、安徽、福建和深圳、杭州、成都等地均发布了AI大模型的相关产业政策,以加速大模型应用落地。Copyright 2024 Transwarp.All Rights Reserved.大模型产业发展-需求端:企业端对生成式AIAI强劲需求14l根据SAS和ColemanParkes调研,中国在生成式人工智能的应用率上领先,在“将生成式AI

    15、AI与现有业务流程进行全面覆盖及整合”的使用程度占比达到19%19%;在“已进行部署生成式AIAI但尚未完全覆盖整合”的使用程度上占比达到64%64%。总比例83%,位居全球第一。美国在该两个维度上则分别达到24%24%和41%41%lIDC2024AIGC应用层十大趋势白皮书中调研显示,从全球化B端(企业端)的应用场景看,作为需求方,知识管理场景是AIGC现在最受企业青睐的应用场景,全球市场、中国市场及美国市场受访企业对此场景的期待应用分别占到了52%、52.2%及60%本主要内容引用自-创业邦2024AIGC创新应用洞察报告第19页上表引用自-艾瑞咨询-2023年中国人工智能产业研究报告第

    16、23页Copyright 2024 Transwarp.All Rights Reserved.大模型产业发展-供给端:在大模型带动下的AI产业蓬勃发展,百花齐放15本页内容来自于艾瑞咨询-2023年中国人工智能产业研究报告第22页本报告来源于三个皮匠报告站(),由用户Id:444287下载,文档Id:182377,下载日期:2024-11-25Copyright 2024 Transwarp.All Rights R构建明日数据世界02大模型应用体系建设Copyright 2024 Transwarp.All Rights Reserved.五种方法快速构建大模型商业应用利用企业自身数据,快速搭建,构建 Copyright 2024 Transwarp.All Rights Reserved.五种方法快速构建大模型商业应用 L1L1 常人LLM(Gneral)大模型LLM提问通用 LLM回答1快速搭建企业领域知识平台,构建专家级领域大模型应用。比如直接部署垂直领域大模型提供基础问答。Copyright 2024 Transwarp.All Rights Reserved.五种方法快速

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:2024大模型技术及其在金融行业的应用探索-星环科技-2024.11.21-51页.pdf
    链接地址:https://wenku.chochina.com/doc/163737.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开