2024大模型技术及其在金融行业的应用探索-星环科技-2024.11.21-51页.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 模型 技术 及其 金融 行业 应用 探索 科技 2024.11 21 51
- 资源描述:
-
1、星 环 科 技,构 建 明 日 数 据 世 界S h a p i n g t h e F u t u r e D a t a W o r l dCopyright 2024 Transwarp.All Rights R星环信息科技(上海)股份有限公司 大模型技术及其在金融行业的应用探索星环科技:東方 2024年11月21日Copyright 2024 Transwarp.All Rights Reserved.目录目录701背景知识02大模型应用体系建设03大模型在金融行业的应用探索星环科技,构建明日数据世界 无涯问知:让知识即刻呈现,让回答值得信赖 扫码体验无涯Copyright 2024
2、Transwarp.All Rights R构建明日数据世界01背景知识Copyright 2024 Transwarp.All Rights Reserved.ChatGPTChatGPT引发的巨大关注生成毁灭人类计划引关注和对于大语言模型的思考一些关于ChatGPTChatGPT的评论1.1.埃隆马斯克和比尔盖茨都对ChatGPT表示了高度评价。马斯克认为ChatGPT“厉害得吓人”,而比尔盖茨则认为ChatGPT的问世具有重大的历史意义,这种人工智能技术的诞生不亚于互联网或个人电脑的诞生。2.2.英伟达CEOCEO黄仁勋也对ChatGPT给予了高度评价,他盛赞ChatGPT的诞生堪比iP
3、hone问世。3.3.澎湃新闻将2022年11月30日视为可能改变人类历史的日子,他们认为ChatGPT不仅催生了人工智能界的又一轮高光期,还并不常见地被誉为“蒸汽机时刻”、“iPhone时刻”甚至“钻木取火时刻”。20222022年1111月3030日,OpenAIOpenAI的生成式对话模型服务ChatGPTChatGPT发布ChatGPTChatGPT带来的震撼1.1.技术突破:基于大规模预训练技术和更长的上下文长度,这使得它在对话流畅性、多轮对话、复杂语义理解等多个传统的NLP任务上取得了巨大的进展。2.2.用户体验:ChatGPT的交互体验非常接近人类,它能够理解和生成自然语言,这使
4、得用户感觉与一个真正有逻辑思维和语言交流能力的真人进行交流。3.3.研究范式改变:它的出现改变了NLP的研究范式,从传统的统计学习方法和词嵌入方法,到预训练加微调范式,再到如今的大语言模型。4.4.应用潜力:其展示出了在众多领域的应用潜力。产业界积极进行场景实践。5.5.社会影响:引发了对AI技术的广泛讨论,包括其在伦理、安全和隐私方面的挑战。甚至已经符号化。9GPT-4接受图灵测试Does GPT-4 pass the Turing test?arXiv.2310.20216People cannot distinguish GPT-4 from a human in Turing test
5、 arXiv.2405.08007Copyright 2024 Transwarp.All Rights Reserved.大模型发展历程Geoffrey Hinton提出逐层无监督预训练方式,缓解深度学习模型梯度消失问题。20062006Tomas Mikolov和他的团队提Word2Vec词向量模型。20132013Ian Goodfellow等人首次提出GAN生成式对抗网络概念。20142014Google提出Transformer架构。开创性的进步,引领NLP新纪元。20172017基于Transformer架构的与训练微调,模型在多种NLP任务上的性能。20182018参数规模达到惊
6、人的1750亿。对算力的巨大需求正式拉开。20202020OpenAI正式发布ChatGPT,引发社会广泛关注。20222022超大规模多模态预训练大模型。2023202310Copyright 2024 Transwarp.All Rights Reserved.通常包含数十亿甚至数千亿个参数,这些参数在训练过程中被调整以最小化损失函数。为了训练这些模型,需要大量的数据。这些数据可以是文本、图像、音频或其他类型的数据,用于训练模型识别模式和做出预测。由于模型的规模和数据量,大模型通常需要大量的计算资源,如高性能的GPU集群,以及大量的内存和存储空间。大模型由于其复杂性,通常具有很强的泛化能力
7、,能够在未见过的数据上也表现出良好的性能。处理和理解多种不同类型的数据输入和输出,例如文本、图像、视频和音频等。使得模型可以跨不同领域和应用场景迁移知识,提供更全面和深入的理解。大模型通常可以在一个任务上预训练,然后在其他相关任务上进行微调,这种迁移学习的能力使得模型可以适应新的数据和任务。大模型的大(强)11Copyright 2024 Transwarp.All Rights Reserved.大语言模型的众多优秀能力为产业深度利用打下坚实基础12基于常识的推理n广泛的常识:大模型通过在大规模文本数据上的预训练,学习到了语言的潜在结构、语法规则和语义关系,因此具备了广泛的常识。例如,它们可
8、以理解和生成涉及各种主题的文本,从科学知识到日常对话。n推理能力:大模型能够进行逻辑推理和问题解决。例如,在算术或逻辑推理任务中,通过构建思维链提示技术,模型能够分步骤解决问题,类似于人类的思考过程。n理解能力:大模型能够理解复杂的指令和上下文信息,这使得它们在执行任务时更加精准。例如,它们可以根据邮件的主题自动撰写回复,理解用户的需求并生成合适的内容。n上下文学习:大模型能够根据上下文信息进行学习和预测,这使得它们在处理具有上下文依赖性的任务时更加有效。例如,它们可以根据对话历史理解和生成连贯的回应。n语言生成能力:大模型能够创造性地生成新的内容,包括文本、图像等。例如,它们可以撰写文章、故
展开阅读全文
