书签 分享 收藏 举报 版权申诉 / 22

类型2025年AI编程发展前景及国内外AI编程应用发展现状分析报告_22页.pdf

  • 上传人:爱吃****子
  • 文档编号:181174
  • 上传时间:2025-05-26
  • 格式:PDF
  • 页数:22
  • 大小:3.24MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    2025 AI 编程 发展前景 国内外 应用 发展 现状 分析 报告 _22
    资源描述:

    1、 2025 年深度行业分析研究报告 目目 录录 1、大模型军备竞赛,编程能力跃进,AI 编程未来已来.4 2、海外 AI 编程杀手级应用涌现.10 2.1、GitHub Copilot:实现亿级美元 ARR,商业化进展积极.10 2.2、Cursor:产品力强劲,获明星资本加持.12 2.3、Cognition:牵手微软,编程 Agent Devin 开放商业化.14 3、国产 AI 编程应用初显峥嵘.16 3.1、字节跳动:MarsCode 和 Trae 齐发,剑指 AI 编程蓝海.16 3.2、科大讯飞:星火 4.0 Turbo 全新升级,代码智能体 iFIyCode 持续选代.17 3.

    2、3、卓易信息:艾普阳低代码 IDE 新产品前景光明.19 3.4、普元信息:国内低代码领军,引领软件研发智能体建设.20 图表目录图表目录 图 1:Claude 3.5 sonnet(new)代码生成测试得分领先.4 图 2:OpenAI 宣布推理模型 o3 Codeforces 表现超过 99%的人类程序员.5 图 3:METR 研究显示在 2 个小时内的编程任务中,Claude 3.5 Sonnet 和 o1-preview 表现均优于人类专家.5 图 4:Github 调研显示 AI 在提高代码质量、使用新编程语言、生成测试案例等方面效果显著.6 图 5:2024 年 Github 上的

    3、公共生成式 AI 项目数量快速增长.7 图 6:DeepSeek-V3 代码场景测评表现比肩 GPT-4o 及 Claude-3.5-Sonnet.8 图 7:豆包通用模型 pro 代码能力提升显著.9 图 8:豆包全新基础模型 Doubao-1.5-pro 模型能力全面升级.9 图 9:GitHub 与 OpenAI 合作推出 GitHub Copilot.10 图 10:GitHub Copilot 生成的代码多数正确,尤其是在 Java 和 C+语言.11 图 11:GitHub Copilot 采用订阅制收费模式.11 图 12:GitHub Copilot 付费用户规模快速增长.12

    4、 图 13:Cursor 产品表现惊艳,吸引多家知名客户.12 图 14:Cursor 订阅定价高于 GitHub Copilot.13 图 15:Cursor 公司主体 Anysphere 获明星资本投资.13 图 16:Cognition 宣布推出首个 AI 软件工程师 Devin.14 图 17:Devin production表现优于 GPT4o 和 o1.14 图 18:Devin 开放商业化,收费 500 美元/月.15 图 19:Devin 获得微软等伙伴认可.15 图 20:字节跳动发布“豆包 MarsCode”智能开发工具.16 图 21:字节跳动推出面向海外的 AI 编程工

    5、具 Trae.16 图 22:科大讯飞发布智能编程助手 iFlyCode,支持 SaaS 模式和私有化部署.17 图 23:讯飞星火 4.0 Turbo 全新升级,代码等七大能力全面提升.18 图 24:代码智能体 iFIyCode 持续选代.18 图 25:艾普阳研发云原生 IDE 工具产品 DevMagicStudio.19 图 26:普元信息为业内领先的一站式软件基础平台提供商.20 图 27:普元信息智能化低代码开发平台发布.21 图 28:普元信息积极探索构建软件研发智能体.21 图 29:普元信息低代码项目连续中标.22 1、大模型军备竞赛,编程能力跃进大模型军备竞赛,编程能力跃进

    6、,AI 编程未来已来编程未来已来 大模型军备竞赛,编程能力跃进,有望大模型军备竞赛,编程能力跃进,有望孕育孕育 AI 编码杀手级应用编码杀手级应用。2023 年以来国内外大模型持续迭代,其中编程能力提升尤为显著,代码正确性和编程速度等方面快速改善。我们认为大模型编程能力快速提升为 AI 编程应用生态繁荣夯实基础底座。Claude 3.5 sonnet(new)代码生成测试得分领先代码生成测试得分领先。以 Claude 系列模型为例,2024年 10 月发布的 Claude 3.5 sonnet(new)版本编程能力超预期,HumanEval 代码生成基准测试得分高居 93.7%,较 2023

    7、年的 Claude1.3 得分 56%、Claude2 得分 71.2%显著提升。图图1:Claude 3.5 sonnet(new)代码生成测试得分领先代码生成测试得分领先 资料来源:Anthropic 官网 OpenAI 发布下一代推理模型发布下一代推理模型 o3,推理能力提升,推理能力提升。12 月 20 日,OpenAI 发布下一代推理模型 o3 和 o3 mini,o3 推理能力较此前的 o1 模型进一步提升,其中编程能力方面,o3 模型 Codeforces(编程测评系统)得分为 2727,超过 99%的人类程序员。图图2:OpenAI 宣布宣布推理模型推理模型 o3 Codefo

    8、rces 表现表现超过超过 99%的人类程序员的人类程序员 资料来源:OpenAI 官网 METR 研究显示在研究显示在 2 个小时内的编程任务中,个小时内的编程任务中,Claude 3.5 Sonnet 和和 o1-preview表现均优于人类专家表现均优于人类专家。根据 METR(Model Evaluation and Threat Research)研究结果,AI 编程速度能以超越人类 10 倍速度生成并测试各种方案。给定 2 个小时,Claude 3.5 Sonnet 和 o1-preview 在 7 项具有挑战性研究工程中,击败了 50 多名人类专家。在一个需要编写自定义内核以优化

    9、前缀和运算的任务中,o1-preview 不仅完成了任务,还创造了惊人的成绩:将运行时间压缩到 0.64 毫秒,甚至超越了最优秀的人类专家解决方案(0.67 毫秒)。图图3:METR 研究显示在研究显示在 2 个小时内的编程任务中,个小时内的编程任务中,Claude 3.5 Sonnet 和和 o1-preview 表现均优于人类专家表现均优于人类专家 资料来源:METRRE-Bench:Evaluating frontier AI R&D capabilities of language model agents against human experts Github 调研显示调研显示 A

    10、I 在提高代码质量、使用新编程语言、生成测试案例等方面在提高代码质量、使用新编程语言、生成测试案例等方面效果显著效果显著。根据 Github2024 年发布的一项针对全球软件开发者调查结果,目前已经有 97%的受访开发者表示在工作内外中使用过 AI 编程类工具,他们认为 AI 在提高代码质量、使用新的编程语言并理解现有代码库以及生成测试用例方面效果显著。图图4:Github 调研显示调研显示 AI 在提高代码质量、使用新编程语言、生成测试案例等方面效果显著在提高代码质量、使用新编程语言、生成测试案例等方面效果显著 资料来源:Github 官网 2024 年年 Github 上的公共生成式上的公

    11、共生成式 AI 项目数量快速增长项目数量快速增长。根据 Github 2024 年Octoverse 报告,GitHub 上的开发人员创建了 7 万多个新的公共和开源生成式 AI 项目,对 GitHub 上所有生成式 AI 项目的总贡献增加了近 60%。图图5:2024 年年 Github 上的公共生成式上的公共生成式 AI 项目数量快速增长项目数量快速增长 资料来源:Github 官网 AI 编程未来已来编程未来已来,AI 编程前景广阔编程前景广阔。Spherical Insights 预计 2032 年 AI 编码工具市场规模超 295 亿美元。科技巨头利用 AI 编程技术降本增效。亚马逊

    12、将生成式AI开发助手“Amazon Q”集成到内部系统,节省了约4500个开发人员一年的工作量,节约 2.6 亿美元的运营资金。谷歌 CEO 在 2024Q3 财报电话会表示谷歌超 25%新代码由 AI 生成,然后由工程师审查通过。Salesforce 利用 Agentforce 和其他 AI 技术将团队生产力提高 30%以上。国产大模型代码能力快速补齐国产大模型代码能力快速补齐,DeepSeek-V3 代码场景测评表现比肩代码场景测评表现比肩 GPT-4o及及 Claude-3.5-Sonnet。12 月 26 日,全新系列模型 DeepSeek-V3 首个版本上线并同步开源。根据官方论文,

    13、DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。在算法类代码场景(Codeforces),DeepSeek-V3 测评表现领先于市面上已有的全 部 非 o1 类 模 型,并 在 工 程 类 代 码 场 景(SWE-Bench Verified)逼 近 Claude-3.5-Sonnet-1022。图图6:DeepSeek-V3 代码场景测评表现比肩代码场景测评表现比肩 GPT-4o 及及 Claude-3.5-Sonnet 资料

    14、来源:DeepSeek 公众号 豆包通用模型豆包通用模型 pro 代码能力提升显著代码能力提升显著。12 月 18 日 2024 年冬季火山引擎 FORCE原动力大会上,火山引擎总裁谭待宣布豆包通用模型 pro 完成新版本迭代,其中代码能力提升速度最为显著。具体来看,综合任务处理能力较 5 月份提升 32%,在推理上提升 13%,在指令遵循上提升 9%,在代码上提升 58%,在数学上提升 43%,在专业知识领域能力提升54%。图图7:豆包通用模型豆包通用模型 pro 代码能力提升显著代码能力提升显著 资料来源:火山引擎公众号 豆包全新基础模型豆包全新基础模型 Doubao-1.5-pro 模型

    15、能力全面升级模型能力全面升级。1 月 22 日,豆包全新基础模型 Doubao-1.5-pro 正式发布,Code 等方面的能力在多个公开评测基准上表现优异。图图8:豆包全新基础模型豆包全新基础模型 Doubao-1.5-pro 模型能力全面升级模型能力全面升级 资料来源:豆包大模型团队公众号 2、海外海外 AI 编程杀手级应用编程杀手级应用涌现涌现 2.1、GitHub Copilot:实现亿级美元:实现亿级美元 ARR,商业化进展积极,商业化进展积极 GitHub 与与 OpenAI 合作推出合作推出 GitHub Copilot,2021 年 6 月,GitHub 宣布与OpenAI 合

    16、作开发的 AI 编程工具 GitHub Copilot,在 Visual Studio Code 开发环境中进行技术预览,专业开发人员可以使用 GPT-3 模型更快速地编写代码。目前 GitHub Copilot 支持使用 Claude 3.5 Sonnet 和 GPT-4o 模型。图图9:GitHub 与与 OpenAI 合作推出合作推出 GitHub Copilot 资料来源:GitHub Copilot 官网 GitHub Copilot 生成的代码生成的代码多数正确,尤其是在多数正确,尤其是在 Java 和和 C+语言语言。根据 GitHub Copilot:the perfect Code compLeeter?论文,作者基于 LeetCode 问题集评估 GitHub Copilot 生成的代码质量,具体评估了 Copilot 在 4 种编程语言(Java、C+、Python3和 Rust),代码生成阶段的可靠性、生成代码的正确性以及其对编程语言、问题难度和问题主题的依赖性,并评估了代码的时间和内存效率,并将其与平均人类结果进行比较。研究发现 Copilot 成功解决了大多

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:2025年AI编程发展前景及国内外AI编程应用发展现状分析报告_22页.pdf
    链接地址:https://wenku.chochina.com/doc/181174.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开