书签 分享 收藏 举报 版权申诉 / 14

类型AI现状:中国-2025人工分析公司-2025.pdf

  • 上传人:爱吃****子
  • 文档编号:175642
  • 上传时间:2025-03-24
  • 格式:PDF
  • 页数:14
  • 大小:1.30MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    AI 现状 中国 2025 人工 分析 公司
    资源描述:

    1、AI 现状:中国人工分析Q1 2025 我们的数据、见解和出版物基于我们对人工智能技术及其应用场景的全面基准测试。这包括从语言模型API的小时级性能测试到我们众包平台上的数百万次投票。我们的公共网站,artificialanalysis.ai,广泛被人工智能创新领域的领先公司引用。如欲讨论本报告、我们的出版物或服务,请通过contactartificialanalysis.ai 联系我们。人工分析人工分析 是领先且独立的AI基准测试和洞察提供商。我们支持工程师和公司了解AI能力,并就其AI战略做出关键决策。1520253035404550556065707580859095233 1主要趋势按

    2、起源划分的前沿语言模型按起源划分的前沿语言模型中国 AI 实验室逐渐赶上美国 AI 实验室;来自中国实验室的模型随着 DeepSeek 的 R1 模型的发布,现在正在接近 o1 级智能OpenAI,o3DeepSeek,R1USA中国OpenAI,o1OpenAI,o1-previewOpenAI,GPT-4 Turbo人类,克劳德十四行诗(6 月 24 日)GPT-4oOpenAI,GPT-4DeepSeek,V3阿里巴巴,Qwen 2.5 指令 72B阿里巴巴,Qwen 2 指导 72BDeepSeek,V2阿里巴巴,Qwen 聊天 72BOpenAI,GPT-3.5 Turbo阿里巴巴,

    3、Qwen 聊天 7B4Q221Q232Q233Q232Q243Q244Q241Q252Q254Q231Q24模型发布日期1.人工分析智能指数:涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于该模型的首次公开发布。2.o3 智能指数通过放大测量的 o1 的智能指数估算得出。3.基于公司声明和可比结果估算。在可用的情况下,尚未通过人工分析进行独立基准测试缩小差距:缩小差距:2024年最后几个月见证了多家顶尖中国AI实验室推出众多高性能模型。这导致了中国AI实验室与美国AI实验室在智能水平上的差距缩小。目前

    4、,一些中国模型已与美国顶级实验室的模型竞争。在前沿实验室附近打开模型:在前沿实验室附近打开模型:由 DeepSeek 和阿里巴巴领导的开放权重模型已经接近 o1 级智能。推理模型很快变得司空见惯:推理模型很快变得司空见惯:推理模型(在回答前进行“思考”的模型)最早由OpenAI在2024年第三季度引入。几个月内,以DeepSeek为代表的中国竞争对手已基本复制了o1的智能水平。目前,多家中国AI实验室已经拥有前沿级别的推理模型。美国和中国:随着时间的推移,前沿语言模型情报美国和中国:随着时间的推移,前沿语言模型情报1 1索引人工分析智能 1520253035404550556065707580

    5、8590952222231领先的美国前沿语言模型领先的美国前沿语言模型主要趋势自 2023 年初推出 OpenAI 的 GPT-4 以来,美国领先的 AI 实验室已经争先恐后赶上 OpenAIOpenAI人类GoogleMetaGPT-4o1-预览双子座 1.5 Pro克劳德 3.5(Sep 24)Gemini 2.0 闪存十四行诗(6 月 24 日)GPT-4 TurboGPT-4o克劳德 3.5 十四行诗(10 月 24 日)双子座 1.5 Pro(24 年 5 月)美洲驼 3.3Gemini 1.0 Ultra克劳德 3405B克劳德 2.1OpusPaLM 2-LGPT-3.5 Tur

    6、bo克劳德 1Llama 3 说明 70BLlama 2 聊天 70B美洲驼 65B4Q221Q232Q233Q232Q243Q244Q241Q252Q254Q231Q24模型发布日期1.人工智能分析指数:涵盖了多种语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于该模型的第一次公开发布。2.估计依据公司声明和可比结果(如有),尚未由Artificial Analysis独立基准测试。3.o3 智力指数通过缩放测量的智力得分 o1 来估计。GPT-4 以外的智能火花:GPT-4 以外的智能火花:2024年最后几个

    7、月见证了除了GPT-4之外的重大智能飞跃,由OpenAI的o3引领。推理模型、数据质量以及新的强化学习技术等主题已与预训练计算扩展一起成为提升模型性能的主要杠杆。Big Tech 关闭了前沿实验室:Big Tech 关闭了前沿实验室:Google和Meta的模型正迅速逼近前沿模型,其中Gemini 2.0 Flash超过了Claude 3.5 Sonnet和GPT 4o的能力。竞争实验室赶上 OpenAI 的 GPT-4:竞争实验室赶上 OpenAI 的 GPT-4:OpenAI于2022年11月通过推出ChatGPT中的GPT-3.5开启了语言模型的竞争;美国领先的实验室已基本赶上OpenA

    8、I的前沿模型。随着时间的推移,美国领先的 AI 实验室前沿语言模型智能随着时间的推移,美国领先的 AI 实验室前沿语言模型智能1 1o3 o170B 美洲驼 3.1索引人工分析智能 11520253035404550556065707580859095222领先的中国前沿语言模型领先的中国前沿语言模型主要趋势DeepSeek R1DeepSeek阿里巴巴DeepSeek V3Qwen 2.5 MaxQwen 2.5 指令 72BDeepSeek V2.5Qwen 2 指示 72BDeepSeek V2Qwen 聊天 72BDeepSeek V1Qwen 聊天 7B4Q221Q232Q233Q2

    9、32Q243Q244Q241Q252Q254Q231Q24模型发布日期模型发布日期2025 年的潜在领导者:2025 年的潜在领导者:2025年初,包括阿里云、深视、明略、腾讯、智谱和通义等中国人工智能实验室纷纷发布了前沿推理模型。发布的速度和频率表明,中国人工智能实验室在2025年已不再是落后者。领先的开放式重量模型:领先的开放式重量模型:中国的人工智能实验室,包括阿里云、深视和腾讯,发布了开放权重前沿模型,这些模型在全球领先的模型中具有竞争力。迅速提高智力:迅速提高智力:尽管中国的AI实验室较晚加入AI竞赛,但在2024年,它们在智能方面与前沿的美国模型之间的差距显著缩小。当OpenAI推

    10、出o1时,中国实验室在几个月内开发出了一个性能相当的模型(DeepSeek的R1)。领先的人工智能实验室DeepSeek和阿里云(Alibaba)持续发布新的模型,在2024年底,DeepSeek超越了阿里云。1.人工分析智能指数:涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQA Diamond、MATH-500及HumanEval。发布日期基于模型的首次公开发布。2.基于公司声明及可比结果进行估算,尚未由人工分析独立基准测试。随着时间的推移,中国领先的 AI 实验室语言模型智能随着时间的推移,中国领先的 AI 实验室语言模型智能1 1索引人工分析智能94908989

    11、84828281807979787776757474727264551语言模型起源国家语言模型起源国家语言模式前沿:起源国语言模式前沿:起源国人工分析智能指数,精选领先模型(2025 年初),非详尽USA中国法国加拿大以色列Grok Beta,Grok1.5 大,命令Jamba,R+,AI21 实验室凝聚o3,o1,R1,o3-mini,o1-mini,Step-2-Gemini Gemini Claude V3,阿里巴巴 GPT-4o Qwen2.5 MiniMax Nova Pro,Llama 3.3 Large 2 V2.5(12 月OpenAIOpenAI DeepSeek OpenA

    12、I OpenAI 16k、2.0 Flash 1.5 Pro 3.5 DeepSeekQwen2.5(8 月 24 日)、Instruct-Text-01、Amazon Instruct(11 月 24 日)、24)、StepFun(经验-(9 月 24 日),十四行诗Max,OpenAI 72B,MiniMax70B,Meta Mistral DeepSeek心理),谷歌(10 月 24 日),阿里巴巴阿里巴巴Google人类在美国继续在情报前沿领域保持总体领先地位的同时,中国与之的距离已不再遥远。很少有其他国家能够展示出同等水平的训练能力。1.根据公司声明和可用的类似结果估算得出,尚未经过

    13、人工分析独立基准测试。2.由于访问限制或评估数据有限,排除了部分中国AI实验室的领先模型。94898784838282818079797877767473737065521111111114-111语言模型起源国家语言模型起源国家1.本估计基于公司的声明及可比结果(尚未由Artificial Analysis进行独立基准比较)。语言模型前沿:中国 AI 实验室的模型语言模型前沿:中国 AI 实验室的模型人工分析智能指数,领先模型(2025 年初),非详尽最高智能美国推理模型美国最高智能非推理模型o3,OpenAI4-Turbo,V1-128k,百川月拍R1,Kimi k1.5,步骤-R-M1-

    14、步骤-2-DeepSeekMoonshot迷你,预览,16k,StepFun 百川StepFunQwQ,豆宝 1.5 MiniMax Hunyuan Ernie 4.0 Yi-阿里巴巴精简版,-Text-01,大,涡轮,闪电,字节跳动MiniMax 腾讯百度Yi AIGLM-Plus,智浦双子座 GLM-豆宝 1.5 V3,Qwen 2.0 闪存零-Pro,DeepSeek 2.5 Max,Expery-预览,字节跳动阿里巴巴心理,智普Google截至2025年初,几家中国人工智能实验室已展示或声称达到了前沿水平的智能,其中七家发布了具备推理能力的模型。45555 11231 其他有 AI 野

    15、心的公司其他有 AI 野心的公司中国 AI 实验室概述:大技术中国 AI 实验室概述:大技术非穷尽 打开权重 LLM 打开权重 LLM中国大型科技公司的前沿模型中国大型科技公司的前沿模型360 安全(奇虎 360)360 安全(奇虎 360)美团美团小米小米科大讯飞科大讯飞阿里巴巴阿里巴巴百度百度字节跳动字节跳动华为华为腾讯腾讯DescriptionAI 战略(高级)非推理推理最佳 LLMRiot 的母公司大型电子商务中国最大的搜索母公司全球电信领导者,游戏和微信,播放器和 Hyperscalerengine,以及抖音(TikTok)和世界上的“多合一”超级之一(阿里云),文信义言,一个 AI

    16、 头条,中国的最大的智能手机中国的 APP;最大的股东聊天机器人与报告主要新闻制造商Hyperscaler 与他们的蚂蚁集团 300m 用户应用程序腾讯云产品 释放打开积极整合开发专有开发的权重模型 释放打开 最近专有模型模型和专有,权重模型和已启动集成到搜索平台中特定域提供专有 专有模型长期领先于消费者模型和腾讯模型上的报价 提供推论自动驾驶 AI平台华为云云阿里云Qwen 2.5 MaxErnie 4.0 Turbo豆宝 1.5 Lite浑源大盘古 5.0 大情报:79情报:79情报:76情报:76情报:77情报:77情报:74情报:74QwQ豆宝 1.5 Pro情报:78情报:78情报:80情报:80文本到语音演讲到演讲图像生成其他型号同义千文豆宝西莉亚元宝,元琪视频生成3D 生成主要消费者Apps估价(美元)235B文心一燕,文心一格32B300B128B469B基于北京的互联网集团,拥有超过3亿月活跃用户(MAU);该集团是Opera浏览器的所有者。推出了SkyWork系列模型和AI加速器。中国的领先消费电子品牌推出了MiLM系列小型型号。最近挖来了DeepSeek研究员罗浮

    展开阅读全文
    提示  搜弘文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:AI现状:中国-2025人工分析公司-2025.pdf
    链接地址:https://wenku.chochina.com/doc/175642.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    Copyright@ 2010-2022 搜弘文库版权所有

    粤ICP备11064537号

    收起
    展开