申万宏源-AI行业系列点评：AI大模型竞争加剧，国内海外多点开花-240311-10页

VIP专享

3.0 西装暴徒 2024-06-30 28 1.98MB 10 页免费

侵权投诉

业

及

产

业

行

业

研

究

行

业

点

评

证

券

研

究

报

告

计算机

2024 年03 月11 日

AI 大模型竞争加剧，国内海外多点

开花

看好

——AI 行业系列点评

相关研究

"华为 2024 年合作伙伴大会核心看点有

哪些？-全年关注计算 +鸿蒙+盘古

+Meta " 2024 年3月10 日

"AI 大模型多点开花！新质生产力落地新

型工业化！-计算机行业周报

20240304-20240308" 2024 年3月9

日

证券分析师

洪依真 A0230519060003

hongyz@swsresearch.com

刘洋 A0230513050006

liuyang2@swsresearch.com

研究支持

洪依真 A0230519060003

hongyz@swsresearch.com

联系人

洪依真

(8621)23297818×

hongyz@swsresearch.com

本期投资提示：

 国产大模型 Kimi、海外大模型 Claude3 新发布，可以达到 GPT-4 的大模型继续增加！

Kimi 和Claude3 均有超预期性能表现。

 Kimi chat 是月之暗面推出的对话助手工具，于 2023 年10 月10 日发布，发布之初即定

位长文本。支持输入 20 万汉字，是目前国产大模型中支持的最长上下文输入长度， 2024

年2月，kimi 迭代了网站、多问题搜索能力，可用性继续提升。Kimi 中英文生成能力已

接近 GPT-4 水平，主要优势在语言理解和长文本处理，复杂逻辑推理、数学解题和多模

态能力暂缺或稍弱。内部实测其长文本处理能力让论文总结、会议纪要变得更具可用性，

加上联网搜索功能，对于需要查阅大量信息和处理会议纪要的办公人群有极大助力，未来

办公类 AI 应用或将受益。Kimi 成功启示：我们认为团队成员能力、资金储备、时间可能

是Kimi 目前较为成功的原因。

 截至目前，国内大模型的文字生成能力已经整体接近 GPT-4 Turbo。上海人工智能实验

室OpenCompass2.0 测评结果显示，不少国内厂商近期新发布的模型在多个能力维度上

正在快速缩小与 GPT-4 Turbo 的差距，包括智谱清言 GLM-4、阿里 Qwen-Max、百度

文心一言 4.0 等。我们认为在 2点上仍有差距：1）大模型普遍在复杂推理能力上有提升

空间，包括 GPT4-Turbo，但明显领先国内商业和开源模型。2）图生文能力，目前阿里

Qwen-VL 暂时能力位居前列，实测来看能够理解简单图片，初步具备基于视觉完成复杂

推理的能力，但复杂计算及视觉问题上较 GPT4V 仍有提升空间。

 3月4日，OpenAI 竞争对手之一 Anthropic 推出最新 Claude3 大模型，效果好于

Gemini。中英文生成、理解、推理，多模态图片理解能力均与 GPT-4 接近，且实际使用

中生成速度快于 GPT-4 和Gemini。内部实测我们认为 Claude3 在如下几点能力上有提

升和突破：1）更快的响应速度。2）多模态能力。3）更强小语种能力。

 整体来看，市场可能认为海外大模型迭代放缓，但我们认为 2024 年模型能力仍然快速迭

代。包括 Open AI 以外的其他模型能力追赶、Llama3 等开源大模型发布、下半年 OpenAI

的新模型迭代等。

 推荐标的：1）AI 办公应用：金山办公、福昕软件；2）多模态算法布局：科大讯飞、虹

软科技、万兴科技、大华股份；3）多模态应用：焦点科技（互联网传媒）、上海电影（互

联网传媒）、光线传媒（互联网传媒）、巨人网络（互联网传媒）、华策影视（互联网传媒）、

易点天下（互联网传媒）

 风险提示：大模型技术中美仍存在差异，部分技术尚处于早期实验室阶段，存在落地风险；

竞争加剧影响利润率风险；AIGC 技术演变过快风险。

请务必仔细阅读正文之后的各项信息披露与声明

行业点评

请务必仔细阅读正文之后的各项信息披露与声明第2页共10 页简单金融成就梦想

一、国产大模型 Kimi、海外大模型 Claude3 新发布，可以达到 GPT-4 的大模型继续

增加！

根据我们内部测评：Kimi 中英文生成能力已经接近 GPT-4 水平，尽管实际测试中复杂

逻辑、数学能力仍有差距，且主打文字生成、目前无多模态能力；Cluade3 中英文生成、

理解、推理，多模态图片理解能力均与 GPT-4 接近，效果好于 Gemini，且实际使用中生

成速度快于 GPT-4 和Gemini。

表1：内部测评各模型中英文文字生成能力情况

中文题得分情况

国内团队

美国团队

欧洲团队

kimi

ChatGLM-4

GPT4

claude3

mistral

10 题中正确题目数

英文题得分情况

国内团队

美国团队

欧洲团队

kimi

ChatGLM-4

GPT4

claude3

mistral

5题中正确题目数

资料来源：Kimi、ChatGLM-4、Open AI、Claude、Mistral 等官网，申万宏源研究

Kimi：国产大模型长文本能力突破，实测文字生成、文本总结等能力接近 GPT-4。

Kimi chat 是月之暗面推出的对话助手工具，于 2023 年10 月10 日发布，发布之初

即定位长文本。支持输入 20 万汉字，是目前国产大模型中支持的最长上下文输入长度，

2024 年2月，kimi 迭代了网站、多问题搜索能力，可用性继续提升。

我们认为其在长文本单点能力上实现突破，精准定位办公人群。Kimi 支持 20 万汉字

的长文本输入，对比来看，GPT-4 Turbo-128k的能力是约 10 万汉字，Claude3 200k 上

下文是约 16 万汉字。因此，Kimi更适用于高效阅读、专业文件解读、资料查询、资料整

理总结等方面。

1）专业论文要点归纳总结任务的表现和 GPT4 大致相同，响应迅速，约 10 秒可以读

完论文并给出回答。回答内容简要，能够根据文档精准回复追问，体现了模型较好的逻辑

推理能力。

图1 kimi 处理 14 万字左右论文

图2 针对论文内容追问的回答

资料来源：kimi chat，申万宏源研究

行业点评

请务必仔细阅读正文之后的各项信息披露与声明第3页共10 页简单金融成就梦想

2）资料整理总结方面 kimi 在会议纪要总结能力上具有优势，选取一场会议的录音转

录文本（分成两份 pdf）给到模型进行文本纠错和全文总结，kimi 的纠错能力和总结能力

强于 GPT4，例如 kimi 能根据上下文将“贝尔 BT 这个 T23，T五”这个乱码纠正为“BERT”,

并告知可能指 BERT 模型，其全文总结结果也比 GPT4 结果更具可用性。

图3 kimi 对会议纪要的纠错及总结

图4 GPT4 对会议纪要的纠错及总结

资料来源：kimi chat，申万宏源研究

资料来源：chatgpt，申万宏源研究

3）能够针对提问自动联网搜索总结回答，答案提供信息来源，更具可靠性。例如下图

问kimi 关于谷歌 2024 的最新新闻，基本涵盖了所有要点新闻，总结也到位。

图5 kimi 联网搜索新闻信息并总结要点

资料来源：kimi chat，申万宏源研究

研报加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载研报到电脑，查找使用更方便

立即下载

标签： #AI #申万宏源 #大模型

摘要：

业及产业行业研究行业点评证券研究报告计算机2024年03月11日AI大b学竞争加剧国内bb多点开花看好——AI行业系列bb华为2024年合作伙伴大会核心看b哪些？全年关bh计算鸿蒙盘古Meta2024年3月10日AI大bb开花！新质bDJ型工业化！计算机行业周报20240304202403082024年3月9日证券分析师br1A0230519060003hongyzswsresearchcom刘bmA0230513050006liuyang2swsresearchcom研究支持br1A0230519060003hongyzswsresearchcom联系人br1862123297818hong...

展开>> 收起<<

申万宏源-AI行业系列点评：AI大模型竞争加剧，国内海外多点开花-240311-10页.pdf

共10页,预览3页

还剩页未读，继续阅读