申万宏源-AI行业系列点评:AI大模型竞争加剧,国内海外多点开花-240311-10页
VIP专享
业
及
产
业
行
业
研
究
/
行
业
点
评
证
券
研
究
报
告
计算机
2024 年03 月11 日
AI 大模型竞争加剧,国内海外多点
开花
看好
——AI 行业系列点评
相关研究
"华为 2024 年合作伙伴大会核心看点有
哪些?-全 年 关注 计算 +鸿蒙+盘古
+Meta " 2024 年3月10 日
"AI 大模型多点开花!新质生产力落地新
型工业化!-计算机行业周报
20240304-20240308" 2024 年3月9
日
证券分析师
洪依真 A0230519060003
hongyz@swsresearch.com
刘洋 A0230513050006
liuyang2@swsresearch.com
研究支持
洪依真 A0230519060003
hongyz@swsresearch.com
联系人
洪依真
(8621)23297818×
hongyz@swsresearch.com
本期投资提示:
国产大模型 Kimi、海外大模型 Claude3 新发布,可以达到 GPT-4 的大模型继续增加!
Kimi 和Claude3 均有超预期性能表现。
Kimi chat 是月之暗面推出的对话助手工具,于 2023 年10 月10 日发布,发布之初即定
位长文本。支持输入 20 万汉字,是目前国产大模型中支持的最长上下文输入长度, 2024
年2月,kimi 迭代了网站、多问题搜索能力,可用性继续提升。Kimi 中英文生成能力已
接近 GPT-4 水平,主要优势在语言理解和长文本处理,复杂逻辑推理、数学解题和多模
态能力暂缺或稍弱。内部实测其长文本处理能力让论文总结、会议纪要变得更具可用性,
加上联网搜索功能,对于需要查阅大量信息和处理会议纪要的办公人群有极大助力,未来
办公类 AI 应用或将受益。Kimi 成功启示:我们认为团队成员能力、资金储备、时间可能
是Kimi 目前较为成功的原因。
截至目前,国内大模型的文字生成能力已经整体接近 GPT-4 Turbo。上海人工智能实验
室OpenCompass2.0 测评结果显示,不少国内厂商近期新发布的模型在多个能力维度上
正在快速缩小与 GPT-4 Turbo 的差距,包括智谱清言 GLM-4、阿里 Qwen-Max、百度
文心一言 4.0 等。我们认为在 2点上仍有差距:1)大模型普遍在复杂推理能力上有提升
空间,包括 GPT4-Turbo,但明显领先国内商业和开源模型。2)图生文能力,目前阿里
Qwen-VL 暂时能力位居前列,实测来看能够理解简单图片,初步具备基于视觉完成复杂
推理的能力,但复杂计算及视觉问题上较 GPT4V 仍有提升空间。
3月4日,OpenAI 竞争对手之一 Anthropic 推出最新 Claude3 大模型,效果好于
Gemini。中英文生成、理解、推理,多模态图片理解能力均与 GPT-4 接近,且实际使用
中生成速度快于 GPT-4 和Gemini。内部实测我们认为 Claude3 在如下几点能力上有提
升和突破:1)更快的响应速度。2)多模态能力。3)更强小语种能力。
整体来看,市场可能认为海外大模型迭代放缓,但我们认为 2024 年模型能力仍然快速迭
代。包括 Open AI 以外的其他模型能力追赶、Llama3 等开源大模型发布、下半年 OpenAI
的新模型迭代等。
推荐标的:1)AI 办公应用:金山办公、福昕软件;2)多模态算法布局:科大讯飞、虹
软科技、万兴科技、大华股份;3)多模态应用:焦点科技(互联网传媒)、上海电影(互
联网传媒)、光线传媒(互联网传媒)、巨人网络(互联网传媒)、华策影视(互联网传媒)、
易点天下(互联网传媒)
风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险;
竞争加剧影响利润率风险;AIGC 技术演变过快风险。
请务必仔细阅读正文之后的各项信息披露与声明
行业点评
请务必仔细阅读正文之后的各项信息披露与声明 第2页 共10 页 简单金融 成就梦想
一、国产大模型 Kimi、海外大模型 Claude3 新发布,可以达到 GPT-4 的大模型继续
增加!
根据我们内部测评:Kimi 中英文生成能力已经接近 GPT-4 水平,尽管实际测试中复杂
逻辑、数学能力仍有差距,且主打文字生成、目前无多模态能力;Cluade3 中英文生成、
理解、推理,多模态图片理解能力均与 GPT-4 接近,效果好于 Gemini,且实际使用中生
成速度快于 GPT-4 和Gemini。
表1:内部测评各模型中英文文字生成能力情况
中文题得分情况
国内团队
美国团队
欧洲团队
kimi
ChatGLM-4
GPT4
claude3
mistral
10 题中正确题目数
8
9
9
8
3
英文题得分情况
国内团队
美国团队
欧洲团队
kimi
ChatGLM-4
GPT4
claude3
mistral
5题中正确题目数
3
4
3
3
4
资料来源:Kimi、ChatGLM-4、Open AI、Claude、Mistral 等官网,申万宏源研究
Kimi:国产大模型长文本能力突破,实测文字生成、文本总结等能力接近 GPT-4。
Kimi chat 是月之暗面推出的对话助手工具,于 2023 年10 月10 日发布,发布之初
即定位长文本。支持输入 20 万汉字,是目前国产大模型中支持的最长上下文输入长度,
2024 年2月,kimi 迭代了网站、多问题搜索能力,可用性继续提升。
我们认为其在长文本单点能力上实现突破,精准定位办公人群。Kimi 支持 20 万汉字
的长文本输入,对比来看,GPT-4 Turbo-128k的能力是约 10 万汉字,Claude3 200k 上
下文是约 16 万汉字。因此,Kimi更适用于高效阅读、专业文件解读、资料查询、资料整
理总结等方面。
1)专业论文要点归纳总结任务的表现和 GPT4 大致相同,响应迅速,约 10 秒可以读
完论文并给出回答。回答内容简要,能够根据文档精准回复追问,体现了模型较好的逻辑
推理能力。
图1 kimi 处理 14 万字左右论文
图2 针对论文内容追问的回答
资料来源:kimi chat,申万宏源研究
资料来源:kimi chat,申万宏源研究
行业点评
请务必仔细阅读正文之后的各项信息披露与声明 第3页 共10 页 简单金融 成就梦想
2)资料整理总结方面 kimi 在会议纪要总结能力上具有优势,选取一场会议的录音转
录文本(分成两份 pdf)给到模型进行文本纠错和全文总结,kimi 的纠错能力和总结能力
强于 GPT4,例如 kimi 能根据上下文将“贝尔 BT 这个 T23,T五”这个乱码纠正为“BERT”,
并告知可能指 BERT 模型,其全文总结结果也比 GPT4 结果更具可用性。
图3 kimi 对会议纪要的纠错及总结
图4 GPT4 对会议纪要的纠错及总结
资料来源:kimi chat,申万宏源研究
资料来源:chatgpt,申万宏源研究
3)能够针对提问自动联网搜索总结回答,答案提供信息来源,更具可靠性。例如下图
问kimi 关于谷歌 2024 的最新新闻,基本涵盖了所有要点新闻,总结也到位。
图5 kimi 联网搜索新闻信息并总结要点
资料来源:kimi chat,申万宏源研究
摘要:
展开>>
收起<<
业及产业行业研究行业点评证券研究报告计算机2024年03月11日AI大b学竞争加剧国内bb多点开花看好——AI行业系列bb华为2024年合作伙伴大会核心看b哪些?全年关bh计算鸿蒙盘古Meta2024年3月10日AI大bb开花!新质bDJ型工业化!计算机行业周报20240304202403082024年3月9日证券分析师br1A0230519060003hongyzswsresearchcom刘bmA0230513050006liuyang2swsresearchcom研究支持br1A0230519060003hongyzswsresearchcom联系人br1862123297818hong...
相关推荐
-
VIP专享2024-07-09 189
-
VIP专享2024-07-13 66
-
VIP专享2024-07-14 52
-
VIP专享2024-08-04 43
-
VIP专享2024-08-10 68
-
VIP专享2024-09-09 106
-
VIP专享2024-09-12 65
-
VIP专享2024-09-18 74
-
VIP专享2024-09-18 47
-
VIP专免2024-10-05 161
作者:西装暴徒
分类:按报告类型
价格:免费
属性:10 页
大小:1.98MB
格式:PDF
时间:2024-06-30