国内AI百团大战还打么?大模型要上房还是要“凉凉”?丨正经深度
文丨林雨秀 编辑丨杜海
来源丨正经社(ID:zhengjingshe)
(本文约为6200字)
【正经社“科技前沿”观察之49】
实话实说,作为2022年底“跑步入场的玩家”,看到这个命题会比较诧异。你看,诺贝尔化学奖,特别是物理学奖都颁发给AI领域科学家了;你再看,自从咱妈9月打出“组合拳”,一些APP开屏广告和信息流广告猛增。
如果售楼的排第一,AI应用(C端为主)至少排第二。
所以,何出“凉凉”?
后面在某乎等平台看到一些讨论,有来自业内人士的冷静反思。核心是,这个非常烧钱,且“我们越追越远”,又没看到真正意义落地的应用,单纯“刷榜”已经让投资人心灰意冷了。
话说“一万个股民心中有一万个政策解读”。但好在AI没那么复杂,达成共识并不难。
那么,实际情况是什么样呢?先白描一下行业现状。
对AI基本盘的两种不同观点
这两年,人工智能(AI)技术迅猛发展,其中LLM大模型作为新一代人工智能技术的核心,发展尤其迅猛——超强数据处理能力、高效算法优化和理论上无界的应用场景,在全球范围内掀起 AI 革命的澎湃浪潮。从谷歌的 BERT、OpenAI 的 GPT 系列,到国内百度的文心一言、阿里巴巴的通义千问,字节跳动的豆包和腾讯混元大模型等,可谓“百舸争流,群雄逐鹿”。
由中国互联网协会发布的《中国数字人发展报告(2024)》,预计2025年中国数字人核心市场规模将达480.6亿元、带动产业市场规模可达6402.7亿元。21财经发布的《2024年大模型行业研究报告》称,大模型市场容量及规模巨大,预计2028年将达到1179亿元。2022至2028年复合增长率约为60.11% 。
然而,新生事物的发展鲜有一帆风顺,AI大模型亦不例外。比如,下面的“两种声音”。
第一种声音主要是“回头看”,聚焦在投入产出、商业化和技术,他们认为,
巨额投资与收益难匹配:大型科技公司、股票投资者及风投机构向AI投入巨额资金,却难获预期收益,恐生金融泡沫。红杉资本合伙人指出,以当前投资成本计,要使AI投资获 50%收益,需赚6000亿美元,此巨额收入短期难以达到。
商业化难题:AI技术理论前景广阔,然众多 AI企业商业化举步维艰,盈利路径不明,致资本与市场对 AI 耐心渐失,泡沫破裂风险存焉。
技术瓶颈:AI大模型虽具强大生成与识别能力,技术瓶颈仍显,尤以推理能力与理解深度为甚。其模型复杂,运作机制难释,其“不可解释性”,在医疗、金融等高风险领域存在信任危机,且“AI 幻觉”频现亦令人困扰。
数据依赖与隐私问题:AI大模型倚赖海量数据,然数据易存偏差与歧视问题,且随数据隐私法律趋严,数据获取及使用门槛升高,成AI商业化拦路虎。
百度李彦宏 2023 年多次提及大模型应“去内卷化”。5 月 26 日中关村论坛,其在《大模型改变世界》演讲中预测AI 原生应用兴起。9 月 5 日界定 AI 原生应用三个条件,强调应超越传统移动互联网和 PC 软件,解决以往无法解决问题,而非“死磕”大模型数量。11 月 15 日深圳西丽湖论坛,李彦宏再度强调 AI 原生应用重要性,指出中国虽大模型众多,却缺相应原生应用,呼吁业界专注开发百万计AI原生应用,而非仅追求 100 个大模型发展。
再说说另一种声音:“向前看”。其认为虽存诸多担忧,AI行业热度降温,资本市场回归理性,不再一味逐求技术突破,转至商业化落地与盈利能力验证。即便如此,AI 技术代表长期技术革命,潜力与价值不容小觑。李彦宏亦曾言,虽 AI 行业会历泡沫,然最终会有 1%企业脱颖而出,为社会缔造巨大价值。
在此,正经社先亮明观点:AI是大势所趋,但包括企业在内的AI从业者需审时度势。
(一)业态速写
新世纪的第三个十年,国内主要科技公司纷纷卷起袖子,加大在 AI 大模型领域的研发投入。
2022年6月24日,工信部部长肖亚庆在第六届世界智能大会致辞中宣称,我国人工智能核心产业规模超 4000 亿元,企业数量超 3000 家。
中国信息通信研究院数据显示,2023 年人工智能核心产业规模突破 5784 亿元,同比增长 19%,预计 2024 年市场规模将突破 6000 亿元。
2024 年 10 月 23 日,国务院新闻办发布会透露,我国现有近 200 个完成备案并上线服务的生成式人工智能服务大模型,注册用户超6亿,人工智能企业数量超 4500 家。
2023 年,全球人工智能大模型市场规模约 210 亿美元。同年 5 月 28 日,中关村论坛“人工智能大模型发展”平行论坛上,中国科学技术信息研究所所长做报告,中国有 79 个 10 亿参数以上大模型,中美大模型研发数量占全球 80%以上,中国大模型数量仅次于美国。中国 AI 领域投融资约 232 笔、融资总额约 20 亿美元;全球生成式 AI 新创获约 204 亿美元融资。
2024 年,截至目前,全球人工智能大模型共 1328 个,美国占 44%,中国占 36%;截至一季度,全球AI核心企业约 3 万家,美国占 34%,中国占 15%;2023 年至 2024 年第一季度,全球 AI 独角兽 234 家、增加 37 家、占新增独角兽总量 40%,其中美国 120 家,中国 71 家(《全球数字经济白皮书(2024 年)》)。
2023 年前后,百度推出文心一言、阿里巴巴推出通义千问、字节跳动推出豆包大模型。第二梯队中,智谱AI大模型、百川智能大模型(专注医疗、金融等特定领域应用)和讯飞星火认知大模型等优秀产品涌现。
此外,腾讯、华为等科技巨头也在持续发力。腾讯有图像识别平台“腾讯云神图”、自然语言处理工具“腾讯云 NLP”、计算机视觉技术“腾讯优图”,以及“混元”跨模态大模型。而异军突起的月之暗面,其大模型产品 Kimi 博得业界掌声。
(二)场景拓展
随着AI大模型技术的不断进步,应用场景的版图也在不断扩张。
医疗领域,目前鲜见“大面积”的“AI入驻三甲医院”报道。2024 年 8 月,丽水市中心医院在全球范围内首发全新格局的智慧医疗体系——全场景大模型应用。AI大模型通过处理和分析大量医疗数据,辅助医生进行更准确的诊断和治疗方案制定,提升医疗服务效率和质量。
AI在制药上的应用比较早,较之“进入医院”,AI制药“在程序上更易于接入”。
AI 技术可通过分析大量数据产生新见解,提高早期发现效率。如英矽智能利用 AI 技术发现治疗特发性肺纤维化的新颖靶点TNIK,并设计出 ISM001 - 055 分子,研发用时缩短三分之二,费用仅为行业平均十分之一。
这里值得大书特书的是,AI技术对蛋白质设计领域带来颠覆性影响——包括这次的诺奖。
尽管AI制药技术在药物研发领域取得不俗进展,但仍面临商业模式不清晰等问题。导致AI制药领域融资增速趋缓,资金向高确定性赛道集中,如AI蛋白质设计。
不过,Precedence Research仍乐观预测,未来十年AI制药市场有望持续高速增长,预计到2032年全球市场规模将超过118亿美元,从2023年至2032年复合增长率将达到近30%。相比之下IDC要谨慎一些,其预计2031年市场规模为85.02亿美元,2022-2031年复合增长率约为27.2%。而根据IQVIA报告,2023年全球药品支出约1.6万亿美元,2019-2023年复合增速为6.0%。
同期,业内企业也在探索不同的商业模式,包括AI+SaaS、AI+CRO以及AI+Biotech三种主要模式。目前,尚未有一种商业模式“胜出”。
业界普遍认为,AI制药行业目前处于“淘汰赛”阶段,管线进展、营收能力成为判断一家AI制药企业优劣的最直观标准。从2013年算起,AI制药行业的发展已有10年,但鲜有AI药物挺过Ⅱ期临床试验。
金融领域,AI大模型被用于风险评估、欺诈检测等方面。通过对用户的交易行为、信用记录等数据进行深入分析,AI大模型能够识别潜在风险点,为金融机构提供及时有效的风险预警和防控措施。
此外,AI大模型还将在教育、交通、智能制造等诸多领域发挥作用,推动相关行业数字化转型和智能化升级。
说到这里,不能不提一笔2020年的“量化基金风波”。
新冠疫情引发市场极端波动,对头部量化基金业绩产生“重创”。2020年,全球规模靠前的量化对冲基金——文艺复兴、Two Sigma、桥水和AQR表现均不及预期,其中,文艺复兴科技损超30%,桥水基金则蒙受121亿美元亏损。Two Sigma则从榜单上消失。
然而,2020年国内却是“风景这边独好”:量化多头策略的收益平均高达36.61%,市场中性策略的收益也达到17.31%(中信证券,《量化基金2020年度回顾与展望》)。考虑到国内AI企业“纷纷下场”时间,或许当时的量化还不够“量化”。
可是,2023到24年度,国内的量化却不乐观了。根据中信证券的统计数据,截至2024年6月,国内股票量化私募管理人的资产规模约7800亿元,相比2023年末的1.21万亿元显著下降,降幅超过了35%。资产规模在“600亿+”的量化私募,在2024年二季度彻底清零。百亿规模的量化私募旗下指数增强产品单周跌幅达到10%至17%,超额收益为负。
国内顶尖量化私募宣称,超过60%的交易由AI算法驱动。国内量化基金在因子挖掘、优化投资组合、风险评估及投资决策支持等方面已经开始应用AI技术。分析人士将这种负面表现,归结为市场因素、监管加强和风控机制的不足等。
(三)政策支持
国务院于2017年7月8日印发《新一代人工智能发展规划》,明确提出加强AI基础理论研究、关键技术突破和创新能力建设等目标,为AI大模型发展“定调”并“保驾护航”。
此外,国家还加大了对AI产业的资金投入和税收优惠力度,鼓励企业加大研发投入和技术创新。同时,为了加强AI技术的监管和风险防范,国家还出台了一系列法律法规和标准规范,打造良好营商环境。
“玩家”需不断进行技术研发和创新,以在激烈市场竞争中保持领先地位,包括对大模型持续优化、多模态能力加强以及模型性能与应用广度提升等,涉及众多环节,简单粗暴理解就是要“烧钱”。
2024 年 9 月,商务部副部长兼国际贸易谈判副代表凌激透露,中国人工智能核心产业规模接近6000 亿元。
先看美国,美国企业在AI大模型上投入堪称豪掷千金。例如,微软在 2023 年 1 月向 OpenAI 投资约 100 亿美元。随后,OpenAI 在 2024 年 10 月又宣布完成新一轮巨额融资,金额达 66 亿美元。这些使 OpenAI 一直保持领先地位。而竞品之一的 Anthropic 已在 2024 年 5 月融资 10 亿美元。由马斯克创办的 xAI,在 2024 年 5 月融资 60 亿美元。
国内AI企业在资金投入方面相较而言存在不小差距。以百度为例,自2013 年涉足AI领域开始,十年来累计研发投入近1700 亿元,可谓巨资投入。然而,置于国际环境中,从十年时间维度看,仍显捉襟见肘。
但投资并不是AI可持续发展的全部。
(一)技术瓶颈与创新
随着AI大模型规模呈指数级增长,对高性能AI芯片的依赖愈发显著。以 Meta(Facebook)为例,2022 年初为支撑其宏大元宇宙愿景,打造了名为“AI 研究超级集群”(RSC)的超级计算机,内含16000个英伟达A100 GPU,算力高达 5 EFLOPS(混合精度)。
算力需求与芯片自研能力方面,算力是AI大模型发展基石,其需求随模型规模扩大急剧增长。澎湃新闻 2023 年初算过一笔账,训练一个拥有 1000 亿参数、基于 1PB 训练数据集的AI模型,至少需要 1.08 万个英伟达 A100 GPU。如果这让人咋舌,也有让人眼前一亮的。 OpenAI在训练 GPT-3 模型(1750 亿参数)时,只使用了约 1000 个英伟达 V100 GPU。注意,V100 性能还不及 A100。
为什么有这么大的“能耗”差距呢?分析认为,OpenAI通过优化模型架构和训练策略,以及利用特定于GPT-3的高效硬件配置,减少了训练所需GPU 数量。其他千亿参数项目因不同模型设计、数据处理需求、训练时间限制或硬件选择,需更多A100 GPU。说人话就是,通过优化等“软实力”或可有效降低“能耗”,但有很多时候还需“大力出奇迹”。
数据集的质量和多样性方面,数据集是AI大模型训练“粮食”,其质量和多样性直接影响模型性能和创新能力。当前国内AI大模型数据主要源于互联网、电商、社交、搜索等领域,存在数据类型单一、信息可信度不高等问题(人民网财经研究院和至顶科技联合发布《2024年中国AI大模型产业发展报告》)。
算法优化与创新方面,Transformer 架构作为当前AI大模型主流选择,算力消耗和存储需求较高。为提升模型训练效率和性能,国内企业和研究机构积极探索算法层面的优化和创新。
国信证券经济研究所报告指出,大模型参数规模增长速度远超摩尔定律下芯片性能提升速度,凸显算法优化重要性。探索和发展新硬件架构与算法优化策略成为算力突破关键路径。
(二)商业化与盈利模式
这是一个繁杂多元的进程,涵盖技术创新、市场需求、商业模式变革等诸多方面。
1.订阅服务,如OpenAI的ChatGPT4.0、百度的文心一言4.0等采用此模式。
2.智能硬件,以智能音箱、智能穿戴设备等为代表,内置AI技术实现各种功能,为用户提供便捷智能生活体验。
3.行业解决方案,针对特定行业需求提供定制化AI解决方案,解决行业难题,提升运营效率与决策质量,实现商业价值。
4.平台即服务(PaaS)模式,构建AI应用市场平台,整合产业链资源,提供一站式 AI 服务,开放 API、SDK 等工具吸引第三方参与,营造良性生态系统,推进商业化与创新。
5.数据和分析,以数据为核心提供商业智能服务,进行市场洞察、客户行为分析等,为数据中台赋能,助力企业决策。
6.技术许可模式,将AI技术知识产权授权给其他公司,获取收入并推广技术。
7.众包和协作模式,融合人工智能与人类劳动力,通过AI Agent 优化任务分配给网络工作者,提升效率创造价值。
8.大语言模型即服务模式(MaaS),以服务形式提供先进机器学习模型,简化集成与应用流程,降低技术门槛,推动普及与发展。
9.广告与内容推荐,提供个性化广告和内容推荐,提高点击率和转化率,为平台和广告主创造收益。
10.教育与培训,开发AI教育平台和课程,提供在线学习资源和个性化学习路径,提升用户技能知识,为教育机构和个人提供收入来源。
11.健康医疗,结合AI技术提供智能诊断、个性化治疗方案和健康管理服务,改善医疗质量效率,带来新增长点。
12.娱乐与游戏,利用AI开发智能游戏和娱乐内容,提供沉浸个性化体验,通过游戏内购买、订阅服务等盈利。
随着AI技术进步和应用领域拓展,商业化与盈利模式也会不断创新演变。企业需紧跟技术发展步伐,探索尝试新商业模式,实现可持续增长和盈利。
(三)数据安全与隐私
在数据驱动的AI大模型中,数据安全与隐私保护问题愈发突出。例如,Clearview AI 数据泄露事件,以及 2023 年 2 月 12 日 Telegram 查询机器人被爆泄露平台内 45 亿条个人信息,数据主要来自各海外快递平台,也涉及淘宝、京东等中国购物网站,包含用户真实姓名、电话与住址等。
2024 年 2 月 29 日,奇安信集团发布《2024 人工智能安全报告》,2023 年基于 AI 的深度伪造欺诈暴增 3000%,基于AI的钓鱼邮件增长 1000%,且已发现多个有国家背景的APT组织,利用AI实施了十余起网络攻击事件。若任由 AI“疯狂发展”而缺乏有效的“反制”AI的未来将游走在失控边缘,人类的未来也将危机四伏。
(一)技术
国内外 AI 大模型在技术层面存在差异。国外在算法优化上更成熟先进,能处理复杂大规模数据集;国内在模型训练方面具优势,可利用丰富数据和计算资源优化模型性能。
在应用场景上,国外在自然语言处理、图像识别等领域应用广泛深入;国内则更注重医疗、金融、教育等领域的实际应用和落地。
(二)投入与研发
全球:根据斯坦福大学人工智能研究院(HAI)的报告,2023年全球人工智能投资连续第二年下降,并购交易金额从 2022 年的 1171.6 亿美元降至 806.1 亿美元,降幅高达 31.2%,外部资本投入跌至 1892 亿美元,较 2022年下降20%。但对生成式人工智能的投资急剧上升,2023年对生成式人工智能初创公司资本投入激增到 252 亿美元,是 2022 年的 9 倍、2019 年的 30 倍左右。全球在生成式人工智能上的投资到 2027 年预计达 1430 亿美元,复合年增长率为 73.3%。
中国:IDC 认为,中国将继续引领亚太地区人工智能市场发展,占亚太地区总支出五成,到 2027 年中国人工智能总投资规模将突破 400 亿美元,年复合增长率为 25.6%。2023 年 AI 核心产业规模突破 5784 亿元,同比增长 19%,预计 2024 年市场规模将突破 6000 亿元(中国信息通信研究院)。
(三)未来
在可预见的未来,AI大模型的发展将呈现以下趋势:
持续技术创新:处理能力将更高效、准确和智能,新的技术框架和算法不断涌现,为发展提供新动力。
行业合作与生态构建:注重行业合作和生态构建,企业需与产业链上下游合作,推动技术研发和应用,同时与政府部门、科研机构合作构建健康生态。
政策导向:中国政府在“十四五”规划中明确提出加快AI技术发展并出台扶持政策,推动大模型技术发展,预期政策和扶持力度只增不减。
综上所述,国内 AI 大模型未来发展前景广阔,但也面临诸多挑战和不确定性。对于从业者或“利益相关者”来说,把握机遇、应对挑战是未来发展关键。【《正经社》出品】
CEO·首席研究员|曹甲清·责编|唐卫平·编辑|杜海·百进·编务|安安·校对|然然
声明:文中观点仅供参考,勿作投资建议。投资有风险,入市需谨慎
喜欢文章的朋友请关注正经社,我们将持续进行价值发现与风险警示
转载正经社任一原创文章,均须获得授权并完整保留文首和文尾的版权信息,否则视为侵权
申请转载、对稿件有异议或投诉,欢迎联系微信号fxyayaya