巨头集体降价！折射一个风向

来源：网易科技报道作者： 2024年05月22日 16:18

导语：在业内看来，此轮大模型降价潮是各家厂商为了抢占市场份额，加速AI应用的商业化落地而采取的策略。

近期，国内多家大模型厂商纷纷宣布降价策略，推动大模型从“以分计价”的定价模式向更“以厘计价”新时代迈进。

5月21日，阿里云通义千问的主力模型Qwen-Long的API输入价格从0.02元/千Tokens降至0.0005元/千Tokens，降幅达97%。这意味着，1元可以买200万Tokens。

阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示：“作为中国第一大云计算公司，阿里云这次大幅降低大模型推理价格，就是希望加速AI应用的爆发。预计未来大模型API的调用量会有成千上万倍的增长。”

同日，百度智能云也宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费。

此前，字节跳动、智谱AI等厂商也纷纷推出了各自的降价方案。“豆包主力模型的推理输入定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。”火山引擎总裁谭待5月15日公开表示。

受访人士认为，这场价格战的背后，是各家厂商对于优先做大市场的共识，各家旨在通过降低使用成本，吸引更多企业和个人开发者使用其技术，从而推动生态繁荣。

大模型厂商打响价格战

5月以来，国内厂商纷纷开启了大模型推理端的价格战。

5月6日，幻方量化官微宣布，旗下深度求索（DeepSeek）正式开源第二代MoE模型DeepSeek-V2。据介绍，DeepSeek-V2API的定价为：每百万Tokens输入1元、输出2元，价格为GPT-4-Turbo的近百分之一。

智谱AI大模型开放平台于5月11日上线了新的价格体系，新注册用户可以获得额度从500万Tokens提升至2500万Tokens，并且个人版GLM-3Turbo模型产品的调用价格从5元/百万Tokens降低至1元/百万Tokens。

5月15日，在火山引擎原动力发布会上，字节跳动豆包大模型家族、火山方舟2.0、AI应用及AI云基础设施等一系列最新产品正式发布。

火山引擎是字节跳动旗下云服务平台，据谭待介绍，经过一年时间的迭代和市场验证，字节跳动自研的豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

“豆包主力模型的推理输入定价只有0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。”谭待表示，大模型从以分计价到以厘计价，将助力企业以更低成本加速业务创新。

谭待强调，降价是用技术优化成本来实现的。如果只是补贴，用亏损换收入是不可持续的，火山引擎不会走这条路。

海外方面，自2023年3月，OpenAI已经进行了多次降价。在今年1月25日夜间的更新中，OpenAI新推出了2个嵌入模型，更新了3种模型的版本，并降低了多个模型及API的使用价格。其中，GPT-3.5 Turbo模型的输入价格降低了50%，至0.0005美元/1000 Tokens，输出价格降低了25%，至0.0015美元/1000 tokens。

5月13日，OpenAI发布新一代大模型GPT-4o，GPT-4o能够接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像输出的任意组合。GPT-4o可以在最短232毫秒内响应音频输入，平均为320毫秒，与人类正常对话的响应时间接近。与GPT-4Turbo相比，GPT-4o的速度快2倍，价格减半，速率限制高出5倍。

在机构分析师看来，GPT-4o的诞生进一步验证了大模型厂商API的降价趋势，其技术路径对国内大模型产业也具备积极的映射作用。

随着国内外大模型厂商技术角逐进一步激烈，华龙证券分析师孙伯文认为，大模型行业开启价格战信号明显。通过降低价格门槛，大模型厂商有望吸引更广泛的企业用户群体，从而进一步平衡收入和成本。

“同时，更多C端用户有望免费使用基础AI应用，庞大的访问量有助于企业进一步提升模型服务能力，完成良性循环。对下游企业来说，推理成本进一步降低，AI应用行业有望迎来成本拐点。”其表示。

AI应用有望加速普及

在业内看来，此轮大模型降价潮是各家厂商为了抢占市场份额，加速AI应用的商业化落地而采取的策略。

谈及字节跳动大模型降价原因，谭待近期指出，今年大模型技术显著提升，应用环节至关重要。繁荣生态是推广应用的关键。市场上，许多客户都渴望尝试大模型，但创新风险高，尤其是AI风险。

“要减少不确定性，我们必须大幅降低试错成本，使大模型能被广泛采用，无论大企业还是个人开发者。市场呼吁我们提供更低成本的核心技术。”他表示。

据悉，目前火山引擎的生态包括了IaaS（基础设施即服务）、PaaS（平台即服务）、SaaS（软件即服务）。

谈及用户场景落地情况时，谭待对21世纪经济报道记者举例道，随着汽车与手机的交互日益自然，如在驾驶中导航、查询周边信息，无需分心操作手机，车载系统可即时响应需求。手机助手AI的应用受限于技术，未充分满足用户需求。

他还表示，在其他场景如消费营销、金融服务中，智能体也展现出巨大潜力。

“为实现AI技术的广泛应用，需提升技术并构建丰富的应用生态。这需要低代码生态的支持，降低开发门槛，激发群体智慧。同时，降低AI技术成本，使更多初创企业和小规模项目得以实施，促进AI时代的创新与发展。”谭待告诉记者。

北京一位人工智能行业人士告诉记者，此轮大模型价格战的开启，对于AI应用的普及具有积极的推动作用，将使得更多企业和个人开发者能够负担得起AI技术的使用成本，从而更加积极地投入到AI技术的研发和应用中来。

“价格战的竞争将促进AI技术的不断创新和优化，推动整个行业的技术水平不断提升。随着AI应用的普及，将带动相关产业链的发展，形成更加完善的AI生态系统，为整个社会的数字化转型提供有力支撑。”该人士表示。

华创证券研报认为，整体来看，降低成本是推动大模型快进到“价值创造阶段”的关键要素，更低的成本价格才能真正满足企业的复杂业务场景需求，充分验证大模型的应用价值。尽管模型终端的价格压降或将促使大模型企业对上游加强成本管控，但目前我国企业正处于AI转型的关键时期，低成本下AI模型生态将进一步完善，终端应用亦将涌现出一批核心的创新应用。

（文章为作者独立观点，不代表贝塔网立场）

AI 大模型降价