yabo.com-降低使用成本!通义千问GPT-4级主力模型降价97%
2026-05-17

【YABO科技新闻】年夜模子的呈现,给各行各业都带来了效率的晋升,可是利用成本太高,是拦阻年夜模子范围化运用的要害。于如许的配景下,阿里云率先出击。5月21日,阿里云公布通义千问GPT-4级主力模子Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。

这象征着,1块钱可以买200万tokens,相称在5本《新华字典》的文字量。这款模子最高撑持1万万tokens长文本输入,降价后约为GPT-4价格的1/400。

降低使用成本!通义千问GPT-4级主力模型降价97%

据悉,Qwen-Long是通义千问的长文本加强版模子,机能对于标GPT-4,上下文长度最高达1万万。除了了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。比拟之下,海内外厂商GPT-四、Gemini1.5 Pro、Claude 3 Sonnet和Ernie-4.0每一千tokens输入价格别离为0.22元、0.025元、0.022元和0.12元,均远高在Qwen-long。

降低使用成本!通义千问GPT-4级主力模型降价97%

通义千问本次降价共笼罩9款贸易化和开源系列模子。不久前发布的通义千问旗舰款年夜模子Qwen-Max,API输入价格降至0.04元/千tokens,降幅达67%。Qwen-Max是今朝业界体现最佳的中文年夜模子,于权势巨子基准OpenCompass上机能追平GPT-4-Turbo,并于年夜模子竞技场Chatbot Arena中跻身全世界前15。

降低使用成本!通义千问GPT-4级主力模型降价97%

不久前,OpenAI的Sam Altman转发了Chatbot Arena榜单来印证GPT-4o的能力,此中全世界排名前20的模子中,仅有的三款中国模子都是通义千问出品。

降低使用成本!通义千问GPT-4级主力模型降价97%

业界遍及认为,跟着年夜模子机能逐渐晋升,AI运用立异正进入密集摸索期,但推理成本太高依然是制约年夜模子范围化运用的要害因素。

于武汉AI智领者峰会现场,阿里云智能集团资深副总裁、大众云事业部总裁刘伟光暗示:“作为中国第一年夜云计较公司,阿里云此次年夜幅降低年夜模子推理价格,就是但愿加快AI运用的发作。咱们估计将来年夜模子API的挪用量会有成千上万倍的增加。”

刘伟光认为,不论是开源模子还有是贸易化模子,大众云+API将成为企业利用年夜模子的主流方式,重要有三点缘故原由:

一是大众云的技能盈余及范围效应,带来巨年夜的成本及机能上风。阿里云可以从模子自身及AI基础举措措施两个层面不停优化,寻求极致的推理成本及机能。阿里云基在自研的异构芯片互联、高机能收集HPN7.0、高机能存储CPFS、人工智能平台PAI等焦点技能及产物,构建了极致弹性的AI算力调理体系,联合百炼漫衍式推理加快引擎,年夜幅压缩了模子推理成本,并加速模子推理速率。

即即是一样的开源模子,于大众云上的挪用价格也远远低在私有化部署。以利用Qwen-72B开源模子、每个月1亿tokens用量为例,于阿里云百炼上直接挪用API每个月仅需600元,私有化部署的成本平均每个月超1万元。

二是云上更利便举行多模子挪用,并提供企业级的数据安全保障。阿里云可以为每一个企业提供专属VPC情况,做到计较断绝、存储断绝、收集断绝、数据加密,充实保障数据安全。今朝,阿里云已经主导或者深度介入10多项年夜模子安全相干国际海内技能尺度的制订。

三是云厂商自然的开放性,能为开发者提供最富厚的模子及东西链。阿里云百炼平台上会聚通义、百川、ChatGLM、Llama系列等上百款海内外优质模子,内置年夜模子定制与运用开发东西链,开发者可以便捷地测试比力差别模子,开发专属年夜模子,并轻松搭建RAG等运用。从选模子、调模子、搭运用到对于外办事,一站式弄定。

版权所有,未经许可不患上转载

-yabo.com
CopyRight  2019-2025   YABO亚博灯饰有限公司       网站地图  所有标签  免责声明  常州网络公司中环互联网设计制作