开yun体育网10K TPM的包月价钱为2000元-开云「中国」集团Kaiyun·官方网站
发布日期:2026-04-18 09:22 点击次数:175

开yun体育网
图片起首:视觉中国
2月26日,明星大模子公司DeepSeek秘书即日起在北京时期逐日00:30至08:30的夜间恬逸时段,大幅下调API调用价钱,其中DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%,降幅最高达75%。该公司称,这一举措旨在饱读动用户充分摆布夜间时段,享受更经济、更运动的作事体验。
这并非DeepSeek初度调度API价钱。旧年8月,DeepSeek曾将API输入用度下调至0.1元/百万tokens,输出用度为2元/百万tokens,激刊行业调动。
然则在2月初,由于作事器资源垂死,DeepSeek一度暂停API作事充值,直至2月25日才再行盛开,并调度了DeepSeek-chat模子的调用价钱,为每百万输入tokens 2元,每百万输出tokens 8元。
要是与豆包和通义千问的调用价钱进行对比,会发现粗浅时段下,豆包大模子的价钱相对较低,通义千问不同模子价钱有各别,而DeepSeek在尺度时段价钱相对较高,但在优惠时段价钱有较大幅度下跌,具有一定竞争力。
以豆包通用模子pro-32k为例,后付费阵势下,推理输入0.0008元/千Tokens、推理输出0.002元/千Tokens,模子推理的空洞价钱为0.001元/千Tokens;预支费阵势下,10K TPM的包月价钱为2000元,平均价钱为0.0046元/千Tokens。
通义千问的qwen1.5-110b-chat模子,输入价钱为0.007元/千Tokens,输出价钱为0.014元/千Tokens;qwen-72b-chat输入和输出价钱均为0.02元/千Tokens;Qwen-VL-Plus输入价钱为0.0015元/千Tokens;Qwen-VL-Max输入价钱为0.003元/千Tokens。
参考之前DeepSeek的调用价钱,优惠时段内DeepSeek-V3百万Tokens输入(缓存射中)为0.25元,百万Tokens输入(缓存未射中)为1元,百万Tokens输出为4元;DeepSeek-R1百万Tokens输入(缓存射中)为0.25元,百万Tokens输入(缓存未射中)为1元,百万Tokens输出为4元。
DeepSeek的降价计谋有助于进一步缩小中小企业和个东谈主诞生者的使用门槛,激动AI时代的普及。此前,DeepSeek的降价曾激刊行业四百四病,包括阿里云、百度、腾讯等头部企业纷纷跟进,秘书各自的降价要领。这次夜间优惠是否会再次掀翻价钱战,还要看其他大模子公司的进一步算作。
DeepSeek推出优惠要领之时,有时其“开源周”。首个开源的代码库为针对Hopper GPU优化的FlashMLA,第二日是首个用于MoE模子考研和推理的开源EP通讯库DeepEP,26日则开源了一个复古密集和MoE GEMM的FP8 GEMM 库,为V3/R1考研和推理提供复古。
另据媒体报谈,DeepSeek权谋提前发布新一代AI模子R2,展望在编程智商、多言语推理等方面有所擢升开yun体育网,还可能在图像生成、语音识别和合成等多模态方面有所升级。R2模子的发布或进一步安稳DeepSeek在AI限度的地位,并激动新一轮的时代纠正。