硅基流动

价格

一站式接入主流开源模型:大语言、多模态、语音、代码、嵌入...全面覆盖,按用量付费,清晰透明。

灵活接入方式:支持模型即用、托管部署和私有化落地,满足不同业务场景所需。

大模型 API 服务

覆盖语言、语音、图片、视频等多场景,一站式提供已加速的大模型 API 服务,按量收费。

托管服务--预留实例

支持用户托管自选模型,在支撑业务迭代的同时,无需关注底层资源、服务质量,有效降低维护成本。

私有化部署

针对企业场景量身定制,省去模型部署、推理优化、模型管理、算力管理麻烦,满足多样化应用需求。

大模型 API 服务

平台现已有数十种语言模型,部分支持 模型微调批量处理 功能。

语言模型
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
免费
免费
1.00
4.00
模型微调
模型
训练(元 / M tokens)
推理(元 / M tokens)
Qwen/Qwen2.5-7B-Instruct
¥3.50
¥0.53
Qwen/Qwen2.5-14B-Instruct
¥7.00
¥1.05
Qwen/Qwen2.5-32B-Instruct
¥12.60
¥1.89
Qwen/Qwen2.5-72B-Instruct
¥41.30
¥6.20
批量处理
模型
输入(元 / M tokens)
输出(元 / M tokens)
deepseek-ai/DeepSeek-R1
¥2.00
¥8.00
deepseek-ai/DeepSeek-V3
¥1.00
¥4.00
Qwen/QwQ-32B
¥0.50
¥2.00

托管服务——预留实例

面向用户多样化的使用场景,

提供灵活的算力服务类型。

预付类型
GPU类型
价格(元 / 小时)
即用即付按需实例
标准版算力单元
昇腾算力单元
¥2.73 限时特惠¥2.28
¥11.73 限时特惠¥7.81
预留实例(三个月起)
标准版 / 昇腾算力单元

私有化部署

针对多租户、高并发的训练和推理场景,硅基流动可提供持续稳定的资源供给,平台现已支持 DeepSeek-R1 & V3 系列模型、Qwen 等上百种模型的一键式私有化部署与训练调优,并对模型进行统一纳管,提供高效的模型推理服务。