价格
一站式接入主流开源模型:大语言、多模态、语音、代码、嵌入...全面覆盖,按用量付费,清晰透明。
灵活接入方式:支持模型即用、托管部署和私有化落地,满足不同业务场景所需。



大模型 API 服务
平台现已有数十种语言模型,部分支持 模型微调 、批量处理 功能。
语言模型
输入 (元 / M tokens)
输出 (元 / M tokens)
语言模型
Qwen/Qwen2.5-Coder-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
THUDM/GLM-4-9B-0414
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
THUDM/GLM-Z1-9B-0414
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
Qwen/Qwen3-8B
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
THUDM/chatglm3-6b
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
Qwen/Qwen2.5-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
internlm/internlm2_5-7b-chat
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
THUDM/glm-4-9b-chat
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
Qwen/Qwen2-1.5B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
Qwen/Qwen2-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
免费
免费
Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
输入 (元 / M tokens)
输出 (元 / M tokens)
0.14
0.14
Pro/Qwen/Qwen2-1.5B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.14
0.14
Pro/Qwen/Qwen2.5-Coder-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/Qwen/Qwen2.5-VL-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/Qwen/Qwen2.5-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/Qwen/Qwen2-VL-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/Qwen/Qwen2-7B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.35
0.35
Pro/THUDM/glm-4-9b-chat
输入 (元 / M tokens)
输出 (元 / M tokens)
0.60
0.60
deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
输入 (元 / M tokens)
输出 (元 / M tokens)
0.70
0.70
Qwen/Qwen2.5-14B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
0.70
0.70
deepseek-ai/deepseek-vl2
输入 (元 / M tokens)
输出 (元 / M tokens)
0.99
0.99
Qwen/Qwen3-14B
输入 (元 / M tokens)
输出 (元 / M tokens)
1.00
1.00
internlm/internlm2_5-20b-chat
输入 (元 / M tokens)
输出 (元 / M tokens)
1.00
1.00
Qwen/Qwen2.5-Coder-32B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
1.26
1.26
deepseek-ai/DeepSeek-R1-Distill-Qwen-32B
输入 (元 / M tokens)
输出 (元 / M tokens)
1.26
1.26
Qwen/QwQ-32B-Preview
输入 (元 / M tokens)
输出 (元 / M tokens)
1.26
1.26
Qwen/Qwen2.5-32B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
1.26
1.26
deepseek-ai/DeepSeek-V2.5
输入 (元 / M tokens)
输出 (元 / M tokens)
1.33
1.33
Qwen/Qwen3-30B-A3B
输入 (元 / M tokens)
输出 (元 / M tokens)
1.40
1.40
Qwen/Qwen2.5-VL-32B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
1.89
1.89
THUDM/GLM-4-32B-0414
输入 (元 / M tokens)
输出 (元 / M tokens)
1.89
1.89
Qwen/Qwen3-32B
输入 (元 / M tokens)
输出 (元 / M tokens)
2.00
2.00
Pro/deepseek-ai/DeepSeek-V3
输入 (元 / M tokens)
输出 (元 / M tokens)
2.00
4.00
THUDM/GLM-Z1-Rumination-32B-0414
输入 (元 / M tokens)
输出 (元 / M tokens)
4.00
4.00
Qwen/QwQ-32B
输入 (元 / M tokens)
输出 (元 / M tokens)
1.00
4.00
THUDM/GLM-Z1-32B-0414
输入 (元 / M tokens)
输出 (元 / M tokens)
4.00
4.00
Qwen/Qwen2.5-VL-72B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
4.13
4.13
Qwen/Qwen2.5-72B-Instruct-128K
输入 (元 / M tokens)
输出 (元 / M tokens)
4.13
4.13
Qwen/Qwen2.5-72B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
4.13
4.13
Qwen/Qwen2-VL-72B-Instruct
输入 (元 / M tokens)
输出 (元 / M tokens)
4.13
4.13
Qwen/Qwen3-235B-A22B
输入 (元 / M tokens)
输出 (元 / M tokens)
5.00
5.00
Pro/deepseek-ai/DeepSeek-R1
输入 (元 / M tokens)
输出 (元 / M tokens)
4.00
8.00
deepseek-ai/DeepSeek-V3
输入 (元 / M tokens)
输出 (元 / M tokens)
2.00
8.00
Pro/deepseek-ai/DeepSeek-V3-1226
输入 (元 / M tokens)
输出 (元 / M tokens)
8.00
8.00
Qwen/QVQ-72B-Preview
输入 (元 / M tokens)
输出 (元 / M tokens)
9.90
9.90
deepseek-ai/DeepSeek-R1
输入 (元 / M tokens)
输出 (元 / M tokens)
4.00
16.00
模型微调
模型
训练(元 / M tokens)
推理(元 / M tokens)
Qwen/Qwen2.5-7B-Instruct
¥3.50
¥0.53
Qwen/Qwen2.5-14B-Instruct
¥7.00
¥1.05
Qwen/Qwen2.5-32B-Instruct
¥12.60
¥1.89
Qwen/Qwen2.5-72B-Instruct
¥41.30
¥6.20
模型微调
Qwen/Qwen2.5-7B-Instruct
训练(元 / M tokens)
¥3.50
推理(元 / M tokens)
¥0.53
Qwen/Qwen2.5-14B-Instruct
训练(元 / M tokens)
¥7.00
推理(元 / M tokens)
¥1.05
Qwen/Qwen2.5-32B-Instruct
训练(元 / M tokens)
¥12.60
推理(元 / M tokens)
¥1.89
Qwen/Qwen2.5-72B-Instruct
训练(元 / M tokens)
¥41.30
推理(元 / M tokens)
¥6.20
批量处理
模型
输入(元 / M tokens)
输出(元 / M tokens)
deepseek-ai/DeepSeek-R1
¥2.00
¥8.00
deepseek-ai/DeepSeek-V3
¥1.00
¥4.00
Qwen/QwQ-32B
¥0.50
¥2.00
批量处理
deepseek-ai/DeepSeek-R1
输入(元 / M tokens)
输出(元 / M tokens)
¥2.00
¥8.00
deepseek-ai/DeepSeek-V3
输入(元 / M tokens)
输出(元 / M tokens)
¥1.00
¥4.00
Qwen/QwQ-32B
输入(元 / M tokens)
输出(元 / M tokens)
¥0.50
¥2.00
托管服务——预留实例
面向用户多样化的使用场景,
提供灵活的算力服务类型。
预付类型
GPU类型
价格(元 / 小时)
即用即付按需实例
标准版算力单元
昇腾算力单元
¥2.73 限时特惠¥2.28
¥11.73 限时特惠¥7.81
私有化部署
针对多租户、高并发的训练和推理场景,硅基流动可提供持续稳定的资源供给,平台现已支持 DeepSeek-R1 & V3 系列模型、Qwen 等上百种模型的一键式私有化部署与训练调优,并对模型进行统一纳管,提供高效的模型推理服务。