火山方舟核心计费模式解析
火山方舟采用「按量后付费」与「预付费模型单元」双轨制计费体系。后付费模式按实际消耗的tokens或调用次数结算,每小时出账;预付费模式通过购买固定TPM(每分钟tokens配额)的模型单元,实现成本可控的包天/包月服务。两者均支持50万tokens的免费体验额度,用户可根据业务流量峰谷灵活选择。
大语言模型定价策略
后付费方案:
- 字节跳动Doubao系列:输入tokens单价0.0003-0.005元,输出tokens单价0.0006-0.009元,支持4K/32K/128K三种上下文长度
- 智谱AI GLM3系列:统一单价0.001元/千tokens,适用于金融等高精度场景
- 月之暗面Moonshot:8K/32K/128K版本单价分别为0.012/0.024/0.06元,擅长长文本生成
预付费方案:
- Doubao-lite-128k模型单元:包天100元/10K TPM,包月2400元
- Doubao-pro-128k高配版:包天340元/10K TPM,包月8000元
视觉大模型计费规则
- 文生图服务:字节跳动智能绘图模型0.2元/次,含200次免费额度
- 专业图像模型:Stable Diffusion系列模型单元包天175元,包月4200元
语音与向量模型计费细节
- 语音合成:5元/万字符,支持中英混合音色定制
- 声音复刻:8元/万字符,实现个性化音色克隆
- 向量模型:Doubao-embedding输入单价0.0005元/千tokens,支持4K长文本编码
模型精调专项费用
基于LoRA的精调服务按「训练文本量×迭代次数」计费:
- Doubao-lite系列:0.03元/千tokens
- Doubao-pro系列:0.05元/千tokens
成本控制关键机制
- 免费体验池:新用户可获50万tokens推理额度及200次文生图体验
- 动态流量调控:通过RPM(每分钟请求数)和TPM双重限制防止突发成本
- 跨模型比价系统:支持多模型效果/成本实时对比决策
企业级账单管理接口
火山方舟提供分钟级粒度消费明细查询,支持按模型/服务类型/时间段多维统计。企业财务系统可通过OpenAPI对接实时获取用量预警,设置部门级预算阈值。所有计费数据采用区块链存证技术确保不可篡改。