Anthropic API 是目前代码生成和推理任务的最强 API,其 Prompt Caching(缓存命中后成本降 90%)和 Thinking(structured reasoning)是独有的差异化特性。但新手上路最重要的是两件事:在 Console 设置月消费上限(API 不会自动限流),以及充分理解 thinking tokens 的成本模型(不计入 max_tokens 但照常收费)。
Anthropic API 没有默认的硬性月消费上限。如果你的代码有 bug(死循环调用、忘记 break),月账单可能从 $100 飙升到 $10,000。在 Console → Usage Limits 中设置硬上限是必须做的第一步。
启用 thinking 时,thinking tokens 会计入输出费用但不计入 max_tokens 预算。设置 thinking: {budget_tokens: 4000} 但 max_tokens: 1000 可能导致实际输出费用远超预期。
Cache 只对 1024+ tokens 的连续内容块生效。对短 system prompt 加 cache_control 不会有任何效果——API 会静默忽略。cache TTL 为 5 分钟,需频繁刷新。
Anthropic 的推理节点主要在 US/EU。从中国/东南亚调用 Anthropic API 的延迟比 OpenAI 高 50-200ms。如果你的 OPC 产品对延迟敏感(实时聊天、代码补全),优先评估延迟是否可接受。
如果你是 OPC 不想管理多个 API key 或需要 fallback 机制,OpenRouter 提供统一入口访问 Claude + GPT + Gemini。价格略高于直接 API 但提供了模型切换的灵活性。
| GitHub - Anthropic Python SDK 官方仓库 | 代码仓库 | - |
| Reddit r/ClaudeAI - Claude 用户社区 | Community | - |