TL;DR
V2EX 有用戶一日燒咗 2500 萬 token(約 $25 USD),原因係 Agent 陷入重試迴圈——不停 retry 失敗嘅 API call,每次都傳入完整 session history。呢個唔係 Bug,係你冇設上限。
5 招防止燒錢:
- 設每日 Token 預算上限
- 用 OpenRouter 做 model fallback
- 精簡 soul.md 減少 system prompt 長度
- 關閉不必要嘅 background task
- 監控 Token 使用量 + 設 alert
點解會燒錢?Token 累積機制
OpenClaw 嘅每次 API call 都會傳入完整 session history。即係:
第 1 次對話:100 tokens
第 2 次對話:100 + 500 = 600 tokens
第 3 次對話:100 + 500 + 1200 = 1800 tokens
...
第 20 次對話:幾萬 tokens
再加上 Agent 自動重試、background task 不停跑、think mode 開到最高——費用就係咁失控嘅。
最危險嘅組合: 長 session + 頂級模型(Claude Opus 4.6 / GPT-5.4)+ think: high + Agent 陷入 retry loop。呢個組合可以喺幾個鐘內燒 $50–100。
招一:設定每日 Token 預算上限
最基本嘅保險。
# 設每日 budget 上限(美元)
openclaw config set budget.daily_limit 5.00
# 設每月上限
openclaw config set budget.monthly_limit 50.00
# 達到上限嘅行為
openclaw config set budget.on_limit fallback
# 選項:warn(警告但繼續)/ stop(停止)/ fallback(切換到平嘅 model)另外,一定要喺 API provider 嗰邊都設 hard limit:
- OpenAI: platform.openai.com → Settings → Limits → 設 Hard limit
- Anthropic: console.anthropic.com → Settings → 設月度上限
兩邊都設先安全。OpenClaw config 嘅上限係軟限制,Provider 嘅 hard limit 先係真正嘅保險。
招二:用 OpenRouter 做 Model Fallback
唔係每個任務都需要最貴嘅 model。用 OpenRouter,你可以一個 key 接入所有 model,然後按任務分配。
各 Model 價格對比(2026 年 3 月)
| 模型 | Input(/1M tokens) | Output(/1M tokens) | 適合任務 |
|---|---|---|---|
| Claude Opus 4.6 | $15.00 | $75.00 | 最複雜推理、架構設計 |
| GPT-5.4 | ~$10.00 | ~$30.00 | 通用、工具整合 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 日常編程、分析 |
| Claude Haiku 4.5 | $0.25 | $1.25 | 簡單任務、高頻 Agent |
| DeepSeek V3 | $0.27 | $1.10 | 高 CP 值、中文佳 |
| GPT-4o mini | $0.15 | $0.60 | 輕量任務、分類 |
| 本地 Ollama | 免費 | 免費 | 需要 Apple Silicon / GPU |
按任務分配 model:
# ~/.openclaw/config.yaml
agents:
main:
model: claude-sonnet-4-6 # 日常任務
fallback_model: claude-haiku-4-5 # 超 budget 自動切換
coder:
model: claude-sonnet-4-6 # 代碼任務需要質素
crawler:
model: claude-haiku-4-5 # 抓數據唔需要貴 model
social:
model: gpt-4o-mini # 輕量文字處理如果你有長期高頻嘅自動化任務,另一個慳錢方法係自託管 — 用 DigitalOcean 或 Vultr 嘅 VPS 跑 Ollama 本地 model,完全唔使 API 費用。初始設定麻煩少少,但長期計絕對更平。
招三:精簡 soul.md
soul.md 嘅內容每次 API call 都會傳入。1000 字嘅 soul.md ≈ 每次對話額外消耗 ~1500 tokens。
精簡原則:
- 砍到 500 字以內
- 刪走 Agent 已經識做嘅事(例如唔使寫「你識寫代碼」)
- 合併重複規則
- 用短句代替長句
# ❌ 之前(800 字)
你係一個非常專業嘅 AI 助手,你嘅主要職責係幫助我完成日常工作。
你應該用繁體中文回覆,語氣要專業但唔好太正式...(後面仲有一大段)
# ✅ 之後(200 字)
你係 Claw,我嘅 AI 助手。叫我 Yau。
- 繁體中文(香港用語),簡潔直接
- shell 指令前要我確認
- 唔好刪檔案、發 email、操作社交媒體
- 唔好透露 API Key詳細嘅 soul.md 寫法睇 soul.md 完整教學。
招四:關閉不必要嘅 Background Task
新手常見錯誤:開咗一堆 cron job 同 heartbeat 但冇留意頻率。
# 睇所有 cron job
openclaw cron list
# 常見問題:heartbeat 每分鐘跑一次
# 每次都係一個 API call,一日 = 1440 次
openclaw config set agents.main.heartbeat.interval 30m # 改成 30 分鐘
# 刪除唔需要嘅 cron
openclaw cron remove <cron-id>頻率調整建議:
| Task 類型 | 建議頻率 | 原因 |
|---|---|---|
| 伺服器監控 | 每 15–30 分鐘 | 大部分服務唔會一分鐘內出事 |
| 社交媒體監控 | 每 1–4 小時 | 除非你做即時客服 |
| RSS / 新聞抓取 | 每 6–12 小時 | 新聞唔需要即時 |
| Email 檢查 | 每 15–30 分鐘 | 夠用 |
每次 cron 執行記得用 --new-session,避免 session history 累積:
openclaw cron add --schedule "*/30 * * * *" \
--agent crawler \
--command "check site updates" \
--new-session招五:監控 Token 使用量
即時監控:TUI 底部
tokens 10k/272k (4%) think low claude-sonnet-4-6
10k:當前 session 已用 tokenthink low:當前 think mode(low 最慳)- 見到 token 超過 50k,考慮開新 session
設 Alert
# session token 警告
openclaw config set budget.session_warn 50000
# 達到時 Telegram 通知
openclaw config set budget.alert_channel telegramThink Mode 控制
# 日常任務用 low
/think low
# 複雜推理先用 high
/think high
# 設預設
openclaw config set agents.default.think low| Think Mode | Token 消耗 | 適合場景 |
|---|---|---|
think: high | 3–5x | 架構設計、複雜推理 |
think: medium | 1.5–2x | 一般任務 |
think: low | 1x | 簡單指令、自動化 |
真實成本估算
| 用戶類型 | 用法描述 | 估計月費 |
|---|---|---|
| 輕度 | 每日少量對話,Haiku 為主 | $3–8 |
| 中度 | 2–3 個 Agent,定期 cron,Sonnet 為主 | $15–30 |
| 重度 | 5+ Agents,高頻 cron,部分用 Opus | $50–100+ |
| 失控 | 冇設上限、長 session、retry loop | $25+/日 ⚠️ |
開新 session + 用啱 model + 設上限,一個人可以慳 60–80% 費用。
FAQ
Q:OpenClaw 本身收唔收錢?
OpenClaw 軟件本身開源免費。費用只嚟自你用嘅 LLM API——即係每次 Agent 問 Claude 或 GPT 問題時嘅 API call 費用。想了解 OpenClaw 同 ChatGPT 嘅費用結構分別,睇 OpenClaw vs ChatGPT。
Q:邊個 model 最平?
雲端 model 入面,GPT-4o mini($0.15/1M input tokens)同 DeepSeek V3($0.27/1M)係最平嘅。如果你有 Apple Silicon Mac,跑 Ollama 本地 model 完全免費。但本地 model 質素通常低過頂級雲端 model。
Q:可唔可以用免費 model?
可以。OpenAI Codex OAuth 有免費額度(唔使信用卡),Google Gemini 有免費 tier,DeepSeek 有少量免費額度。另外 Ollama 本地 model 完全免費。詳細各 provider 設定方法睇 API Key 設定教學。
Q:點知我而家燒咗幾多錢?
TUI 底部有實時 token 顯示。另外去各 Provider 嘅 dashboard(OpenAI Usage、Anthropic Console)可以睇到實際費用。建議每隔幾日睇一次,直至習慣咗自己嘅用量模式。
相關文章
- API Key 設定教學 — 設定好 Key 之後,跟住呢篇慳錢
- OpenClaw 安全避坑指南 — API key 安全管理,防止被盜用燒錢
- Gateway 排錯指南 — Gateway 出問題可能導致 retry loop 燒錢