OpenClaw Token 慳錢 5 招:避免一日燒 $25 美金嘅慘痛教訓

·7 分鐘OpenClaw 2026.3.13 · 驗證於 16/3/2026

TL;DR

V2EX 有用戶一日燒咗 2500 萬 token(約 $25 USD),原因係 Agent 陷入重試迴圈——不停 retry 失敗嘅 API call,每次都傳入完整 session history。呢個唔係 Bug,係你冇設上限。

5 招防止燒錢:

  1. 設每日 Token 預算上限
  2. 用 OpenRouter 做 model fallback
  3. 精簡 soul.md 減少 system prompt 長度
  4. 關閉不必要嘅 background task
  5. 監控 Token 使用量 + 設 alert

點解會燒錢?Token 累積機制

OpenClaw 嘅每次 API call 都會傳入完整 session history。即係:

第 1 次對話:100 tokens
第 2 次對話:100 + 500 = 600 tokens
第 3 次對話:100 + 500 + 1200 = 1800 tokens
...
第 20 次對話:幾萬 tokens

再加上 Agent 自動重試、background task 不停跑、think mode 開到最高——費用就係咁失控嘅。

最危險嘅組合: 長 session + 頂級模型(Claude Opus 4.6 / GPT-5.4)+ think: high + Agent 陷入 retry loop。呢個組合可以喺幾個鐘內燒 $50–100。


招一:設定每日 Token 預算上限

最基本嘅保險。

# 設每日 budget 上限(美元)
openclaw config set budget.daily_limit 5.00
 
# 設每月上限
openclaw config set budget.monthly_limit 50.00
 
# 達到上限嘅行為
openclaw config set budget.on_limit fallback
# 選項:warn(警告但繼續)/ stop(停止)/ fallback(切換到平嘅 model)

另外,一定要喺 API provider 嗰邊都設 hard limit

  • OpenAI: platform.openai.com → Settings → Limits → 設 Hard limit
  • Anthropic: console.anthropic.com → Settings → 設月度上限

兩邊都設先安全。OpenClaw config 嘅上限係軟限制,Provider 嘅 hard limit 先係真正嘅保險。


招二:用 OpenRouter 做 Model Fallback

唔係每個任務都需要最貴嘅 model。用 OpenRouter,你可以一個 key 接入所有 model,然後按任務分配。

各 Model 價格對比(2026 年 3 月)

模型Input(/1M tokens)Output(/1M tokens)適合任務
Claude Opus 4.6$15.00$75.00最複雜推理、架構設計
GPT-5.4~$10.00~$30.00通用、工具整合
Claude Sonnet 4.6$3.00$15.00日常編程、分析
Claude Haiku 4.5$0.25$1.25簡單任務、高頻 Agent
DeepSeek V3$0.27$1.10高 CP 值、中文佳
GPT-4o mini$0.15$0.60輕量任務、分類
本地 Ollama免費免費需要 Apple Silicon / GPU

按任務分配 model:

# ~/.openclaw/config.yaml
agents:
  main:
    model: claude-sonnet-4-6          # 日常任務
    fallback_model: claude-haiku-4-5  # 超 budget 自動切換
  coder:
    model: claude-sonnet-4-6          # 代碼任務需要質素
  crawler:
    model: claude-haiku-4-5           # 抓數據唔需要貴 model
  social:
    model: gpt-4o-mini                # 輕量文字處理
推薦連結

🔀 OpenRouter — 一個 API Key 用所有 AI 模型

唔使每個 provider 都開帳號,GPT、Claude、DeepSeek 一站搞掂

了解詳情 →

如果你有長期高頻嘅自動化任務,另一個慳錢方法係自託管 — 用 DigitalOceanVultr 嘅 VPS 跑 Ollama 本地 model,完全唔使 API 費用。初始設定麻煩少少,但長期計絕對更平。


招三:精簡 soul.md

soul.md 嘅內容每次 API call 都會傳入。1000 字嘅 soul.md ≈ 每次對話額外消耗 ~1500 tokens。

精簡原則:

  • 砍到 500 字以內
  • 刪走 Agent 已經識做嘅事(例如唔使寫「你識寫代碼」)
  • 合併重複規則
  • 用短句代替長句
# ❌ 之前(800 字)
你係一個非常專業嘅 AI 助手,你嘅主要職責係幫助我完成日常工作。
你應該用繁體中文回覆,語氣要專業但唔好太正式...(後面仲有一大段)
 
# ✅ 之後(200 字)
你係 Claw,我嘅 AI 助手。叫我 Yau。
- 繁體中文(香港用語),簡潔直接
- shell 指令前要我確認
- 唔好刪檔案、發 email、操作社交媒體
- 唔好透露 API Key

詳細嘅 soul.md 寫法睇 soul.md 完整教學


招四:關閉不必要嘅 Background Task

新手常見錯誤:開咗一堆 cron job 同 heartbeat 但冇留意頻率。

# 睇所有 cron job
openclaw cron list
 
# 常見問題:heartbeat 每分鐘跑一次
# 每次都係一個 API call,一日 = 1440 次
openclaw config set agents.main.heartbeat.interval 30m  # 改成 30 分鐘
 
# 刪除唔需要嘅 cron
openclaw cron remove <cron-id>

頻率調整建議:

Task 類型建議頻率原因
伺服器監控每 15–30 分鐘大部分服務唔會一分鐘內出事
社交媒體監控每 1–4 小時除非你做即時客服
RSS / 新聞抓取每 6–12 小時新聞唔需要即時
Email 檢查每 15–30 分鐘夠用

每次 cron 執行記得用 --new-session,避免 session history 累積:

openclaw cron add --schedule "*/30 * * * *" \
  --agent crawler \
  --command "check site updates" \
  --new-session

招五:監控 Token 使用量

即時監控:TUI 底部

tokens 10k/272k (4%)  think low  claude-sonnet-4-6
  • 10k:當前 session 已用 token
  • think low:當前 think mode(low 最慳)
  • 見到 token 超過 50k,考慮開新 session

設 Alert

# session token 警告
openclaw config set budget.session_warn 50000
 
# 達到時 Telegram 通知
openclaw config set budget.alert_channel telegram

Think Mode 控制

# 日常任務用 low
/think low
 
# 複雜推理先用 high
/think high
 
# 設預設
openclaw config set agents.default.think low
Think ModeToken 消耗適合場景
think: high3–5x架構設計、複雜推理
think: medium1.5–2x一般任務
think: low1x簡單指令、自動化

真實成本估算

用戶類型用法描述估計月費
輕度每日少量對話,Haiku 為主$3–8
中度2–3 個 Agent,定期 cron,Sonnet 為主$15–30
重度5+ Agents,高頻 cron,部分用 Opus$50–100+
失控冇設上限、長 session、retry loop$25+/日 ⚠️

開新 session + 用啱 model + 設上限,一個人可以慳 60–80% 費用。


FAQ

Q:OpenClaw 本身收唔收錢?

OpenClaw 軟件本身開源免費。費用只嚟自你用嘅 LLM API——即係每次 Agent 問 Claude 或 GPT 問題時嘅 API call 費用。想了解 OpenClaw 同 ChatGPT 嘅費用結構分別,睇 OpenClaw vs ChatGPT

Q:邊個 model 最平?

雲端 model 入面,GPT-4o mini($0.15/1M input tokens)同 DeepSeek V3($0.27/1M)係最平嘅。如果你有 Apple Silicon Mac,跑 Ollama 本地 model 完全免費。但本地 model 質素通常低過頂級雲端 model。

Q:可唔可以用免費 model?

可以。OpenAI Codex OAuth 有免費額度(唔使信用卡),Google Gemini 有免費 tier,DeepSeek 有少量免費額度。另外 Ollama 本地 model 完全免費。詳細各 provider 設定方法睇 API Key 設定教學

Q:點知我而家燒咗幾多錢?

TUI 底部有實時 token 顯示。另外去各 Provider 嘅 dashboard(OpenAI Usage、Anthropic Console)可以睇到實際費用。建議每隔幾日睇一次,直至習慣咗自己嘅用量模式。


相關文章