快速开始
10 分钟跑起公共 ai-cost-gate 实例,然后把 agent 指向它。
你要跑的东西
公共 ai-cost-gate 实例是一个 Docker 容器,底层一个 SQLite 文件。暴露:
- 本地 OpenAI 兼容代理
:8080(可配)。你的 agent 改指向这个端点,而不是上游 LLM。 - Web dashboard
:3000(可配)—— 成本、归因、告警。 - 只读内部 API
/internal/query/...—— 工具集成用。
1. 拉公共镜像
docker pull ghcr.io/costbrake/ai-cost-gate:latest或者购买 Pro 后从源码跑:
git clone https://github.com/CostBrake/ai-cost-gate.git
cd ai-cost-gate
docker compose up2. 配置
镜像通过环境变量读上游 LLM 凭据。最少需要:
UPSTREAM_OPENAI_API_KEY=sk-...
UPSTREAM_ANTHROPIC_API_KEY=sk-ant-...
DATABASE_URL=sqlite:///data/ai-cost-gate.db
ADMIN_TOKEN=change-me完整列表见 环境变量。
3. 启动
docker run -d \
--name ai-cost-gate \
-p 3000:3000 \
-p 8080:8080 \
-v $(pwd)/data:/data \
--env-file .env \
ghcr.io/costbrake/ai-cost-gate:latestDashboard 在 http://localhost:3000。代理监听 http://localhost:8080。
4. 让 agent 指向代理
任何 OpenAI 兼容 SDK 都行。OpenAI Python SDK 示例:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:8080/v1",
api_key="not-used-by-the-gateway",
)
resp = client.chat.completions.create(
model="claude-opus-4-7",
messages=[{"role": "user", "content": "你好"}],
extra_headers={"x-acg-project": "my-app"},
)x-acg-project header 给每条请求打标,方便后面归因。
5. 在 dashboard 看
打开 http://localhost:3000,新请求会以 project、agent、model、cost 维度被记录。可以下钻归因、设置预算、配置 auto-stop。