ACG 文档

快速开始

10 分钟跑起公共 ai-cost-gate 实例,然后把 agent 指向它。

你要跑的东西

公共 ai-cost-gate 实例是一个 Docker 容器,底层一个 SQLite 文件。暴露:

  • 本地 OpenAI 兼容代理 :8080(可配)。你的 agent 改指向这个端点,而不是上游 LLM。
  • Web dashboard :3000(可配)—— 成本、归因、告警。
  • 只读内部 API /internal/query/... —— 工具集成用。

1. 拉公共镜像

docker pull ghcr.io/costbrake/ai-cost-gate:latest

或者购买 Pro 后从源码跑:

git clone https://github.com/CostBrake/ai-cost-gate.git
cd ai-cost-gate
docker compose up

2. 配置

镜像通过环境变量读上游 LLM 凭据。最少需要:

UPSTREAM_OPENAI_API_KEY=sk-...
UPSTREAM_ANTHROPIC_API_KEY=sk-ant-...
DATABASE_URL=sqlite:///data/ai-cost-gate.db
ADMIN_TOKEN=change-me

完整列表见 环境变量

3. 启动

docker run -d \
  --name ai-cost-gate \
  -p 3000:3000 \
  -p 8080:8080 \
  -v $(pwd)/data:/data \
  --env-file .env \
  ghcr.io/costbrake/ai-cost-gate:latest

Dashboard 在 http://localhost:3000。代理监听 http://localhost:8080

4. 让 agent 指向代理

任何 OpenAI 兼容 SDK 都行。OpenAI Python SDK 示例:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:8080/v1",
    api_key="not-used-by-the-gateway",
)

resp = client.chat.completions.create(
    model="claude-opus-4-7",
    messages=[{"role": "user", "content": "你好"}],
    extra_headers={"x-acg-project": "my-app"},
)

x-acg-project header 给每条请求打标,方便后面归因。

5. 在 dashboard 看

打开 http://localhost:3000,新请求会以 project、agent、model、cost 维度被记录。可以下钻归因、设置预算、配置 auto-stop。

下一步

On this page