白皮書 · v0.1

TQI — Token Quality Index

一個 0–100 的 AI API Key 綜合品質分數。所有測量方法、權重、數學定義公開透明。

Layer 1

TL;DR 摘要

TQI 是一個 0–100 的 AI API Key 綜合品質分數，由六大維度加權計算：

TQI = Availability × 25% + Response Quality × 20% + Speed × 15% + Consistency × 15% + Capacity × 15% + Integrity × 10%

Grade

A+

90–100

Grade

80–89

Grade

70–79

Grade

55–69

Grade

40–54

Grade

0–39

Layer 2

六維度詳解

Availability · 可用性

25%

代表什麼

Key 真的能用嗎？

測量方法

對原廠端點 (Anthropic /v1/messages、OpenAI /v1/chat/completions) 發送最小請求。只有 2xx + 成功解出回應 token 才算通過。401/403 得 0 分；能驗證但產不出輸出得 40。

score = 98 × 1_{auth ∧ quality} + 40 × 1_{auth ∧ ¬quality}

Response Quality · 回應品質

20%

代表什麼

Key 指向的是真的模型嗎？

測量方法

要求模型輸出一段確定字串 (例如 PONG)，檢查是否出現。這能偵測到指向假模型、被中間人攔截、或輸出被裁切的異常 Key。

score = 92 × 1_{quality_ok} + 30 × 1_{¬quality_ok}

Speed · 速度

15%

代表什麼

會不會很慢？

測量方法

使用串流模式測量首 token 延遲 (TTFT)。300ms 內滿分、3000ms 接近 30 分，中間線性。

score = clamp(100 − (ttft − 300) / 2700 × 70, 0, 100)

Consistency · 穩定性

15%

代表什麼

會不會忽好忽壞？

測量方法

多次請求結果的變異度。MVP 階段以單次樣本為主，預設 80 分；V2 將引入 n=5 採樣並以 CV (變異係數) 計分。

score = clamp(100 − variance × 100, 0, 100)

Capacity · 容量

15%

代表什麼

能跑多大的量？

測量方法

從原廠的 Rate Limit 回應標頭讀出 TPM 與 RPM 上限，再以各供應商的 Tier 3 天花板正規化。

score = round(60 × (tpm / tpm_ceiling) + 40 × (rpm / rpm_ceiling))

Integrity · 完整性

10%

代表什麼

會不會突然被封？

測量方法

結合驗證是否通過、是否出現帳務異常訊號 (429 被限、403 被撤、payment required 等)、Tier 是否與可用模型一致。

score = 90 × 1_{integrity_ok ∧ auth_ok} + 55 × 1_{¬integrity_ok ∧ auth_ok}

Layer 3

完整白皮書

1. 為什麼需要 TQI

AI API Key 的二手市場缺少標準化的品質評估。買方看到「Tier 3 Anthropic Key」無法判斷它是真的能跑 400K TPM，還是會在首次請求時就被 429 擋下。 TQI 的目標是：把 Key 的真實品質，濃縮成一個可比較的 0–100 數字。

2. 設計原則

可複核：所有測量都是對原廠公開端點的請求，任何人可重製。
低干擾：單次檢測成本 < 20 tokens，不會觸發原廠風控。
零信任：TQI 服務本身不儲存、不轉售 Key，檢測邏輯將逐步開源。
可演進：權重每季度會根據市場數據重新校準，歷史版本永久保留。

3. 測量協定

對 Anthropic：GET /v1/models 取得目錄 → POST /v1/messages 串流 ≤ 20 tokens 的 ping，同時要求 thinking 以觀察 SSE 事件形狀、usage 一致性、身份與知識庫截止。對 OpenAI：GET /v1/models → POST /v1/chat/completions stream 128 tokens。 Rate Limit 從原廠回應標頭直讀（anthropic-ratelimit-* / x-ratelimit-*）， Tier 由 TPM 閾值反推。

4. 與現有標準對比

Anthropic Console 與 OpenAI Dashboard 僅提供帳戶維度的額度數字；市面上的 Key 代理平台通常只做 401/200 二元判斷。TQI 是目前唯一公開的、涵蓋真實性、品質、速度、容量同時量化成單一分數的評估方式。

5. 路線圖

v0.1（目前）：單次採樣、Anthropic + OpenAI + Gemini AI Studio + Azure OpenAI。
v0.2：多樣本 Consistency、Bedrock + Vertex + Azure AI Foundry、邊際採樣成本分析。
v0.3：長窗口回歸（7/30 天歷史趨勢線），賣家信用分數。
v1.0：與交易平台整合，作為撮合價格的基準分數。

6. 回饋與貢獻

白皮書、測量腳本、權重校準依據都會開放在 GitHub 上。有建議或發現測量偏差？歡迎 Issue 或 Pull Request。透明不是口號，是產品的一部分。

準備好看看你的 Key 值多少了嗎？

立即檢測 →