Metrik API

Real-time LLM performance data

Introduction

The Metrik API provides real-time Time to First Token (TTFT) data for 26+ LLM models across OpenAI, Anthropic, Google, and xAI.

Data is updated hourly and includes performance comparisons, provider averages, and change tracking.

Base URL

https://metrik.vercel.app/api/v1

Rate Limits

Requests per Hour

100

Rate Limit Window

1 hour

Authentication

None

Rate limit headers: Every response includes X-RateLimit-Limit, X-RateLimit-Remaining, and X-RateLimit-Reset

Endpoints

GET/ttft

Get latest TTFT data for all models

Example Request

curl https://metrik.vercel.app/api/v1/ttft

Example Response

{
  "success": true,
  "version": "1.0",
  "timestamp": "2025-01-15T12:02:00Z",
  "data": {
    "summary": {
      "total_models": 26,
      "average_ttft": 589,
      "fastest_model": {
        "name": "Grok Code Fast",
        "model_id": "grok-code-fast-1",
        "provider": "xAI",
        "ttft": 211
      },
      "slowest_model": {
        "name": "GPT-4o Mini",
        "model_id": "gpt-4o-mini",
        "provider": "OpenAI",
        "ttft": 3228
      }
    },
    "providers": [
      {
        "name": "xAI",
        "model_count": 6,
        "average_ttft": 290,
        "models": [
          {
            "name": "Grok Code Fast",
            "model_id": "grok-code-fast-1",
            "ttft": 211,
            "change_from_last_hour": -87,
            "status": "operational"
          }
          // ... more models
        ]
      }
      // ... more providers
    ]
  }
}

Code Examples

JavaScript / Node.js

const response = await fetch('https://metrik.vercel.app/api/v1/ttft');
const data = await response.json();

console.log(`Fastest model: ${data.data.summary.fastest_model.name}`);
console.log(`Average TTFT: ${data.data.summary.average_ttft}ms`);

Python

import requests

response = requests.get('https://metrik.vercel.app/api/v1/ttft')
data = response.json()

print(f"Fastest model: {data['data']['summary']['fastest_model']['name']}")
print(f"Average TTFT: {data['data']['summary']['average_ttft']}ms")

Error Responses

429 - Rate Limit Exceeded

{
  "success": false,
  "error": "Rate limit exceeded",
  "message": "You have exceeded the limit of 100 requests per hour",
  "retry_after": 3600
}

503 - No Data Available

{
  "success": false,
  "error": "No data available",
  "message": "Waiting for first hourly measurement"
}

Need Help?

Have questions or need higher rate limits? Get in touch!