cerebras.json

 1{
 2    "name": "Cerebras",
 3    "id": "cerebras",
 4    "type": "openai-compat",
 5    "api_key": "$CEREBRAS_API_KEY",
 6    "api_endpoint": "https://api.cerebras.ai/v1",
 7    "default_large_model_id": "gpt-oss-120b",
 8    "default_small_model_id": "qwen-3-32b",
 9    "default_headers": {
10        "X-Cerebras-3rd-Party-Integration": "crush"
11    },
12    "models": [
13        {
14            "id": "llama-3.3-70b",
15            "name": "Llama 3.3 70B",
16            "cost_per_1m_in": 0.85,
17            "cost_per_1m_out": 1.2,
18            "context_window": 131072,
19            "default_max_tokens": 25000,
20            "can_reason": false,
21            "supports_attachments": false
22        },
23        {
24            "id": "gpt-oss-120b",
25            "name": "OpenAI GPT OSS",
26            "cost_per_1m_in": 0.35,
27            "cost_per_1m_out": 0.75,
28            "context_window": 131072,
29            "default_max_tokens": 25000,
30            "can_reason": true,
31            "reasoning_levels": [
32                "low",
33                "medium",
34                "high"
35            ],
36            "default_reasoning_efforts": "medium",
37            "supports_attachments": false
38        },
39        {
40            "id": "qwen-3-32b",
41            "name": "Qwen 3 32B",
42            "cost_per_1m_in": 0.4,
43            "cost_per_1m_out": 0.8,
44            "context_window": 131072,
45            "default_max_tokens": 25000,
46            "can_reason": false,
47            "supports_attachments": false
48        },
49        {
50            "id": "qwen-3-235b-a22b-instruct-2507",
51            "name": "Qwen 3 235B Instruct",
52            "cost_per_1m_in": 0.6,
53            "cost_per_1m_out": 1.2,
54            "context_window": 131072,
55            "default_max_tokens": 25000,
56            "can_reason": false,
57            "supports_attachments": false
58        },
59        {
60            "id": "zai-glm-4.6",
61            "name": "Z.ai GLM 4.6",
62            "cost_per_1m_in": 2.25,
63            "cost_per_1m_out": 2.75,
64            "context_window": 131072,
65            "default_max_tokens": 25000,
66            "can_reason": false,
67            "supports_attachments": false
68        }
69    ]
70}