provider.json

  1{
  2  "name": "Charm Hyper",
  3  "id": "hyper",
  4  "api_endpoint": "https://hyper.charm.land/api/v1/fantasy",
  5  "type": "hyper",
  6  "default_large_model_id": "glm-5.1",
  7  "default_small_model_id": "deepseek-v4-flash",
  8  "models": [
  9    {
 10      "id": "deepseek-v4-flash",
 11      "name": "DeepSeek V4 Flash",
 12      "cost_per_1m_in": 0.14,
 13      "cost_per_1m_out": 0.28,
 14      "cost_per_1m_in_cached": 0.0028,
 15      "cost_per_1m_out_cached": 0,
 16      "context_window": 1000000,
 17      "default_max_tokens": 384000,
 18      "can_reason": true,
 19      "reasoning_levels": [
 20        "high",
 21        "xhigh"
 22      ],
 23      "default_reasoning_effort": "high",
 24      "supports_attachments": true
 25    },
 26    {
 27      "id": "deepseek-v4-pro",
 28      "name": "DeepSeek V4 Pro",
 29      "cost_per_1m_in": 0.435,
 30      "cost_per_1m_out": 0.87,
 31      "cost_per_1m_in_cached": 0.0036,
 32      "cost_per_1m_out_cached": 0,
 33      "context_window": 1000000,
 34      "default_max_tokens": 384000,
 35      "can_reason": true,
 36      "reasoning_levels": [
 37        "high",
 38        "xhigh"
 39      ],
 40      "default_reasoning_effort": "high",
 41      "supports_attachments": false
 42    },
 43    {
 44      "id": "gemma-4-26b-a4b-it",
 45      "name": "Gemma 4 26B A4B",
 46      "cost_per_1m_in": 0.102,
 47      "cost_per_1m_out": 0.394,
 48      "cost_per_1m_in_cached": 0.051,
 49      "cost_per_1m_out_cached": 0,
 50      "context_window": 256000,
 51      "default_max_tokens": 25600,
 52      "can_reason": true,
 53      "supports_attachments": false
 54    },
 55    {
 56      "id": "glm-5",
 57      "name": "GLM-5",
 58      "cost_per_1m_in": 0.99,
 59      "cost_per_1m_out": 3.07,
 60      "cost_per_1m_in_cached": 0.495,
 61      "cost_per_1m_out_cached": 0,
 62      "context_window": 202752,
 63      "default_max_tokens": 20275,
 64      "can_reason": true,
 65      "supports_attachments": false
 66    },
 67    {
 68      "id": "glm-5.1",
 69      "name": "GLM 5.1",
 70      "cost_per_1m_in": 1.4,
 71      "cost_per_1m_out": 4.4,
 72      "cost_per_1m_in_cached": 0.26,
 73      "cost_per_1m_out_cached": 0,
 74      "context_window": 202800,
 75      "default_max_tokens": 64000,
 76      "can_reason": true,
 77      "reasoning_levels": [
 78        "low",
 79        "medium",
 80        "high"
 81      ],
 82      "default_reasoning_effort": "medium",
 83      "supports_attachments": true
 84    },
 85    {
 86      "id": "gpt-oss-120b",
 87      "name": "gpt-oss-120b",
 88      "cost_per_1m_in": 0.178,
 89      "cost_per_1m_out": 0.68,
 90      "cost_per_1m_in_cached": 0.089,
 91      "cost_per_1m_out_cached": 0,
 92      "context_window": 131072,
 93      "default_max_tokens": 13107,
 94      "can_reason": true,
 95      "reasoning_levels": [
 96        "low",
 97        "medium",
 98        "high"
 99      ],
100      "default_reasoning_effort": "medium",
101      "supports_attachments": false
102    },
103    {
104      "id": "kimi-k2.5",
105      "name": "Kimi K2.5",
106      "cost_per_1m_in": 0.518,
107      "cost_per_1m_out": 2.57,
108      "cost_per_1m_in_cached": 0.259,
109      "cost_per_1m_out_cached": 0,
110      "context_window": 262144,
111      "default_max_tokens": 26214,
112      "can_reason": true,
113      "supports_attachments": false
114    },
115    {
116      "id": "kimi-k2.6",
117      "name": "Kimi K2.6",
118      "cost_per_1m_in": 0.95,
119      "cost_per_1m_out": 4,
120      "cost_per_1m_in_cached": 0.16,
121      "cost_per_1m_out_cached": 0,
122      "context_window": 262000,
123      "default_max_tokens": 262000,
124      "can_reason": true,
125      "reasoning_levels": [
126        "low",
127        "medium",
128        "high"
129      ],
130      "default_reasoning_effort": "medium",
131      "supports_attachments": true
132    },
133    {
134      "id": "llama-3.3-70b-instruct",
135      "name": "Llama 3.3 70B Instruct",
136      "cost_per_1m_in": 0.574,
137      "cost_per_1m_out": 0.668,
138      "cost_per_1m_in_cached": 0.287,
139      "cost_per_1m_out_cached": 0,
140      "context_window": 128000,
141      "default_max_tokens": 12800,
142      "can_reason": true,
143      "supports_attachments": false
144    },
145    {
146      "id": "llama-4-maverick-17b-128e-instruct-fp8",
147      "name": "Llama 4 Maverick 17B 128E Instruct FP8",
148      "cost_per_1m_in": 0.35,
149      "cost_per_1m_out": 1.08,
150      "cost_per_1m_in_cached": 0.175,
151      "cost_per_1m_out_cached": 0,
152      "context_window": 430000,
153      "default_max_tokens": 43000,
154      "can_reason": true,
155      "supports_attachments": false
156    },
157    {
158      "id": "minimax-m2.7",
159      "name": "MiniMax M2.7",
160      "cost_per_1m_in": 0.3,
161      "cost_per_1m_out": 1.2,
162      "cost_per_1m_in_cached": 0.06,
163      "cost_per_1m_out_cached": 0.375,
164      "context_window": 204800,
165      "default_max_tokens": 131000,
166      "can_reason": true,
167      "reasoning_levels": [
168        "low",
169        "medium",
170        "high"
171      ],
172      "default_reasoning_effort": "medium",
173      "supports_attachments": false
174    },
175    {
176      "id": "qwen3.6-flash",
177      "name": "Qwen3.6-Flash",
178      "cost_per_1m_in": 1,
179      "cost_per_1m_out": 4,
180      "cost_per_1m_in_cached": 1.25,
181      "cost_per_1m_out_cached": 0.1,
182      "context_window": 1000000,
183      "default_max_tokens": 64000,
184      "can_reason": true,
185      "supports_attachments": true
186    },
187    {
188      "id": "qwen3.6-max",
189      "name": "Qwen3.6-Max",
190      "cost_per_1m_in": 2,
191      "cost_per_1m_out": 12,
192      "cost_per_1m_in_cached": 2.5,
193      "cost_per_1m_out_cached": 0.2,
194      "context_window": 256000,
195      "default_max_tokens": 64000,
196      "can_reason": true,
197      "supports_attachments": false
198    },
199    {
200      "id": "qwen3.6-plus",
201      "name": "Qwen3.6-Plus",
202      "cost_per_1m_in": 2,
203      "cost_per_1m_out": 6,
204      "cost_per_1m_in_cached": 2.5,
205      "cost_per_1m_out_cached": 0.2,
206      "context_window": 1000000,
207      "default_max_tokens": 64000,
208      "can_reason": true,
209      "supports_attachments": true
210    },
211    {
212      "id": "qwen3.7-max",
213      "name": "Qwen3.7-Max",
214      "cost_per_1m_in": 2.5,
215      "cost_per_1m_out": 7.5,
216      "cost_per_1m_in_cached": 3.125,
217      "cost_per_1m_out_cached": 0.25,
218      "context_window": 1000000,
219      "default_max_tokens": 64000,
220      "can_reason": true,
221      "supports_attachments": false
222    },
223    {
224      "id": "qwen3-coder-480b-a35b-instruct-int4-mixed-ar",
225      "name": "Qwen3 Coder 480B A35B Instruct INT4 Mixed AR",
226      "cost_per_1m_in": 0.531,
227      "cost_per_1m_out": 2.605,
228      "cost_per_1m_in_cached": 0.2655,
229      "cost_per_1m_out_cached": 0,
230      "context_window": 106000,
231      "default_max_tokens": 10600,
232      "can_reason": false,
233      "supports_attachments": false
234    },
235    {
236      "id": "qwen3-next-80b-a3b-instruct",
237      "name": "Qwen3 Next 80B A3B Instruct",
238      "cost_per_1m_in": 0.128,
239      "cost_per_1m_out": 1.28,
240      "cost_per_1m_in_cached": 0.064,
241      "cost_per_1m_out_cached": 0,
242      "context_window": 262144,
243      "default_max_tokens": 26214,
244      "can_reason": false,
245      "supports_attachments": false
246    }
247  ]
248}