Рейтинг LLM-моделей для кода
Модели, которые используются как мозг для agentic coding: качество, стоимость, скорость и confidence.
Dominance: Codex 100 · Opus 84•Mode: V0 manual consensus
Index leader
GPT 5.5 XH
+1.8%Avg score
73
/100Fear & FOMO
31
calmData mode
V0
manualTopicCodex still leads the AI coding stack
NewOpus 4.8 token burn watch
| # | Name | Score | 1d % | 7d % | Confidence | Value | Best for | Sources | Last 7 Days | |
|---|---|---|---|---|---|---|---|---|---|---|
| 1 | G GPT 5.5 Extra HighGPT 5.5 XHOpen OpenAI | 98 | 1.29% | 1.98% | High | дорого, но сильно | сложный код, архитектура, Codex workflows | |||
| 2 | O Claude Opus 4.8Opus 4.8Open Anthropic | 84 | 6.94% | 7.63% | High | дорого, но умнее 4.7 | длинные задачи, аудиты, TypeScript/Rust | |||
| 3 | G Gemini 3.1 Pro HighGemini 3.1 ProOpen | 62 | 3.43% | 4.12% | Medium | сильный value | стратегия, анализ, мультимодальность | |||
| 4 | C Composer 2.5Composer 2.5Open Cursor | 47 | 1.11% | 1.80% | Medium | зависит от Cursor | Cursor workflows | |||
| 5 | O Claude Opus 4.7Opus 4.7Open Anthropic | 43 | 0.66% | 1.35% | Medium | уступает 4.8 | сравнение прогресса Anthropic | |||
| 6 | G Gemini 3.5 FlashGemini FlashOpen | 14 | 3.76% | 4.45% | Low | дешево | быстрые дешевые итерации |
Методология V0
Публичные лидерборды переводятся в percentile score по месту внутри источника. Missing data не считается нулем, а снижает confidence.
Как считается индекс