Vibecoding IndexMethodology×
vibecoding.ru
BenchmarksToolsBlogNewsletterCourse
AI Coding

Рейтинг LLM-моделей для кода

Модели, которые используются как мозг для agentic coding: качество, стоимость, скорость и confidence.

AI assets: 6•Sources: 5•Updated: 2 июня 2026•Methodology
Dominance: Codex 100 · Opus 84•Mode: V0 manual consensus
TopModelsAgentsIDEs

Index leader

GPT 5.5 XH

+1.8%

Avg score

73

/100

Fear & FOMO

31

calm

Data mode

V0

manual
TopicCodex still leads the AI coding stack
NewOpus 4.8 token burn watch
◎All AIMModelsAAgentsIIDEsCCLIDDesign
#NameScore1d %7d %ConfidenceValueBest forSourcesLast 7 Days
1
G
GPT 5.5 Extra HighGPT 5.5 XHOpen

OpenAI

981.29%1.98%Highдорого, но сильносложный код, архитектура, Codex workflows
ArtificialDeepSWETerminal-BenchCursorBenchvendor
2
O
Claude Opus 4.8Opus 4.8Open

Anthropic

846.94%7.63%Highдорого, но умнее 4.7длинные задачи, аудиты, TypeScript/Rust
ArtificialDeepSWETerminal-BenchCursorBenchvendor
3
G
Gemini 3.1 Pro HighGemini 3.1 ProOpen

Google

623.43%4.12%Mediumсильный valueстратегия, анализ, мультимодальность
ArtificialDeepSWETerminal-BenchShilov
4
C
Composer 2.5Composer 2.5Open

Cursor

471.11%1.80%Mediumзависит от CursorCursor workflows
CursorBenchvendorArtificial
5
O
Claude Opus 4.7Opus 4.7Open

Anthropic

430.66%1.35%Mediumуступает 4.8сравнение прогресса Anthropic
ArtificialDeepSWECursorBenchvendor
6
G
Gemini 3.5 FlashGemini FlashOpen

Google

143.76%4.45%Lowдешевобыстрые дешевые итерации
ArtificialTerminal-Bench

Методология V0

Публичные лидерборды переводятся в percentile score по месту внутри источника. Missing data не считается нулем, а снижает confidence.

Как считается индекс

Sources

DeepSWEpublicArtificial Analysis Coding Agent IndexpublicTerminal-BenchpaperSWE-bench familypublicCursorBenchvendor
MMarkets★Watchlist▣Blog@MailVCourse