Ranking de MIR 2026

Netas obtenidas

Puntuación MIR: (3 × aciertos - fallos) / 3

200.00 pts

197.33 pts

197.33 pts

192.33 pts

192.00 pts

191.00 pts

188.00 pts

Mejor humano

188.00 pts

186.00 pts

186.00 pts

Sonar Deep Research

186.00 pts

185.66 pts

185.66 pts

179.33 pts

125

175.66 pts

141

172.33 pts

155

169.66 pts

165

166.33 pts

177

166.00 pts

178

165.66 pts

182

165.66 pts

183

160.00 pts

159.66 pts

155.66 pts

219

154.66 pts

223

149.66 pts

238

115.00 pts

268

106.00 pts

279

76.00 pts

290

65.66 pts

298

65.00 pts

299

52.00 pts

306

0.00 pts

Media:156.16 pts

(319 modelos)

Aciertos obtenidos

Número total de respuestas correctas

200

198

198

191

Mejor humano

191

Sonar Deep Research

140

177

177

162

175

173

173

169

169

164

225

124

281

105

296

Granite 4.0 Micro

297

298

299

UnslopNemo 12B

300

301

Olmo 3 7B Instruct

302

307

319

Qwen3 4B

Total:52589

Media:164.85

(319 modelos)

Fallos cometidos

Número total de respuestas incorrectas

ALMA

Miri

Qwen3 4B

GPT-5.4 Pro

GPT-5.1-Codex

o4 Mini

GLM 5

Grok 4

Kimi K2.5

Auto Router

Claude Opus 4

Mistral Large

GPT-4o (2024-11-20)

Grok 3 Beta

Mejor humano

100

gpt-oss-120b

115

130

145

146

MiniMax M2

147

148

149

Qwen3 Coder Plus

150

151

Qwen3 32B

152

153

Qwen VL Max

154

166

170

GLM 4.5 Air

171

172

178

179

Sonar

180

182

183

198

218

223

224

Command A

225

226

gpt-oss-20b

227

228

Qwen-Max

229

247

248

296

307

308

309

Total:8332

Media:26.11

(319 modelos)

Porcentaje de aciertos

Proporción de respuestas correctas sobre el total

97.0%

97.0%

95.5%

Mejor humano

95.5%

Sonar Deep Research

90.5%

140

88.5%

88.5%

162

87.5%

173

86.5%

84.5%

84.5%

82.0%

225

62.0%

281

52.5%

46.0%

298

40.0%

307

Media:82.4%

(319 modelos)

Tiempo promedio de respuesta

Tiempo promedio que tarda el modelo en responder a cada pregunta

Ministral 3B

1.2s

1.9s

Mercury

2.0s

3.1s

3.1s

3.3s

Morph V3 Fast

3.4s

3.8s

4.3s

6.7s

6.8s

Claude 3.5 Haiku

6.8s

6.9s

Nova 2 Lite

7.0s

7.0s

GLM 4 32B

7.0s

7.1s

7.6s

107

9.9s

137

11.6s

12.2s

170

12.3s

171

14.3s

192

14.4s

193

14.4s

15.2s

15.3s

210

16.3s

221

16.6s

227

16.9s

228

21.5s

247

21.9s

248

22.6s

249

23.7s

255

24.2s

256

26.5s

265

33.3s

286

81.7s

312

Media:17.4s

(318 modelos)

Coste promedio por pregunta

Coste medio en USD por pregunta evaluada

Pixtral 12B

Phi 4

Ministral 3 3B 2512

Trinity Mini

Gemma 3 27B

Ministral 3 14B 2512

$0.0003

$0.0003

GPT-4o-mini

$0.0005

$0.0005

$0.0006

101

$0.0006

102

$0.0007

122

123

124

127

$0.0010

139

$0.0011

149

$0.0012

154

$0.0014

167

$0.0015

172

$0.0026

193

$0.0029

204

$0.0029

205

$0.0029

$0.0037

213

$0.0295

Media:$0.0100

(303 modelos)

Confianza promedio

Nivel de confianza medio reportado por el modelo

GPT-5.1-Codex-Mini

99.9%

99.9%

99.8%

99.5%

GPT-4o (2024-08-06)

99.5%

99.5%

Qwen VL Max

99.2%

100

113

98.7%

133

98.7%

134

158

159

160

162

97.5%

97.3%

96.7%

223

95.3%

257

95.0%

260

93.7%

272

89.0%

86.4%

294

83.6%

302

53.8%

314

16.9%

Media:95.4%

(318 modelos)

Coste total

Coste total en USD para evaluar todas las preguntas

Pixtral 12B

Phi 4

Ministral 3 3B 2512

Trinity Mini

Gemma 3 27B

$0.05

Ministral 3 14B 2512

$0.05

$0.07

$0.08

GPT-4o-mini

$0.10

$0.12

101

$0.12

102

$0.14

$0.15

122

$0.16

123

$0.16

124

$0.16

127

$0.20

139

$0.23

149

$0.24

154

$0.29

167

$0.30

172

$0.51

193

$0.59

204

$0.59

205

$0.59

$0.74

213

$5.90

Total:$994.54

Media:$3.28

(303 modelos)

Tokens de razonamiento

Tokens utilizados en el proceso de razonamiento

226K

242K

Kimi K2 Thinking

247K

249K

GLM 4.6V

251K

260K

264K

271K

Kimi K2.5

279K

280K

282K

289K

Solar Pro 3

295K

398K

425K

Total:94.0M

Media:847K

(111 modelos)

Tokens salientes

Tokens generados en las respuestas

65K

66K

Command A

67K

72K

74K

76K

92K

Devstral 2 2512

92K

92K

94K

94K

98K

99K

100K

102

103K

107

124K

145

126K

150

139K

167

152K

192

167K

193K

224

293K

269

323K

272

347K

278

377K

284

403K

287

521K

299

572K

303

577K

304

1.6M

317