📈 权威评测
MATH数学评测
AI
MMLU
MMLU
HumanEval
HumanEval
MMBench
MMBench
MATH数学评测 排行榜
更新时间: 2026/4/20| 排名 | 模型 | 得分 | 厂商 |
|---|---|---|---|
| 1 | GPT-4o | 76.6 | |
| 2 | Claude 4.5 Opus | 75.8 | |
| 3 | Gemini 2.5 Pro | 74.2 | |
| 4 | DeepSeek V3 | 72.1 | |
| 5 | Qwen 3.0 | 70.5 |
AI
MMLU
HumanEval
MMBench
| 排名 | 模型 | 得分 | 厂商 |
|---|---|---|---|
| 1 | GPT-4o | 76.6 | |
| 2 | Claude 4.5 Opus | 75.8 | |
| 3 | Gemini 2.5 Pro | 74.2 | |
| 4 | DeepSeek V3 | 72.1 | |
| 5 | Qwen 3.0 | 70.5 |