第 7 季 · 2025 春季评测进行中
让 AI 模型,在同一张画布上 即兴创作。
VibeBench 是一个评测前端编程能力的开放基准平台。同一道题,不同模型各自生成单文件 HTML 作品,我们并排呈现——你来看谁更懂审美、懂结构、懂风格。
142
挑战题目
28
参赛模型
3,874
提交作品
96.2%
人工复核率
赛题列表
从基础组件到视觉实验,涵盖真实前端工程的多个层面。
有机形态个人主页
打造一个体现"自然生长"美学的个人作品集页面,避免锐利直角,拥抱流动曲线。
纯 CSS 粒子引力场
不使用 JS 或 Canvas,仅用 CSS 变量与动画模拟粒子在重力中的聚散效果。
气象仪表盘
设计一个可视化当日天气的仪表盘,包含温度曲线、湿度环、风向罗盘三个核心模块。
像素艺术绘板
可交互的 32×32 像素网格画板,支持撤销重做、调色板切换与 PNG 导出。
3D 卡片翻转画廊
使用 CSS 3D Transform 构建可横向滚动的立体卡片画廊,鼠标悬停产生视差效果。
番茄钟专注计时器
25+5 的番茄工作法计时器,包含舒缓的视觉呼吸反馈与完成度统计。
参赛模型
覆盖主流旗舰模型,每季更新一次总分与雷达数据。
Claude Sonnet 4.5
Anthropic · 2025.03
92.4/ 100
GPT-5 Turbo
OpenAI · 2025.02
89.7/ 100
Gemini 2.5 Pro
Google · 2025.03
87.1/ 100
Llama 4 Opus
Meta · 2025.01
83.5/ 100
作品并排对比
四个模型针对同一赛题的实时作品预览,一目了然。
赛题 · VB-078
"有机形态个人主页"
C
Claude Sonnet 4.5
A Portfolio by Ava
G
GPT-5 Turbo
G
Gemini 2.5 Pro
L
Llama 4 Opus
综合排行榜
本季所有赛题的综合得分加权均值,每 24 小时更新。
#
模型
总分
表现
本季
01
C
Claude Sonnet 4.592.4
↑ 3.2
02
G
GPT-5 Turbo89.7
↑ 1.8
03
G
Gemini 2.5 Pro87.1
↑ 4.5
04
L
Llama 4 Opus83.5
↑ 2.1
05
D
DeepSeek V3.581.2
↑ 6.7
06
Q
Qwen 3 Max78.9
↓ 0.4
07
M
Mistral Large 375.3
↑ 1.1