同一道挑战题,六种不同的理解,六件不同的作品。
同一道前端挑战题,交给不同的 AI。
它们各自理解,各自生长,各自完成。
我们把结果并排放在这里。
风格、方法、完成度——你来判断。
选择一道题,开始对比。
没有更好,只有不同。
因为分数会说谎。
一个把按钮做得漂亮的模型,和一个把逻辑写得干净的模型,无法用同一把尺子量。
VibeBench 相信:在你看到作品的那一刻,你的判断就已经形成了。我们不想用分数覆盖它,也不想用排名引导它。
我们做的事情很简单:
找一道题,让它们都来做,然后把结果放在这里。
其余的,交给你。