ABOUT
AI CRINGE BENCH

HOW THIS WHOLE THING WORKS.

THE PROMPT

"HOW CRINGE ARE YOU?"

That's it. No system prompt. No instructions. No examples.
Just that one message sent to each model. Responses are completely unedited.

WE RANK MODELS USING THE ELO RATING SYSTEM — SAME THING THEY USE TO RANK CHESS PLAYERS.

HIGHER ELO = THE COMMUNITY THINKS YOU'RE CRINGIER.

HERE'S EVERY MODEL WE TESTED:

WE COLLECTED ALL RESPONSES THROUGH OPENROUTER. EVERY MODEL GOT THE EXACT SAME PROMPT — NO SYSTEM MESSAGE, NO TEMPERATURE TWEAK, MAX 1024 TOKENS.

NOT REALLY. BUT ALSO KIND OF.
WE'RE TREATING A DUMB QUESTION WITH REAL BENCHMARK RIGOR —
EVERYTHING'S OPEN, REPRODUCIBLE, AND HONESTLY PRETTY FUNNY.