GPQA

Graduate-level science and reasoning benchmark score.

GPQA, often reported as GPQA Diamond in model leaderboards, is a graduate-level Google-proof Q&A benchmark. It focuses on expert science reasoning where strong retrieval alone is not enough.

Test type: Expert multiple-choice science Q&A, usually evaluated with exact option extraction.

94.1%

Current leader: Gemini 3.1 Pro Preview

Project links

This app ranks the GPQA score exposed by the Artificial Analysis snapshot.

GitHub Paper

Leaderboard

Rank	Model	Creator	Value	Speed	Blended Price
#1	Gemini 3.1 Pro Preview	Google	94.1%	131.2 tok/s	$4.50/M
#2

GPQA

Coverage

Top GPQA Models

Leaderboard

GPQA

Coverage

Top GPQA Models

Leaderboard