Skip to main content
Market icon

Anthropic Claude score on FrontierMath Benchmark by June 30?

Market icon

Anthropic Claude score on FrontierMath Benchmark by June 30?

$57,063 Vol.

28 feb 2026
Polymarket

$57,063 Vol.

Polymarket

50%+

$10,029 Vol.

77%

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.Anthropic's Claude Opus 4.6 recently tied OpenAI's GPT-5.2 for the top score of around 40% on Epoch AI's FrontierMath benchmark Tiers 1-4, a set of exceptionally challenging, unpublished math problems testing frontier AI reasoning capabilities, quadrupling prior Claude performance on Tier 4 alone. This progress, reported in early 2026 evaluations, reflects scaling improvements in long-context thinking tokens. On April 7, Anthropic unveiled the even more advanced Claude Mythos Preview—their most capable large language model to date—dominating benchmarks like SWE-Bench (77-94%) and GPQA Diamond (94.6%), though FrontierMath results remain unreleased amid safety concerns delaying public access. Traders eye potential Mythos deployment or Opus upgrades before the June 30 deadline, amid fierce competition from GPT-5.x and Gemini 3, but model timelines and evaluation uncertainties persist.

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No".

This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered.

The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
Volume
$57,063
Data di fine
30 giu 2026
Mercato aperto
Jan 30, 2026, 12:00 AM ET
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.Anthropic's Claude Opus 4.6 recently tied OpenAI's GPT-5.2 for the top score of around 40% on Epoch AI's FrontierMath benchmark Tiers 1-4, a set of exceptionally challenging, unpublished math problems testing frontier AI reasoning capabilities, quadrupling prior Claude performance on Tier 4 alone. This progress, reported in early 2026 evaluations, reflects scaling improvements in long-context thinking tokens. On April 7, Anthropic unveiled the even more advanced Claude Mythos Preview—their most capable large language model to date—dominating benchmarks like SWE-Bench (77-94%) and GPQA Diamond (94.6%), though FrontierMath results remain unreleased amid safety concerns delaying public access. Traders eye potential Mythos deployment or Opus upgrades before the June 30 deadline, amid fierce competition from GPT-5.x and Gemini 3, but model timelines and evaluation uncertainties persist.

This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No".

This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered.

The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.
Volume
$57,063
Data di fine
30 giu 2026
Mercato aperto
Jan 30, 2026, 12:00 AM ET
This market will resolve to "Yes" if any Anthropic Claude model achieves the listed score or greater on the FrontierMath Exam by June 30, 2026, 11:59 PM ET. Otherwise, the market will resolve to "No". This market will resolve according to the Epoch AI’s Frontier Math benchmarking leaderboard (https://epoch.ai/frontiermath) for Tier 1-3. Studies which are not included in the leaderboard (e.g. https://x.com/EpochAIResearch/status/1945905796904005720) will not be considered. The primary resolution source will be information from EpochAI; however, a consensus of credible reporting may also be used.

Fai attenzione ai link esterni.

Domande frequenti

"Anthropic Claude score on FrontierMath Benchmark by June 30?" è un mercato predittivo su Polymarket con 4 possibili esiti dove i trader comprano e vendono azioni in base a ciò che credono accadrà. L'esito attualmente in testa è "25%+" a 100%, seguito da "30%+" a 100%. I prezzi riflettono probabilità aggregate in tempo reale. Ad esempio, un'azione quotata a 100¢ implica che il mercato assegna collettivamente una probabilità di 100% a quell'esito. Queste quote cambiano continuamente man mano che i trader reagiscono a nuovi sviluppi e informazioni. Le azioni nell'esito corretto possono essere riscattate per $1 ciascuna alla risoluzione del mercato.

Ad oggi, "Anthropic Claude score on FrontierMath Benchmark by June 30?" ha generato $57.1K in volume totale di trading dal lancio del mercato il Jan 30, 2026. Questo livello di attività di trading riflette un forte coinvolgimento della comunità Polymarket e contribuisce a garantire che le quote attuali siano informate da un ampio pool di partecipanti al mercato. Puoi seguire i movimenti di prezzo in tempo reale e fare trading su qualsiasi esito direttamente su questa pagina.

Per fare trading su "Anthropic Claude score on FrontierMath Benchmark by June 30?", esplora i 4 esiti disponibili elencati in questa pagina. Ogni esito mostra un prezzo corrente che rappresenta la probabilità implicita del mercato. Per prendere una posizione, seleziona l'esito che ritieni più probabile, scegli "Sì" per fare trading a suo favore o "No" per fare trading contro di esso, inserisci il tuo importo e clicca "Trading". Se il tuo esito scelto è corretto alla risoluzione del mercato, le tue azioni "Sì" pagano $1 ciascuna. Se è errato, pagano $0. Puoi anche vendere le tue azioni in qualsiasi momento prima della risoluzione se vuoi consolidare un profitto o limitare una perdita.

L'attuale favorito per "Anthropic Claude score on FrontierMath Benchmark by June 30?" è "25%+" a 100%, il che significa che il mercato assegna una probabilità di 100% a quell'esito. L'esito successivo più vicino è "30%+" a 100%. Queste quote si aggiornano in tempo reale man mano che i trader comprano e vendono azioni, quindi riflettono l'ultima visione collettiva di ciò che è più probabile che accada. Controlla frequentemente o aggiungi questa pagina ai preferiti per seguire come cambiano le quote man mano che emergono nuove informazioni.

Le regole di risoluzione per "Anthropic Claude score on FrontierMath Benchmark by June 30?" definiscono esattamente cosa deve accadere affinché ogni esito venga dichiarato vincitore — comprese le fonti di dati ufficiali utilizzate per determinare il risultato. Puoi consultare i criteri completi di risoluzione nella sezione "Regole" di questa pagina sopra i commenti. Ti consigliamo di leggere attentamente le regole prima di fare trading, poiché specificano le condizioni precise, i casi limite e le fonti che regolano come viene risolto questo mercato.