← 전체 지표
추상추론 점수 (ARC-AGI)
최신
88% %
2024-12
목표
~85% (human)
ARC-AGI-1에서의 평균 인간 성능 — AI가 2024년 말 넘어선 기준선.
시계열
아직 검증된 측정값이 없습니다.
정의 ARC-AGI-1 점수 — 사람에겐 쉽지만(~85%) AI엔 오래 어려웠던 퍼즐. 2024년 12월 OpenAI o3가 76~88%에 도달해, 이 시험에서 암기를 넘어선 첫 AI가 됐습니다. ARC-AGI-2는 더 어려운 후속으로 프론티어 모델도 아직 낮은 점수입니다. (제3자 벤치마크이며 우리 점수가 아닙니다.)
출처 ↗주체별
88