라이언 셰이가 AI 모델의 성능을 인간 IQ처럼 비교하는 'AI IQ' 평가 프로젝트를 공개했어요. 50개 이상의 LLM에 인간식 IQ 개념을 적용해 점수를 부여하고 시각화하는 방식이에요.
GPT-5.5가 'AI IQ' 테스트에서 136점으로 1위를 차지했으며, 30개월 만에 IQ가 60점이나 급등했어요. 이는 AI 모델의 성능 향상을 보여주는 지표로 해석될 수 있어요.
새로운 평가 방식에 대해 AI의 복잡한 능력을 단일 숫자로 환원하는 것은 위험하다는 비판도 제기되고 있으며, AI 성능 평가에 대한 논쟁이 이어질 것으로 예상돼요.