Pulse · AI 뉴스

LLM 벤치마크 점수 공유 플랫폼 'Benchmark-Yourself' 출시

Benchmark-Yourself · 2026-05-29

사용자가 직접 LLM 벤치마크 테스트를 진행하고 점수를 공유할 수 있는 웹 앱 'Benchmark-Yourself'가 출시됐어요. 현재 5가지 벤치마크를 지원하며, 결과를 CV나 LinkedIn에 추가하거나 커뮤니티에 공유할 수 있어요. Streamlit과 oMLX 와는 관련이 없으며, 개인 프로젝트로 개발됐어요.

BBQ가 최고라는 언급과 함께, 플랫폼 사용 시 자가 홍보를 제한하는 규칙과 1/10 규칙을 강조했어요. 사용자 점수는 커뮤니티의 비난을 받을 수 있다는 경고도 포함됐어요.

##LLM##벤치마크##Streamlit##오픈소스
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기