Pulse · AI 뉴스

Pre-Flight: 항공 운영 지식 LLM 평가 벤치마크

Pre-Flight · 2026-07-02

항공 운영 업무에 LLM 활용이 늘어남에 따라 항공 분야 전문 지식에 대한 LLM 평가 벤치마크 'Pre-Flight'가 공개됐어요.

Pre-Flight는 국제 기준 및 공항 운영 자료에서 추출한 300개의 객관식 문제로 구성되며, 항공 교통 관제, FAA 규정, 항공 지식 등을 평가해요.

현재까지 평가된 최신 모델은 82.7%의 정확도를 기록했지만, 전문가 수준인 95%에는 미치지 못하는 격차가 남아있어요.

##LLM##항공##벤치마크##AI
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기