항공 운영 업무에 LLM 활용이 늘어남에 따라 항공 분야 전문 지식에 대한 LLM 평가 벤치마크 'Pre-Flight'가 공개됐어요. Pre-Flight는 국제 기준 및 공항 운영 자료에서 추출한 300개의 객관식 문제로 구성되며, 항공 교통 관제, FAA 규정, 항공 지식 등을 평가해요. 현재까지 평가된 최신 모델은 82.7%의 정확도를 기록했지만, 전문가 수준인 95%에는 미치지 못하는 격차가 남아있어요.