SemEval-2026 Task 5는 실제 스토리 맥락에서 LLM의 활용도를 알아보기 위해 단어의 적절성을 예측하는 과제를 제시했어요. 연구진은 구조화된 추론 메커니즘을 활용한 LLM 기반 프레임워크를 제안하여 단어의 다양한 의미 중 적절한 의미를 판단하고, 그 적절성을 평가했어요. 적은 파라미터 LLM을 다양한 추론 전략으로 튜닝하거나, 큰 파라미터 모델에 동적 few-shot 프롬프팅을 적용했을 때 인간과 유사한 판단을 내릴 수 있었어요.