연구진이 SemEval-2026 Task 6에서 정치 회피 전략 분류를 위해 Qwen3 모델 파인튜닝과 DeepSeek-V3.2, Grok-4-Fast API 모델의 구조화된 Chain-of-Thought (CoT) 프롬프팅을 비교했어요.
구조화된 CoT 프롬프팅이 파라미터 효율적 파인튜닝보다 훨씬 우수한 성능을 보였으며, Grok-4-Fast 모델은 최대 Macro F1 0.5147을 기록했어요.
연구 결과, 계층적 분류 체계로 라벨을 제시하고, few-shot 예제를 활용하면 모델의 추론을 구조화하는 데 도움이 된다는 점을 확인했어요.