연구진은 LLM이 비유적 언어와 부정 표현을 얼마나 정확히 이해하는지 조사했어요. 기존 데이터셋에 부정 어노테이션을 추가하고 다양한 LLM을 테스트했죠. 부정과 비유가 결합된 문장은 특히 LLM에게 어려움을 줘요. 프롬프트 스타일이 모델 성능에 큰 영향을 미치는 것으로 나타났어요.
연구 결과, LLM이 부정과 비유를 동시에 포함하는 문장을 해석하는 데 어려움을 겪는다는 사실을 확인했어요. 모델 성능은 프롬프트 스타일에 따라 크게 달라졌어요. 연구진은 이 결과를 바탕으로 LLM의 언어 이해 능력 개선 방향을 제시할 예정이에요.
연구진은 LLM의 언어 이해 능력 향상을 위해 부정과 비유를 결합한 새로운 데이터셋을 개발하고 다양한 모델을 테스트했어요. 연구 결과는 LLM의 한계와 개선 방향을 제시하며, 실제 활용 시 주의해야 할 점을 알려줍니다.