연구진은 LLM 기반 태도 감지 방법 5가지(프롬프트 기반 추론과 에이전트 기반 토론)를 4개 데이터셋, 15개 모델로 체계적으로 비교했어요. 프롬프트 기반 방법이 에이전트 기반 방법보다 성능이 좋았고, 에이전트 기반 방법은 샘플당 7~12배 더 많은 API 호출이 필요했어요. 모델 규모가 방법 선택보다 성능에 더 큰 영향을 미치며, 32B 파라미터 정도에서 성능 향상이 둔화되는 경향을 보였어요.