유저 recro69가 3-크리틱 하니스를 사용한 Qwen3.6-27B 테스트 경험을 공유했어요. 하니스(코드 리뷰, 테스트 리뷰, Playwright E2E)를 통해 모델의 활용 가능성이 높아졌다고 설명했어요.
모델 크기보다 신뢰성 있는 프로세스가 중요하며, 작은 모델도 크리틱 파이프라인으로 추가적인 실수를 잡아낼 수 있다고 강조했어요.
팀들은 모델 선택과 프롬프트 튜닝에 집중하지만, 결과 검증 없이 모델의 문제로 돌리는 실수를 저지르며, 실제 신뢰성은 하니스에서 나온다고 조언했어요.