본 보고서는 BERT와 T5 모델을 활용한 개체명 인식(NER) 태스크 구현을 다룹니다. BERT는 간단한 분류 헤드를 사용하고, T5는 few-shot 프롬프트를 활용하여 파인튜닝합니다. 7개 클래스 태그와 3개 클래스 단순화된 태그 체계 하에서 성능을 비교 분석했습니다.
BERT는 가중치 교차 엔트로피 손실 함수를 사용하고, T5는 두 가지 검증 전략으로 파인튜닝되었습니다. 다양한 하이퍼파라미터에 대한 ablation study를 통해 성능을 분석하고, BERT의 일반적인 오류와 모델 성능에 대한 인사이트를 제공합니다.
성능 지표를 기반으로 두 아키텍처를 비교하고 시퀀스 라벨링 태스크에서의 능력을 탐구하여, 향후 실용적인 활용 사례를 위한 기반을 마련합니다.