본 연구는 대규모 언어 모델(LLM)을 특정 분야에 맞게 조정하는 감독 미세 조정(SFT) 과정에서 개인 식별 정보(PII)가 유출될 수 있는지 조사합니다. 의료 및 법률 분야의 민감한 정보를 포함하는 Q&A 데이터셋을 구축하여 공격자가 다양한 수준의 지식을 가지고 PII를 추론할 수 있는지 평가했습니다. COVA라는 새로운 디코딩 알고리즘을 제안하여 기존 추출 방법보다 PII 재구성에 효과적임을 입증했습니다.