GPT-4를 활용해 대규모 언어 모델(LLM) 내 뉴런의 행동을 설명하고 평가하는 방법을 개발했어요. GPT-2의 모든 뉴런에 대한 설명과 점수 데이터셋을 공개했는데, 아직 완벽하지 않은 수준이에요. 이 데이터셋은 LLM 내부 작동 방식 이해에 기여하고, 모델 해석 가능성을 높이는 데 활용될 수 있을 거예요.