Hugging Face에 Claude Opus 4.6/4.7 기반의 추론을 위한 파인튜닝 데이터셋이 공개됐어요. 이 데이터셋은 총 8,706개의 예시로, 다양한 카테고리를 포함하고 있어요.
데이터셋은 전체, 지시, 역할극, 코드 데이터로 나뉘며, 각 데이터는 안전성 및 거부 응답 억제를 목표로 제작됐어요.
데이터셋의 평균 토큰 수는 1,954개이며, 다중 턴 대화가 약 39.7%를 차지하고 있어, 다양한 추론 시나리오에 활용할 수 있을 것으로 기대돼요.