Together AI가 DPO(Direct Preference Optimization) 파인튜닝을 지원하기 시작했어요. DPO는 언어 모델을 인간의 선호도에 맞게 조정하는 기술로, 코드 예제와 기술적 상세 내용이 함께 공개됐어요. 이번 지원을 통해 Together AI 플랫폼에서 DPO를 활용한 모델 커스터마이징이 가능해졌어요.