연구진이 타타르어 텍스트 디톡스 시스템 'Tatoxa'를 개발했어요. 기존 LLM보다 성능이 뛰어나고, 타타르어 디톡스 데이터셋도 공개됐어요. 러시아어 등 다른 언어에서 성능을 이식하는 것보다 타타르어 데이터로 직접 학습하는 것이 훨씬 효과적이었어요. Tatoxa는 온라인 커뮤니티 안전 확보와 사용자 보호에 기여할 것으로 기대돼요.