Lazarus AI와 Eric Hartford가 ReAligned-Qwen3.5 모델 시리즈를 공개했어요. 중국식 검열과 편향성을 줄이고 거부 반응을 완화하는 데 초점을 맞췄어요. Apache 2.0 라이선스로 공개되었으며, 0.8B부터 35B-A3B까지 다양한 크기의 모델을 제공해요.
SFT + GRPO 파이프라인을 사용해 중국 검열 및 편향 분류 체계를 타겟팅하는 데이터셋으로 학습되었으며, ReAligned 분류기 모델을 GRPO 보상 신호로 활용했어요. Hugging Face에서 모델을 다운로드할 수 있어요.
블로그와 Hugging Face 컬렉션을 통해 자세한 정보를 확인할 수 있으며, GGUF 모델 카드 템플릿은 Bartowski에서 가져왔어요.