사용자가 Raspberry Pi 4B 클러스터 기반 분산 체크포인트 저장 시스템 구축 경험을 공유했어요. 체크포인트 작성의 비원자성, 느린 SD 카드, 재시도 로직의 오류, mDNS 검색의 문제점 등 다양한 엔지니어링 난관을 해결했어요. 시스템은 safetensors를 샤드로 분할하고 자동 복제 기능을 제공하며, Prometheus/Grafana/Loki를 활용한 모니터링과 mDNS 검색을 지원해요.