컴퓨터 공학 전공 학생이 APTOS 2019 데이터셋 기반 5등급 당뇨망막병증 분류 모델을 구축 중입니다. 웹 애플리케이션은 완성되었으나 AI 모델 예측의 일관성이 떨어지는 문제가 발생했어요.
Moderate 등급이 Severe 또는 Proliferative로 잘못 분류되는 경우도 있고, Severe 등급은 Moderate 또는 Proliferative로 분류되는 경향이 있으며, 외부 데이터셋 이미지의 경우 예측 결과가 완전히 예상과 다르게 나타나기도 합니다.
모델은 때때로 90% 이상의 높은 신뢰도를 보이지만, 예측이 틀린 경우도 많아 클래스 혼동이 일반적인 현상인지, 개선을 위해 어떤 방법을 시도해야 할지 궁금합니다.
ResNet50, EfficientNet, DenseNet 등 앙상블 모델 사용을 고려하고 있지만, 호환 가능한 사전 학습된 5등급 DR 모델을 찾기 어렵다고 합니다.