Reddit 사용자가 10만 건 데이터 중 56건에 불과한 실패 사례를 가진 불균형 데이터셋을 활용하여 기계 고장 및 잔여 수명(RUL) 예측 방법을 문의했어요. 운영 시간과 습도는 기계 고장과 상관관계가 없다고 판단하여 제거했습니다. 적합한 알고리즘 또는 딥러닝 모델을 추천받고 싶어해요.
데이터셋은 타임스탬프 기반이며, 기계 고장 시 1로 레이블링되어 있습니다. 불균형 데이터셋에 적합한 알고리즘 또는 딥러닝 모델을 추천받고 싶어해요.
기존 운영 시간 및 습도 데이터는 관련성이 낮다고 판단하여 제거했습니다.