연구진은 스트리밍 머신러닝 파이프라인에서 추론과 상태 지속성을 분리하는 '확률적 희석' 기법을 제안했어요. 모든 이벤트를 점수화하지만, 유의미한 이벤트에 대해서만 내구성이 있는 상태 업데이트를 선택적으로 트리거하는 방식이에요. 기존 방식과 달리, 디스크 기반 키-값 저장소에서 가져온 근사 통계를 활용해 고주파 메모리 제어 장치나 워커 간 조정 없이 지속성 경로 제어가 가능해요.
시간 기반 집계에서 편향이 발생하지 않도록 분산 인지 수식을 적용했으며, 실험 결과 최대 90%의 이벤트가 지속성 경로에서 제외되면서 저장 I/O 및 직렬화 오버헤드를 줄이는 효과를 확인했어요. 다운스트림 유용성을 유지하거나 개선하는 데 기여했어요.