연구진은 SAGE(set-aggregated genome embeddings)라는 방법을 사용하여 미생군집의 유전체 서열 정보만으로 군집 수준의 풍부도 프로필을 예측했습니다. SAGE는 GLM(genomic language models)의 few-shot learning 능력을 활용하여 새로운 유전체에 대한 일반화 성능을 향상시켰습니다. 연구 결과, 군집 수준의 잠재적 표현은 성능 향상에 직접적인 영향을 미치는 것으로 나타났습니다.