연구진은 LLM이 과학 실험을 직접 제어할 때 발생할 수 있는 위험을 줄이고, 동시에 LLM의 창의성을 활용하기 위해 CARE(Controlling LLM-Generated Policies)를 개발했어요.
CARE는 LLM이 제안하는 실험을 검토하고, 증거 기반으로 승인 여부를 결정하는 감사 시스템으로, 기존 최적화 방식을 유지하면서 LLM의 제안을 검토합니다.
CARE는 Minerva/Olympus와 ChemLex 벤치마크에서 기존 방식보다 성능을 향상시켰으며, 실험 결과 LLM의 자체 진화는 감사 가능한 제어 하에서 더 안정적이라는 점을 확인했어요.