개발자가 AWS 장애 조사 자동화 오픈소스 에이전트 개발 배경을 설명했어요. 초기 10분 동안 팀은 수동으로 CloudWatch, 로그, 알람 등 정보를 수집하여 가설을 세우는 경우가 많다고 가정하고 있어요. 실제 환경과 다르다면 피드백을 요청했어요.
현재 에이전트는 읽기 전용이며, 사용자가 원하는 LLM을 사용할 수 있어요. 팀의 초기 대응 과정, 자동화 활용 정도, '무엇이 변경되었는가?'에 대한 가장 빠른 답변 방법 등에 대한 의견을 구하고 있어요.
자동화된 근본 원인 가설 생성 시스템이 워크플로우를 개선할 수 있는지, 혹은 신뢰성이 문제인지 확인하고 싶어해요.