Reddit 사용자가 Nanobanana 및 GPT-Image와 유사한 편집 능력 구현에 도움이 될 연구 논문을 문의했어요. 특히 autoregressive architecture가 아닌 SCOPE와 같은 편집 능력과 이해 능력에 대한 질문입니다. Boogu-Image와 SCOPE와 같은 모델의 작동 방식과 관련된 연구를 찾고 있어요.
Nanobanana 및 GPT-Image는 이미지 편집 능력과 이해 능력이 뛰어나며, 이를 구현하는 데 필요한 연구 논문을 찾고 있습니다. Reddit 사용자들은 이러한 모델의 작동 방식에 대한 정보를 공유하고 싶어합니다.