Pulse · AI 뉴스

모델 로짓은 무엇을 알고 있을까요? (당신을 놀라게 할지도)

OpenAI · 2026-04-20

최근 연구에 따르면 모델 내부를 탐색하면 모델 생성 결과로는 알 수 없는 많은 정보를 얻을 수 있다고 해요.

이는 의도치 않거나 악의적인 정보 유출의 위험을 초래하며, 모델 사용자가 모델 소유자가 접근 불가능하다고 생각했던 정보를 학습할 수 있게 만들 수 있어요.

본 연구에서는 비전-언어 모델을 테스트베드로 삼아, 잔차 흐름에서 다양한 '표현 수준'에 저장된 정보를 체계적으로 비교 분석했어요.

##정보유출##모델보안##비전언어모델
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기