AMALIA-VL은 유럽 포르투갈어(pt-PT)에 최적화된 최초의 오픈소스 비전·언어 모델입니다. 기존 모델이 브라질 포르투갈어와 혼동하거나 pt-PT 데이터를 부족하게 포함하는 문제를 해결합니다.
고해상도 비전 인코더와 동적 이미지 타일링, 학습된 커넥터를 통해 pt-PT 언어 모델을 결합하는 방식으로 3단계 학습 과정을 거쳤습니다.
모델 가중치, 학습 데이터, 구축 파이프라인과 함께 기계 번역된 pt-PT 평가 벤치마크를 공개하여 pt-PT 비전·언어 모델 개발을 지원합니다.